出门问问发布自研大模型「序列猴子」,未来主做 B 端企业专属模型

栏目:人物资讯  时间:2023-04-25
手机版

  文|沈筱

  编辑|王与桐

  36 氪获悉,4 月 20 日,出门问问在北京举办 "AGI · 降临 "2023 AIGC 战略发布会。会上,出门问问宣布开启自研大型语言模型「序列猴子」,以及集成大模型能力的三大系列产品 / 服务内测。

  三个系列分别为面向创作者的 CoPilot 产品矩阵、面向 C 端的升级版语音助手魔法小问,以及面向 B 端的企业专属大模型服务。其中,面向创作者的 CoPilot 产品矩阵包括 AI 写作平台「奇妙文」、AI 绘画平台「言之画」、AI 配音平台「魔音工坊」、数字人视频与直播平台「奇妙元」。

  大模型「序列猴子」,自测能拿 50 分

  序列猴子是一款百亿参数级的多模态大型语言模型,支持文字、语音、图片、3D 内容生成等多个任务。

  谈及大模型命名的涵义,出门问问创始人兼 CEO 李志飞,以数学家埃米尔 · 波雷尔 20 世纪初提出的 " 无限猴子 " 定理为类比,解释道:" ‘无限猴子’定理讲的是概率的事情。一方面可以认为只要给定无限时间,任何事情都是可能的;但另一方面实现概率非常低。而我们内部构想了一个序列猴子定理,也就是喂给机器猴子海量的文本序列,通过大规模算力训练,便会逐渐练成有智能的序列猴子。"

  据介绍,目前,序列猴子的核心能力覆盖 " 知识、对话、数学、逻辑、推理、规划 " 六个维度。

  在现场,李志飞对模型的上述能力进行了实时演示。从演示情况来看,序列猴子表现还算不错。比如它能够准确回答出 " 湖南和湖北哪一个省会的人口更多 " 的问题,并能阐述回答该问题的 step by step 推理过程。

  但是,和其他大模型一样,序列猴子仍然会出现回答冗长、文生图不对应等情况。例如,其根据 " 画一只赛博朋克风格的猫 " 的描述生成了一张长着两只猫耳朵的动漫人物图片。

  李志飞表示:" 任何一项高科技都要经历一个长时间的发展过程,早期随着时间推移,能力刚开始发展特别慢,到了某一阶段后会‘顿悟’、‘能力涌现’,再之后就是持续优化,不断提升能力,解决胡说八道等各种问题。序列猴子在训练过程中已经展现出了‘涌现’能力,但目前正处于‘顿悟’阶段,未来提升速度会越来越快。"

  那么,序列猴子到底能拿多少分?据介绍,李志飞坦言:" 我们做了一个比较客观的评测,收集了 500 多个问题,包括逻辑推理、数学计算、文案生成,并对相关模型的回答结果进行人工评分。如果 GDP4 是 100 分,GDP3.5 是 80 分,我们的模型就是 50 分。"

  而针对近期讨论较多的问题—— " 国内企业落后 OpenAI 多长时间 ",李志飞也给出了自己的答案,并再次呼吁 " 不要焦虑 "。在他看来,目前所有企业都处于 Google FLAN 模型(Google 2022 年 1 月发布的指令学习大模型)阶段,即落后 GPT-4 约 16 个月。

  不做硬件,商业化主攻 B 端企业专属模型

  事实上,据李志飞介绍,出门问问早在 2020 年就关注到 GPT-3 模型的发展,并开始尝试自研大模型,在 2021 年推出了大模型 UCLAI。但是,李志飞坦言,由于当时 UCLAI 的效果差强人意,同时难以在研发成本和商业化应用收益之间进行可预见的权衡,所以短暂放弃了。

  直到 2022 年,随着 Stability 开源 Stable diffusion 图像生成模型,GPT 系列模型优化,美国 Midjourney、Jasper AI 等一系列 AIGC 创业公司营收、估值飙升,李志飞在 2022 年 10 月决定重拾大模型研发。

  再出发的出门问问,相较于 2021 年,在大模型技术能力、语音助手等 AIGC 应用方面已经有了积累,但是,对如何做大模型这件事,包括如何商业化落地都有了新的看法。

  一方面,李志飞强调,出门问问是一家 AI 公司而非智能硬件公司。他指出,在未来公司将更关注大模型本身,包括软件或算法层面的技术研发和优化迭代,并会以赋能的形式与智能硬件厂商展开合作。

  李志飞表示:" 我们仍然认为,智能硬件会是大模型在消费端落地应用的很好的场景。我们最初做智能手表、音箱、耳机等硬件的主要目的,也是为语音助手找到更好的场景落地。但是,过去我们更多是自己做硬件,也做语音助手 /VPA 虚拟个人助理。因为在十年前做 AI,市面上还没有好的智能硬件。我现在需要强调的是,我们主要做的是 AI,接下来不做硬件。我们更多希望与(智能硬件)合作伙伴合作,为他们赋能。比如为硬件升级语音助手,与他们共同探讨如何利用硬件积累的大量有时间序列关系的数据,进行数据分析,创造更多价值。"

  另一方面,尽管出门问问推出了面向创作者、C 端、B 端三个系列的产品 / 服务,但公司未来会更关注 B 端,以及创作者小 B 端的商业化机会。李志飞指出:" 我们希望做企业定制类的服务,帮助他们提供专属模型,提供个性化答案,这会比一个通用大模型可能更加有用。"

  目前,出门问问面向创作者提供的产品矩阵,其盈利模式已经相对成熟,采取按月付费 + 按使用量付费的混合模式。据介绍,出门问问的奇妙文、言之画、魔音工坊、奇妙元四个 AIGC 产品在全球已经拥有超 500 万注册用户,其中付费用户超 100 万。

  在 B 端,出门问问已与春秋航空、趁早、中国移动、中国电信、易车 APP、中国工商银行、VIPKID 等 500 余个行业客户开展合作探索,覆盖企业咨询、教育培训、出海产品介绍、口播短视频、直播等多类场景。

  另外,在发布会上,李志飞表示,目前新的 B 端合作伙伴可能需要排队等候。他坦言:" 主要是因为模型现在规模较大,还没有做太多优化,所以对显卡的要求较高。这(缺卡)确实是现在一个比较现实的问题。一方面我们确实需要持续打磨模型,进行训练,另一方面我们又需要为海量用户提供服务。" 但是,他补充道:" 我相信算力问题可以慢慢解决 "。

上一篇:广州印象:古韵传说与画意花城
下一篇:原创终于明白吴京《战狼3》为何迟迟未开机!这电影占据天时地利人和