腾讯自研混元大模型亮相，将通过腾讯云对外开放

栏目：职业教育时间：2023-09-15

　　国产大模型进入长跑期，从参数至上转向实用优先。

　　在今天举行的 2023 腾讯全球数字生态大会上，腾讯混元大模型亮相，并宣布通过腾讯云对外开放。据悉，腾讯混元大模型是由腾讯全链路自研的通用大语言模型，拥有超千亿参数规模，预训练语料超 2 万亿 tokens，具备强大的中文创作能力，复杂语境下的逻辑推理能力，以及可靠的任务执行能力。

　　据腾讯称，腾讯混元大模型是 " 从实践中来，到实践中去 " 的实用级大模型。腾讯云、腾讯广告、腾讯游戏、腾讯金融科技、腾讯会议、腾讯文档、微信搜一搜、QQ 浏览器等超过 50 个腾讯业务和产品，已经接入腾讯混元大模型测试，并取得初步效果。混元大模型将作为腾讯云 MaaS 服务的底座，客户不仅可以直接通过 API 调用混元，也可以将混元作为基底模型，为不同产业场景构建专属应用。

　　腾讯集团高级执行副总裁、云与智慧产业事业群 CEO 汤道生表示：" 以大模型生成技术为核心，人工智能正在成为下一轮数字化发展的关键动力，也为解决产业痛点带来了全新的思路。大模型需要基于产业场景，与企业数据融合，才能释放出最大的价值。"

　　全链路技术自研，在中文理科、高考题和数学上表现突出

　　腾讯集团副总裁蒋杰介绍，腾讯混元大模型从第一个 token 开始从零训练，掌握了从模型算法到机器学习框架，再到 AI 基础设施的全链路自研技术。

　　从 2021 年开始，腾讯先后推出千亿和万亿参数的 NLP 稀疏大模型，打破 CLUE 三大榜单记录，实现在中文理解能力上的新突破。

　　目前，业界大模型在场景中的应用依然有限，主要集中在容错率高、任务简单的休闲场景。腾讯在算法层面进行了一系列自研创新，提高了模型可靠性和成熟度。

　　针对大模型容易 " 胡言乱语 " 的问题，腾讯优化了预训练算法及策略，让混元大模型的幻觉相比主流开源大模型降低了 30% 至 50%；通过强化学习的方法，让模型学会识别陷阱问题；通过位置编码优化，提高了超长文的处理效果和性能；提出思维链的新策略，让大模型能够像人一样结合实际的应用场景进行推理和决策。

　　得益于全链路自研技术，腾讯混元大模型能够理解上下文的含义，并且有长文记忆能力，可以流畅地进行专业领域的多轮对话。除此之外，它还能进行文学创作、文本摘要、角色扮演等内容创作，做到充分理解用户意图，并高效、准确的给出有时效性的答复。

　　在中国信通院《大规模预训练模型技术和应用的评估方法》的标准符合性测试中，混元大模型共测评 66 个能力项，在 " 模型开发 " 和 " 模型能力 " 两个重要领域的综合评价均获得了当前的最高分。在主流的评测集 MMLU、CEval 和 AGI-eval 上，混元大模型均有优异的表现，特别是在中文的理科、高考题和数学等子项上表现突出。

　　上海财经大学校长刘元春认为：" 借助于全链路自研，中国将不断积累大模型相关人才和技术，逐渐形成体系化的产业链、人才链、技术链和创新链，最终走出一条发展通用人工智能的中国路径，助力我们在数字技术的创新上取得突破性进展。"

　　腾讯全面拥抱大模型

　　腾讯自研混元大模型亮相，也代表着腾讯在大模型上的全面拥抱态势。蒋杰表示，研发大模型的目标不是在评测上获得高分，而是将技术应用到实际场景中。"

　　此次大会上，蒋杰展示了腾讯会议、腾讯文档、腾讯广告等多个业务，在接入腾讯混元大模型后的实际应用情况。比如腾讯会议基于混元大模型打造了 AI 小助手，只需要简单的自然语言指令，就能完成会议信息提取、内容分析等复杂任务，会后还能生成智能总结纪要。据实测，在指令理解、会中问答、会议摘要、会议待办项等多个方面，混元大模型均获得较高的用户采纳率。

　　在文档处理方面，腾讯混元大模型支持数十种文本创作场景，在腾讯文档推出的智能助手功能中已有应用。同时，混元还能够一键生成标准格式文本，精通数百种 Excel 公式，支持自然语言生成函数，并基于表格内容生成图表，目前这些功能正在内测阶段，将在成熟后面向用户开放。

　　据了解，今年 6 月，腾讯云推出了模型即服务（MaaS）解决方案，提供涵盖模型预训练、模型精调、智能应用开发等一站式的行业大模型服务。最近，腾讯云也全面接入 Llama 2、Bloom 等 20 多个主流模型，和混元一样，都支持直接部署调用。客户可以根据实际需求，基于混元、也可以基于开源模型，打造自己专属的行业大模型。

　　作者：徐晶卉

　　编辑：商慧

　　责任编辑：戎兵

　　* 文汇独家稿件，转载请注明出处。

上一篇：花样迎新家校共育！德州学院7350名新生启航逐梦
下一篇：头部企业集中落户福田，这里已成建装行业头部企业集聚区

腾讯自研混元大模型亮相，将通过腾讯云对外开放

最近更新职业教育