SuperCLUE琅琊榜第五!香港中文大学(深圳)凤凰大语言模型即将上线

栏目:义务教育  时间:2023-08-26
手机版

  深圳新闻网2023年8月14日讯(记者 傅杨清 通讯员 马明霞)“我们可以开发一款专门用于校内的大语言模型,为校内师生提供个性化的智能学习和研究辅助,让学术探索更加高效和智能化!”这是2023年5月发生在香港中文大学(深圳)一次小组讨论时的对话。

  一次偶然的师生讨论,一直对学生学习与科研需求的关怀,让数据科学学院教授王本友有了一个大胆的灵感——做出一款专属于校内师生的大语言模型,真正将人工智能与校园生活无缝地结合起来。

  王本友带领博士生陈志鸿、计算机科学与技术专业的本科生研究助理刘禹恒,以及三位研究助理大数据科学专业本科生欧阳恺瑞、大数据科学专业本科生张一笛、大数据研究院的研究助理宋定杰等人经过数月的不懈努力,融合各自的专业知识,经过通宵达旦地研究、探索和迭代,一款名为“凤凰”的大语言模型拟在8月中旬发布内测版。

  

  “凤凰”大语言模型学生团队,从左至右依次为:2019级博士生陈志鸿、2020级本科生刘禹恒、2021级本科生欧阳恺瑞、2021级本科生张一笛。

  从模型和算法转到了以数据为中心

  据了解,“凤凰”大语言模型结合了全球领先的人工智能技术与校园教学、研究需求,是一款经过校内数据科学团队精心研发的一项人工智能应用,旨在针对校内数据进行指令微调,为广大师生提供智能化、高效率的学习与研究支持。

  大模型发展到现在,研究从模型和算法转到了以数据为中心(Data-centric),Data-centric是一个新概念,研发团队秉持以数据为中心的计算方式,完成了数据工程,指令微调反馈学习和检索增强等一系列关键步骤。

  其中,在数据工程环节,研发团队从香港中文大学(深圳)收集了丰富多样的校内数据,包括校园建设、教授信息、学生反馈等,数据量高达3万条。此外,为了让“凤凰”模型更好地适用于校园场景,在指令微调环节,团队还采用了渐进式的两阶段模型训练策略,提升模型在校园场景中理解并回答特定问题的能力。

  以前,为了获取校内各领域的资讯,师生可能需要在数十个校内公众号间来回切换获取信息。如今,有了“凤凰”大模型,只需轻松提出问题,“凤凰”将深入研究,呈现更加准确的信息,为学生的学术和生活提供便捷的指引。

  

  SuperCLUE琅琊榜第五

  据悉,“凤凰”是第一个多语言开源的类ChatGPT的语言模型。“凤凰”根据第三方排行榜SuperCLUE琅琊榜(中文通用大模型匿名对战评价基准)https://www.superclueai.com/ 的排名情况,它排名第五,为高校独立开发的首位。

  同时,英特尔公司专门选取“凤凰”模型做CPU的适配,参考https://github.com/intel-analytics/BigDL,彰显了模型的全球影响力和工业界影响力。

  

  第三方中文大模型排行榜,凤凰大模型排名第五名。

  (本文由香港中文大学深圳供图)

上一篇:得物App获权威机构认证,全方位保护用户信息安全和隐私
下一篇:锻造高素质专业化海事铁军——海事队伍“四化”建设助力广西海事高质量发展

最近更新义务教育