字节上线豆包App:学霸、聊天搭子和专科老师,和快手AI打擂台
作者 | 虞景霖
编辑 | 邓咏仪
半年来闷不做声的字节,终于发布自家大模型的最新进展了!
没有一点点讯号,8月17日,字节跳动宣布开始对外测试AI对话产品“豆包”,进入官网(https://www.doubao.com/ )直接注册使用或通过官网提供的二维码下载App即可使用。
来源:豆包app
在“豆包”发布前,字节最新的AI进展,是6月被曝光的内部AI项目“Grace”。
据Tech星球报道,Grace在7月就开始小范围内测,再到如今改名“豆包”,正式与公众见面。
不过,据36氪最新获得的信息,字节Grace并不能算是豆包前身,Grace在内部的定位更像是个AI应用货架,“豆包”只是Grace团队开发的第一款产品。目前,扫描豆包官网的App下载按钮,官网会显示安卓和IOS App都只能下载Beta测试版本。
从名字“豆包”还有可爱的虚拟3D形象就可以看出,字节并不是希望做一个像ChatGPT那样的“学霸”工具,而是一个更亲民的产品。
进入默认页,可以发现“豆包”将页面分为两部分,左边是四个AI机器人,包括豆包、超爱聊天的小宁、英语学习助手和全能写作助手。右边是AI机器人对应的对话框。
来源:豆包app
四个AI助手有什么区别呢?
听豆包自己介绍——
来源:豆包app
总结来说,它们四个各有所长——
豆包是班长,哪里需要哪里搬;
超爱聊天的小宁是中国好同桌,聊天逗趣好搭子;
英语学习助手是英语课代表,全方位提高你的英语成绩;
全能写作助手是语文课代表,文学素养全靠它。
但这并不代表用户只能使用这四个默认AI机器人,就像在ChatGPT建立新对话框一样,用户可以通过创建新的对话框来“另起一个”,还可以编辑新对话的名字或者删除该对话。
来源:豆包
如果你向豆包提问:豆包是谁?可以做什么?
来源:豆包
来源:豆包
自ChatGPT横空出世,同样作为生成式人工智能,豆包和其他生成式人工智能大语言模型相比,有什么优势和劣势?
来源:豆包
下面再来看看“豆包”的“语言理解能力”。
来源:豆包
若提问四大名著,“豆包”回答准确,且在理解小说内容方面表现良好。
相比之下,豆包在“总结”劣势方面表现得相当诚实——它的准确性确实有待提高。
当我们随机输入一道数学题:
来源:豆包
正确的答案应该是[0,1),即使重新回答,也依然提供了错误答案......
来源:豆包
如果不是数学学科又会如何?
来源:豆包
回答正确!
另外,从测评来看,“豆包”仅支持回答“有科学依据”的问题。
来源:豆包
除了中文,“豆包”还支持英文对话,点击右上角即可切换语言。
来源:豆包
有传言称国产大模型缺乏自己的数据库,需要大量借助英语国家的数据进行训练,“豆包”是否会这样,切换语言测试一下:
从讲笑话来看,“豆包”在中英文的表现半斤八两。
来源:豆包
无聊的时候可以找“超爱聊天的小宁”聊天,它是否是一个合格的聊天好搭子呢?让我来测试一下!
来源:豆包
小宁的“默认状态”就好像水豚,相当稳定与严肃。但十分听话,当你希望它切换风格的时候它能立即切换。
全能写作助手不仅可以根据要求生成诗歌,还提供了阅读鉴赏功能。
来源:豆包
尽管这首《田间之歌》的诗句并不那么优美,但这首诗可仅仅只用了10s不到。
当我们向“英语学习助手”提问时,它的回答表现又如何呢?
来源:豆包
根据提问建议,我尝试询问它“ban”和“interdict”两词的区别,可以看到,“英语学习助手”的回答并不完全是英文。
如果觉得英文的回答中仍然不好理解,可以让“英语学习助手”把它转化为中文,双语切换,十分丝滑~
总体而言,“豆包”目前能够支持一些简单问答,准确性有待提升。
并且,现在豆包是仅支持文字生成,暂时还没有上图片功能。
豆包也还没有联网。根据字节官方介绍,“豆包”的训练数据截至2023年之前,因此无法回答2023年的相关问题。
相较于国内其他互联网企业,字节尽管早在2月就开始了大模型团队组建,但到真正发布第一款产品“豆包”,可谓是姗姗来迟。
字节在人工智能领域布局已久。2016年,字节就成立了人工智能实验室AI Lab,聚焦于自然语言处理、机器学习、数据挖掘等方面的研究。
不过,国内“大模型之战”掀起后,字节一直没有公布任何底层大模型的进展。
反倒是在6月,火山引擎先发布了大模型服务平台“火山方舟”,给国内大模型公司提供算力和其他配套服务。
来源:火山引擎
而到最近发布豆包,字节大模型团队其实悄悄放出了不少进展。
7月,一个名为BuboGPT的大模型正式上线Github,背后同样是字节跳动团队。
BuboGPT是一个多模态大模型——BuboGPT能够将文本、图像和音频等多模态输入进行整合,在图像音频数据处理方面表现出了出色的对话能力。
官网:https://bubo-gpt.github.io/
来源:BuboGPT
BuboGPT最牛的地方在于听音辨位。
来源:BuboGPT
以上图为例,只需要上传一段音频一个图像,BuboGPT就能快速识别音频来自于图像的哪个地方,并且贴心地用边界框帮你框出来!
从BuboGPT中,也可以看出字节大模型的方向——结合图像和文字,做多模态的应用尝试。
可以想见,这和字节的业务密切相关——作为APP工厂,字节旗下有抖音等多个C端应用,在音视频上的应用场景非常丰富,在这方面发力,也是合情合理。
不过,字节扔的豆包还热乎着,字节的老对家——快手,显然是按捺不住了。
8月18日晚,快手突然宣布,“快手AI对话”安卓版本开放内测——此前,快手AI已经在8月初进行过一波小范围测试了。
但字节豆包还是一个独立app,但显然快手在应用上想抢先一步,快手AI对话直接就内置在快手中。
使用方法上,用户只需要点击快手搜索首页右上角的AI图标,直接输入内容或者点击引导问题,就可以开始对话。
另外,用户也可以触发「搜索智能问答」卡片,通过底部入口使用这项功能。
来源:快手
在大模型的支持下,用户能够更加高效的找到自己感兴趣的主播或者视频。
来源:快手
来源:快手
快手AI对话,也是首个基于大语言模型在短视频直播行业落地的应用产品。
国内大模型混战依旧火热,各家厂商在辛勤耕耘底层的大语言模型时,在应用端的争夺也已经开始——
AI 大模型逐渐进入各种终端和国民级应用之中。比如最近,华为和小米都已经把大模型放到自家手机系统当中了。
如今,“抖快”均发布AI应用,无疑是国内大模型落地的又一个重要节点。
来源:公开网络
参考资料:
https://arxiv.org/pdf/2307.08581.pdf
举报/反馈
最近更新幼儿教育
- 枣庄市庆祝建队节暨流动少年宫15周年和科普大篷车特别活动走进
- 原创光荣!女排2米副攻从985名校毕业,照毕业照鹤立鸡群化身小巨人
- 探索“大中小贯通式创新人才培养”,博导指导高中生学术研究
- “荆门政法先锋”系列事迹(十八)|他,是“游走的”司法所所长,也是村里的“灭火器
- 在今日凌晨进行的一场欧冠小组赛中,曼城3-1击败年轻人
- 上海:世界技能博物馆11月7日起正式对公众开放
- 国考2024岗位表发布,招录3.96万人
- 电信业务发展稳中有升,5G用户和基站数量呈快速增长趋势!
- 四川宜宾:三大举措提高优待证含金量
- 浅析小学数学课堂教学的有效性
- 曾立新率团赴澳门高校访问并参加内地与澳门产学研合作路演对接会
- 湘潭下摄司大桥建设有条不紊 2025年6月或达通车条件
- 【品质新生活】涉及玩具、教育、婴童用品领域……一波展览将在本周开展
- 托福机经是什么
- 美国宾夕法尼亚大学宣布决定:将追授林徽因建筑学学位
- 共设22站!全长约28.6公里!23号线建设迎新进展,此外……
- 京津冀密集发布多项协同举措,涉及国土规划、康养合作等
- 「东莞市技师学院专业风采」④中西式面点:匠心追梦 师生在各类大赛中频频获奖
- 诗画乐至,岂止农桑跫音或乡音的侠骨柔情
- 广东2024年普通高考报名问答(六)
- 为新时代干部教育培训工作高质量发展提供制度保证
- 正观漫读丨嘴刁的信阳男人
- 巴以冲突升级,油价向好“开足马力”
- 小商品城正式发布全球首个商品贸易领域大语言模型
- 南充文旅產業煥發新氣象