8月31日消息(南山)今年堪称大模型爆发元年。国外以ChatGPT为代表,掀起了大模型投资热潮;国内随着百度文心一言在3月16日开启邀测,一批大模型如雨后春笋般纷纷冒出,“百模大战”已经打响。
不过,国内大模型此前均处于内测阶段,更多是圈内人申请内测名额,不熟悉玩法的广大公众基本无缘使用。从今日起,大模型正式掀开半遮的面纱,进入公众视野:百度文心一言宣布向全社会全面开放,广大用户可以在应用商店下载“文心一言APP”或登陆“文心一言官网”(https://yiyan.baidu.com),体验最新版本。
这意味着大模型技术走向成熟,也意味着大模型将迎接更多新奇的眼光、有趣的灵魂、千奇百怪的应用,从而发挥出更大的创造力。以百度文心一言为代表,大模型,躁起来了!
已在行业市场展现能力
在面向全社会全面开放前,百度文心一言一方面不断扩大内测范围,加快技术迭代升级;另一方面进军垂直行业市场,通过百度智能云千帆大模型平台,赋能行业数智化转型。据此前媒体报道,不到2个月时间,就有15万家企业申请加入百度文心一言内测。
在发布后不到半年时间里,百度文心一言取得了醒目的成绩:6月迭代的文心大模型3.5版本,训练速度提高了2倍,推理速度提高了17倍,模型效果累计提升超过50%。而8月最新数据显示,文心大模型训练速度提高至3倍,推理速度提高了30多倍。
8月升级的千帆大模型平台,全面接入 Llama 2 全系列、ChatGLM2-6B、RWKV-4-World、MPT-7B- Instruct、Falcon-7B 等 33 个大模型,成为国内拥有大模型最多的平台。接入的模型经过千帆平台二次性能增强,模型推理成本最高可降低50%。
技术侧和市场侧并跑且互相促进,使得百度文心一言整体能力愈加突出。据了解,在IDC发布的《AI大模型技术能力评估报告,2023》中,文心大模型3.5在12项指标中拿到了7个满分,在9个国产大模型中,综合评分、算法模型和行业覆盖均为第一。
在清华大学新闻与传播学院沈阳团队发布的《大语言模型综合性能评估报告》中,百度文心一言在三大维度20项指标中综合评分国内第一,中文语义理解排名第一,综合表现超过ChatGPT 3.5。
具体到应用方面,例如百度文心一言为国家电网提供大模型技术,用AI帮助预测用电的高峰波谷,为电网调度提供建议,双方联合训练了电力行业大模型;联合吉利汽车构建了工厂数字化大脑,帮助其降低了30%管理运维成本,提高了20%资源利用效率,等等。
对公众而言更重要的是,百度创始人、董事长兼首席执行官李彦宏此前提出,“百度要做第一个用大模型把全部产品重做一遍的公司”。目前,百度搜索、百度地图、小度等国民产品,已经融合了百度文心一言的能力,也就是说,大量公众其实在潜移默化中参与了“内测”,使用大模型服务。
李彦宏相信,当文心一言向数以亿计互联网用户大规模开放服务后,能够获得大量真实世界中的人工反馈,这将进一步改进基础模型,并以更快速度迭代文心一言,创造更好的用户体验。今天开始,百度文心一言面向全社会全面开放,能力迭代还将提速。
千亿研发投资奠定基石
“百模大战”的原因,是业界广泛认识到大模型技术变革经济社会的巨大潜能,为了不在新一轮竞争中落后,必须参与其中。可以看到,大模型的开发者来自云计算、AI、通信、游戏娱乐等多个领域的公司和创业公司,可谓鱼龙混杂,莫衷一是。
百度则不然。该公司多年来一直投资AI技术创新和大模型产品研发,早在2019年就发布了国内领先的文心大模型,基于文心大模型3.0版本训练的百度文心一言,则是国内首个大语言模型。为此,近十年累计研发投入超过1400亿元。其中2022 年百度核心研发费用超过214亿元,占百度核心收入比例达到22.4%。
在文心大模型和文心一言背后,是百度对人工智能时代技术架构的全新理解:IT技术栈从芯片层、操作系统层和应用层,演进到芯片层、框架层、模型层和应用层。大模型是“新IT四层架构”中的关键一环,但离不开其他三层架构的支持。
百度是全球为数不多、进行全栈布局的人工智能公司,从高端芯片昆仑芯,到飞桨 学习框架,再到文心大模型,各个层面都有领先业界的关键自研技术,并深入到行业应用赋能。这实现了层与层之间的反馈,推动IT架构端到端优化,从而大幅提升了推理、训练效率。
基于这一判断,百度进行压强式研发投资,赢得了业内的广泛认同。中国工程院院士邬贺铨评价,“百度文心一言作为国内互联网巨头布局大语言模型研发的重要一环,为各行各业带来更多的创新和变革,以其为代表的大语言模型正成为中国数字经济的新赛道。基于百度对中国文化的感悟和对中国市场的理解,相信能够做出不逊于国外公司的AI应用。”
对公众来说,百度文心一言的一系列能力提升更值得期待:截至2023年8月,百度文心一言熟练掌握的创作体裁超过了200个,内容丰富度是发布初期的1.6倍,思维链长度已经是发布初期的2.1倍,知识点覆盖达到了发布初期的8.3倍。同期,文心一言还发布了5个原生插件:百度搜索、览卷文档 (基于文档的交互插件)、E言易图(数据洞察图表生成插件)、说图解画(基于图片的交互插件)、一镜流影(文字生成视频插件),文心一言支持一次同时使用3个插件。
上述各项功能,对公众的工作、生活、娱乐各方面都可以起到较大的帮助。据悉,百度还将开放一批经过全新重构的AI原生应用,让广大用户充分体验生成式AI的理解、生成、逻辑、记忆四大核心能力。
过去十多年来,智能手机改变了人类的生活、娱乐、工作方式。可以相信,未来十多年乃至数十年,大模型将再一次全面影响人类社会的运行方式。站在“上帝视角”看,以百度文心一言为代表,大模型面向全社会全面开放,将是发生这一改变的重要时间节点。
- 蜜度索骥:以跨模态检索技术助力“企宣”向上生长
- 加速迈向万兆时代:聚焦5G-A商业成功正当时
- 智赋“中国方案”,酿造“世界味道” ——中企通信助力华润啤酒数字化转型之路行稳致远
- 年度营收将超400亿:超聚变瞄准“城企数智”新机遇
- 专访亨鑫科技宋海燕:“绿色”和“智慧”指引,推动通信行业可持续发展
- 中国移动云化语音网络新通话新建设备集采:4家中标,华为呈最大赢家
- “连接+算力”构筑数智底座:探访中兴通讯2024年PT展之旅
- 中国工程院院士沈昌祥:“六不原则”打造安全可信的算力网络新业态
- 中国移动5G消息系统三期工程设备第一批集采:中兴、华为两家分食
- 上海万兆光网基础设施全国领先 10G PON以上端口占比近99%
- 河南省工信厅李翔:全省算力中心将超100个,算力规模超6000P
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。