6月27日消息,据报道,日前,百度文心大模型3.5版本已内测应用,且在三大公开测试集上的评测中表现不俗,综合能力评测得分超过ChatGPT、部分中文能力超出GPT-4。
据《中国科学报》报道,3月,百度新一代知识增强大语言模型“文心一言”公开邀测。该模型基于文心大模型3.0版本打造。时隔3个多月,文心大模型3.5版本的效果、功能、性能全面提升。
百度首席技术官王海峰介绍,与文心大模型3.0版本相比,3.5版本在效果、功能、性能上全面提升,这不仅表现在文心大模型的创作、问答、推理和代码的提升上,还体现在训练速度和推理速度的提升上。
对比数据显示,文心大模型3.5的训练速度提升2倍、推理速度提升17倍。这将大大提高模型迭代升级效率,大幅降低训练及使用成本,进一步提升用户体验。
功能方面,文心大模型最大的一个变化是新增了插件机制。王海峰说,默认的内置插件“百度搜索”使文心一言具备生成实时准确信息的能力、长文本摘要和问答插件“ChatFile”支持超长文本输入,等等。
王海峰表示,下一阶段,文心一言将发布更多优质的百度官方和第三方插件,使用户能够更好地应用文心大模型。同时,文心一言将逐步开放插件生态给第三方开发者,帮助开发者基于文心大模型打造自己的应用。
王海峰透露,文心大模型3.5在基础模型训练中采用了飞桨最先进的自适应混合并行训练技术及混合精度计算策略,采用多种策略优化数据源及数据分布,大大加快了模型的迭代速度,显著提升了模型效果和安全性。
同时,百度文心大模型研发团队创新了多类型多阶段有监督精调、多层次多粒度奖励模型、多损失函数混合优化策略、双飞轮结合的模型优化等技术,使模型效果及场景适配能力进一步提升。
王海峰说,在此前的知识增强和检索增强的基础上,文心大模型3.5版本进一步提出了“知识点增强技术”。
具体而言,知识点增强技术首先是对用户输入的查询、问题等进行分析理解,并解析生成答案所需要的相关知识点,之后运用知识图谱和搜索引擎为这些知识点找到相应答案,最后用这些知识点构造输入给大模型的提示。
显然,知识点增强技术能为大模型注入更具体、更详细、更专业的知识点,显著提升大模型对世界知识的掌握和运用,使其完成各项任务的效果显著提升。
此外,在推理方面,研发团队通过大规模逻辑数据构建、逻辑知识建模、粗粒度与细粒度语义知识组合以及符号神经网络技术,显著提升文心大模型3.5在逻辑推理、数学计算及代码生成等任务上的表现。
媒体注意到,目前面向公众邀测的文心一言自5月23日以来,已升级到文心一言2.0,最新版本为6月21日上线的文心一言V2.1.0。该版本的更新信息有“上线官方插件ChatFile,可基于长文档进行问答和摘要”“优化了模型在数学计算和作文创作的能力”等,其背后正是文心大模型3.5提供的服务。
王海峰称,已获得邀测资格的用户可以随时访问服务,体验文心大模型3.5的实际效果。比如,当前百度“如流”已经基于文心一言的能力上线了“智能总结”“智能洞察”“超级助理”等多个新功能,倾力打造企业办公的统一入口、重塑业务流程、打破系统边界,实现工作模式的范式变革。
再比如,在智能编程方面,百度智能编码助手Comate已可根据自然语言的描述,生成对应的代码片段,支持在代码编辑区内根据注释自动生成代码,提升开发效率。
- 蜜度索骥:以跨模态检索技术助力“企宣”向上生长
- 阿里巴巴拟发行 26.5 亿美元和 170 亿人民币债券
- 腾讯音乐Q3持续稳健增长:总收入70.2亿元,付费用户数1.19亿
- 苹果Q4营收949亿美元同比增6%,在华营收微降
- 三星电子Q3营收79万亿韩元,营业利润受一次性成本影响下滑
- 赛力斯已向华为支付23亿,购买引望10%股权
- 格力电器三季度营收同比降超15%,净利润逆势增长
- 合合信息2024年前三季度业绩稳健:营收增长超21%,净利润增长超11%
- 台积电四季度营收有望再攀高峰,预计超260亿美元刷新纪录
- 韩国三星电子决定退出LED业务,市值蒸发超4600亿元
- 鸿蒙概念龙头大涨超9倍,北交所与新能源板块引领A股强势行情
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。