我们习以为常的科技世界,正在以肉眼可见的速度被大模型所改变甚至重构。不想错失机遇的科技企业,都怀揣着造AI重器的梦想,各种大模型纷至沓来。
发布大模型只是开始,如同火箭发射,升空是第一步,后续能否顺利冲向太空、进入产业轨道,是一条充满了不确定的路。
有的企业耗费大量成本开发大模型,但实用效果不佳,发布之后就哑然无声、乏人问津,徒增了负担;有的大模型后续推动力不足,不能像OpenAI或百度一样,根据用户反馈持续推动大模型的迭代升级;有的则迷失了方向,找不到大模型进入产业的准确角度……
成功冲向天穹和产业轨道的大语言模型,文心一言,算是领衔的那个。
数据是最有力的佐证。5月16日,百度发布了截至2023年第一季度未经审计的财务报告,营收和利润双双超市场预期,其中营收311亿元,同比增长10%,净利润(non-GAAP)57亿元,同比大幅增长48%。
百度将这份稳健的业绩答卷,归功于生成式人工智能和大语言模型为各行各业带来的革命性潜力,以及百度及时布局大模型,文心一言开启内测,并计划逐步将文心一言融入百度的所有业务,围绕文心一言在新的时代中建立新生态,实现长期、可持续的增长。
借助文心一言这个“AI火箭”,百度业绩正冲向高处。
我们可以将文心一言的“动力装置”进行拆解,理解大模型的前进动力与产业价值。
飞桨+文心一言,全速前进
对于百度的业绩表现,有券商给出了这样的评价——百度是一个有多种催化剂的首选,如生成式人工智能、云和ADAS,可以推动多重扩张。
多重动力,这一特点也体现在百度大语言模型文心一言。
大模型要飞向产业轨道,光有前端的“航天器”是不够的,还需要算力、框架、生态等多重动力,提供足够的技术动能,来支撑整个旅程的不断加速。
就拿文心一言来说,发布之后行业伙伴普遍反馈效果好,一个主要原因是,能够根据用户反馈及时迭代强化模型能力、提高模型的推理效率、优化算力利用率,从而支撑大规模、高增长、高要求的产业需求。
而文心一言的全速前进,离不开与百度自研的产业级 学习框架飞桨的联合优化。
文心一言+飞桨的协同,为大模型注入了多重动力:
第一,不断提高的推理能力,性能提升近10倍
大模型在通用任务上的表现,需要根据用户反馈,来及时强化和提高模型的推理能力。
文心一言及背后的大模型,以飞桨做支撑,结合一言的模型结构特色和量化技术,完成推理引擎优化版本储备,从发布开始,平均保持着一星期左右完成1次迭代的速率,已经完成了4次迭代,相对第一版大模型推理服务,单机QPS已累计提升近10倍。这也意味着,文心一言的模型推理成本大幅降低,可为10倍数量的用户提供服务,大模型有望更加普惠地“飞入寻常百姓家”,落地各行业。
简单来说,就是文心一言的学习速度更快,变得越来越聪明。
另外,大语言模型的用户猛增,算力成为不容忽视的瓶颈,也进一步推高了算力成本。砸钱买算力是一个需要长期高投入的“无底洞”,提高模型算力利用率或是“治本”之道。基于飞桨分布式并行策略优化和训练精度策略调整,百度模型算力利用率将大幅度提升。
飞桨支持AI模型从训练到推理的全流程落地,AI大模型+ 学习框架的协同,是文心一言得以一飞冲天、向产业轨道加速前进的关键推动力。
大模型的多级动力装置
1909年,罗伯特·戈达德读了《月球上的第一批人》等科幻小说,开始对火箭动力学进行了广泛的理论研究,并提出了多级火箭的蓝图。根据动量守恒定理,火箭进入太空轨道,需要多级推进器,在航程的每个阶段,持续供给燃料,才能突破地球引力圈。
大模型要突破技术落地的限制,走向产业轨道,也需要一个层层推进的多级动力装置。
百度全栈AI技术,就组成了这样一个 “多级动力装置”,在大模型时代,让文心一言呈现出差异化的能力:
一是成长快速。
前面提到,模型层的文心一言,和框架层的飞桨,联合优化、相互促进、相互成就,是大模型效率、效果提升的最根本原因。飞桨集 学习核心框架、基础模型库、端到端开发套件、丰富的工具组件于一体,百度全栈自研产品,分布在百度人工智能四层架构,彼此适配度更高,可以高效协同,实现端到端优化,模型迭代开发的速度自然更快。
没有自研 学习框架的大模型服务商,要么从头开始研发,要么基于TensorFlow和PyTorch等 学习框架进行再开发,很难充分满足大模型的训练需求。
二是全面可靠。
大模型是当之无愧的“AI重器”,而围绕大模型展开的博弈,或许会在不远的将来,成为困扰大量行业用户的头疼问题。
每天与无数国人进行问答的大模型,建立在其他国家的 学习框架上,危险系数可想而知。因此,大模型的自立自强、安全可靠,必须将核心技术掌握在中国企业受众。
文心系列大模型,建立在百度长期部署的AI基础设施与底层自研技术之上,能够消除千行百业应用大模型的后顾之忧,加速产业智能化转型升级。
三是可持续发展。
大模型作为一种新技术、新产品,发展模式还没有成熟的路径可以借鉴,需要长期投入、探索无人区、试错迭代,摸索的过程也意味着大量的创新投入,一不小心就会掉队,紧跟行业趋势,补全大模型所需要的基础设施和配套技术,又会带来巨大的研发工作量和成本压力。
百度人工智能四层框架“芯片层-框架层-模型层-应用层”,布局完整、技术领先、应用落地,为文心一言构筑了持续竞争力。
举个例子,大模型如何落地业务场景,在很多行业还是个未知数,而得益于百度AI生态的产业实践和积累,文心行业大模型已经在电力、燃气、金融、航天、传媒、城市、影视、制造、社科等领域,展开了应用落地。
IDC发布《2022中国大模型发展白皮书》显示,百度文心大模型处于行业第一梯队,产品能力、应用能力、生态能力全面领先。
正如OpenAI的突破不是一朝一夕完成的,文心一言的“一飞冲天”,靠的并不是单一技术的炸裂,而是没有短板的百度AI长期蓄力,最终让文心大模型突破限制、飞向天穹。
百度AI,跃向无限可能,
火箭航程的最后一阶段,是让太空船能安然步入与行星同步的轨道。大模型的终点,则是与产业接轨,百度已经走到了这一环节。
大模型的浪潮还将持续,如何将大模型嵌入到产业中去,与产业应用结合?恐怕会成为未来几年内国产大模型的重要话题,或者说挑战。
我们关注文心一言的意义,就在于此。
有券商报告显示,自ERNIE Bot宣布以来,企业客户对基于云的ERNIE Bot服务的需求强烈,其中许多是新的云客户。此外,ERNIE Bot推出以来获得了大量高质量销售线索,许多已经转化为探索AIGC应用的共同开发项目。
AI基础设施和SaaS化服务,对云服务的直接带动作用,在百度财报中也有较为清晰的体现。百度智能云2023年第一季度营收为42亿元,同比增长8%,且在本季度实现盈利。在竞争激烈的云市场中实现盈利,是很多云巨头面临的难题,百度智能云则凭借AI的核心优势,找到了自己的节奏。随着文心一言的持续发力,百度在云市场的表现也有了更多可能性。
这些实打实的产业成绩单,都是大模型与产业接轨、百度AI技术成功转化的证明。拆解百度AI的成功路径,对于大模型和产业的后续影响,其重要性可能远大于财报本身。
文心一言完成与产业轨道的“最后一米”对接,我们可以看到一条路径:首先是技术能力的自证与他证,接下来是平台化的动力供给与工具完备,才有了文心与百度业务和行业应用的结合与落地。
文心一言与飞桨协同进化,共同组成新型AI基础设施,这一思路也为后来的大模型创新,踏平了道路。
敢为天下先的百度AI,也在“飞桨+文心“动力引擎的轰鸣声中,驶出了我们期待的中国速度和中国力量,驶向产业智能化的无限未来。
免责声明:此文内容为第三方自媒体作者发布的观察或评论性文章,所有文字和图片版权归作者所有,且仅代表作者个人观点,与 无关。文章仅供读者参考,并请自行核实相关内容。投诉邮箱:editor@fromgeek.com。
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。