2016年,美国公司谷歌做出AlphaGo(阿尔法狗),打败了全世界顶级的围棋棋手,中国公司都在忙着送外卖;2023年伊始,美国公司OpenAI做出ChatGPT(一款聊天机器人程序),中国公司还热衷于送外卖。
这类声音随着OpenAI推出ChatGPT并迅速火爆全球而达到沸点。国内投资机构、行业媒体和观察人士开始遍历中国科技企业——究竟哪些公司在做大语言模型/生成式AI产品;哪家国内公司在人工智能和AIGC(人工智能生成内容)赛道有绝对优势以及大语言模型/生成式AI服务最佳应用场景是什么?结果不约而同都指向了一个熟悉的名字——百度。
文心一言是百度新一代大语言模型、生成式AI产品,也是国内第一个对标ChatGPT的重磅AI产品。3月16日,百度在北京总部召开新闻发布会,主题围绕“文心一言”。
百度全栈布局AI技术,才有“文心一言”
众人才恍然大悟,十几年前百度就投入AI研究,并在过去十年中累计投入超过1000亿投资AI,最终成为国内人工智能领域的NO.1。这期间,百度做出了国内规模最大的 学习框架“百度飞桨”、推出自研AI芯片“百度昆仑”、上线了全球首个自动驾驶开放平台Apollo、萝卜快跑累计订单量突破200万单、还做出了用户过亿的智能语音助手小度。
然而,这些成绩并未完全打消外界对于百度“文心一言”的疑虑,毕竟它要对标的可是当前全球最先进的AI大模型ChatGPT,甚至在微软耗资百亿美元投资OpenAI后,后者更是迭代出功能更为强大的GPT-4 。
3月16日下午14时,文心一言如期而至,终于揭开了庐山真面目。新闻发布会现场,百度创始人、董事长兼首席执行官李彦宏展示了文心一言在五个使用场景的表现,包括文学创作、商业文案创作、数理推算、中文理解和多模态生成。
在文学创作场景中,文心一言根据对话问题将知名科幻小说《三体》的核心内容进行了总结,并提出了五个续写《三体》的建议角度,体现出对话问答、总结分析、内容创作生成的综合能力。此外,文心一言准确回答了《三体》作者、电视剧角色扮演者等事实性问题。
在商业文案创作场景中,文心一言顺利完成了给公司起名、写Slogan、写新闻稿的创作任务。文心一言还具备了一定的思维能力,能够学会数学推演及逻辑推理等相对复杂任务。面对“鸡兔同笼”这类锻炼人类逻辑思维的经典题,文心一言能理解题意,并有正确的解题思路。
多模态生成方面,李彦宏现场展示了文心一言生成文本、图片、音频和视频的能力。有趣的是,文心一言甚至能够生成四川话等方言语音。
从现场展示来看,文心一言某种程度上具有了对人类意图的理解能力,回答的准确性、逻辑性、流畅性都逐渐接近人类水平。但李彦宏也多次提及,这类大语言模型还远未到发展完善的阶段,进步空间很大。在笔者看来,对标ChatGPT,这个门槛很高,但文心一言还是做到了“人有我有,人有我优”。
搜索作为AI大模型产品的最佳落地场景,未来用户仍将通过文心一言和ChatGPT来得到他们最想要的搜索结果。文心一言是高度本土化的AI模型,更加匹配中文环境的使用习惯,作为百度基本盘的搜索业务,不仅能够提供巨大的基础数据,而且在中文搜索上的显著优势,可以提升文心一言在运行时的准确性与时效性。
当前,ChatGPT似乎更愿意为用户提供经过主动加工的搜索结果,既让用户体验到多元化,也会造成幸福的“超纲”烦恼。百度则基于搜索业务积累,建成了世界上最大的知识图谱,致力于给用户提供唯一答案。这一切让文心一言回答准确性及生成结果的可信度得到提升,更符合国内用户的搜索习惯。
另一方面,百度在人工智能技术领域深耕多年,搭建了芯片、框架、模型、应用四层技术栈。其中,文心系列大模型参数规模达到2600亿,表现超越谷歌的T5和OpenAI的GPT-3,是全球最大的中文单体模型,在行业产业已经获得普遍应用。
有研究表明,数据规模大,参数达到千亿级,大模型就可能发生“智能涌现”,涌现出知识和逻辑推理能力。不仅仅是数据规模,百度的数据形态也最贴合回答和生成需求。在百度搜索中,问答和生成类的搜索请求占比很高。因此文心一言大模型,在自然语言问答和创意内容生成上有突出表现。
不过相比ChatGPT,进化版的GPT-4是一个多模态大型语言模型,使用了1.5万亿个参数,比GPT-3.5增加了10倍,也是目前世界上最大的人工智能模型。只是相较于免费的ChatGPT,用户使用GPT-4需每月支付20美元的订阅费。
从笔者目前观察对比来看,文心一言在本土化方面无疑是超越GPT-4和ChatGPT,而在文学创作、商业文案创作、数理推算、中文理解、多模态生成等综合能力方面,其能力应该介于GPT-4和ChatGPT之间。对于1.0版本的文心一言而言,这个成绩实属难得。
“一言”既出,二“马”难追
无论对于ChatGPT还是文心一言,搜索都是当下最有价值和最重要的应用场景。此前微软必应在接入ChatGPT后,其日活跃用户数历史首次突破1亿人,并且每天大概有三分之一用户,会与基于ChatGPT的Bing Chat AI进行交互。得益于此,必应移动端使用率也有所增长。这也让微软的老对手谷歌大为紧张。谷歌随后上马了聊天机器人产品Bard,尽管用户体验和市场反馈不佳,导致谷歌受到批评,但谷歌依然决定将该技术全面融入搜索、YouTube等重量级产品中。
文心一言的成功亮相,也使得百度成为国内首家推出生成式AI产品/大模型的唯一科技大厂,将阿里巴巴、腾讯、字节跳动等企业甩在了身后。与此同时,文心一言与百度搜索的融合,也将创造全新的搜索体验和商业模式。这也印证了此前李彦宏“引领搜索体验的代际变革”的宣言。
但如果把文心一言的价值,仅框定在搜索领域,那无疑是大材小用。基于百度深厚的应用生态和文心一言强大的生成式AI能力,其相互融合将引发一连串的蝴蝶效应。
ChatGPT催生了国外市场对AIGC服务的爆发式需求,国内市场需求同样强烈。在百度生态下,从搜索到智能云,再到自动驾驶,市场和合作伙伴都表达的强烈需求。短短一个月时间,超过600家行业头部合作伙伴宣布加入文心一言生态,期待尽早用上最新最先进的大语言模型。
笔者也不禁感慨,百度一直作为国内最优秀的技术公司之一,但能在短时间吸引到全行业的瞩目以及合作伙伴云集响应,这在近几年的百度身上未曾看到。从当年BAT三足鼎立的志得意满,到逐步被阿里巴巴、腾讯落下身位致使外界冠以“百度掉队论”,再到梭哈人工智能后的卧薪尝胆、厉兵秣马,百度始终不变的是以技术为使命,以用户为中心的企业价值。
回想当年,在腾讯和阿里围猎打车、支付、电商、社交等市场展开烧钱大战,不断攫取用户规模的时候,似乎只有百度在憨憨的重金投入深不见底的人工智能。在笔者看来,也正是百度这份“万古如长夜”的意气和孤胆,造就了国内在人工智能领域没有被强大的谷歌、微软甩在身后。人工智能被称为“计算机科学皇冠上的宝石”,这颗宝石最终没有像芯片一样被国外卡脖子。
事实上,在ChatGPT火爆全球之际,国内诸如百度、阿里、腾讯、京东、科大讯飞、360等大厂,都先后宣布将围绕ChatGPT展开动作或发布产品,但目前只有百度如期兑现,率先推出了文心一言。一方面证明了自己在AI方向的深厚内力,十年耕耘,终有收获;另一方面,似乎也让阿里和腾讯两大巨头一直坚持的商业大战模式相形见绌。在AI江湖,也重新奠定了BAT领域的排序。可谓是,一言既出,二“马”难追。
对标ChatGPT,百度吹响国内AI领军号角
如笔者前文分析,GPT-4相较于上一代有了不小的飞跃,这也让很多业内人士纷纷惊呼,“未来的AI时代难道还是美国的统治”,甚至也有声音担心GPT-4最终会对国内科技公司产生“毁灭性”打击。老话说,“人无远虑,必有近忧”,但这样的畏惧论也大可不必。
正如OpenAI创始人Sam Altman在推特上表示,GPT-4“仍然有缺陷,有局限性”。尽管GPT-4在多模态演示上有突破,可以输入图片内容,但是输出的却还只能是文字。用户最期待的图片、视频生成仅仅停留在PPT讲稿上,尚不知道何时上线具体功能。
另据外媒报道,一些用户在尝试使用GPT-4模式时,用户发现他们仍然在与基于GPT-3.5模型的ChatGPT进行交流。在一次互动中,ChatGPT坦言,尽管有GPT-4模型选项,但其实际运行的仍是GPT-3.5模型。这样招致不少用户吐槽,莫非单模态的GPT-3.5伪装成了多模态的GPT-4,这样的迭代升级似乎有欲速则不达的感觉。
笔者认为,文心一言的适时推出,不仅标志着百度正式吹响国内AI领军号角,有可以对标ChatGPT的底气;也标志着国产AI大模型产品将开始在各行各业逐步落地和为合作伙伴、用户创造价值。
根据硅谷著名投资人木头姐的分析报告,到2030年,人工智能可以将知识工作者的生产力提高4倍以上,在百分百采用的情况下,人工智能可以增加全球劳动生产率约200万亿美元,这远超知识工作者约32万亿美元的工资总额。
很显然,文心一言和生成式AI,是一个每家企业都不可以错过的巨大的机会。但真正的机会并不是从头开始做ChatGPT和文心一言这样的大模型,这既不现实,也不经济。这也是李彦宏和百度开放文心一言的真正价值。
李彦宏是这样讲的:“百度将进一步拓展搜索的市场规模,从而帮助越来越多的行业去构建自己的语言模型和应用,从而极大的提升各个行业的效率,我们正在搭建基于文心一言的AI生态系统。现在已经有很多的组织承诺,将会把文心一言与他们的产品和服务相结合。”
借助文心一言,有能力的企业可以构建自己的模型和应用,赋能交通、能源、制造等实体经济领域,实现生产效率的大幅提升;大部分的企业则可以借助这项AI工具去创造更好的客户体验,从而在行业里获得更强的竞争优势。
写在最后
写到这里,笔者才意识到,李彦宏一季度给自己定下的“引领搜索体验的代际变革”的OKR或许保守了。文心一言将推动人工智能技术进步,让所有人都能使用最先进的生产力工具,让所有人都能从中受益。
免责声明:此文内容为第三方自媒体作者发布的观察或评论性文章,所有文字和图片版权归作者所有,且仅代表作者个人观点,与 无关。文章仅供读者参考,并请自行核实相关内容。投诉邮箱:editor@fromgeek.com。
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。