这段时间,ChatGPT成了全球科技企业“群起而攻之”的风口,几乎打开每一个社交媒体平台、每一个微信群,都在激情讨论ChatGPT。
不过我发现,经过一段时间的发酵,大家的情绪不再只是猎奇和兴奋,一部分AI业内人士,已经率先进入了ChatGPT冷静期。
一位长期从事NLP/AI的研究人士告诉我,NLP本来属于长期坐冷板凳的领域,ChatGPT对话中错误随处可见,LLM大语言模型的商业模式还不清晰,认知智能刚刚划过了冰山一角,对目前ChatGPT的一波波信息轰炸已经审美疲劳了,是时候给ChatGPT降降温了。
降温是不可能降温的,但找回常识和理性是必须的。
大胆预测,今年会是一个ChatGPT大年。
国产化的必然选择,股市与投资者的热捧,大量中国科技企业已经切实在跟进类ChatGPT,而且“chat”问答天然的低门槛和娱乐性,确实会吸引大量原本不关心技术的人开始玩AI。所以,尽管围绕ChatGPT,有很多疯狂炒作和无稽之谈,但热度势必还会持续一段时间。
当然,如果你已经对ChatGPT资讯有点审美疲劳了,好消息是,大部分人在“调戏”ChatGPT之后,猎奇心理也会消失。加上ChatGPT在应用和体验上还需要迭代,个人关注度会下降,而能够用ChatGPT带来业务价值的产业关注度,还会持续保温。
所以,ChatGPT接下来的发展,不是“要么火要么凉”那么两极分化,而是会经历一个恒温培育孵化的发展期。
担心中国做不好ChatGPT的,不用急,一切才只是刚刚开始;认为中国ChatGPT可以弯道超车的,不用嗨,新技术还是要按照规律按部就班地发展进步。
从第一代生成式预训练模型GPT-1到GPT-4,这条路OpenAI走了五年。可以说,没有对大模型的长期投入与探索,是不可能一步登天,做出ChatGPT这样的产品的。
那么,中国有没有类似的AI企业,拥有支撑起类 ChatGPT的综合实力呢?
通过国际权威咨询机构IDC新近发布的《2022 中国大模型发展白皮书》,我们可以一窥国内大模型实力分布。
评估结果显示,百度旗下的文心大模型表现非常突出,在市场格局中处于第一梯队,产品能力、生态能力、应用能力全面领先,给百度即将发布的生成式对话产品文心一言,提供了强大的技术支持。
让我们暂时排除“支持国货”的民族情绪,带着理性和常识去探究一下,文心大模型的水平到底怎么样?文心一言等类ChatGPT产品,究竟能为用户和市场提供什么样的价值?
拆解ChatGPT:一匹以大模型为骨架的“特洛伊木马”
ChatGPT的出现,代表了大语言模型的突破,将对话式AI与NLP技术带到了一个全新的高度,展现了AI的更多可能性和商用潜力。
上个世纪,信息哲学领军人卢西亚诺•弗洛里迪就说过,“人工智能就像特洛伊木马, 把一种更具包容性的计算/信息的范式引入哲学的城堡。”而ChatGPT就是一匹看起来极其神奇的特洛伊木马,令人类啧啧称奇,担心自己不再是城堡中唯一的万物之灵。
当然,归根结底,AI也好,ChatGPT也好,都是一匹人造的木马,由人类创造,也为人类所驱使。
ChatGPT这匹“特洛伊木马”的出现,更大的意义在于,它代表了一个标志——通过大模型这种方式,人工智能的知识瓶颈,是可以被打破的。
我们知道,算力、算法、数据,这AI三要素在当下基本得到了满足,带来了AI技术应用化的突破。但许多自然语言处理NLP任务,如机器翻译、情感分析、问答系统、语言生成等,需要模型具有一定的语言知识和理解能力。张钹院士曾提出:AI最重要的能力是知识。但知识,始终是AI的一个瓶颈。
ChatGPT的出现,标志着知识瓶颈是可以被打破的。通过大模型,学习海量的语料库,可以获取丰富的语言知识,对语言中的复杂结构、语义和逻辑,进行识别和处理。
大家感觉ChatGPT特别神奇,好像真的有自主思维一样,正是源自知识能力融入大模型后,在泛化性、通用性、迁移性上的强大表现。
它是一个标志,也只是一个标志。
因为ChatGPT也并没有彻底解决知识瓶颈,还存在一些局限性。比如由于中文语料不够多,获取的 中文知识少,所以对中文的理解和问答效果都不如英文,经常出现常识性错误。
那么,问题来了。OpenAI又不向中国大陆开放服务,对于优化ChatGPT的中文能力显然不会投入太多资源。同时,AI又广泛应用在安防、识别、智慧城市等重要领域,安全性和可靠性也决定了,发展国产化ChatGPT,成为了必然的选择。
好消息是,机会总是留给有准备的人,中国AI过去多年间不断积累升级,并没有在大模型时代令我们失望。
自2018年预训练大模型成为风潮后,中国AI领域快速跟进,已经积累了大模型所需要的全产业链要素,包括算力基础设施、数据集、算子库、 学习开发框架、AI开发工具,以及多个领域的大模型产品。
人家牵出了盘亮条顺的“特洛伊木马”,中国科技企业将自家拉磨的驴包装成汗血宝马,显然就不太合适了。国产大模型必须足够优秀,才能让国人和企业放心支持。
IDC此时发布《2022中国大模型发展白皮书—— 元能力引擎筑基智能底座》,首提大模型评估框架,是一个大模型比武的好契机,让我们可以综合评估国产大模型的实力。
从文心的三轮驱动,称称国产大模型的重量
投资市场有句话,“在短期,市场是个投票器;在长期,市场是个称重器。”遇到短期风口“猪也能在天上飞”,但长期来看,任何公司和概念都要靠扎扎实实的核心能力,长出翅膀,才能穿越风雨,持续腾飞。
放到ChatGPT概念上也一样,各种国产类ChatGPT产品出现,到底是骡子是马,得拉出来遛遛。
此次《白皮书》中,IDC搭建了大模型评估框架V1.0,选取国内主流厂商(N=9),从模型能力、工具平台能力、开放性、应用广度、应用 、应用生态共6大维度的11项指标,进行打分评估。结果显示,百度文心大模型的产品能力、生态能力达到L4水平,应用能力达到L3水平,处于第一梯队。IDC中国副总裁兼首席分析师武连峰认为,百度文心大模型是其打造文心一言的坚实基础。
现实进展来看,百度率先打开局面,即将推出类ChatGPT的生成式对话产品文心一言。
《白皮书》中提到,“模型+工具平台+生态” 三级协同,是OpenAI在开发GPT大模型过程中的核心思路,经过长期的积累,也更容易形成竞争壁垒。
我们不妨从这三个角度出发,去称称百度文心大模型的重量,究竟与OpenAI有何差距?
第一,大模型的产品能力。
模型层,是大模型的核心引擎,也是相关产品的主要优势和竞争赛点。
ChatGPT的成功,得益于大规模的数据集,较强的模型开发和算法调优能力,在NLP领域的长期积累,以及来自微软的计算资源支撑等。总的来说,打造一个像ChatGPT这样的大模型产品,需要对算法和技术有深入的理解,以及数据、算力等支持。
这方面,我们可以看到,百度要打造类ChatGPT产品,不是从零开始,而是有着长期积累和综合优势。
百度自2019年开始深入研发预训练模型,发布了知识增强的产业级大模型文心ERNIE1.0。在 学习的基础上融入知识,将海量的知识积淀和自研的多源异构知识图谱,投入到文心大模型的预训练中,在知识的指导下,文心大模型的效率更高、效果更好,可解释性更强。用于训练的数据量级也有显著优势,模型参数达到万亿级别。2020年开始将文心大模型应用到搜索业务,可以说,百度在破解AI知识瓶颈这一问题上的探索,并不比OpenAI落后,更比国内很多科技企业要早得多。
目前,困扰国产ChatGPT的算力资源和成本问题,百度也在开发文心大模型的过程当中,与国内外硬件伙伴合作寻找解决方案,百度飞桨 学习平台向下适配各种硬件,以支持文心大模型的开发、高性能训练、模型压缩、服务部署的各种能力。
可以说,百度在大模型方面有着贯通全产业链的积累,能够满足类ChatGPT产品的开发需求,具有较强的先发优势。
第二,应用工具平台。
大模型的落地应用,是海外AI研究机构很少提及,却是产业智能化不可规避的问题。真实的产业应用场景中,企业和开发者接入大模型的方式多种多样,有的需要产品级的API接口,有的希望能够开放 定制,有的则对成本非常敏感。
所以,要让大模型广泛应用,就必须平台提供完善的成体系的全栈工具链,包括 学习框架、基础模型库、数据集、端到端开发套件、API接口等,才能让更多行业人员或开发者,能够低门槛甚至零门槛的将大模型应用于自己的业务中。
目前,ChatGPT还是没有开源的,想要基于ChatGPT打造集成化的行业应用产品,还不现实。这一点上,和飞桨 学习平台生态共享的文心大模型,可以借助飞桨庞大且丰富的工具平台,以及AI开发社区,加速大模型的产业化应用,更快建立起商业闭环。
第三,行业生态。
正如OpenAI的首席执行官山姆·奥特曼所说,ChatGPT的技术不应该被保留在科技行业的狭小范围内,而应该拥抱真实世界。
但是,大模型与千行百业的融合,充满了未知的领域,要一个行业、一个行业去探索,与开发者、行业用户、上下游产业共创,这是一个苦活重活,确实大模型走向产业、拥抱真实世界的更优解。
生态建设上,百度文心大模型与飞桨 学习平台生态共享,前期已经做了大量的工作。《白皮书》显示,百度飞桨生态已经凝聚了535万开发者、服务20万家企事业单位,与12家硬件伙伴联合发布飞桨生态发行版、推动 学习平台与更多硬件适配,还与国内科研院所、实验室以及高校强强联手,一同攻克AI技术难关,目前赋能了389所高校,服务747名教师,学分课培养10万余名AI学子 。
在此基础上,文心大模型与众多头部企业合作,融合了通用数据和行业特有知识,推出行业大模型系列,比如能源行业NLP大模型国网-百度·文心、金融行业NLP大模型浦发-百度·文心等,显著提升了大模型在行业任务上的应用效果,也在重点行业形成了大模型落地应用的参考路径,给全球大模型走向商业化,起到一定的示范作用。
“模型+工具平台+生态”,三轮驱动下,一点点将大模型推向广阔的产业天地。
化解中国AI焦虑的另一种思路:大模型的产业突围
ChatGPT火爆之后,大家可能听到了类似的声音,认为中国科技企业不像OpenAI这样长期投入,中国AI缺乏元创新、底层创新,中国在ChatGPT上已经落后了追赶要花很多钱……
其实梳理百度文心大模型的进化史会发现,这些都是一种科技自立焦虑心理的“晕轮效应”,即因为某个细分领域、垂直领域的短板,而放大到对中国AI整体能力的质疑和虚无论,这显然是不客观的。至少在大模型这个领域,中国技术自信是很真实的。
ChatGPT热潮也体现出,大模型成为发展AI技术的必然选择。这也为化解中国AI焦虑,提供了另一种思路,那就是大模型的产业突围。
IDC认为,大模型将会助推数字经济,为智能化升级带来新范式。对行业用户而言,大模型已表现出巨大的潜力,企业应该尽早关注,在业务中布局。
但ChatGPT虽好,这类新技术在与行业融合时,实际中还会面对一系列适配问题,比如:
1.原始模型太大,难以在产线、矿山、园区等终端侧部署。
2.需要与行业专精知识相结合,开发定制程度更高、更安全可靠的垂直应用。
3.服务商自行开发类ChatGPT成本太高,难度很大,商业效益难保障。
所以,要打通ChatGPT等新AI技术向产业释放的一系列关节,真是“寻龙分金看缠山,一重山是一重关”,有着千山万水要过。这时候,围绕文心大模型这样的产业级平台,去撬动新技术的可能,或许才是真正的机遇所在。
在这个过程中,百度这样的AI头部玩家,接下来还需要做好三件事:
1.夯实AI基础设施。通过文心大模型与飞桨 学习平台,夯实AI基础设施底座,加速类ChatGPT产品的开发,持续技术创新的同时,提供基础模型、丰富工具栈、API接口等必要资源,成为各行业都可以低门槛引入AI的创新底座。
2.进一步加强生态开放。有活力的创新开发环境,才有中国AI应用的百花齐放,头部企业有责任为生态赋能,不断向开发者释放资源和支持。近日来,爱奇艺、集度汽车(通过Apollo)、小度、宇信科技、汉得信息、金蝶软件、宝宝巴士、智联招聘、太平洋汽车网等知名企业,都已经加入了百度文心一言生态圈,获得该AI技术的“加持”。据说,文心一言还将会推出生态伙伴计划,全面支持伙伴,共同发展商业市场。
3.探索无人区,不断推动新技术与行业问题的结合。尽管每次AI领域的技术突破都会引发很大的舆论关注,但AI在行业当中的渗透率只有10%左右,还有大量空白地带是可以与AI相结合的,需要头部企业去引导和探索,形成示范案例。
总之,中美AI或许在顶级科研、底层技术上有差距,但中国科技企业、从业者、开发者以及无数行业和企业,从来没有“躺平”过,一直在追逐着新技术的脚步。这些要素叠加在一起,是文心大模型的重量,也是中国AI的重量。
免责声明:此文内容为第三方自媒体作者发布的观察或评论性文章,所有文字和图片版权归作者所有,且仅代表作者个人观点,与 无关。文章仅供读者参考,并请自行核实相关内容。投诉邮箱:editor@fromgeek.com。
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。