1725年,法国的纺织工人Basile Bouchon发明了一种织布机,可以根据送入的穿孔卡片指令编织图案。打孔的是“1”,没有打孔是“0”。这几乎是最早出现的二进制代码,虽然此后执行的机器发生了很大变化,但代码的基本构建块却就此延续了下来。
三百年后,编程已成为改变世界的无形力量。今天我们手中的智能手机、办公室的自动化系统甚至工厂的智能制造,它无处不在。
但AI浪潮的席卷速度,不仅超过了以往任何一场技术革命,也让编程有了另外一种可能——按照李彦宏的说法,大模型和生成式AI将彻底改变开发者这个群体。
而在这背后,是百模大战后徐徐铺开的AI原生应用建设,以及在这关键的赛道上,中国企业已经率先站上了起跑线。
AI原生应用开发,没那么复杂
到目前为止,全世界已经发展出超过600门的编程语言。从语法简单只有32个keywords的C语言,到以但丁《地狱》中第八层地狱命名的Malbolge(第一个程序花了两年时间才被写出来)。
但无论是哪种编程语言,开发者想要创建程序就要敲下海量的代码。随着代码量越来越大,程序开发工作也变得无比繁杂。
例如Windows 95只有1500万行,Windows XP为3500万行,而目前程序员写出来的最大软件是Google在线服务,大概是20亿行代码,大概是一名程序员正常发量的13000倍。
而当前正值移动互联网转向AI时代,按照李彦宏的观点,AI时代需要100万量级的原生应用,趋近2021年手机App总量的三分之一。
如果参考支付宝仅2019年一年就增加了4亿行代码(相当于80个魔兽世界)的话,AI原生应用需要程序员敲下的代码量可想而知。
而且AI原生应用在逻辑上完全不同于Native App,需要以AI为出发点,将AI作为核心驱动力,重新设计和构建应用。
不久前,一位开发者在论坛上发布了一则AI原生应用速通指南,虽然开发流程只有5条,但对于开发者来说工作量并不低,仅数据准备一项就要耗费大量的人力物力,更别提需要用到的关键技术。
但随着Transformer推开大模型时代的大门,不仅AI应用的转机来了,程序员开发者的转机也出现了。
在AI时代,科技巨头们不仅在意如何让技术更容易地被用户接受,同时也在思考如何简化程序员的工作。
去年OpenAI推出的GPTs和今年Hugging Face发布的HuggingChat助手,它们通过将能力封装,把开发门槛拉低,进而创造了一个新的职业——不会编程的开发者、任何一个普通用户都能创建自己的AI应用。
如今,给普通人搭梯子的名单上又多了一家科技巨头,并且是使用中文作为自然语言prompt。
“人人都是开发者”
「打开开发界面,第一步给应用起名,第二步填写角色指令,第三步再插入需要的工具组件。」
这是出现在今年Create2024百度AI开发者大会上的一幕。在零代码的情况下,一个AI原生应用就生成了。
开发者借助百度发布的AI原生应用开发工具AppBuilder,不写一行代码,最快只需三步,就可以用自然语言开发出一个应用,并且还能便捷地发布、集成到各种各样的业务环境中。
在AppBuilder上面,百度也提供了一定的跨模态能力,开发者只需要给一段文字,或者几句话,就可以快速创建绘画类应用。百度文库最新推出的漫画生成和绘本生成功能,就利用了AppBuilder上提供的这类组件。
关键,类似这样的开发工具,百度一口气发布了三款,除了AppBuilder,还有智能体开发工具AgentBuilder和面向专业开发者的ModelBuilder,主打一个「开箱即用」。
其中,AgentBuilder也是零代码开发,整个过程完全不需要编程,通过类似prompt(提示词)的信息输入,和简单的几步操作调优,就能迅速生成一个智能体。目前百度已经与携程合作,提供酒店、景点、票务等旅游服务工具。
而为专业开发者准备的ModelBuilder,可以根据开发者的需求定制任意尺寸的模型,并根据细分场景对模型进一步精调,达到更好的效果。
ModelBuilder中既包括适合通用复杂场景的旗舰版ERNIE3.5和ERNIE4.0,也有Speed、Lite、Tiny三个轻量级大模型和ERNIE Character、ERNIE Functions两个垂直场景模型,也覆盖了国内外其它第三方主流模型,预置量多达77个大模型,是国内拥有大模型数量最多的开发平台。
前两款工具可实现“人人都是开发者”,相当于是AI原生应用的冲量担当,而后一款工具则是保质担当。
李彦宏判断,未来绝大多数的AI原生应用都是MoE的,也就是大小模型混用,不依赖一个模型来解决所有问题。
而ModelBuilder也是参考MoE思路,开发者在一个平台上可调用多个大模型,意味着开发成本和产品性能都能达到相对最优。
大会上展示的小度添添AI机器人日程规划功能,就是调用了不同的模型。
先是由小模型ERNIE Tiny执行“模型路由”工作,把晨跑中的天气问题分配给基于ERNIE Lite打造的精调模型,快速查出气温25度、天气晴朗这些信息;同时,又把更复杂的日程安排,分配给性能最好的文心4.0大模型,来计算一天各项事项安排。
总的来说,MoE架构既能提升开发平台的“宽度”,也能兼顾“ ”,大大降低开发时的算力消耗,降低应用门槛。
对多模态大模型而言,百度推出的三大AI开发神器,将会加速killer App的出现时间,而对于视觉大模型来说,其最大应用场景——自动驾驶,早已被市场验真了。
百度在视觉大模型的发展有目共睹,不只是训练AI如何生成视频,更是训练AI理解和生成一个真实的场景或世界。
基于超过1亿公里的中国复杂城市道路测试里程数据,百度训练出来的Apollo视觉感知大模型,具备检测、跟踪、理解、建图四大基础能力。百度也将这些能力下放到了具体产品,比如已在武汉实现7X24小时全天候运营的萝卜快跑,以及将视觉感知大模型应用到了制图领域的百度地图。
梯子要稳固
去年,著名计算机科学家吴恩达曾在斯坦福做过一场题演讲。他认为AI其实和电力、互联网一样,是一项通用技术,更多的机会在于大规模应用落地。
这与李彦宏此前的观点不谋而合。在基础模型之上,要有千千万万甚至数以百万计的AI原生应用,大模型的价值才能被体现出来。
而今天百度发布的三大AI开发神器,相当于搭了一把梯子,让开发者和企业能够不费力的进入AGI时代。但这里面一个重要的前提是,这把梯子要足够的稳固。
而所谓稳固,指的就是基础大模型的技术水平要过硬。
从数据上看,相比一年前文心大模型的算法训练效率提升了5.1倍,周均训练有效率超过了98%,推理性能提升了105倍,推理的成本降到了原来的1%。也就是说,客户原来一天调用1万次,同样成本现在可以调用100万次。
发布一年零一个月以来,文心一言用户数突破2亿,API日均调用量也突破了2亿,服务的客户数达到了8.5万,利用千帆平台开发的AI原生应用数超过了19万。
对于企业和开发者来说,基于文心大模型开发原生应用、做二次开发,都能够拥有更低的推理成本和更高的训练效率。
这主要基于李彦宏此前对大模型一个精准判断,与模型开源会越来越落后不同,闭源有真正商业模式,能够赚到钱,且在成本上有优势,只要是同等能力,闭源模型的推理成本一定是更低的,响应速度一定是更快的。
事实上,有了强大的基础大模型,百度能提供很多低门槛,甚至零门槛的开发工具,大大提高开发者的生产力。比如三大AI开发工具之外,基于文心大模型的智能代码助手Comate。
不仅支持100多种语言和所有主流IDE平台,可以推荐代码、生成代码注释、进行代码续写、查找代码缺陷、给出优化方案,还可以 解读代码库、关联私域知识生成新的代码。
上岗一年多以来,Comate已经走入了喜马拉雅、三菱电梯、软通动力等上万家企业,生成的代码采纳率达到了46%,百度每天新增的代码中,已经有27%是由Comate生成的。
显然,想要壮大AI原生应用生态,仅靠某一家公司远远不够,需要发动更多人一起参与创新。
去年5月,百度启动了“文心杯”创业大赛,帮助创业者、开发者开发各种AI原生应用。在第一届大赛中,百度为15支优胜团队提供了数千万元的资金支持,并在技术、团队和资源上持续提供全方位扶持。今年将扩大项目筛选范围、设置分赛场,加大对创业者的支持力度,特别优秀的项目将有机会获得最高5000万人民币的现金和资源支持。
尾声
2023年6月,Open AI安全系统负责人&前应用研究负责人Lilian Weng在博客中发表了一篇文章《大模型驱动的自主代理(LLM Powered Autonomous Agents)》。
Lilian Weng将AI发展路径类比自动驾驶L1-L5,而人类当前所处的位置正好从Copilot向Agent过渡。
这对人类社会而言,意味着一次巨大的变革正在孕育,它将惠及产业和生活的方方面面。而在这个过渡阶段里,如何让更多“高楼大厦”在大模型的地基上拔地而起,正是中国在生成式AI的赛道上,实现反超的最大机会。
与此同时也是百度的巨大机会。文心一言、百度文库、百度新搜索等,AI原生应用释放出的新变现机会,将开启长期增长空间。
中国有10亿互联网用户,有强大的基础大模型,有足够多的AI应用场景,有全球最完备的产业体系,国家也在大力鼓励和支持“人工智能+”行动,每一个人,每一个企业,只需要充分利用这些工具,就可以释放无限的创造力和生产力。
免责声明:本文基于已公开的资料信息或受访人提供的信息撰写,但解码Decode及文章作者不保证该等信息资料的完整性、准确性。在任何情况下,本文中的信息或所表述的意见均不构成对任何人的投资建议。
免责声明:此文内容为第三方自媒体作者发布的观察或评论性文章,所有文字和图片版权归作者所有,且仅代表作者个人观点,与 无关。文章仅供读者参考,并请自行核实相关内容。投诉邮箱:editor@fromgeek.com。
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。