工业革命的秋之涟漪(一):百度飞桨&AI引擎

18世纪中后期,人类推开了工业革命的大门。

在此后的近250年里,世界经济迎来了从未有过的发展曲线,漫长的中古时期轰然倒塌,现代化的晨曦点燃了文明之光。

此后的岁月里,每当经济发展遇到瓶颈,社会问题凸显,新的工业革命总会适时出现。从蒸汽革命、电气革命,到信息革命,人类已经完成了三轮奇迹般的生产力增长。

那么,第四次呢?它将出现在何时,以何种技术作为主轴,又如何一步步改变我们的社会经济?毫无疑问,回答这些问题在这个时代无比重要。

幸运的是,互联网、云计算、大数据,再到AI的一系列发展,基本已经让第四次工业革命的首要问题产生了共识:这次全球行动注定由智能化来指挥,以 学习为代表的第三次AI崛起,将为各行业生产力再次飞跃提供原动力。

而与前三次工业革命不同,即将迎来的智能革命中,中国首次与世界站上了同一起点。

那么接下来的问题,是产业智能革命从理论可行到实际发展,如何一步步填补AI与现实生产力间的缝隙。这个10月,作为中国唯一功能完备的 学习开源平台,百度飞桨将迎来一系列走入工业化生产与现实世界的 。我们发现,沿着飞桨落地的脚步,恰好可以完整描述出从AI技术,到可用平台,再到产业实践与经济矩阵, 学习一步步扩散到现实世界中的行为逻辑。

如果说,得出AI与产业结合的可能性,是智能革命的春芽;那么收获AI渗透现实的真实路径,就是这场智能革命的秋实。恰好时至华夏大地满眼秋色,我们希望用一个系列,来追寻从飞桨蜕变,到第四次工业革命的先声。从 学习的一粒石子,到产业与国民经济的层层波澜,改变正在这个秋天层层震荡开去——也许可以称之为,工业革命的秋之涟漪。

第一层的故事,关于飞桨产业级 学习开源开放平台。10月16日,首届世界科技与发展论坛在北京举办,面对着现场来自全球20多个国家和地区的200多名院士、诺贝尔奖获得者、世界重要科技组织会员、大学校长和企业家,百度CTO王海峰发布“飞桨产业级 学习开源开放平台”,智能时代的操作系统,再次得以升级。

这件事改变了什么?让我们先从一切故事的背景说起:产业智能化的沃土,我们的中国。

一片土地的期望

工业革命是需要温床的,18世纪完成土地和宗教改革的英伦半岛,19世纪急需全球化经济的欧洲大陆,20世纪在硅晶片上孕育新时代的美利坚。必须有技术底座和强烈需求,才能孕育工业革命的动力和舞台。

而今天的中国,广泛的产业升级需求和供给侧改革,构筑了充分的工业革命需求;而互联网的长足发展,数据与计算底层设施的建造,则为智能技术提供了生长温床。二者相加,最适合AI技术投入产业应用,同时也是最需要AI技术完成生产力迭代的地方,都变成了中国。

智能革命发生于中国,是三种情况的交汇。首先互联网的长足发展,酝酿了人才与技术的底座,这股力量需要被引导向产业智能的新蓝海;其次,中国的产业结构完整而广泛,各行业或多或少都蕴藏了可以被AI技术完成“提质增效”的空间。在中美科技齐头发展的国际新局势下,国家经济整体对AI技术应用具有深层渴望。一系列需求构成了产业智能化命题最大的市场空间;同时需要看到的是,中国数字化渗透度不如发达国家,各产业的经济发展周期、人才储备情况、数字化水平参差不齐,这让AI深入产业充满了具体性与不确定性。AI基础平台与行业智慧的交融有待进一步探索。

全球前列的技术水准、广泛庞大的市场需求、复杂具体的行业挑战,这三者共同构成了这片土地与AI技术相遇时惊喜与困难并存的现状。虽然广义的前景无限光明,但当智能革命深入某个具体行业时,问题往往层出不穷。以 学习为代表的第三代AI技术,与以往软件应用不同的地方在于,它以机器学习和神经网络为基础特征,需要经历开发、训练、推理部署,最终走向产业应用。但这整套流程对于垂直行业来说,每个步骤都充斥着挑战:

1、AI模型的开发效率低、开发成本大,人才难以寻找。

2、能够支撑产业级别的AI训练,需要庞大算力和巨大的数据量,以及精度保障能力。这个环节往往是企业的最大负担。

3、模型在推理端的高时延、高能耗、低速度,容易造成AI应用不达标,形成临门一脚的失误。

4、千差万别的行业需求和应用特征,对AI技术的标准化、模块化、行业智慧结合提出了广泛挑战。

综合起来看,中国引领第四次工业革命,在今天希望巨大同时挑战巨大。解决这些问题,有很多种思路。但有一个逻辑是无可否认的:今天开发 学习模型,需要开发框架的支持;未来的产业智能应用,需要高度可用的操作系统作为底层算力、算法与行业应用的中间件——无论是今天还是未来,飞桨的战略价值都与中国的期待紧密相连。

一座车站

在讨论飞桨的价值生长时,我们必须要注意产业节奏的变化。

学习模型的开发,需要以开发框架作为基础工具,这在今天已经成为了常识。支持高并发训练部署的完整框架,是飞桨诞生时的价值指向,这时它是AI开发者的一种选择;随着产业智能化不断加深,国民经济应用AI的需求加强,自主可控变成了安全前提,这就让飞桨这个中国唯一功能完备开源平台的战略价值顺势凸显;接下来,占据了关键位置的飞桨,可用向上向下生长出更多算法、工具与解决方案优势,成为尽可能容纳开发、训练、部署周期,一站式解决AI应用困境的操作系统。

这个逻辑就像车站。当铁路贯通时,车站是必需品。而当中国AI的铁轨上,只有飞桨一座车站时,这座车站可以进一步扩容功能,为旅客提供尽可能多的服务。我们知道很多车站成长为了商业综合体,就是这个逻辑。

在王海峰发布的飞桨全景图中,我们可以看到飞桨的目标,是打造一个向下抵达芯片层、向下输出到应用层,容纳其中所有的开发支持与产业应用需求,从而打造标准化、模块化、自动化的AI入口。这就像智能手机时代,开发者只需要学习安卓/IOS,再懂基础的标准语言就可以进行开发。AI时代想要真正到来,同样需要一套类似逻辑的操作系统——这就是飞桨的发展轨迹。

目前,飞桨已经形成了体系完善、工具丰富的开发平台生态。在核心框架层面,提供开发、训练和预测一整套的技术能力;在此之上,官方支持包括自然语言处理、视觉、推荐和语音等在内的丰富的工业级模型库,以及支持语义理解、目标监测、图像分割等任务的端到端开发套件。工具和服务平台层面,提供自动化 学习、迁移学习、强化学习、多任务学习等工具组件和EasyDL、AI Studio等降低技术门槛的服务平台。最终形成了集 学习训练和预测框架、模型库、开发套件、工具组件和服务平台等为一体,功能完备、全面开源开放的产业级 学习平台。

当 学习的水滴投入现实世界,飞桨是它激起的第一层波澜。我们可能需要追寻的,就是这层涟漪如何向更远处蔓延。其实答案已经显露,王海峰对飞桨的最新定义,是产业级级 学习开源开放平台——显然,这里的关键点是“产业级”三个字。

这三个字代表了飞桨接下来的发展方向。一座车站,可能生长出一个商业综合体。接下来,更可能诞生一座城市,美国的奥尔良、芝加哥;中国的郑州、石家庄莫不如此。飞桨之城,就建立在第四次工业革命的中国底座中。

一条线

或许很多朋友,觉得“产业级”无非就是一个修饰。但是百度技术体系向来是不会随便添加修饰词的。相反,他们更喜欢把重要的技术更新,轻描淡写地说出来。

想要理解飞桨的“产业级”蜕变,需要知道机械学中有个概念叫做“工业红线”。我们自己在家也可以DIY一个发电机或者蒸汽机,实验室里可以制造机器复杂的机械设备,但是这些设备都无法投入工业应用,就是因为他们无法越过“工业红线”。

一种技术和设备,想要达到工业标准,需要满足一系列条件:成本控制、使用难度控制、生产效率达标、模块化组件、大规模生产支撑等等。所以产业工业化必须是一套完整的体系相互支撑,任何一个创新点如何达不到标准,都可能摧毁整个产业链的效率。

在今天,企业知道AI好用却无法用,所有困难本质上都因为AI相关工具和平台,无法达到切合产业生产需求的工业级标准。够快、够大、够简单,这些听起来简单的话题,其实是极其困难的部分。

而飞桨加上“产业级”,就是百度决定闯过这条工业红线的标志。具体来说,飞桨踏过产业级红线,来自于四个方面国际领先技术的突破:

1、人才线

想要挺进工业生产,我们就不能假定每个行业的AI开发者和技术人员都是天才大神。然而工业级的 学习模型却在持续复杂化,代码结构的理解难度不断提升。这给开发人员带来的巨大挑战。

想要AI走进产业,就必须让开发简单易懂,与如今同行的编程教育和行业并轨。为此,飞桨完成了基于编程逻辑的 学习框架技术,同时支持声明式和命令式编程,兼具开发灵活性和稳定性。也就是说,如今的编程从业者可以不经历漫长学习就能使用飞桨,企业的AI人才门槛也将极大降低。

2、训练线

工业级AI的基础特征,就是训练所用的数据和算力异常巨大,尤其是大规模个性化推进场景,需要超大规模的稀疏性特征训练,堪称AI中的重工业。再精巧是算法和工具,如果适配超大规模训练都没有意义。踏过训练线,是AI操作系统驶向未来的核心。

为此,飞桨平台率先突破了超大规模 学习模型训练技术,实现了世界首个支持千亿特征、万亿参数、数百节点的开源大规模训练平台,攻克了超大规模 学习模型的在线学习难题,实现了万亿规模参数模型的实时更新。这就像工业领域的超大熔炉和巨型锻造机,为未来更复杂的产业需求打造平台底座。

3、硬件线

AI驶向工业革命,一个基本逻辑就是需要把 学习技术与现实中的无数设备相结合,并且兼容复杂的异构算力、差异化平台,组成能够适应行业需求的解决方案。引申到操作系统中,这就需要技术中间层提供端到端部署的部署能力,实现软硬件一体优化。

这个领域,飞桨为产业世界提供多端多平台部署的高性能推理引擎。在推理方面,飞桨平台不仅可以和其他开源框架训练的模型无缝衔接,还可以轻松的部署到X86 CPU、ARM CPU、Nividia GPU、Mali GPU等不同架构的平台设备上。同时提供领先的推理速度。经过跟华为麒麟NPU的软硬一体优化,使得在NPU上的推理速度进一步突破。

4、算法线

最后到应用层,工业领域所需要的 学习算法,往往以超高效率、多模态为主要特征。这类算法的开发训练难度不低,企业往往无法自行研发。为了让工业级的AI算法普惠行业,飞桨提供面向产业应用的跨模态通用语义表示技术,开源开放覆盖多领域的工业级模型库。

截至目前,飞桨平台支持80多个产业实践中长期总结和打磨的主流模型,同时开源开放100多个预训练模型,搭配大量工具和服务层的能力,构成适合产业应用的算法+工具+服务综合工具箱。

每一条必须要跑过的路,飞桨都愿意和有能力比国际竞品多跑一段距离。累计起来,构成了世界AI框架领域,唯一的“工业过线者”。

产业级,三个笔画简单的字里,孕育了多个领域对已极限的突破,对未知世界的憧憬和洞察。

一圈涟漪

目前,飞桨 学习平台的开源开放,已累计服务了150多万开发者,拥有超过6.5万企业用户、在定制化训练平台上发布了16.9万个模型,真实推动了中国AI技术的标准化、自动化和模块化,加快产业应用步伐。

在从 学习到产业级开发平台的第一层涟漪之后,飞桨的能量震荡到广袤的产业世界与开发者群落,形成了第二层坚强有力的涟漪。

在接下来的第二篇里,我们将追溯工业革命的涟漪——飞桨向产业实践和开发者群落中的投射与尝试。

各行业的案例、大量真实场景的凝结、实践中的问题与解答,都在飞桨与这个秋天的相遇和成长。

作为产业AI引擎的飞桨,要在飒飒风声中,让世界听到它的轰鸣声。

免责声明:此文内容为第三方自媒体作者发布的观察或评论性文章,所有文字和图片版权归作者所有,且仅代表作者个人观点,与 无关。文章仅供读者参考,并请自行核实相关内容。投诉邮箱:editor@fromgeek.com。


企业会员

免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。

2019-10-16
工业革命的秋之涟漪(一):百度飞桨&AI引擎
幸运的是,互联网、云计算、大数据,再到AI的一系列发展,基本已经让第四次工业革命的首要问题产生了共识:这次全球行动注定由智能化来指挥,以 学习为代表的第三次AI崛起,将为各行业生产力再次飞跃提供原动

长按扫码 阅读全文

Baidu
map