又是一年云栖时。
阿里的云栖大会,堪称科技众的年度狂欢之一。而今年似乎格外特殊,阿里云十岁生日,阿里巴巴集团20周年,似乎都让今年的云栖有点不同。而从技术从业者的角度来看,或许另一个不同更加引人注目:被广泛认知为互联网公司的阿里,今年云栖上唱主角的居然是一款AI芯片。
9月25日,达摩院院长张建锋现发布了“全球最强的AI芯片”——含光800。在AI行业目前被广泛作为标准化测试的ResNet-50中,含光800推理性能达到78563IPS,刷新了AI推理芯片的世界纪录。
如果站在大众舆论中看,或许我们很难把阿里和“最强AI芯片”这两件事联系在一起。也许会认为其中充满了反常识和突如其来。
但如果站在计算与智能产业的时间迭序上看,或许会又对含光800抱有完全不同的看法:这枚最强AI芯,并不是阿里的转型之作。反而阿里始终在践行为产业提供最强AI算力的路上。平头哥的第一次“云栖秀”,则是这条路上自然而然酝酿的结果。
从云到AI,阿里就像一位游戏玩家,再每一个版本的副本中都拿到了关键道具。而在快速流转的AI时代,这些关键道具组成了“阿里套装”——作为产业底座的最强AI算力,就是这个套装的加持效果。
从云、大数据、算法到芯片,云栖的叠影凝固成了AI计算之路。
神奇AI算力在哪里?
或许我们有必要先了解这样一个理论:AI算力的差异化供给,究竟来自于何处?
去年5月,OpenAI 发布过一份数据报告。其中提到自2012年以来全球AI算力需求在6年中扩大了30万倍,AI产业的算力需求每3.5个月就在翻一番。
这个远大于摩尔定律增长的需求裂变,意味着AI算力在这个产业周期里必然面对大量供不应求的局面。这也就锚定了AI算力提供的第一条规则:云是AI的最佳出口。
由于云端算力天生具有能够裁量提供的特点,这对于AI任务从训练、测试到部署中广泛面对的弹性增长、大规模并行部署、极端训练用算力等几大特点来说,具有难以取代的价值。瞬时性、并发性、弹力性,是AI对算力需求的基本面貌。
而在从云到端、从训练到推理、从部署到迭代的AI落地过程里,我们可以看到AI算力的运行实际上受制于非常多的条件:计算架构、训练集群性能、框架对算法的优化程度、部署环境等等都在影的响AI算力的最终实际体验。这个漫长的流程,决定了AI算力的第二条规则:算力性能的优越与否不取决于单纯的芯片,而是由从芯片、云、数据处理能力、框架,再到算法开发基础、部署环境等一揽子条件来决定的整体阈值。
这意味着,AI算力不是一个单纯的部件性能比拼,而是一个体系化工程,是产业技术叠加与AI基础开发部署探索的完整序列。这意味着AI算力是一条路,这条路,需要不同时间的不同馈赠。
在时代收获所需,这正是阿里云的特点。
云计算时代,飞天的路标与馈赠
我们知道了AI算力来自哪里之后,就可以来看阿里云的收获过程。虽然我们今天的焦点是平头哥,但故事的开端其实早在十年前就已经发生。
2009年,草创的阿里云写下了第一行关于飞天的代码。当时这个“冒天下之大不韪”的团队,就意识到大规模计算是未来互联网的发展中轴,甚至是更多计算迭代的肇始因缘。
时至如今,这个判断应该说已经被证明是正确的。阿里云自研的飞天云操作系统,已经成长位国内规模最大的计算平台,可扩展至10万台计算集群,单日数据处理量超过600PB。2018年双11期间,阿里云弹性计算能力累计超过1000万核,相当于10座大型数据中心,创造了“脉冲计算”的新纪录。双11作为一个巨大的数据任务,某种程度上位飞天挺入智能时代,成为计算底座提供了验证。
AI计算的本质,是对异构计算和多样性计算的需求。为此,阿里云提供在云服务市场率先提供了异构计算服务。构筑了亚洲规模最大的GPU公共云服务,并可在短时间内实现全球最大规模的GPU服务器调用,超级GPU计算集群支持每秒10亿次AI峰值计算。此外,阿里云还最早发布了FPGA云服务。
这些基于云服务提供的大规模计算和异构计算,可以看作阿里云最早投身公有云事业,在产业草莽期积累的时代馈赠。云计算的支柱能力和多元架构囊括,是产业AI所需算力的基本构成。这层叠影成为了阿里云提供AI算力的底色,是一切故事的起点。
而在AI逐渐并入产业视角时,坐拥强大多元的云,让阿里可以更凶猛投身这个新的产业纪元。
AI探索时代,向实而生的阿里三叉戟
假如说,十年之前是公有云时代的崛起;那么从2016、2017年开始,AI时代逐渐在产业服务市场落地生根。
这个阶段,早期探索同样艰难充满挑战,但也给阿里的AI算力之路带来了第二层底色:实用化。
2016年的云栖大会,阿里与杭州一同公布了城市大脑计划。此后,随着城市大脑计划的陆续落地,阿里在2017年宣布成立了达摩院。此后的产业分工,是达摩院承担AI算法的开发与升级,而技术则通过阿里云的AI解决方案与阿里生态进行应用转化。
这一过程中,我们可以看到阿里的技术体系牵引起了AI算法、数据应用,与产业场景三个维度的走廊,构筑了一把探索AI真实价值的产业三叉戟。
达摩院的AI技术与服务体系,先后在工业、遥感、医疗、城市大脑等多个应用场景中落地。而阿里小蜜、拍立淘、支付宝、天猫精灵则成为了阿里内部生态的AI出口。根据阿里巴巴在杭州云栖大会上公布的人工智能调用规模:每天调用超1万亿次,服务全球10亿人,日处理图像10亿张、视频120万小时、语音55万小时及自然语言5千亿句,阿里已经成为中国最大的人工智能公司。
在AI应用时代早期,阿里通过一系列技术和组织部署,形成了技术先锋营、数据转化引擎,与场景实验室的三个新角色,为AI算力走向实用化探索了落地入口。
AI芯片时代,平头哥的万里长征
如果对比CPU在70年代的历史,可以发现AI从探索期走向实用化和成熟期,关键标志就是核心芯片的大规模商用。
这个时代才刚刚开始,我们或许还无法代替计算史为它命名,但毫无疑问AI的芯片级基础设施,是这个周期的关键开端。
曾几何时,IBM从打印机走向了芯片让美国人莫名其妙;而去年,阿里宣布成立面向AI时代的平头哥,确实也让中国人大吃了一惊。
气质独特,生死看淡的平头哥,在计划中将为产业提供最全芯片产品形态,涵盖处理器IP、SoC平台以及芯片。
不久之前,我们见到了平头哥发布了面向端侧的无剑平台和玄铁处理器IP。而当含光800面世时,则意味着平头哥第一次挺进云端,与阿里云的计算、数据、算法体系连为一体,构成了云端最强推理算力的萌芽。
含光800性能突破,得益于达摩院的软硬件协同创新:硬件层面采用自研芯片架构,通过推理加速等技术解决芯片性能瓶颈问题;软件层面集成了先进AI算法,针对CNN及视觉类算法 优化计算、存储密度,可实现大网络模型在一颗NPU上完成计算。
根据云栖大会的现场演示,在城市大脑中实时处理杭州主城区交通视频,需要40颗传统GPU,延时为300ms,使用含光800仅需4颗,延时降至150ms。拍立淘商品库每天新增10亿商品图片,使用传统GPU算力识别需要1小时,使用含光800后可缩减至5分钟。
虽然平头哥的万里长征刚刚开始,但是这第一步,确实已经跨了出来。
关于未来时代的叠影,平头哥用含光800做了一声怒吼,它的意思大概是,阿里将突入最底层,在计算基础设施中完成对AI最强算力的探索。
云,AI,到芯片,三个时代的叠影,让最强AI算力自然流淌而出,云气万物里。
免责声明:此文内容为第三方自媒体作者发布的观察或评论性文章,所有文字和图片版权归作者所有,且仅代表作者个人观点,与 无关。文章仅供读者参考,并请自行核实相关内容。投诉邮箱:editor@fromgeek.com。
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。