如果在人工智技术上落伍,那么就可能错过下一个时代。据埃森哲研究报告预测,到2035年,人工智能将为中国GDP提供1.6%的额外增幅,届时由人工智能衍生出的产业增加值有望超过万亿元规模。
云计算、大数据和 学习构成了智慧计算的三大支点,智慧计算也成为了数字经济的核心引擎。传统的计算技术如何与人工智能相匹配?智慧计算的设备该具有何种新特征?智慧计算的生态该如何构建?智慧计算会对商业重构造成怎样的影响?
7月12日,答案浮出水面,浪潮发布了面向智慧计算的M5新一代服务器,M5“极致、弹性、开放、智能”设计原则,让我们看到了智慧计算时代设备、生态以及社会的进化之路。
为什么浪潮M5代表着智慧计算的新趋势?
“未来云计算、大数据、 学习将不断聚合,我们将其称为智慧计算,智慧计算有可能改变人类历史的进程。站在智慧时代的潮头,浪潮服务器致力于做智能化转型的赋能者和推动者。”浪潮集团副总裁彭震在浪潮M5发布会,如此定义智慧计算的社会价值以及浪潮的历史使命。
智慧计算的提法,源自于浪潮对未来计算的前瞻和预判。按照浪潮的定义,智慧计算是以云计算为基础平台、大数据为认知方法, 学习为优化工具。智慧计算是云计算、大数据和 学习 融合的计算形态,浪潮认为智慧计算将是未来社会主要计算形式。
计算,已经逐渐成为数字经济中不可或缺的主引擎,尤其是在数据大爆炸的万物互联时代,计算更是让数据有效流转和利用的关键一环。而应用需求的变迁,计算类型的改变,也让人们对计算的需求发生着本质的变化,服务器作为计算的主力设备,自然也要应需而变。
在过去几年中,阿里云、腾讯云等国内云服务提供商,数次宣布旗下云服务产品大幅度降价,这背后其实是超大规模数据中心在规模效应、成本控制、智能运维的综合结果。根据Synergy ResearchGroup的最新数据,截止2016年12月,全球超大型数据中心(可部署10万个以上的标准机架)的数量已突破300大关,粗略估计,这些数据中心的服务器部署量超过2016年全球服务器总出货量。所以,数据中心的管理者对于服务器的性能有更极致的要求,而对成本控制则更为严苛。
全球范围内人工智能技术大火,带动了新一轮的IT基础架构军备竞赛,BAT在人工智能上纷纷投入重注,京东、今日头条、科大讯飞等新贵也将人工智能视为赢取未来的底牌,所以对用于 学习的异构计算设备需求暴增,这也对服务器厂商提出了全新的挑战。
浪潮M5新一代服务器,可以说是专门为智慧计算而生,它遵循“极致、弹性、开放、智能”4个设计原则,通过高度平台化的产品和丰富的扩展模块相互组合,为不同应用业务提供 定制化的承载平台,为云数据中心提供优化的整体成本以及便捷的部署和运维管理。计算性能峰值提升125%;多路服务器计算密度提升100%;存储服务器的存储密度是上一代的2.78倍;业界最全的AI的产品线,在部署密度、峰值性能、硬件解耦处于业界领先水平,相比上一代产品性能提升1.5倍。
浪潮集团副总裁彭震在接受采访表示,在服务器设计中采取追求极致的设计,本质上是为了满足客户新的需求变化。过去是一个服务器面向各种场景、各种应用,大家做设计都比较中庸也比较均衡。但现在随着超大规模数据中心陆续投入使用,在严格控制成本的前提下,用户开始对极致优化的需求越来越大,比如做视频存储的希望在4U里放100盘,做GPU加速的希望2U里边放8个GPU,用户希望服务器设计可以通过不断细化而更加极致,所以在全新一代的浪潮M5中, NF5280M5在2U空间内可扩展2个Skylake处理器,24个内存插槽和10个标准PCI-E接口,24块2.5寸硬盘,通过场景化配置,链路多模复用,可以实现30多种应用配置方案,覆盖通用计算、异构计算等5类应用场景。NF5288M5在2U空间内可支持8块GPU,平均每U空间可提供 480TFLOPs的张量计算能力。
现在一款流行的APP,从正式立项到上线运行,可能只有短短数周的时间,而且由于需求和市场反馈存在较大的波动,所以互联网公司对于服务器的弹性部署有越来越高的要求。据彭震介绍,M5在设计中为了业务满足高弹性的需求,在服务器中加入了很多弹性的设计,可以满足一对多的标准化场景。比如在2U标准的服务器,前面就有三种面板可供选择,可以分别做成大盘、小盘等,2U服务器可以根据需求不同选择4块GPU或者8块GPU,通过模块化设计,用户可以像搭积木一样自由组合。
当设备种类繁多、规模跃升之后,数据中心的可管理性就变得异常重要。浪潮M5新一代服务器配置多维合一的自动管理方案,支持OpenBMC和Redfish,可帮助用户构建一个涵盖服务器、存储、网络、制冷、安监等所有设备和设施的双向互动管理体系,并辅助管理的部署、配置等日常工作,不断降低数据中心管理员工作的复杂度。
为了解决标准林立的问题,M5服务器同时涵盖了ODCC、OCP白金会员以及Open19三大开放标准,新一代M5服务器包括了天蝎整机柜、4U多子星、OCP整机柜、OCS整机柜、Open19整机柜等5大方案平台以及17款扩展节点,这也让用户在选择时不会受到开放标准的制约。
用极致设计,来满足效率要求;用弹性设计,来满足业务多样化和灵活性要求;用智能设计,来满足成本控制要求;用开放设计,来保持兼容性和生态活力。浪潮M5“极致、弹性、开放、智能”这四大特性,也将是智慧计算设备未来的流行趋势。
智慧计算,是基于应用场景创新的必然结果
“现在来找浪潮来一同探索 学习应用落地的客户太多了,我们预计今年基于 学习的服务器产品增幅可能会达到去年的两到三倍。”彭震在接受采访时表示,中国服务器市场基于人工智能、 学习的产品线已经处于即将爆发式增长的阶段。
当面对《老尚看科技》现场提问,像Alpha Go这类 学习应用,初期做 学习算法训练时对GPU的性能要求非常高,但当算法不断成熟后,后期应用时对GPU性能要求会有所下降,那么如果购置了大批量GPU 加速服务器来 学习,是否会在后期造成一定的性能冗余?彭震坦率的表示,这种现象在某种程度上是存在的,在初期做 学习训练的时候,实际上对GPU的性能要求是非常高的,当 学习的算法成熟后,对GPU的性能要求会降低一些,甚至用一些FPGA卡就能满足,浪潮M5具备高弹性的模块化设计,可以根据用户在 学习不同阶段的需求,来动态调整资源配置、保护用户的投资。
彭震指出,如果从另一个维度来看, 学习需要不断优化,比如人脸识别,在大规模部署之后,当有海量数据汇入,其实还需要后台的GPU具有强大的性能,来不断进行 学习的算法优化,训练优化取决于数据量的多少, 学习之所以越来越聪明,需要后端不断的通过训练。比如人脸识别,百度人脸识别的正确率,经过几年的不断改进才达到了97%,而且这还是在正常照明情况下、正脸识别的结果,如果在低照明环境或者是侧脸状态,目前的识别率还有继续提升的空间,实际上后台训练对于GPU的性能需求也有在不断增加的情况。所以,用于 学习的GPU服务器采购并不是说完成了算法训练就万事大吉了,它好像软件产业一样,在软件开发完,还需要不断运维和优化。
彭震表示,智慧计算,并不是浪潮凭空想象出来的理念,它是为了满足应用创新自然生长的产物。就比如在数据中心智能管理上,如果采用 学习来不断优化管理方案,差不多可以把PUE降低20%。从实际情况来说,数据中心主要的热源就是服务器,服务器产生了热量,为了把这个热量散发掉,数据中心可能还要再耗费同等的能耗成本,这些热量把它弄到室外去、把冷风送进来。
浪潮M5服务器中设计了很多传感器,可以监测CPU功耗、出风口温度、进风口温度,用智能调度的方式来动态调整服务器功率、空调功率,当功耗上来的时候,就把供电调上来,如果现在服务器都进入休眠了,供电能力就可以降下来,比如发现进风的风口温度太高了,导致整个机器过热了,就可以通知精密空调多送点冷风,如果冷风送多了,服务器发现负载下来了,不需要这么多热量产生了,然后就可以通过控制系统少送些风,这样就形成了一套互相的联动和控制。
过去做服务器,大家更关心这台服务器可管理性如何,后来做整机柜,大家会关心整机柜服务器可管理性好不好,当数据中心的服务器规模越来越大,我们对能耗的管理已经不再是管理它本身,而是管理整个数据中心,这时 学习算法可以降功耗、省成本的优势就可以充分体现出来。
构建智慧计算生态,加速智慧社会重构
构建健康、可良性循环的智慧计算生态体系,就成为了非常紧迫的时代命题。彭震在接受采访时表示,浪潮对自己在智慧计算生态中扮演的角色定义非常清晰,那就是搭好平台、做好服务,浪潮提供硬件平台+软件平台,硬件平台包括我们说的服务器、存储,包括还有和思科合资的产品,软件平台包括AI 云的管理软件、优化软件、各种各样的 学习框架工具,浪潮希望为智慧计算的生态伙伴提供创新的武器和工具,会把大量垂直行业应用创新的机会留给智慧计算生态合作伙伴。
在智慧计算时代,满足用户的个性化定制需求,将成为服务器厂商必备技能,不管用户提出60天后要上线一款线上对战手游,还是50天后要上线一个短视频的应用,或者三个月后上线一款采用AR技术的线上家居体验店,数据中心主管们不会再说这么短时间部署是不可能的,因为像浪潮M5这类具有弹性的新一代服务器,已经可以根据业务的需求来灵活调配IT资源。
即将到来的智慧互联时代,智慧计算将通过基础架构的新老交替,加速智慧社会的重构。比如在传统商业中,是厂商生产什么,消费者就只能被动买什么,消费者选择的权利仅限于具体选择哪个品牌或者哪件商品,但在未来,消费者的需求和喜好等大数据,在经过 学习算法的分析后,将有可能变成指导厂商设计和生产的指挥棒,智慧计算将带来更为彻底的商业重构。
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。