最近产业中最爱玩的一个游戏,就是“AI在哪”。以往我们能看到AI存在于实验室内、存在于软件之中,但想要让AI从模型走进现实,往往没那么容易。最起码的,AI任务需要一系列条件去支撑,其细节建立在各种ICT基础设施的迭代之上。或许可以这样比喻,AI就像汽车,当它到来时,配套的高速路加油站修车厂都要建好。马车时代的路况,是无法发挥汽车任何优势的。
AI走到现实的重要条件有很多,尤其需要注意的是,AI必然建立在ICT基础设施之上,通过网络空间延展到万物智能应用当中。可以说,AI的运转与网络环境息息相关,网络是AI的行军之路。然而在AI的兵马到来之际,网络环境这条运兵栈道真的已经修建好了吗?如果我们分析一下今天AI面临的“网络路况”,会发现其中孕育着很多痛点。同时,一个智能时代的产业机遇也蕴藏其中。
AI时代的前夜,网络表示“压力山大”
我们相信AI时代会在明晨到来,那么今天就是AI时代的前夜。
这个漫长的前夜里,AI应用正在为ICT基础设施提出越来越多的挑战。
首先AI运算相比以往的运算更加复杂,一次智能化识别的背后可能包含着几百个模型的计算。能够承担更复杂的运算任务,显然是AI应用ICT基础设施的第一要务。
同时AI运算往往关乎于图像、关乎于视频,其数据量的庞大程度相比以往实现了从线性到张量的跃进。能承担更大的数据通过量才能让AI应用平稳运行。
最后AI运算对于ICT基础设施的部署条件要求也更加严苛,以往以太网1‰的丢包率,对于AI应用来说会极大的影响其算力发挥。
这些AI给计算和通信带来的改变,同时也给通行的网络环境施加了巨大的负担。无论是智能驾驶这样的巨大数据量任务,还是工业互联网精准的算法模型部署要求,或者AIoT驳杂的运维压力,都给网络环境添加了无数压力。
面对AI的到来,网络环境的痛点可以体现在这样几个方面:
1、庞大算力需要和复杂的异构计算,需要弹性的网络环境支撑,网络速度跟不上,AI算力也就无的放矢。
2、AI任务要求大规模部署和并行计算、海量非结构化数据通过、实时学习、算法在框架层和应用层的精准度一致等等。这些新要求是此前的网络环境中所不具备的,需要新的主动网络优化能力。
3、AI时代,企业业务空间增长,并行数据量暴增,直接导致运维工作太过复杂,解放这一压力,也已经刻不容缓。
这三大痛点之下,直接的结果是网络交换机市场迎来了全新的挑战,同时也是市场迭代的深刻机遇。具有AI支撑能力、智能运维能力的次世代网络交换机,成为了今天AI大局中的当务之急。
引入CloudEngine 16800作为华为AI发展战略以及全栈全场景AI解决方案中的新成员,通过创造性地在交换机中安装AI芯片,通过智能优化和本地决策获取自动驾驶网络能力。加上单槽48 x 400GE高密端口,可以最大化支持AI运算的高密度流量,把网络环境建设推向了AI时代的新层次。
CloudEngine 16800背后,华为解决了AI前夜的两个重要问题:让现在简单,让未来通顺。
更简单的今天:用AI之力扭转网络运维困境
分析通过安装AI芯片,CloudEngine 16800首创在交换机当中添加AI算力,在设备层面集成了智能化的主动识别和实施决策能力。在这种能力之下,可以实现秒级故障识别和分钟级故障自动定位。
而这一功能为应用者带来的第一个改变,就在于将可以用AI的智慧来完成运维工作,将今天与日俱增的运维压力释放出来。
用AI来承担原本耗费大量人力,并且逐渐已经无法为人类所完成的网络运维工作,可以看作几个梯段达成的目标。
在CloudEngine 16800的AI引擎解决方案中,首先完成的是智能诊断的本地化,通过CloudEngine 16800的本地推理和实时决策,用AI承担运维工作,减少对云服务诊断的依赖,实现低成本高效率。
接下来,基于智能化运维和故障检测,以及专业故障库的智能匹配,达成故障主动排查,主动监控的能力。将人工难以完成的复杂网络运维监控承担下来。
此外,通过智能运维平台和交换机本地智能构成的分布式AI运维架构的配合,实现故障快速自我修复,完成从本地分析到自我愈合的完整AI网络运维体系。整个网络系统开始接近“自动驾驶”状态,将用户从不断复杂的网络运维中解放出来,从而更加关注场景和应用,而不是消耗大量人力物力在后勤保障上。当以往的困境被改变,整个网络运维系统的灵活性和可部署性也会随之提高。过去伤筋动骨式的维修、扩展将不再重现。
换言之,在AI之力的影响下。交换机的应用模式会一改往日的沉重复,变得更加轻盈、更加简单。
智能优化之下,更多想象力的未来
对于网络环境来说,今天更大的任务是要适应企业用户不断增大的AI算力需求,以及衍生的网络依赖。网络环境必须为AI任务大量普及,提供必要的网络支持。不能等到数据泛滥, 学习应用迫在眉睫,才发现原来路还没铺好。
基于AI芯片带来的主动分析能力和实时学习能力,CloudEngine 16800应用上了华为独创的iLossLess智能无损交换算法,提供网络结构优化和全网调度能力,满足复杂AI任务在运行时需要的网络空间。这一能力对于AI开发者和运用者来说,将针对未来越来越广泛的AI需求,解决三大底层问题:
1、 解决以太网原生短板的丢包问题,提升AI任务精度以及场景一致性。应用上智能无损交换算法后,可以让以太网实现零丢包,充分发挥AI算力,不会在从任务到场景的过程中产生误差。
2、通过灵活的网络调度,加速AI任务训练,加快模型部署效率。同样在智能无损交换算法下,数据中心可以根据流量模型实现自适应和自优化,根据应用状况自主进行资源调度,更加适应AI应用流量弹性空间较大的特征。
3、基于AI开发平台,让IT人员更好的加入AI,从另一个维度降低开发成本,最终实现AI快速低成本落地。这种更加普惠的模式,在企业进行智能化转型时,提供了强大的推助力。
AI时代,并不只是算法的时代,同时也是满足于AI运行,能够把AI效能最大化的系列技术共同的时代。
此刻我们需要的不仅仅是AI技术本身的发展,还有一切与其相关技术的合力前行。其中,网络基础环境就是至关重要的一项。新一代的网络产品,必须比等待中的产业格局走到更前面。而在产业智能化转型的革命征程中,网络产品绝非是在基层供给燃料的后备军,而是要充当起先锋和开路者的角色,才能让这条漫长的征程走得更加顺遂。(作者:脑极体)
(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )