5月25日消息(九九)5月23日,2024中国高质量发展论坛的第四场线上论坛——“AI时代:数据中心光互联技术新趋势”顺利举行。论坛邀请电信运营商、互联网服务商、云计算厂商、模块芯片商、科研院所、业内专家共聚一堂,围绕热点话题深入探讨光互联和全光交换的应用及其面临的机遇和挑战。
中国移动研究院基础网络技术研究所副所长程伟强在主题演讲中表示,全球智能算力需求快速增长,亟需构建标准统一、技术领先、软硬协同、兼容开放的新型智算中心(NICC)技术体系。其中,智算中心网络用于连接CPU、GPU、内存等池化异构算力资源,贯穿数据计算、存储全流程,网络性能增强对提升智算中心整体算力水平具有关键意义。
程伟强介绍,当前业界智算中心高性能网络创新主要分为两个方向,一是基于现有以太网优化,二是革新底层以太网方案。中国公司主导的全调度以太网(GSE)和美国公司主导的超级以太网(UE)都以革新以太网转发机制作为核心,并进一步优化各层协议栈,推动网络芯片底层逻辑架构支持,突破无损以太性能瓶颈。
程伟强进一步介绍,全调度以太网(GSE)技术体系能够最大限度兼容以太网生态,从四层(物理层、链路层、网络层、传输层)+一体(管理和运维体系)等几个层级进行优化和增强,构建无阻塞、高带宽、低时延的新型智算中心网络,形成标准开放的技术体系,助力AI产业发展。
当前,基于GSE的以太网技术路线逐渐形成产业共识,高带宽、高性能、高可靠、高安全的以太网助力智算中心互联,提升智算中心网络性能和整体算力水平。
在高带宽方面,AIGC推动B400G技术发展,800GE将成为智算中心组网的重要代际节点。IEEE 800G标准进展顺利,802.3df(8x100G)已发布,802.3dj(4x200G和800G相干)在快速推动。中国移动专家积极贡献,推动实现了20km、40km、80km互通和共平台,并主导完成800GE 20km Objective立项,是中国公司专家在IEEE的首个以太网基础标准立项。
1.6Tb/s标准制定也已启动,业界开始积极布局。802.3dj重点关注1.6TE短距光标准,PCS/FEC方案已确定,1.6TBASE-DR8(500m)和1.6TBASE-DR8-2(2km)光接口基础参数已确定;OIF已领跑1.6T相干,同步开展互操作的1600ZR和1600ZR+标准化,降低成本并加强行业间的协作,产业趋势明朗。
在高性能方面,GSE创新以太网转发机制,基于三大核心机制转变:从“流”分发到“报文”分发、从“盲发+被动控制”到“感知+主动控制”、从“局部”决策到“全局”调度,实现高精度负载均衡、网络层原生无损及低延迟。
程伟强指出,采用GSE分发技术后,有个特别的优势是,用相对小容量的交换芯片,构建更大的GPU集群。因为GSE采用了报文容器分发机制,对leaf上行端口速率需求降低,同等芯片容量下,leaf上行口的端口速率越小,组网规模越大,负载分担链路更加散列,包均衡能力更优,更适配国产芯片大规模组网需求。以12.8T交换芯片构建H100 GPU集群为例,
若采用传统RoCE组网,Spine交换机和Leaf交换机之间需要采用400GE接口互联,算力集群的最大规模仅能达到512张GPU卡;若采用GSE组网,Spine交换机和Leaf交换机之间用100GE接口互联即可,算力集群的最大规模能够达到2048张GPU卡。也就是说,GSE用同样大小的交换芯片可以组出4倍于RoCE网络的集群,这个对于国内交换芯片相对落后的情况尤其重要。
程伟强进一步介绍了全调度以太网的技术优势和产业进展:超大规模,极致的链路负载,同等芯片容量,GSE网络可支持更大集群规模;超高性能,GSE网络较RoCE网络性能提升30%,提升大模型训练效率;超高可用,集中控制统一纳管,高精度监控“135”故障处理,保证集群可用性。目前,GSE推进计划已经有40余家合作伙伴,多个GSE的芯片项目已经在开发过程中。
在高可靠方面,AI大模型网络集群规模已达到万卡级别,模型训练耗时长、成本高。链路异常导致训练中断,造成算力的浪费与成本的增加;万卡集群端口数超过几万,线路故障不可避免。来自相关厂商统计数据,光链路异常频发,故障率约为0.1%~0.2%,平均每周近1起链路闪断类告警。
程伟强强调,团队正在发展FlexLane技术,这是基于以太网物理层弹性通道的高可靠保障技术。当物理层检测到lane故障后进行快速故障隔离,可以有效减少大模型训练因模块故障而重新load check piont的几率,在智算中心场景有很好应用前景。
在高安全方面,传统网络安全方案无法满足智算中心网络需求,IPSec、MACSec等安全方案应用于智算网络时,难以兼容存量设备,无法覆盖所有数据报文,引入较长处理时延,增加大量封装开销,影响AI算效。
程伟强介绍,中国移动提出的以太网物理层安全(PHYSec)架构及关键技术,具有四大特点:一是协议透明,全加密。在物理层对比特流加密,保护所有帧头部,掩盖帧长度、帧发送频率。二是随流安全,低时延。随流加密,解密时延全掩盖(~20ns),对AI训练或推理基本无影响。三是不占带宽,低开销。基于物理层原生机制承载协议,不占用用户带宽。四是兼容存量,易部署。可基于PHY芯片或光模块DSP芯片实现,安全可插拔,支持存量网络平滑升级。
演讲的最后,程伟强表示,欢迎大家加入GSE推进计划,共同推动中国智算中心网络的技术发展,构建AI网络的中国方案。
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。