当前,AI芯片的功能日益复杂化、多样化,一方面,芯片厂商纷纷给出不同的衡量标准,声称其产品在计算性能、单位能耗算力等方面处于行业领先水平;另一方面,用户却关心如何能从厂商给出的信息中判断出芯片是否能实际满足其真实场景的计算需求。
因此,成立于2018年5月的行业基准测试组织MLPerf推出了MLPerf基准测试,MLPerf基准测试是业内首套衡量机器学习软硬件性能的通用基准,即训练过的神经网络在不同量级的设备(物联网、智能手机、PC、服务器)、各种应用(自动驾驶、NLP、计算机视觉)上处理新数据的速度。MLPerf现有50多家成员,包括谷歌、微软、Facebook、阿里巴巴等企业,以及斯坦福、哈佛、多伦多大学等高校,并跟随AI的发展步伐持续演进。
根据近日发布的MLPerf基准测试结果显示,内置超过2000个NVIDIA A100 GPU的NVIDIA全新DGX SuperPOD在市售商用产品中脱颖而出,在各项针对大规模计算性能的MLPerf基准测试中均取得了优异成绩。此次已是NVIDIA在MLPerf训练测试中连续第三次展现了最强劲的性能。2018年12月,NVIDIA首次在MLPerf训练基准测试中创下了六项纪录,次年7月NVIDIA再次创下八项纪录。
NVIDIA在测试中用到的产品基于最新NVIDIA Ampere架构以及Volta架构。A100 Tensor Core GPU在加速器的全部八项MLPerf基准测试中展现了最快的性能。在实现总体最快的大规模解决方案方面,利用HDR InfiniBand实现多个DGX A100系统互联的庞大集群——DGX SuperPOD系统在性能上,也开创了八项全新里程碑。
NVIDIA是唯一一家在所有测试中均采用市售商用产品的公司。其他大多数提交使用的要么是预览类别(preview category),其所用的产品预计需要几个月后才会面市,要么使用的是研究类别的产品,更是较长一段时间内都不会面市。
速度与规模兼得的DGX SuperPOD架构
NVIDIA在Selene上运行了系统的MLPerf测试,Selene是基于DGX SuperPOD的内部集群。DGX SuperPOD是针对大规模GPU集群的公共参考架构,NVIDIA DGX SuperPOD基于NVIDIA DGX A100系统。NVIDIA DGX A100在一台6U服务器中集成了8颗A100 GPU以及NVIDIA Mellanox HDR InfiniBand网络技术,可以为高性能计算、数据分析和AI工作(包括训练和推理)等多种组合提供加速,并实现快速部署。
Selene最近在TOP500榜单中首次亮相,凭借百亿亿次(exaflops)级别的AI性能,成为美国最快的工业系统。它也是Green500榜单中全球第二大节能系统。除了出色的能效表现,Selene的快速部署能力也是令人刮目相看。工程师们可以使用NVIDIA的模块化参照架构,在不到四周的时间内就能快速构建Selene。4名操作人员仅需不到1个小时,就能组装起一套由20台系统组成的DGX A100集群,创建出一套性能可以达到2petaflops的系统。
目前,客户已经采用这些参考架构来构建自身的DGX POD和DGX SuperPOD。其中包括美国最快的学术领域AI超级计算机HiPerGator,该超级计算机也将成为佛罗里达大学跨学科AI创新的基石。
同时,全球领先的超算中心Argonne国家实验室正在使用DGX A100,寻找抗击COVID-19疫情的方法。Argonne国家实验室是六个首批采用A100 GPU的高性能计算中心中的先行者之一。
DGX SuperPOD现已助力汽车领域的大陆集团、航空航天领域的Lockheed Martin和云计算服务领域的微软等公司取得了良好的业务成果。这些系统的顺利运转,部分得益于其广泛的生态系统对于NVIDIA GPU和DGX支持。
123下一页>(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )