寒武纪思元370通过芯粒技术适配多样场景需求

思元 370 是寒武纪首款采用 chiplet(芯粒)技术的 AI 芯片,应该也是国内首颗 chiplet AI 芯片。基于台积电 7nm 制程工艺,整体集成了 390 亿个晶体管,最大算力达到 256TOPS(INT8),这一数据是寒武纪第二代产品思元 270 算力的 2 倍。

凭借寒武纪最新智能芯片架构 MLUarch03,相较于峰值算力的提升,思元 370 实测性能表现非常亮眼:同功率性能超过 T4 两倍还多,完成同样的任务,功耗可以是 A10 的一半。

此外,寒武纪还基于思元370智能芯片的技术,通过Chiplet(芯粒)技术,灵活组合产品的特性,适配出符合不同场景需求的三款加速卡,包括:MLU370-S4、MLU370-X4和MLU370-X8。

具体来说,MLU370-S4为半高半长单槽位加速卡,板卡功耗为75W,可面向机器视觉/推理任务,适合于对计算密度要求较高的数据中心场景。

而MLU370-X4为单槽位150W全尺寸加速卡,可提供256TOPS(INT8)推理算力和24TFLOPS(FP32)训练算力,同时提供FP16、BF16等多种训练精度,主要面向互联网行业等推理任务或训推一体场景,适合于对单卡算力需求较高的应用场景。

MLU370-X8则采用双芯思元370配置,为双槽位250W全尺寸加速卡,可提供24TFLOPS(FP32)训练算力和256TOPS(INT8)推理算力,同时提供丰富的FP16、BF16等多种训练精度,主要面向对算力和带宽要求较高的训练任务。在业界应用广泛的YOLOv3、Transformer等训练任务中,8卡计算系统的并行性能平均达到350W RTX GPU的155%。

总而言之,寒武纪在同样的研发费用之下,满足了更多元的市场需求。

据了解,寒武纪是智能芯片领域全球知名的新兴公司,主营业务是各类云服务器、边缘计算设备、终端设备中人工智能核心芯片的研发、设计和销售,通过向客户提供芯片及加速卡产品、训练整机、智能计算集群系统、IP授权及软件获取业务收入。

成立以来,寒武纪一直根据市场和客户的需求,加强研发创新投入力度,持续升级迭代云边端系列化产品及基础系统软件平台,丰富公司的产品矩阵,以适应不同的人工智能应用场景。

(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )

Baidu
map