近日,寒武纪正式发布新款训练加速卡MLU370-X8,据介绍,该款产品搭载双芯片四芯粒思元370,集成寒武纪MLU-Link™多芯互联技术,主要面向训练任务,在业界应用广泛的YOLOv3、Transformer等训练任务中, 8卡计算系统的并行性能平均达到350W RTX GPU的155%,并已实现商业化部署。
MLU370-X8提供两倍思元370的内存带宽,结合MLUarch03架构和MLU-Link多芯互联技术,将思元370芯片在训练任务的优势充分发挥。据了解,MLU370-X8加速卡与国内主流服务器合作伙伴的适配工作已经完成,并已对客户实现小规模出货。
MLU370-X8定位中高端,与高端训练产品思元290、玄思1000相互结合,进一步丰富了寒武纪的训练算力交付方式;并与基于思元370芯粒(chiplet)技术构建的MLU370-X4、MLU370-S4智能加速卡协同,形成完整的云端训练、推理产品组合。
此外,从去年伊始,寒武纪便开始发力智能驾驶芯片领域,并成立了寒武纪控股的车载芯片子公司行歌。作为寒武纪行歌的执行总裁,王平表示:寒武纪行歌将推出覆盖不同场景和不同自动驾驶级别的产品。今明两年,寒武纪行歌将会推出两款重磅芯片,一款针对L4市场,可以支持车端训练;而另一款则是面向L2+市场。
针对L4 级别智能驾驶市场的是SD5226 芯片。该系列芯片解决方案在人工智能算力方面将进一步提高到超过400 个 TOPS,CPU 最大算力超 300K DMIPS,采用 7nm 工艺,独立安全岛的设计,率先提供基于单颗 SoC 的 L4 级别的自动驾驶解决方案。而且,这颗芯片的最大亮点将是可以支持车端训练,支持车端的自学习架构。这一解决方案计划在 2023 年正式发布。
针对L2 + 级别智能驾驶市场的是SD5223 芯片。寒武纪行歌 L2 + 行泊一体的芯片解决方案,采用先进工艺,最大算力达到 16 个 TOPS,单颗 SoC 就可实现行泊一体功能,并可采用自然散热,推动自动驾驶系统向 10 万元左右的入门级车型覆盖,这款芯片将在 2022 年发布。
迈向自动驾驶时代,业界已逐渐达成共识,要真正实现高效、安全的交通和出行,单车智能已远远不够,且面临不少瓶颈,单车智能+车路云协同发展才是未来发展方向,这也是中国智能汽车产业“换道超车”的关键路径。
单车智能方面,首当其冲的问题是,目前单片的SoC处理能力普遍不足,一般需要2片甚至更多片实现,这使得系统复杂度指数级上升,量产困难;而多片SoC又将造成域控制器的功耗很高,必须采用风冷甚至液冷,无疑增加了系统成本,从而使得智能驾驶系统在燃油汽车以及10万元以下的车型很难普及;此外,国产芯片的占比仍然较低,整体芯片供应受到全球供应链的影响巨大。
车路云协同方面也主要面临三大挑战:首先是海量数据的闭环需要大规模的AI集群支撑,根据特斯拉的数据,每一辆智能车上路,需要增加价值500美元的云端AI计算资源来支撑,成本压力巨大;其次,车企为实现数据安全和隐私保护,也需要投入大量的资源;此外,云端统一运营数据的模式还不能有效的满足车主个性化的需求。
而寒武纪的优势,则是寒武纪行歌还将协同寒武纪一起推出云边端车的方案。在云端,寒武纪提供高性能的训练芯片,能够处理车端收集的海量数据,进行训练,形成先进的自动驾驶模型,通过OTA推送到车端;在边端,基于寒武纪边缘的智能芯片,与合作伙伴推出面向车路协同的路测单元,可以感知更远的信息,推送给车端,形成协同感知;而在车端,寒武纪行歌的自动驾驶芯片,能支持未来高等级自动驾驶的复杂模型的大算力需求,也能支持算法模型的持续迭代。这一切都是基于统一的平台级基础架构和技术软件,以及统一的 AI 处理器架构和指令集。
(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )