寒武纪与百川智能完成大模型适配 行业合作逐步落地

近日,在广东省政府与中国电信联合主办的2023数字科技生态大会上,联想联合寒武纪共同展示了搭载寒武纪GPU芯片的联想SR660 V2服务器。据介绍,该款服务器最多可配备12个PCIe 4.0插槽、两个OCP 3.0插槽,可支持最多四个300W GPU, 实现了更高的可扩展性。值得注意的是,该款服务器能够完整支撑政府、垂直行业,以及大中型企业和IPDC等客户全业务负载类型的需求,覆盖商业决策、虚拟化、混合云基础架构、业务协同等主流场景。

作为智能芯片领域全球知名的新兴公司,寒武纪能提供云边端一体、软硬件协同、训练推理融合、具备统一生态的系列化智能芯片产品和平台化基础系统软件。此前,寒武纪2023年半年度报告提及在行业客户中,寒武纪依托于近年来持续拓展和深耕的成效,在互联网、运营商、金融、电力能源等多个行业及客户中进行了广泛的业务部署与落地。

此外,寒武纪董事长、总经理陈天石在与投资者互动时表示:基于云端产品的优势,针对最近兴起的大模型领域,优化了寒武纪产品在AIGC及大语言模型领域的性能,并与多个行业客户及ISV推动了技术和产品合作。此外,寒武纪的第六代智能处理器微架构和指令集正在研发中。新一代智能处理器微架构及指令集将对自然语言处理大模型和推荐系统的训练推理等场景进行重点优化,将在编程灵活性、能效、功耗、面积等方面提升产品竞争力。

近日,寒武纪正式宣布了思元(MLU)系列云端智能加速卡与百川智能旗下的大模型Baichuan2-53B、Baichuan2-13B、Baichuan2-7B等已完成全面适配,寒武纪思元(MLU)系列产品性能均达到国际主流产品的水平。

寒武纪的思元(MLU)云端智能加速卡支持多种数据位宽、超大内存容量和高速内存带宽等产品优势,加上寒武纪自研的BangTransformer算法加速库,硬件和基础软件平台充分协同,适配过程中,满足了百川大模型对加速卡计算、通信和能效等多方面需求,显著加速了大模型从训练到部署的全部流程。

(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )

Baidu
map