今年年初,ChatGPT犹如一颗火种,激发了AI应用的发展动力,AI产业进入发展的快车道。国内的AI产业自然也乘势而起,仅半年光景国内就涌现出近百款AI大模型产品,由此进入“百模大战”的竞争格局。
训练大模型需要以算力为基础,全球AI公司对NVIDIA 芯片追捧至极,GPU有价无市。近期新闻,NVIDIA H100已无存货,就算现在订购,也要等2024年Q1甚至Q2才能用上。据传闻,百度、字节、阿里、腾讯等大型科技公司也向NVIDIA下了总计50亿美元的A800等芯片订单。
只不过有人企图对国内AI大模型发展加以干涉。美国《华尔街日报》透露,由于担心中国可能使用NVIDIA 和其他公司的人工智能芯片“进行武器开发和黑客攻击”,美国政府考虑加码计算芯片领域的制裁,限制NVIDIA公司向中国出口A800、H800芯片,一时间让处于快速发展中国AI产业,又一次笼罩于禁售阴影之下。
难以替代的GPGPU架构芯片
从美国对国内算力芯片的一而再,再而三地限制中,可以看到美国对中国AI产业发展的忌惮。近年来随着数字经济的蓬勃发展,国内在推进算力基础设施建设取得积极成效。据工信部统计,目前我国算力总规模居全球第二,保持30%左右的年增长率,而且新增算力设施中智能算力占比过半。这其中作为算力载体的AI计算芯片,其地位自然无比重要。
目前全球AI计算芯片主要分为GPGPU、ASIC、FPGA三种架构。而被限制的A800和H800芯片就属于GPGPU架构芯片。GPGPU架构也是AI加速芯片市场的主流,占据了90%的市场份额。
GPGPU从GPU发展而来,是GPU去掉图形处理能力,提升并行计算能力之后的产物。GPGPU是如何成为最适合AI计算的芯片呢?
对比CPU和GPU,结构上的差异决定了CPU和GPU功能上的区别。由于CPU在控制和存储的能力上比较强,因此能进行比较复杂的计算,不过可以同时执行的线程很少。而GPU则相反,大量的计算单元让它可以同时执行多线程的任务,但每一个任务都比较简单。
打个比方,如果CPU是一个懂高等数学的大学生,概率、微积分全都会做,但让他做一万道四则运算数学题,还是要花费大量的时间;而GPU好像是一万名只懂得四则运算的小学生,虽然不会函数、代数等高级知识,但是遇到一万道四则运算两秒就能做完。
在AI神经算法成熟后,业内发现GPU的功能特性很适合进行AI训练,因为在 学习模型中,最主要的运算就是矩阵运算和卷积,而这些运算从根本上都可以分解为简单的加法和乘法。如此挖掘出了GPU在AI领域的应用空间。2007年,英伟达提出了GPGPU,即通用GPU架构,将原本专用于图形处理的GPU改造成了更适合AI运算的GPGPU。
其实AI计算芯片除了GPGPU架构,还有ASIC、FPGA等架构。只不过ASIC、FPGA芯片是结合某些计算场景需求的定制化产品,通用性不强。
GPGPU研发难度高,国产短板待补齐
在美国限制出口、国内大模型急需GPU或GPGPU的时候,国内真正能做GPGPU的厂家却很少。因为GPGPU芯片研发难度,比其他类型的AI芯片要高出很多。
有业内人士分析过,GPGPU 芯片的团队大概需要1000 人左右,至少也要做两年才能做出一颗芯片,这还只是推理芯片而已。如果要做大模型训推一体的大芯片,那么至少 3 年才能把一颗芯片做出来。这意味着,如果有国内厂商能赶上今年大模型风潮,至少需要从2020年就开始布局研发设计。
并且GPGPU研发出来之后,决定其性能发挥上下限的,不止是架构设计优劣、制造工艺先进与否等条件,还需要有软件生态支持,还需要售后团队结合大模型情况调优产品等等。
NVIDIA之所以能称霸AI芯片领域,在于其结合GPGPU架构开发了CUDA软件平台,允许开发者使用类C语言编写GPU的并行计算代码,并且提供了大量的库函数和工具来帮助优化GPU计算。NVIDIA运营CUDA已经十余年时间,软件生态才是NVIDIA真正的护城河。
国内AI芯片面对NVIDIA先发优势,如何把握住AI大模型带来的GPGPU黄金机遇?
国产GPGPU杀出几匹黑马
当前国内AI芯片主要厂商包括华为、寒武纪、海光信息、遂原、壁仞、天数智芯等,此外龙芯也在布局。其中,发力GPGPU芯片的包括海光、壁仞科技、龙芯等等。
海光GPGPU架构芯片深算一号在2018年启动研发,于去年发布。据了解,海光深算一号性能优异,对比NVIDIA A100及 AMD MI100发现,在典型应用场景下,深算一号指标已经达到国际上同类型高端产品的水平。并且深算一号最大亮点在于,支持全部计算精度,在国产GPGPU中具备唯一性。在生态方面,海光深算一号可兼容类CUDA环境,对于AI开发者无需复杂适配,即可迁移到海光平台。
如此以来,在禁售阴影下,海光GPGPU产品可作为国外芯片最好平替。据海光披露,截止今年GPGPU产品已量产商业化应用,规模达几十万片,应用领域涵盖互联网、能源等行业。
壁仞科技成立于2019年,在2022年发布了首款GPGPU芯片BR100系列,性能方面超越NVIDIA A100,今年发力目标为量产上市。但业内人士认为,对于国内初创GPGPU公司而言,软件生态更为重要。目前国内的初创公司虽然在细分领域上有一定的落地,而真正在大模型训练上能有实际应用的几乎没有。
而龙芯暂无产品发布,目前进展为已经完成相关IP的设计,正在验证优化过程中,第一个集成自研GPGPU核的SOC芯片计划于2024年Q1流片。从流片到量产,如果按最快6-12个月来算,龙芯的GPGPU产品至少也要在2024年Q3以后才能发布,量产估计需要在2025年了。
总体而言,国产GPGPU迈出从0到1的第一步是最主要的。禁售危机中蕴藏着机遇,哪怕作为后来者,在国内如此大的消费市场支撑下,也将有追赶上NVIDIA的可能。
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。