·极客观察12月18日 CNBC报道称,中国想在AI领域成为统治者,这种尝试可能已经获得回报。一些美国AI业内人士和科技分析人士认为,中国AI模型已经相当流行,从性能角度看,中国的一些模型与美国产品齐头并进,甚至超越。
由于无法采购美国先进AI芯片,中国只能寻找其它办法增强AI模型性能,比如依赖开源技术,开发自主软件和芯片。
OpenAI ChatGPT是基于闭源模型开发的,但中国的许多企业选择了开源LLM。查看Hugging Face平台,下载最多的LLM有许多来自中国企业,其中阿里巴巴Qwen(通义千问)热度最高, 求索的DeepSeek也备受推崇。
阿里Qwen、DeepSeek等中国大模型受追捧
Hugging Face机器学习工程师Tiezhen Wang告诉CNBC:“从评测基准看,Qwen的性能极为出色,这是它快速流行的主要原因。”还有,Qwen的授权模式比较友好,企业使用时法律评估没有那么复杂。
阿里巴巴给Qwen分了级,有的参数很多,更强大,但算力要求高,运行成本也高,如果是参数少的小模型,运行成本更低。
Tiezhen Wang说:“不管你选择什么规模的模型,Qwen都可能是现今性能最棒的模型之一。”
DeepSeek也成为耀眼明星,它不久前刚刚推出DeepSeek-R1模型。上个月DeepSeek发布消息称,R1模型可以与OpenAI o1模型竞争。
中国企业宣称,它们的模型可以与Meta Llama开源模型竞争,也与OpenAI等闭源模型一样好。
Lux Capital合伙人Grace Isford说:“2023年,我观察到中国对开源AI的贡献不断增加,中国模型的性能很强,成本低,吞吐量高。”
不只是中国企业支持开源LLM,Meta和欧洲创业公司Mistral也有开源版AI模型。随着中美科技竞争加剧,开源模型还有一个优势:中国企业可以将自己的模型推向全球。
全球咨询公司DGA Group的合伙人Paul Triolo说:“中国企业当然希望自己的模型能在中国之外使用,所以中国企业看重开源模型,希望借开源成为AI领域的全球性玩家。”
中国企业认为LLM会是未来科技生态系统的核心
虽然全球都在热炒AI模型,但是到底应该在模型之上开发什么应用?未来谁会主导全球互联网版图?现在还充满争论。
Grace Isford说:“如果你认为前沿基本AI模型是必需,那就应该思考这些模型的用途,比如用于前沿科学、工程技术。”
乐观者将AI模型比作操作系统,它和Windows、Android、iOS一样重要,有可能会主导市场,就像科技企业主导手机和PC一样。
英国伦敦大学国王学院学者Xin Sun认为:“中国企业认为LLM会是未来科技生态系统的核心。”
Xin Sun还说:“未来的商业模型有赖于开发者加入生态系统,要基于LLM开发新的应用,要通过各种手段吸引用户、数据并获得利润,远不只是引导用户使用云服务那么简单。”
中国构建独立于英伟达高性能AI芯片之外的基础设施
训练AI模型需要海量数据,运行时需要强大算力。英伟达已经成为AI芯片的垄断者,许多头部AI企业也用英伟达芯片训练模型,但中国是个例外。
虽然美国百般阻挠,禁止英伟达高端AI芯片流入中国,但中国企业仍然不断推出先进AI模型。
Paul Triolo说:“目前大多中国科技平台都拥有充足的算力,完全可以继续优化模型。首先,中国企业囤积了大量英伟达GPU;其次,中国有自己的GPU,它们来自华为等企业。”
实际上,中国科技企业正在开发英伟达芯片的替代品,华为是领导者,百度、阿里巴巴也在投资半导体设计。
Paul Triolo认为:“在未来的日子里,中国与美国先进硬件的差距还会拉大,特别是明年,因为明年英伟达将会推出Blackwell系统,美国会严格禁止Blackwell流向中国。”
Grace Isford认为,中国一直在向本国AI基础设施进行投资,它独立于英伟达高性能AI芯片之外。“不管美国有没有禁止英伟达AI芯片在中国销售,中国都会继续投资,继续打造自己的基础设施,继续开发、训练AI模型。”(小刀)
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。