阿里云发布通义千问 QwQ-32B:1/20参数超越DeepSeek R1,惊艳推理模型革新

标题:阿里云发布通义千问 QwQ-32B:1/20参数超越DeepSeek R1,惊艳推理模型革新

随着人工智能技术的飞速发展,强化学习在模型推理能力上的提升备受瞩目。近日,阿里云通义千问推出的最新推理模型 QwQ-32B,凭借其强大的性能和潜力,引发了业内的广泛关注。

首先,让我们来了解一下 QwQ-32B 的背景。这款拥有 320 亿参数的模型,其性能可与具备 6710 亿参数(其中 370 亿被激活)的 DeepSeek-R1 相媲美。这一成果凸显了将强化学习应用于经过大规模预训练的强大基础模型的有效性。

QwQ-32B 的推出,不仅展示了阿里云在强化学习领域的突破,也揭示了预训练语言模型中尚未开发的可能性。这是 Qwen 在大规模强化学习以增强推理能力方面的第一步,预示着未来更强大、更接近实现人工通用智能(AGI)的模型即将到来。

在性能方面,阿里云对 QwQ-32B 进行了全面测试,包括数学推理、编程能力和通用能力等。测试结果显示,QwQ-32B 在 AIME24 评测集上的表现与 DeepSeek-R1-Distilled-Qwen-32B、DeepSeek-R1-Distilled-Llama-70B、o1-mini 以及原始的 DeepSeek-R1 等领先模型相当。而在 LiveCodeBench 和 Meta 首席科学家杨立昆领衔的“最难 LLMs 评测榜” LiveBench、谷歌等提出的指令遵循能力 IFEval 评测集、由加州大学伯克利分校等提出的评估准确调用函数或工具方面的 BFCL 测试中,QwQ-32B 的表现更是远胜于 DeepSeek-R1。

更为引人注目的是,QwQ-32B 的性能超越了 DeepSeek-R1,但其参数却仅为后者的 1/20。这一突破性的成果,无疑为推理模型的革新揭开了新的篇章。

然而,这并不是阿里云在强化学习领域的终点。为了进一步推动人工智能技术的发展,阿里云计划将更强大的基础模型与依托规模化计算资源的 RL 相结合。通过将智能体与 RL 集成,实现长时推理,目标是释放更高的智能。这一创新性的举措,无疑将为人工智能的发展注入新的活力。

总的来说,阿里云发布的通义千问 QwQ-32B 凭借其强大的性能和潜力,引发了业界的广泛关注。这一成果不仅展示了强化学习的巨大潜力,也揭示了预训练语言模型中尚未开发的可能性。在未来的发展中,我们有理由期待阿里云将为我们带来更多惊喜和创新。

(免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。 )

赞助商
2025-03-06
阿里云发布通义千问 QwQ-32B:1/20参数超越DeepSeek R1,惊艳推理模型革新
阿里云发布通义千问 QwQ-32B,参数超越DeepSeek R1一半,性能卓越,引发业界关注。计划集成智能体与RL,推动人工智能发展。

长按扫码 阅读全文

Baidu
map