新版DeepSeek-V3大模型官方报告：超越GPT-4.5，中文写作比R1优

631人阅读

2025-03-26 11:27:05

来源：TechWeb.com.cn
相关关键词
- DeepSeek-V3
- AI

3月25日消息，继在开源平台放出更新版的DeepSeek-V3 模型后，DeepSeek官方正式公布了该模型的具体性能改进情况，包括推理任务表现提高、前端开发能力增强、中文写作升级、中文搜索能力优化，在工具调用、角色扮演、问答闲聊等方面也有一定幅度的能力提升。

DeepSeek V3 模型升级后目前版本号 DeepSeek-V3-0324，用户登录官方网页、APP、小程序进入对话界面后，关闭思考即可体验。API 接口和使用方式保持不变。

DeepSeek官方建议：如非复杂推理任务，建议使用新版本 V3 模型，即刻享受速度更加流畅、效果全面提升的对话体验。

DeepSeek-V3-0324 与之前的 DeepSeek-V3 使用同样的 base 模型，仅改进了后训练方法。私有化部署时只需要更新 checkpoint 和tokenizer_config.json（tool calls 相关变动）。模型参数约 660B，开源版本上下文长度为 128K（网页端、App 和 API 提供 64K 上下文）。

与 DeepSeek-R1 保持一致，此次DeepSeek-V3-0324的开源仓库（包括模型权重）统一采用 MIT License，并允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。

DeepSeek-V3-0324大模型的优化情况：

推理任务表现提高

新版 V3 模型借鉴 DeepSeek-R1 模型训练过程中所使用的强化学习技术，大幅提高了在推理类任务上的表现水平，在数学、代码类相关评测集上取得了超过 GPT-4.5 的得分成绩。

前端开发能力增强

在 HTML 等代码前端任务上，新版 V3 模型生成的代码可用性更高，视觉效果也更加美观、富有设计感。

中文写作升级

在中文写作任务方面，新版 V3 模型基于 R1 的写作水平进行了进一步优化，同时特别提升了中长篇文本创作的内容质量。

中文搜索能力优化

新版 V3 模型可以在联网搜索场景下，对于报告生成类指令输出内容更为详实准确、排版更加清晰美观的结果。（宜月）

（免责声明：本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿，凡在本网站出现的信息，均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏，概不负任何法律责任。
任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时，应及时向本网站提出书面权利通知或不实情况说明，并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后，将会依法尽快联系相关文章源头核实，沟通删除相关内容或断开相关链接。）

为您推荐

新版DeepSeek-V3大模型官方报告：超越GPT-4.5，中文写作比R1优

为您推荐

比亚迪王传福：云辇-Z量产标志着中国车企首次突破高端悬架技术壁垒

携手华为将智能科技“武装到牙齿”，阿维塔06想要真正打动年轻人

谷歌关闭Android开源项目：一场“开源”名义下的商业收编

2024年欧洲专利申请排名揭晓：华为位居第二，高通排名第四

全球超大规模数据中心数量五年翻倍，2024年新增137个！

DeepSeek上线次月月活用户达1.8亿，AI大模型应用增长迅猛

智赋百业能启千行：广州人工智能公共算力中心公布成绩单

3D光电子芯片破解AI难题？新技术落地面临三大挑战

华为杨超斌：行业智能化是开启产业新纪元的磅礴引擎

华为郭振兴：2025年行业数智化将呈现五大特征

上一篇

下一篇