DeepSeek最新版本V3-0324更新了什么?
DeepSeek V3 在 2025 年 3 月 24 日进行了小版本升级,版本号为V3-0324,而且也已经同步更新到官网上,使用的时候关闭深度思考就行了,下面是更新的内容:
性能提升
编程能力显著增强:新版 V3 在前端编码能力上进步明显,生成的代码质量和逻辑清晰度大幅提升,特别是在 HTML、CSS 和 JavaScript 方面,毫不夸张地说,V3-0324版本已经吊打之前的自己,编程能力跟 Claude 相当接近。
数学能力增强:新版V3支持复杂解题,达到推理模型水平,数学能力提升显著。
多轮对话能力提升:新版 V3 在多轮对话中展现了更强的上下文理解能力,上下文长度从64K翻倍到128K,支持更长的对话历史和大篇幅文档处理。
生成速度提升:DeepSeek-V3 的生成速度从 20 TPS 提升至 60 TPS,相比 V2.5 模型实现了 3 倍的提升。
开源协议变更
新版 V3 采用了 MIT 开源许可,相比初代 V3 的开源协议,这一变化使开发者可以在商业项目中更自由地使用该模型,极大地提升了其在商业应用中的灵活性和吸引力。
模型参数与训练
新版 V3 的开源版本模型体积达到 6850 亿参数,由新的 32K GPU 集群上改进的后训练提供支持。
用户体验
实际测试反馈:在生成一个包含 CSS 和 JavaScript 的动画天气卡片的任务中,新版 V3 生成的结果不仅逻辑清晰,而且效果出色,明显优于旧版本 R1。
与其他模型对比:与 Claude 3.7 的对比测试显示,新版 V3 在前端网站搭建方面已经能够与之相媲美。
其他更新
API 接口不变:用户可以通过指定 model=deepseek-chat 调用新版 V3。
试用体验:用户可以通过访问 DeepSeek 的官方网站、应用程序以及小程序来体验这一新版本。
HuggingFace:https://huggingface.co/deepseek-ai/DeepSeek-V3-0324
项目地址:https://github.com/deepseek-ai/DeepSeek-V3