更新日志
时间: 2025-09-29
DeepSeek-V3.2-Exp
deepseek-chat
和 deepseek-reasoner
都已经升级为 DeepSeek-V3.2-Exp。
deepseek-chat
对应 DeepSeek-V3.2-Exp 的非思考模式deepseek-reasoner
对应 DeepSeek-V3.2-Exp 的思考模式
详细更新内容请参阅文档
时间: 2025-09-22
DeepSeek-V3.1-Terminus
deepseek-chat
和 deepseek-reasoner
都已经升级为 DeepSeek-V3.1-Terminus。deepseek-chat
对应 DeepSeek-V3.1-Terminus 的非思考模式,deepseek-reasoner
对应 DeepSeek-V3.1-Terminus 的思考模式。
此次更新在保持模型原有能力的基础上,针对用户反馈的问题进行了改进,包括:
- 语言一致性:缓解了中英文混杂、偶发异常字符等情况;
- Agent能力:进一步优化了 Code Agent 与 Search Agent 的表现。
时间: 2025-08-21
DeepSeek-V3.1
deepseek-chat
和 deepseek-reasoner
都已经升级为 DeepSeek-V3.1。deepseek-chat
对应 DeepSeek-V3.1 的非思考模式,deepseek-reasoner
对应 DeepSeek-V3.1 的思考模式。
- DeepSeek-V3.1 包含以下主要变化:
- 混合推理架构:一个模型同时支持思考模式与非思考模式
- 更高的思考效率:相比 DeepSeek-R1-0528,DeepSeek-V3.1-Think 能在更短时间内给出答案
- 更强的 Agent 能力:通过 Post-Training 优化,新模型在工具使用与智能体任务中的表现有较大提升
- SWE-bench Verified: 66.0
- SWE-bench Multilingual: 54.5
- Terminal-bench: 31.3
时间: 2025-05-28
deepseek-reasoner
deepseek-reasoner
模型升级为 DeepSeek-R1-0528:
- 推理能力增强
- 基准测试提升显著(Pass@1)
- AIME 2025: 70.0→ 87.5 (+17.5)
- GPQA: 71.5 → 81.0 (+9.5)
- LCB_v6: 63.5 → 73.3 (+9.8)
- Aider: 57.0 → 71.6 (+14.6)
- 注:复杂推理问题相比老版本R1会使用更多tokens
- 基准测试提升显著(Pass@1)
- Web前端开发能力优化
- 生成的网页与游戏更加美观
- 幻觉降低
- 极大程度抑制了老版本R1所存在的幻觉问题
- Json Output与Function Calling 支持
- Function call性能
- Tau-bench score: 53.5 (Airline)/63.9 (Retail)
- Function call性能
时间: 2025-03-24
deepseek-chat
deepseek-chat
模型升级为 DeepSeek-V3-0324:
- 推理能力增强
- 基准测试提升显著
- MMLU-Pro: 75.9 → 81.2 (+5.3)
- GPQA: 59.1 → 68.4 (+9.3)
- AIME: 39.6 → 59.4 (+19.8)
- LiveCodeBench: 39.2 → 49.2 (+10.0)
- 基准测试提升显著
- Web前端开发能力优化
- 代码生成准确率提升
- 生成的网页与游戏前端更加美观
- 中文写作能力升级
- 风格与内容优化
- 实现与R1写作风格对齐
- 中长篇写作内容质量提升
- 风格与内容优化
- 功能增强
- 多轮交互式改写能力提升
- 翻译质量与书信写作优化
- 中文搜索能力优化
- 报告分析类请求优化,输出内容详实
- Function Calling 能力改进
- Function Calling 准确率提升,修复 V3 之前的问题
时间: 2025-01-20
deepseek-reasoner
deepseek-reasoner
是我们的新模型 DeepSeek-R1. 可以通过指定model=deepseek-reasoner
调用。- 详细更新,请参考: DeepSeek-R1 正式发布
- 调用指南,请参考: 推理模型
时间: 2024-12-26
deepseek-chat
deepseek-chat
模型升级为 DeepSeek-V3,接口不变,可以通过指定model=deepseek-chat
调用。- 详细更新,请参考:DeepSeek-V3 正式发布
时间:2024-12-10
deepseek-chat
deepseek-chat 模型升级为 DeepSeek-V2.5-1210,模型各项能力提升,相关基准测试:
- 数学能力:在 MATH-500 基准测试中的表现从 74.8% 提升至 82.8%
- 代码能力:在 LiveCodebench (08.01 - 12.01) 基准测试中的准确率从 29.2% 提升至 34.38%
- 中文写作与推理能力:在内部测试集中表现也有相应提升
与此同时,全新版本的模型对文件上传和网页总结功能的用户体验进行了优化。