更新日志
版本: 2025-03-24
deepseek-chat
deepseek-chat
模型升级为 DeepSeek-V3-0324:
- 推理能力增强
- 基准测试提升显著
- MMLU-Pro: 75.9 → 81.2 (+5.3)
- GPQA: 59.1 → 68.4 (+9.3)
- AIME: 39.6 → 59.4 (+19.8)
- LiveCodeBench: 39.2 → 49.2 (+10.0)
- 基准测试提升显著
- Web前端开发能力优化
- 代码生成准确率提升
- 生成的网页与游戏前端更加美观
- 中文写作能力升级
- 风格与内容优化
- 实现与R1写作风格对齐
- 中长篇写作内容质量提升
- 风格与内容优化
- 功能增强
- 多轮交互式改写能力提升
- 翻译质量与书信写作优化
- 中文搜索能力优化
- 报告分析类请求优化,输出内容详实
- Function Calling 能力改进
- Function Calling 准确率提升,修复 V3 之前的问题
版本: 2025-01-20
deepseek-reasoner
deepseek-reasoner
是我们的新模型 DeepSeek-R1. 可以通过指定model=deepseek-reasoner
调用。- 详细更 新,请参考: DeepSeek-R1 正式发布
- 调用指南,请参考: 推理模型
版本: 2024-12-26
deepseek-chat
deepseek-chat
模型升级为 DeepSeek-V3,接口不变,可以通过指定model=deepseek-chat
调用。- 详细更新,请参考:DeepSeek-V3 正式发布
版本:2024-12-10
deepseek-chat
deepseek-chat 模型升级为 DeepSeek-V2.5-1210,模型各项能力提升,相关基准测试:
- 数学能力:在 MATH-500 基准测试中的表现从 74.8% 提升至 82.8%
- 代码能力:在 LiveCodebench (08.01 - 12.01) 基准测试中的准确率从 29.2% 提升至 34.38%
- 中文写作与推理能力:在内部测试集中表现也有相应提升
与此同时,全新版本的模型对文件上传和网页总结功能的用户体验进行了优化。