跳到主要内容

模型 & 价格

下表所列模型价格以“百万 tokens”为单位。Token 是模型用来表示自然语言文本的的最小单位,可以是一个词、一个数字或一个标点符号等。我们将根据模型输入和输出的总 token 数进行计量计费。


模型细节

模型deepseek-v4-flash(1)deepseek-v4-pro
BASE URL (OpenAI 格式)https://api.deepseek.com
BASE URL (Anthropic 格式)https://api.deepseek.com/anthropic
模型版本DeepSeek-V4-FlashDeepSeek-V4-Pro
思考模式支持非思考与思考模式(默认)
切换方式详见思考模式
上下文长度1M
输出长度最大 384K
功能Json Output支持支持
Tool Calls支持支持
对话前缀续写(Beta)支持支持
FIM 补全(Beta)仅非思考模式支持仅非思考模式支持
价格百万tokens输入(缓存命中)(2)0.02元0.025元(2.5折(3)0.1元
百万tokens输入(缓存未命中)1元3元(2.5折(3)12元
百万tokens输出2元6元(2.5折(3)24元
并发限制(4)2500500

(1) deepseek-chat 与 deepseek-reasoner 两个模型名将于日后弃用。出于兼容考虑,二者分别对应 deepseek-v4-flash 的非思考与思考模式。
(2) 全系列模型,输入缓存命中的价格已降至首发价格的 1/10,该价格调整自北京时间 2026/4/26 20:15 起生效
(3) deepseek-v4-pro 模型 API 价格将于北京时间 2026/05/31 23:59 结束 2.5 折优惠活动后,正式调整为原定价的 1/4
(4) 更多并发限制细节,请参考限速与隔离


扣费规则

扣减费用 = token 消耗量 × 模型单价,对应的费用将直接从充值余额或赠送余额中进行扣减。 当充值余额与赠送余额同时存在时,优先扣减赠送余额。

产品价格可能发生变动,DeepSeek 保留修改价格的权利。请您依据实际用量按需充值,定期查看此页面以获知最新价格信息。