模型 & 价格
下表所列模型价格以“百万 tokens”为单位。Token 是模型用来表示自然语言文本的的最小单位,可以是一个词、一个数字或一个标点符号等。我们将根据模型输入和输出的总 token 数进行计量计费。
模型 & 价格细节
模型(1) | deepseek-chat | deepseek-reasoner | |
上下文长度 | 64K | 64K(2) | |
输出长度(3) | 默认 4K,最大 8K | 默认 32K,最大 64K | |
功能 | Json Output | 支持 | 支持 |
Function Calling | 支持 | 支持 | |
对话前缀续写(Beta) | 支持 | 支持 | |
FIM 补全(Beta) | 支持 | 不支持 | |
标准时段价格 (北京时间 08:30-00:30) | 百万tokens输入(缓存命中)(4) | 0.5元 | 1元 |
百万tokens输入(缓存未命中) | 2元 | 4元 | |
百万tokens输出 (5) | 8元 | 16元 | |
优惠时段价格(6) (北京时间 00:30-08:30) | 百万tokens输入(缓存命中) | 0.25元(5折) | 0.25元(2.5折) |
百万tokens输入(缓存未命中) | 1元(5折) | 1元(2.5折) | |
百万tokens输出 | 4元(5折) | 4元(2.5折) |
deepseek-chat
模型对应 DeepSeek-V3-0324;deepseek-reasoner
模型对应 DeepSeek-R1-0528。deepseek-reasoner
的最大输入长度为 64K,输出长度不计入上下文限制。deepseek-reasoner
的max_tokens
参数限制了模型单次输出的最大长度(思维链输出)。- 关于上下文缓存的细节,请参考 DeepSeek 硬盘缓存。
deepseek-reasoner
的输出 token 数包含了思维链和最终答案的所有 token,其计价相同。- DeepSeek API 现实行错峰优惠定价,每日优惠时段为北京时间 00:30-08:30,其余时间按照标准价格计费。请求的计价时间为该请求完成的时间。
扣费规则
扣减费用 = token 消耗量 × 模型单价,对应的费用将直接从充值余额或赠送余额中进行扣减。 当充值余额与赠送余额同时存在时,优先扣减赠送余额。
产品价格可能发生变动,DeepSeek 保留修改价格的权利。请您依据实际用量按需充值,定期查看此页面以获知最新价格信息。