限速与隔离
并发限速
对每个账号,DeepSeek API 不同模型的并发限制如下表所示。
若您有更高的并发需求,可提交账号扩容申请工单,我们将根据您实际的业务需求匹配合适的并发量,扩容并不增加额外的费用。
| deepseek-v4-pro | deepseek-v4-flash | |
| 并发限制 | 500 | 2500 |
- 一个请求从发出后,到模型响应完成之前记为一个并发
- 并发限制以账号粒度计,与 API Key 无关
- 对于一个账号,在并发限度内,您的 API 请求都会得到响应;超过并发限度时,您会收到 HTTP 429 错误码
user_id 隔离
用户可以向 API 传递 user_id 参数,来实现同一账号下,对您业务侧不同用户的细粒度管理。user_id 的具体功能如下:
- 内容安全隔离:
user_id用于我们区分您业务侧的用户身份,以进行内容安全状况处理 - KVCache 隔离:
user_id用于我们对您业务侧用户进行 KVCache 隔离,以进行隐私管理 - 调度隔离:
user_id用于我们对您业务侧用户进行调度隔离- 对于普通 API 用户,所有
user_id合并计算并发限速 - 对于提升了并发配额的 API 用户,我们会限制您账号下的总并发,同时我们会对每个您传入的
user_id进行并发限制(空 id 为一个特殊的user_id)。对每个user_id,deepseek-v4-pro 并发限制为 500,deepseek-v4-flash 并发限制为 2500。若某个user_id超过了该限制,则您账号下设置了该user_id的请求将会收到 HTTP 429 错误码
- 对于普通 API 用户,所有