限速
DeepSeek API 会根据负载情况,动态限制用户并发量。当您到达并发上限时,会立即收到 HTTP 429 返回。
您的请求发出后,可能需要等待一段时间才能获取服务器的响应。在这段时间里,您的 HTTP 请求会保持连接,并持续收到如下格式的返回内容:
- 非流式请求:持续返回空行
- 流式请求:持续返回 SSE keep-alive 注释(
: keep-alive)
这些内容不影响对响应的 JSON body 的解析。如果您在自己解析 HTTP 响应,请注意处理这些空行或注释。
如果 10 分钟后,请求仍未开始推理,服务器将关闭连接。