跳到主要内容

限速

DeepSeek API 会根据负载情况,动态限制用户并发量。当您到达并发上限时,会立即收到 HTTP 429 返回。

您的请求发出后,可能需要等待一段时间才能获取服务器的响应。在这段时间里,您的 HTTP 请求会保持连接,并持续收到如下格式的返回内容:

  • 非流式请求:持续返回空行
  • 流式请求:持续返回 SSE keep-alive 注释(: keep-alive

这些内容不影响对响应的 JSON body 的解析。如果您在自己解析 HTTP 响应,请注意处理这些空行或注释。

如果 10 分钟后,请求仍未开始推理,服务器将关闭连接。