并发&配额

说明一下OpenAI GPT、Gemini、CLaude等顶尖大模型的并发访问上限和配额。(最后更新:2025-10-8,最新配额请咨询我们)

术语

  • TPM:Tokens Per Minute,每分钟令牌数
  • RPM:Requests Per Minute,每分钟请求数
  • RPD:Requests Per Day,每日请求数

OpenAI GPT

模型TPMRPM
GPT-51M tokens1万
GPT-5-mini1M tokens1千
GPT-5-nano5M tokens5千
GPT-5-chat1M tokens1千
GPT-5-codex1M tokens1千

Gemini

模型TPMRPD批量排队Tokens
Gemini 2.5 Pro2M tokens1万500万
Gemini 2.5 Flash1M tokens1万300万
Gemini 2.5 Flash-Lite4M tokens1万1000万
Gemini 2.0 Flash4M tokens-1000万
Gemini 2.0 Flash-Lite4M tokens-1000万

批量调用API的请求限制:

  • 并发批量请求数:100
  • 输入文件大小限制:2 GB
  • 文件存储空间上限:20 GB

Claude

模型词元数/秒消耗率
Claude Opus 4.1701 个输入 token = 1 个 token
1 个输出 token = 5 个 token
1 个缓存写入 token = 1.25 个 token
1 个缓存命中 token = 0.1 个 token
Claude Opus 4701 个输入 token = 1 个 token
1 个输出 token = 5 个 token
1 个缓存写入 token = 1.25 个 token
1 个缓存命中 token = 0.1 个 token
Claude Sonnet 4.5350小于 200,000 个输入 token
1 个输入 token = 1 个 token
1 个输出 token = 5 个 token
1 个缓存写入 token = 1.25 个 token
1 个缓存命中 token = 0.1 个 token

大于或等于 200,000 个输入 token
1 个输入 token = 2 个 token
1 个输出 token = 7.5 个 token
1 个缓存写入 token = 2.5 个 token
1 个缓存命中 token = 0.2 个 token
Claude Sonnet 4350小于 200,000 个输入 token
1 个输入 token = 1 个 token
1 个输出 token = 5 个 token
1 个缓存写入 token = 1.25 个 token
1 个缓存命中 token = 0.1 个 token

大于或等于 200,000 个输入 token
1 个输入 token = 2 个 token
1 个输出 token = 7.5 个 token
1 个缓存写入 token = 2.5 个 token
1 个缓存命中 token = 0.2 个 token
Claude 3.7 Sonnet3501 个输入 token = 1 个 token
1 个输出 token = 5 个 token
1 个缓存写入 token = 1.25 个 token
1 个缓存命中 token = 0.1 个 token

技术支持[email protected] GREATTEC PTE, LTD. @2025 版权所有