简短回答
并发限制因模型类型而异,文本模型并发最高,图片模型有适度控制。重要说明并发限制是针对单一模型,而不是整个账号。例如,Nano Banana Pro 模型有 30 个并发,不影响其他模型的并发使用。
不同模型类型的并发限制
文本类模型
默认:50 次/秒
- ✅ 高并发支持
- ✅ 适合批量处理
- 🔓 可申请更高额度
视频异步模型
默认:高并发
- ✅ 异步处理机制
- ✅ 支持大规模调用
- 📊 适合批量视频生成
图片类模型
默认:30 次/秒
- ⚠️ 有并发控制
- 📦 Base64 大数据传输
- 🔓 可申请调整
为什么图片模型有并发控制?
并发计算方式
按单一模型计算
并发限制是针对每个具体模型,而非整个账号:| 场景 | 并发计算方式 |
|---|---|
| 调用同一模型 | 受该模型并发限制(如 Nano Banana Pro 30次) |
| 调用不同模型 | 各模型独立计算,互不影响 |
| 多个令牌 | 每个令牌独立计算并发 |
如何申请更高并发?
个人用户
1
评估实际需求
确定您需要的并发量级和使用场景
2
联系客服申请
通过微信客服 8765058 说明需求
3
技术评估
我们会根据您的使用场景和历史数据评估
4
调整配额
审核通过后,为您的令牌调整并发限制
企业大客户
专线保障服务企业客户可申请专线保障,享受:
- 🚀 更高并发配额:根据业务需求定制
- 🔒 独立资源池:不受公共流量影响
- ⚡ 优先调度:保证响应速度
- 📞 专属技术支持:一对一服务
常见问题
为什么文本模型并发比图片模型高?
为什么文本模型并发比图片模型高?
文本模型的请求和响应数据量较小(通常几 KB),而图片模型传输 Base64 编码的图像数据(通常 500KB-5MB),为保证整体服务质量需要控制并发。
如何知道当前并发配额?
如何知道当前并发配额?
可以通过以下方式查看:
- 后台控制台查看令牌配置
- API 响应头中的 Rate Limit 信息
- 联系客服查询具体配额
超出并发限制会怎样?
超出并发限制会怎样?
超出并发限制时,API 会返回
429 Too Many Requests 错误。建议:- 实现请求队列管理
- 添加重试机制(指数退避)
- 申请更高并发配额
不同令牌的并发是否共享?
不同令牌的并发是否共享?
不共享。每个令牌有独立的并发配额,互不影响。如需更高总并发,可以创建多个令牌分散请求。
调整并发配额需要额外费用吗?
调整并发配额需要额外费用吗?
一般情况下,合理的并发调整不收取额外费用。但极高并发或专线服务可能涉及企业定制方案,具体请咨询客服。
并发优化建议
使用请求队列
实现本地队列管理,控制同时发送的请求数量,避免超限
错误重试机制
遇到 429 错误时,使用指数退避策略重试
多令牌分散
创建多个令牌,将请求分散到不同令牌,提升总并发
异步处理优先
对于非实时场景,优先使用异步 API(如视频生成)