大语言模型应用的错误处理最佳实践,包括重试策略、熔断器模式和优雅降级
错误类型 | 主要原因 | 常见场景 |
---|---|---|
🚫 客户端错误 | 认证、授权、参数错误 | API密钥无效、权限不足 |
⚡ 速率限制 | API调用频率、令牌限制 | 并发过高、token超限 |
🔧 服务器错误 | 内部错误、服务不可用 | 模型故障、系统维护 |
🌐 网络错误 | 连接超时、网络中断 | 网络抖动、DNS问题 |
429 Too Many Requests
:超过API调用频率限制401 Unauthorized
:无效的API密钥403 Forbidden
:权限不足500 Internal Server Error
:AI提供商服务器问题502 Bad Gateway
:网关错误503 Service Unavailable
:服务暂时不可用504 Gateway Timeout
:网关超时base_delay
秒min(base_delay * (multiplier ^ attempt), max_delay)
delay * random(jitter_range)