跳转到主要内容

Documentation Index

Fetch the complete documentation index at: https://docs.apiyi.com/llms.txt

Use this file to discover all available pages before exploring further.

一句话回答

分组是令牌可选择的”调用通道”,决定可用模型范围、计费倍率与上游路由。 从用户视角看像”我自己所在的分组”,但每一次调用真正生效的,始终是令牌上选定的那个分组

用户视角 vs 平台视角

用户视角

分组 = 我在创建/编辑令牌时自选的通道,决定这把令牌能用哪些模型、按什么倍率计费、走哪条上游线路。

平台视角

分组是资源管理与突显特性的手段:把同类型模型、专属算力、定向折扣聚合成一条通道,便于精准计费与差异化定价。

“用户分组” ≠ “令牌分组”,别混淆

很多用户的第一反应是:“我账户上是不是有个分组,需要在哪里切换?”
  • 账户层确实有”用户分组”概念,决定基础权限范围(例如能否看到 SVIP 模型列表、是否解锁企业兜底分组等)
  • 每一次 API 调用,决定路由、计费倍率与模型可用性的,都是令牌上所选的分组
所以排查问题时,先看令牌的「选择分组」与「兜底分组」设置,而不是去找”我账户的分组”。详见 令牌与分组

案例 1:为什么会有 ClaudeCode 这个分组?

目的:把支持 Anthropic 原生 /v1/messages 调用格式的模型聚合到一个通道,让你在 Claude Code、Cherry Studio、其它 Anthropic 原生客户端里像调用 Claude 一样直接使用国产编程模型,无需改任何代码格式 包含哪些模型
  • Claude 全系列(官转 / AWS Claude)
  • 国产兼容 /v1/messages 的编程模型,如 qwen3.x-maxglm-5.xdeepseek-v4
折扣
  • 默认 95 折(5% off),无需任何操作
  • 可叠加充值加赠 10%–20%,实际成本比官方直连便宜约两成
怎么用
  1. 打开 https://api.apiyi.com/token 新增或编辑令牌
  2. 「选择分组」选 ClaudeCode
  3. 客户端按 Anthropic 原生格式调用即可

案例 2:视频模型为什么要走专属分组?

视频模型的计费方式(按秒、按张、按时长)与文本模型完全不同,且各自的上游通道独立。平台用分组来让特殊计费规则精准生效
模型必须选择的分组
Sora 2 官转视频Sora2Official(按秒计费)
阿里 Wan 视频系列Wan
Seedance 2 视频对应专属分组(以控制台为准)
走错分组的常见后果:模型不可用(404)、计费异常或调用直接被拒。请确认令牌的「选择分组」或「兜底分组」里有目标模型对应的分组。

案例 3:报错”当前分组上游负载已饱和”是平台在限我吗?

这是 SaaS 多用户产品场景下的高频问题,取材自一次真实工单 场景还原
  • 开发者:我的工具是 SaaS 模式,多用户分散调用,点击量一上来就报:
    error 429 (content-type-not-allowed):当前分组上游负载已饱和,请稍后再试
  • 我以为是平台限制了我的并发,需要在哪里”分组”来规避?
真相
  • 这条错误不是账户层面的并发限流
  • 它指的是:该模型在该分组所对应的上游通道当前繁忙
  • 常见诱因:使用了厂商侧仍处于 preview 阶段的模型(例如 *-preview-* 命名的版本),其官方算力本身存在波动
正确应对
1

放宽客户端的超时与重试

把超时调到更宽松(如 60–120s),失败重试间隔从立即重试改为指数退避;不要在错误瞬间立刻并发重发。
2

为常用模型挂兜底分组

在令牌上为目标模型对应的分组添加 1–2 个兜底分组,主分组拥塞时自动切换备用通道,提高成功率。
3

对高并发业务做模型评估

若业务对延迟和稳定性敏感,可在自己的场景里中性评估同系列里负载更稳定的型号(不同厂商通常会有更轻量、负载更分散的同系列分支),由业务侧自行测试取舍。
我们没有对客户的调用做并发墙。这条 429 来自上游通道,不是计费意义上的限流,重试通常即可恢复。

我该怎么选分组?快速决策

你的场景选择分组
文本、多模态、NanoBanana、Veo 3.1 等绝大部分模型Default
Claude Code 里同时使用 Claude 与国产编程模型(/v1/messages 格式)ClaudeCode(默认 95 折,可叠加加赠)
Sora 2 官转视频Sora2Official
Wan / Seedance 2 视频对应专属分组
高并发不稳定、需要更高成功率在令牌挂 1–2 个兜底分组

关于”组倍率”

控制台显示的「组倍率」是人民币计价的相对值,并非直接的美元折扣比例——0.14x 不等于”打 1.4 折”。一般情况下您不需要深究,选对分组即可;想理解倍率与价格换算,请看 系统里模型的【倍率】是什么?

相关文档

令牌与分组

令牌作用、创建/编辑、查看代码示例与分组一览图。

令牌计费模式

按量优先、按次优先等计费模式的区别。

模型倍率说明

倍率含义、人民币计价单位与美元价格的换算。

模型可用性

模型分级与不同用户分组的访问权限。