Documentation Index
Fetch the complete documentation index at: https://docs.apiyi.com/llms.txt
Use this file to discover all available pages before exploring further.
概述
VEO 3.1 Official 是 API易 接入 Google Veo 3.1 系列的 官转通道(透传 Google AI Studio),直连 Googleveo-3.1-generate-preview / veo-3.1-fast-generate-preview 异步端点,模型 ID、响应字段、约束条件与 Google 官方完全一致。按次计费、默认分组即可调用,是目前接入门槛最低的 Veo 3.1 官方质量通道。
🎬 核心亮点:透传 Google AI Studio 官方端点 + 同步音视频原生输出 + 4 / 6 / 8 秒灵活时长 + 720p / 1080p / 4k 三档分辨率 + 按次计费 $0.3 起 + 默认分组 + 按次计费 / 按量优先令牌即可调用(无需切换专属分组)。适合广告短片、电商视频素材、社交媒体内容、产品演示 等追求官方画质 + 简单接入的生产场景。
文生视频 API
POST /v1/videos,纯文本提示词生成视频,JSON 请求体,最简单的入口。图生视频 API
POST /v1/videos + multipart 上传 input_reference,让静态图片动起来。官转 vs 官逆
与既有 VEO 3.1(官逆) 的选型对照表。
为什么选 API易 的 VEO 3.1 Official
对标 Google 官方 / Vertex AI 通道,针对企业生产场景在 接入门槛、稳定性、成本 三方面做了深度优化:官转直连 · 模型 ID 一致
透传到 Google AI Studio 的 Veo 3.1 异步端点,模型 ID(
veo-3.1-generate-preview / veo-3.1-fast-generate-preview)与官方完全一致,请求/响应字段、约束条件一比一对齐。开箱即用 · 无需切分组
走
Default 默认分组、按次计费 或 按量优先 令牌均可调用(按量计费暂不支持),无需切换专属分组。老用户现有 Key 不改配置就能直接跑,是最低接入门槛的官方质量通道。不限并发 · 企业可放量
账号池聚合透传,批量出片 / 短视频矩阵 / 广告生产等高并发场景下可线性扩容,不受 Google 单账号 Tier 限制。
按次定价 · 对比 Google 立省 60%+
veo-3.1-fast-generate-preview $0.3/次、veo-3.1-generate-preview $1.2/次,按次计费、4/6/8 秒 + 720p/1080p/4k 同价。对比 Google 官方 8 秒 1080p 立省 62-68%,叠加 充值加赠活动 进一步下降;失败任务不计费。全球零门槛接入
无需海外服务器或代理,国内机房、家宽网络、海外节点均可直连
api.apiyi.com,省去为 Google AI Studio / Vertex AI 配置出海链路的麻烦。专业服务 · 企业陪跑
团队深耕视频生成场景,在 prompt 工程、分辨率选型、批量生产、视频后处理等场景具备丰富经验,可为企业客户提供从 PoC 到生产上线的完整技术支持。
核心特性
同步音视频原生输出
Veo 3.1 系列原生输出带同步音轨的视频(环境音、对话、配乐),无需后期单独配音。音频效果通过 prompt 描述即可。
4 / 6 / 8 秒灵活时长
duration 字符串枚举 "4" / "6" / "8",按次计费、时长不影响单价。1080p / 4k 分辨率仅支持 "8"。三档分辨率分级
720p / 1080p / 4k 三档,单价均一。横屏(16:9)、竖屏(9:16)灵活切换。精准指令遵循
Veo 3.1 在镜头运动、物体物理、人物表情等细节上的指令遵循能力领先同档模型,支持丰富的镜头语言关键词(推/拉/摇/跟、俯/仰拍等)。
图生视频(input_reference)
上传一张图片作为视频起始帧,让静态画面”动起来”。详见 图生视频。
异步任务化
提交后返回
task_id,轮询状态、独立下载视频,便于批量管理和断点续传。OpenAI 兼容协议
base_url=https://api.apiyi.com/v1 + Bearer 鉴权,HTTP / OpenAI SDK 底层 client.post() 均可调用。失败不计费
异步模式下,生成失败、内容审核拦截、参数错误等情况均不计费,仅
status=completed 的任务才扣费。模型定价
API易 使用 Pay-per-request 计费,在支持的时长和分辨率组合内统一价格,不按时长或分辨率额外加价。按ai.google.dev/gemini-api/docs/pricing 公开价格测算,Google 官方 Veo 3.1 以秒计费;以下折扣按 8 秒视频 计算。
| 模型 | API易 价格 | Google 官方 8 秒 1080p | Google 官方 8 秒 4K |
|---|---|---|---|
veo-3.1-fast-generate-preview | $0.3 / 次 | $0.96 便宜 68.8% | $2.40 便宜 87.5% |
veo-3.1-generate-preview | $1.2 / 次 | $3.20 便宜 62.5% | $4.80 便宜 75.0% |
计费说明:
- 按 模型名 按次结算,与时长(4/6/8 秒)、分辨率(720p/1080p/4k)、是否传
input_reference无关——选 4K 不加价 - 异步模式下生成失败 / 内容审核拦截 / 服务过载错误均不计费
- 充值加赠政策见 充值加赠活动,叠加后实际成本进一步下降
- 4K 同价但渲染慢 4–6 倍、文件大 ~10 倍,日常用 1080p 性价比更优
- Google 官方 4K 单价 fast $0.30/秒、standard $0.60/秒,8 秒约 $2.40 / $4.80(数据来源
ai.google.dev/gemini-api/docs/pricing)
分组介绍
VEO 3.1 Official 在Default 默认分组即可调用(1x),无需切换专属分组。令牌计费模式需为 按次计费 或 按量优先——按量计费暂不支持(请在 控制台 把令牌切到按次或按量优先)。
| 维度 | VEO 3.1 Official | 备注 |
|---|---|---|
| 分组 | Default(1x) | 无需切换 |
| 计费模式 | 按次计费 ✅ / 按量优先 ✅ / 按量计费 ❌ | 按量计费不支持,必须切换 |
| 令牌要求 | 按次 或 按量优先 + Default 分组 | 不需要专属令牌 |
| 倍率 | 1.0x | 直接按定价表结算 |
技术规格
| 维度 | veo-3.1-fast-generate-preview | veo-3.1-generate-preview |
|---|---|---|
| 价格 | $0.3 / 次 | $1.2 / 次 |
| 支持时长(duration,字符串) | "4" / "6" / "8" | "4" / "6" / "8" |
| 支持分辨率(metadata.resolution) | 720p / 1080p / 4k | 720p / 1080p / 4k |
| 支持比例(metadata.aspectRatio) | 16:9 / 9:16 | 16:9 / 9:16 |
| 音轨 | ✅ 同步音视频 | ✅ 同步音视频 |
| 图生视频(input_reference) | ✅(仅 1 张参考图) | ✅(仅 1 张参考图) |
| 典型生成耗时 | 720p 60–90s · 1080p 80–120s · 4K 5–6 分钟 | 同 |
| 视频留存 | 官方未明确,建议生成后立即下载落地 | 同 |
| 响应字段 | id / task_id / status / progress / created_at | 同 |
端点一览
| 端点 | 方法 | 用途 | Content-Type |
|---|---|---|---|
/v1/videos | POST | 提交视频生成任务(文生视频 / 图生视频统一端点) | application/json 或 multipart/form-data |
/v1/videos/{task_id} | GET | 查询任务状态与进度 | — |
/v1/videos/{task_id}/content | GET | 下载已生成的视频文件(MP4 二进制) | — |
关键参数详解
duration(视频时长)
必须传字符串("4" / "6" / "8"),传数字会被服务端拒绝并报:
| 值 | 720p | 1080p | 4k |
|---|---|---|---|
"4" | ✅ | ❌ | ❌ |
"6" | ✅ | ❌ | ❌ |
"8" | ✅(默认) | ✅(必填) | ✅(必填) |
metadata.durationSeconds > duration > seconds > 8
metadata.resolution(分辨率)
| 值 | 像素(横) | 像素(竖) | 备注 |
|---|---|---|---|
720p(默认) | 1280x720 | 720x1280 | 三档时长都可用 |
1080p | 1920x1080 | 1080x1920 | 仅支持 duration="8" |
4k | 3840x2160 | 2160x3840 | 仅支持 duration="8",渲染慢 4–6 倍 |
metadata.resolution > size > 720p
⚠️ 不要传 generateAudio
Veo 3 / 3.1 原生带音频,但 generateAudio 参数不要传,上游会回 INVALID_ARGUMENT。要控制音频效果,把意图写进 prompt:
“黄昏海边的灯塔,海浪声、远处海鸟叫声,低沉的风声,电影级氛围”
最佳实践
按需选模型
- 试水 / 批量预览 →
veo-3.1-fast-generate-preview($0.3/次) - 最终交付 / 4K 高清 →
veo-3.1-generate-preview($1.2/次) - 同 prompt + 同 seed 下两个模型各跑一次,人工挑成片
走异步轮询而不是同步等待
官转通道仅支持异步:POST 提交拿
task_id → 每 8–10 秒轮询 GET /v1/videos/{task_id} 直到 status: "completed" → 从 /content 下载 MP4。没有 webhook,只能轮询。完成后立即下载落地
生成完成后立即下载到自己的 OSS / CDN,不要长期依赖远端
task_id 拿视频。status 刚翻 completed 后调 /content 偶发 400,等 4 秒重试一次即可(参考客户端已内置重试)。音频效果写进 prompt
不要传
generateAudio 参数(会被 INVALID_ARGUMENT 拒)。要环境音 / 对白 / BGM 直接写到 prompt 里:“海浪声、远处海鸟叫声、低沉的风声”。错误码与重试
| 状态码 / 现象 | 含义 | 处理建议 |
|---|---|---|
400 + parse_request_failed | duration 传成数字了 | 改成字符串 "4" / "6" / "8" |
INVALID_ARGUMENT | 传了 generateAudio 或 1080p/4k 配了非 8 秒 | 删掉 generateAudio;分辨率高档时 duration="8" |
401 | 令牌无效 | 检查 Authorization: Bearer <key> 无空格、key 未过期 |
429 | 限流 / 余额不足 | 指数退避重试;充值后立即可用 |
5xx / INTERNAL | 上游瞬时错误 | 保持同 seed 重试 1–2 次(不计费) |
GET /content 偶发 400 | status 刚翻 completed | 等 4 秒重试一次(建议客户端做 3–5 次重试) |
任务 failed | 视频生成失败(多为内容审核或上游容量) | 调整 prompt 重试;该任务不计费 |
建议客户端:
- POST 提交超时 30 秒(multipart 上传可能更慢)
- GET 轮询间隔 8–10 秒,最长等待 720p/1080p 3 分钟、4K 10 分钟
- 对 5xx 与任务
failed做 指数退避重试(建议 1–2 次) - 下载
/content做 3–5 次重试,每次间隔 4 秒
常见问题
官转和官逆有什么区别?现在还能用官逆吗?
官转和官逆有什么区别?现在还能用官逆吗?
官转(本页):透传到 Google AI Studio 官方端点,模型 ID 与 Google 官方一致(
veo-3.1-generate-preview / veo-3.1-fast-generate-preview),按次 $0.3 / $1.2,仅支持异步端点。官逆(既有 VEO 3.1):通过逆向工程接入 Google Flow,模型 ID 是 veo-3.1-fast / veo-3.1 / -fl 系列,按次 $0.15 起,价格更便宜,同时支持 同步流式 与异步两种调用,且支持首尾帧。详细对比见 官转 vs 官逆 选型表。两个通道并存,按业务需求选。为什么 duration 一定要传字符串?
为什么 duration 一定要传字符串?
后端用的 Go struct 把
duration 声明为 string 类型,传数字直接被解码层拒掉,报 parse_request_failed: cannot unmarshal number into Go struct field ... duration of type string。这是上游强约束,不会改。写代码时记得加引号:"4" / "6" / "8"。想要带对白 / 环境音 / BGM 怎么办?generateAudio 能传吗?
想要带对白 / 环境音 / BGM 怎么办?generateAudio 能传吗?
Veo 3 / 3.1 是 原生带音频 的视频模型,但
generateAudio 这个参数 不要传(传了会被上游回 INVALID_ARGUMENT)。要控制声音,把音频意图写进 prompt:“黄昏海边的灯塔,海浪声、远处海鸟叫声,低沉的风声,电影级氛围”
fast 和 standard 到底怎么选?fast 是更快还是更便宜?
fast 和 standard 到底怎么选?fast 是更快还是更便宜?
- 同等参数下 渲染时长基本相同(实测 720p 8 秒:fast 83s、standard 78s),fast 不是更快,而是更便宜($0.3 vs $1.2)
- 默认用
veo-3.1-fast-generate-preview - 最终交付、对画面细腻度 / 物理一致性敏感时切
veo-3.1-generate-preview - 建议线上 AB:同 prompt + 同 seed 下两个模型各跑一次,人工挑
4K 值得用吗?什么时候用 4K?
4K 值得用吗?什么时候用 4K?
绝大多数场景不推荐:
- 同价格按次,听起来划算
- 但渲染慢 4–6 倍(720p 80s → 4K 350s)
- 文件大 ~10 倍(720p 4MB → 4K 40MB),带宽 / 存储成本翻倍
- 视觉上 1080p 已经够用,大部分播放场景看不出差别
veo-3.1-generate-preview、duration 必须 "8"、客户端超时 ≥ 10 分钟、异步任务做好后台处理。任务什么时候才算完成?要不要 webhook?
任务什么时候才算完成?要不要 webhook?
- 目前 没有 webhook,只能轮询
GET /v1/videos/{task_id} - 推荐轮询间隔:8 秒(实测够用,不触发限流)
- 实测耗时:720p / 1080p 60–115 秒,4K 5–6 分钟
- 客户端超时建议 720p/1080p 设 3 分钟,4K 设 10 分钟
GET /content 返回 400 是什么原因?
GET /content 返回 400 是什么原因?
status 刚翻 completed 后立即调 /v1/videos/{task_id}/content 偶发 400,是上游 CDN 同步延迟。等 4 秒重试一次通常就好(参考客户端内置 3–5 次重试,间隔 4 秒)。响应里能直接拿到视频的 CDN URL 吗?前端能直连吗?
响应里能直接拿到视频的 CDN URL 吗?前端能直连吗?
暂时不可以。本通道目前不返回任何 CDN / 公网 URL——响应字段里没有
video_url / data.url 之类的可直接分发链接。唯一拿视频的方式:拿到 status: "completed" 后调 GET /v1/videos/{task_id}/content,返回 MP4 二进制流(需要带 Authorization: Bearer 头)。生产侧标准做法:- 后端任务完成后立即下载 MP4 → 推到自己的 OSS / CDN
- 把自家 CDN URL 分发给终端用户
- 前端
<video>标签不要直接指向/content端点——浏览器请求不带鉴权头会 401
视频在远端保存多久?需要立刻下载吗?
视频在远端保存多久?需要立刻下载吗?
官方文档未明确给出留存期。强烈建议生成完成后立即下载落本地存储,不要长期依赖远端
task_id 拿视频——/content 端点过期后会 404。progress 字段为什么一直是 50%?
progress 字段为什么一直是 50%?
这个字段是粗粒度,只在 0 / 50 / 100 三档之间跳,不要拿来做百分比进度条。要展示进度,要么用旋转 loading,要么按”已等待秒数 / 预期秒数”自己算。
视频生成失败会扣费吗?
视频生成失败会扣费吗?
不会。只对
status=completed 的任务计费,failed / 取消 / 内容审核拦截 / 参数错误都免费。只要任务没真正出片就不扣费。seed 能复现一模一样的视频吗?
seed 能复现一模一样的视频吗?
不能字节级复现。实测同 prompt + 同 seed(
88888)+ 同参数,fast 跑两次:文件大小 9.81 MB vs 9.25 MB、md5 完全不同、渲染耗时也不同。但 seed 不是装饰品:同 seed 多次结果互相聚集(5 次实测组内文件大小跨度仅 6%),不同 seed 系统性偏移(组间差距 +36.8%)。所以:- 想要”稳定风格” → 固定 seed
- 想要”探索变体” → 换 seed 比换 prompt 局部词更直观
- 想要”精确重放” → 别想了,把 mp4 存下来
能传多张参考图吗?能传首尾帧吗?
能传多张参考图吗?能传首尾帧吗?
当前都不支持。图生视频只能 1 张图,字段名固定
input_reference,且只接受文件或 Base64,不接受远程 URL。Google 官方 Veo 3.1 有多参考图 / 首尾帧 / 视频扩展能力,但本站官转通道暂未开放。首尾帧需求请用 VEO 3.1(官逆) 的 -fl 系列模型。一次能并发多少任务?有 QPS 限制吗?
一次能并发多少任务?有 QPS 限制吗?
实测一口气提交 10 个任务全部成功入队,未触发拒绝。具体上限官方未明示,建议生产侧自己限流(in-flight ≤ 10),对 429 / 5xx 加指数退避重试。
视频带水印 / 溯源信息吗?
视频带水印 / 溯源信息吗?
- 没有可视水印
- 但带 Google C2PA Content Credentials 签名(
urn:c2pa:...,Google C2PA Media Services 颁发),藏在 MP4 元数据里。终端用户肉眼看不到,用 C2PA 工具(如 Adobe Content Authenticity)可以验出”由 Veo 生成” - 二创再分发知情即可,一般不影响播放
可以用 OpenAI 官方 SDK 直连吗?
可以用 OpenAI 官方 SDK 直连吗?
部分可以。接口是 OpenAI 风格的(
Bearer 鉴权 + /v1/...),但 OpenAI 官方 SDK 没有 videos.create 这个方法(/v1/videos 是自定义路径),多半要用 OpenAI SDK 的底层 client.post() 或直接 HTTP 调用。直接 HTTP 最省事,详见 文生视频 Playground 页的代码示例。相关文档
- 文生视频 Playground -
POST /v1/videos(JSON)在线调试,5 段语言代码示例 - 图生视频 Playground -
POST /v1/videos(multipart)+input_reference用法详解 - 官转 vs 官逆 选型表 - 与 VEO 3.1(官逆) 的差异对照
- 充值加赠活动 - 加赠最高档位与适用渠道
- API 使用手册 - 通用调用规范、超时与重试建议
- Google 官方模型页:
ai.google.dev/gemini-api/docs/models/veo-3.1-generate-preview - Google 官方视频生成文档:
ai.google.dev/gemini-api/docs/video
VEO 3.1 Official 是 API易 透传 Google AI Studio 的稳定官转服务。模型 ID、响应字段、约束条件与 Google 官方完全一致,且默认分组 + 按次计费 / 按量优先 令牌即可调用——是目前接入门槛最低的官方质量通道。如有问题或建议,欢迎在控制台工单中反馈。