跳转到主要内容

概述

apiyi-gpt-image-2-genapiyi-gpt-image-2-all-gen 是社区用户 wuchubuzai2018 贡献的两个开源 AI Agent Skill,让你在 Codex CLI、OpenCode、Gemini CLI、GitHub Copilot、Cursor、Amp 等支持 Skills 的 AI 编程工具中,通过一句自然语言调用 API易 的两款 OpenAI GPT 图像模型 —— 官转 gpt-image-2(精细可控、按 token 计费、支持 4K)与 官逆 gpt-image-2-all(对话式、按次计费、ChatGPT 一致体验)。
项目信息
  • 🔗 开源地址:github.com/wuchubuzai2018/expert-skills-hub
  • 📦 Skill 标识:apiyi-gpt-image-2-gen(官转)、apiyi-gpt-image-2-all-gen(官逆)
  • 👤 作者:wuchubuzai2018(无处不在的技术)
  • ⭐ 该项目由社区用户贡献,与同作者的 Nano Banana Pro 生图 Skill 属于同一 Skills 合集仓库
两个 Skill 如何选?
  • apiyi-gpt-image-2-gen(官转,推荐):可控 size / quality / output-format / compression,支持 4K(3840×2160)、自定义尺寸、mask 语义编辑,按 token 计费——适合有明确画质/尺寸要求的场景
  • apiyi-gpt-image-2-all-gen(官逆):仅需 prompt + 可选 response-format,通过 Prompt 描述尺寸/比例,按次计费($0.03 / 次),与 ChatGPT 网页版体验一致——适合自然语言直出、文字还原、多轮改图
  • 完整差异见 官转 vs 官逆对比文档

核心功能

一句话生图

在 AI 编程助手中直接用中文/英文自然语言描述,即刻生成或编辑图片

双模型覆盖

官转 gpt-image-2 与官逆 gpt-image-2-all 同时可用,按场景切换

4K + 自定义尺寸(官转)

官转 Skill 支持 1024² / 1536×1024 / 2048² / 3840×2160 等预设及自定义尺寸

画质/格式可选(官转)

quality(low / medium / high / auto)+ 输出格式(png / jpeg / webp)+ 压缩率 0-100

最多 5 张参考图

两个 Skill 均支持最多 5 张参考图叠加输入,实现多图融合与风格迁移

多平台兼容

Codex CLI / OpenCode / Gemini CLI / GitHub Copilot / Cursor / Amp 均可用

Node.js 与 Python 双运行时

脚本同时提供 generate_image.jsgenerate_image.py

零侵入式配置

环境变量 APIYI_API_KEY 一次设置,全局可用;也支持 -k 命令行临时覆盖

支持的 API易 模型

模型名称模型标识对应 Skill计费API 文档
GPT-Image 2(官转,推荐)gpt-image-2apiyi-gpt-image-2-gen按 token 实计查看文档
GPT-Image 2 All(官逆)gpt-image-2-allapiyi-gpt-image-2-all-gen$0.03 / 次查看文档

快速上手:3 步开始生图

1

第一步:获取 API易 密钥

  1. 访问 API易控制台 注册/登录
  2. 进入【令牌】栏目,生成新的 API 密钥(以 sk- 开头)
  3. 建议单独建一个带用量上限的专用密钥
新用户注册即可获得免费测试额度,足够体验两款 GPT 图像模型。
2

第二步:安装 Skill(按需二选一或全装)

官转 gpt-image-2(推荐)
npx skills add https://github.com/wuchubuzai2018/expert-skills-hub --skill apiyi-gpt-image-2-gen
官逆 gpt-image-2-all
npx skills add https://github.com/wuchubuzai2018/expert-skills-hub --skill apiyi-gpt-image-2-all-gen
需要 Node.js 环境;Python 脚本可作为备选运行时。未装 Node.js 可访问 nodejs.org 下载。
3

第三步:配置 API 密钥

设置环境变量(推荐写入 ~/.zshrc / ~/.bashrc):
export APIYI_API_KEY="sk-你的API易密钥"
Windows PowerShell:
$env:APIYI_API_KEY="sk-你的API易密钥"
配置完成!在支持 Skills 的 AI 编程工具中即可通过自然语言触发两个 Skill。

命令参数详解

apiyi-gpt-image-2-gen(官转)

参数缩写必填说明示例
--prompt-p文生图描述或编辑指令"橘猫在草地上玩耍"
--filename-f输出路径(省略自动生成带时间戳的名字)"cat.png"
--size-s预设(1024x1024 / 1536x1024 / 1024x1536 / 2048x2048 / 2048x1152 / 3840x2160 / 2160x3840)或自定义"2048x1152"
--quality-qlow / medium / high / auto"high"
--output-format-opng(默认)/ jpeg / webp"webp"
--output-compression-c0-100,仅对 jpeg / webp 生效80
--input-image-i参考图路径(最多 5 张)"portrait.png"
--api-key-k临时覆盖环境变量密钥"sk-xxx"
支持的宽高比1:13:22:316:99:16,以及 ≤ 3:1 的自定义比例。 自定义尺寸约束:单边 ≤ 3840px,长宽均为 16 的倍数,总像素 65.5 万 – 829.4 万。 典型耗时:120–150 秒 / 请求(4K 复杂场景会更久)。

apiyi-gpt-image-2-all-gen(官逆)

参数缩写必填说明示例
--prompt-p对话式生图或编辑指令(尺寸/比例通过 prompt 描述)"横版 16:9 赛博朋克城市"
--filename-f输出路径(省略自动生成带时间戳的 PNG)"city.png"
--response-format-rurl(默认,R2 CDN 约 24h 有效)或 b64_json"b64_json"
--input-image-i参考图路径(最多 5 张)"ref.png"
--api-key-k临时覆盖环境变量密钥"sk-xxx"
官逆 Skill 不支持 size / quality / aspect_ratio 命令行参数 —— 这些都通过 prompt 文字描述(如 "竖版 9:16 手机海报""1024x1024 方图")。耗时 60–300 秒。

使用示例

示例 1:官转文生图 + 精细控制

node scripts/generate_image.js \
  -p "Cinematic product shot of a minimalist ceramic teacup, soft morning light, 35mm lens" \
  -f "teacup.png" \
  -s "3840x2160" \
  -q "high" \
  -o "png"

示例 2:官转图生图(参考图编辑)

node scripts/generate_image.js \
  -p "把背景换成夕阳海滩,人物保持不变" \
  -i "portrait.png" \
  -f "portrait-beach.jpg" \
  -s "2048x1152" \
  -q "high" \
  -o "jpeg" \
  -c 85

示例 3:官转多图融合

node scripts/generate_image.js \
  -p "把图 1 的人物放进图 2 的场景,光线参考图 3" \
  -i person.png scene.png light.png \
  -f merged.png \
  -q high

示例 4:官逆对话式生图(尺寸通过 prompt)

node scripts/generate_image.js \
  -p "横版 16:9 电影画幅:一位穿汉服的少女站在樱花树下,水彩画风格,柔和光线" \
  -f "sakura.png" \
  -r url

示例 5:在 AI 编程工具中调用

安装后,直接对 AI 助手说(以 Cursor / Codex CLI 为例):
  • “用 apiyi-gpt-image-2-gen 生成一张 3840x2160、high 质量的赛博朋克城市壁纸”
  • “调用 apiyi-gpt-image-2-all-gen,把 photo.jpg 改成吉卜力动画风格”
  • “用官转 Skill 生成一张 logo,1:1,high 质量,webp 格式”
AI 助手会自动识别 Skill 并拼好命令行参数。

常见问题

  • 需要精确尺寸(如 3840×2160)、可控画质(low/medium/high)、特定输出格式(webp / 压缩)→ 选 官转 apiyi-gpt-image-2-gen
  • 需要与 ChatGPT 一致的对话式体验按次固定计费($0.03 / 次)、强文字还原自然语言描述尺寸即可 → 选 官逆 apiyi-gpt-image-2-all-gen
  • 完整差异参考 官转 vs 官逆对比文档
  1. 确认已安装 Node.js(node -v
  2. 网络通畅,能访问 GitHub
  3. npx skills 不可用,可手动克隆仓库:
git clone https://github.com/wuchubuzai2018/expert-skills-hub.git
然后将 skills/apiyi-gpt-image-2-genskills/apiyi-gpt-image-2-all-gen 目录复制到你的 Skills 目录。
  1. 环境变量 APIYI_API_KEY 是否正确(以 sk- 开头)
  2. 余额是否充足,可参考 为什么还有余额跑不通
  3. 临时测试可用 -k "sk-xxx" 直接传入
自定义 size 需满足:
  • 单边不超过 3840px
  • 长宽均为 16 的整数倍
  • 总像素在 65.5 万 – 829.4 万之间 例如 2048x3072 合法,3000x2000 因 3000 非 16 倍数会被拒。
官逆默认返回的 R2 CDN URL 约 24 小时 有效。生产场景建议传 -r b64_json 取 Base64 自行落盘,或立即下载到本地。
目前已适配:Codex CLI、OpenCode、Gemini CLI、GitHub Copilot、Cursor、Amp。任何支持 Skills 协议的工具都可以调用。

相关资源

gpt-image-2(官转)文档

原生 2K/4K 生图,按 token 计费

gpt-image-2-all(官逆)文档

ChatGPT 一致体验,$0.03 / 次按次计费

官转 vs 官逆 对比

17 个维度一表看清差异

Nano Banana Pro 生图 Skill(同作者)

同一 Skills 合集下的 Gemini 生图 Skill

Luck GPT-Image 2 ComfyUI 节点

同模型的 ComfyUI 节点方案

API易控制台

管理密钥、用量与分组