概述
apiyi-gpt-image-2-gen 与 apiyi-gpt-image-2-all-gen 是社区用户 wuchubuzai2018 贡献的两个开源 AI Agent Skill,让你在 Codex CLI、OpenCode、Gemini CLI、GitHub Copilot、Cursor、Amp 等支持 Skills 的 AI 编程工具中,通过一句自然语言调用 API易 的两款 OpenAI GPT 图像模型 —— 官转 gpt-image-2(精细可控、按 token 计费、支持 4K)与 官逆 gpt-image-2-all(对话式、按次计费、ChatGPT 一致体验)。
项目信息
- 🔗 开源地址:
github.com/wuchubuzai2018/expert-skills-hub - 📦 Skill 标识:
apiyi-gpt-image-2-gen(官转)、apiyi-gpt-image-2-all-gen(官逆) - 👤 作者:wuchubuzai2018(无处不在的技术)
- ⭐ 该项目由社区用户贡献,与同作者的 Nano Banana Pro 生图 Skill 属于同一 Skills 合集仓库
核心功能
一句话生图
在 AI 编程助手中直接用中文/英文自然语言描述,即刻生成或编辑图片
双模型覆盖
官转
gpt-image-2 与官逆 gpt-image-2-all 同时可用,按场景切换4K + 自定义尺寸(官转)
官转 Skill 支持 1024² / 1536×1024 / 2048² / 3840×2160 等预设及自定义尺寸
画质/格式可选(官转)
quality(low / medium / high / auto)+ 输出格式(png / jpeg / webp)+ 压缩率 0-100最多 5 张参考图
两个 Skill 均支持最多 5 张参考图叠加输入,实现多图融合与风格迁移
多平台兼容
Codex CLI / OpenCode / Gemini CLI / GitHub Copilot / Cursor / Amp 均可用
Node.js 与 Python 双运行时
脚本同时提供
generate_image.js 与 generate_image.py零侵入式配置
环境变量
APIYI_API_KEY 一次设置,全局可用;也支持 -k 命令行临时覆盖支持的 API易 模型
快速上手:3 步开始生图
第一步:获取 API易 密钥
- 访问 API易控制台 注册/登录
- 进入【令牌】栏目,生成新的 API 密钥(以
sk-开头) - 建议单独建一个带用量上限的专用密钥
新用户注册即可获得免费测试额度,足够体验两款 GPT 图像模型。
命令参数详解
apiyi-gpt-image-2-gen(官转)
| 参数 | 缩写 | 必填 | 说明 | 示例 |
|---|---|---|---|---|
--prompt | -p | 是 | 文生图描述或编辑指令 | "橘猫在草地上玩耍" |
--filename | -f | 否 | 输出路径(省略自动生成带时间戳的名字) | "cat.png" |
--size | -s | 否 | 预设(1024x1024 / 1536x1024 / 1024x1536 / 2048x2048 / 2048x1152 / 3840x2160 / 2160x3840)或自定义 | "2048x1152" |
--quality | -q | 否 | low / medium / high / auto | "high" |
--output-format | -o | 否 | png(默认)/ jpeg / webp | "webp" |
--output-compression | -c | 否 | 0-100,仅对 jpeg / webp 生效 | 80 |
--input-image | -i | 否 | 参考图路径(最多 5 张) | "portrait.png" |
--api-key | -k | 否 | 临时覆盖环境变量密钥 | "sk-xxx" |
1:1、3:2、2:3、16:9、9:16,以及 ≤ 3:1 的自定义比例。
自定义尺寸约束:单边 ≤ 3840px,长宽均为 16 的倍数,总像素 65.5 万 – 829.4 万。
典型耗时:120–150 秒 / 请求(4K 复杂场景会更久)。
apiyi-gpt-image-2-all-gen(官逆)
| 参数 | 缩写 | 必填 | 说明 | 示例 |
|---|---|---|---|---|
--prompt | -p | 是 | 对话式生图或编辑指令(尺寸/比例通过 prompt 描述) | "横版 16:9 赛博朋克城市" |
--filename | -f | 否 | 输出路径(省略自动生成带时间戳的 PNG) | "city.png" |
--response-format | -r | 否 | url(默认,R2 CDN 约 24h 有效)或 b64_json | "b64_json" |
--input-image | -i | 否 | 参考图路径(最多 5 张) | "ref.png" |
--api-key | -k | 否 | 临时覆盖环境变量密钥 | "sk-xxx" |
官逆 Skill 不支持
size / quality / aspect_ratio 命令行参数 —— 这些都通过 prompt 文字描述(如 "竖版 9:16 手机海报"、"1024x1024 方图")。耗时 60–300 秒。使用示例
示例 1:官转文生图 + 精细控制
示例 2:官转图生图(参考图编辑)
示例 3:官转多图融合
示例 4:官逆对话式生图(尺寸通过 prompt)
示例 5:在 AI 编程工具中调用
安装后,直接对 AI 助手说(以 Cursor / Codex CLI 为例):- “用 apiyi-gpt-image-2-gen 生成一张 3840x2160、high 质量的赛博朋克城市壁纸”
- “调用 apiyi-gpt-image-2-all-gen,把 photo.jpg 改成吉卜力动画风格”
- “用官转 Skill 生成一张 logo,1:1,high 质量,webp 格式”
常见问题
两个 Skill 如何选?
两个 Skill 如何选?
- 需要精确尺寸(如 3840×2160)、可控画质(low/medium/high)、特定输出格式(webp / 压缩)→ 选 官转
apiyi-gpt-image-2-gen - 需要与 ChatGPT 一致的对话式体验、按次固定计费($0.03 / 次)、强文字还原、自然语言描述尺寸即可 → 选 官逆
apiyi-gpt-image-2-all-gen - 完整差异参考 官转 vs 官逆对比文档
安装 npx skills 报错?
安装 npx skills 报错?
- 确认已安装 Node.js(
node -v) - 网络通畅,能访问 GitHub
- 若
npx skills不可用,可手动克隆仓库:
skills/apiyi-gpt-image-2-gen 或 skills/apiyi-gpt-image-2-all-gen 目录复制到你的 Skills 目录。报错 API Key 无效?
报错 API Key 无效?
- 环境变量
APIYI_API_KEY是否正确(以sk-开头) - 余额是否充足,可参考 为什么还有余额跑不通
- 临时测试可用
-k "sk-xxx"直接传入
官转 Skill 的自定义尺寸报错?
官转 Skill 的自定义尺寸报错?
自定义
size 需满足:- 单边不超过 3840px
- 长宽均为 16 的整数倍
- 总像素在 65.5 万 – 829.4 万之间
例如
2048x3072合法,3000x2000因 3000 非 16 倍数会被拒。
官逆 Skill 的 URL 返回多久失效?
官逆 Skill 的 URL 返回多久失效?
官逆默认返回的 R2 CDN URL 约 24 小时 有效。生产场景建议传
-r b64_json 取 Base64 自行落盘,或立即下载到本地。支持哪些 AI 编程工具?
支持哪些 AI 编程工具?
目前已适配:Codex CLI、OpenCode、Gemini CLI、GitHub Copilot、Cursor、Amp。任何支持 Skills 协议的工具都可以调用。
相关资源
gpt-image-2(官转)文档
原生 2K/4K 生图,按 token 计费
gpt-image-2-all(官逆)文档
ChatGPT 一致体验,$0.03 / 次按次计费
官转 vs 官逆 对比
17 个维度一表看清差异
Nano Banana Pro 生图 Skill(同作者)
同一 Skills 合集下的 Gemini 生图 Skill
Luck GPT-Image 2 ComfyUI 节点
同模型的 ComfyUI 节点方案
API易控制台
管理密钥、用量与分组