概述
comfyui-image-annotator 是社区用户 luckdvr 贡献的交互式图像标注 ComfyUI 节点。它的核心价值是——降低提示词门槛。你不用再费劲描述”把图片左上角那个红色按钮换成蓝色”,只要在图上圈出来、点一下、画个框,让模型清楚看到”我要改这里”即可。最适合搭配在 Nano Banana Pro 节点前面,组成”图片 → 标注 → API”的三段式工作流。
项目信息
- 🔗 开源地址:
github.com/luckdvr/comfyui-image-annotator - 📜 许可证:MIT
- 👤 作者:luckdvr
- ⭐ 社区贡献,与 Luck Nano Banana Pro 同作者
核心功能
三种标注方式
点(⦿):单击放置 · 矩形(▢):拖拽画框 · 多边形(⬡):多点连线自动闭合
实时渲染预览
标注实时渲染到画布,所见即所得,不用反复跑图看效果
缩放 / 平移 / 选择
内置画布操作,处理大图也能精准定位局部
50 步撤销
最多 50 步撤销历史,尽情尝试不怕误操作
双输出
同时输出标注后的图片(供模型参考)+ JSON 标注数据(便于后续节点解析)
样式可定制
描边颜色、宽度、填充透明度、点大小均可配置
支持的 API易 模型
该节点本身不调用 API,只负责对图像做标注。标注后的图片可喂给任何支持图像输入的 API易 模型,最佳搭档:节点说明
输入
| 参数名 | 类型 | 必填 | 说明 |
|---|---|---|---|
image | IMAGE | 是 | 要标注的原图 |
输出
| 输出端 | 类型 | 说明 |
|---|---|---|
annotated_image | IMAGE | 已渲染标注标记的图片(可直接喂给下游 API 节点) |
annotations_json | STRING | 描述标注位置/类型的 JSON 字符串(供需要结构化输入的节点使用) |
安装配置
使用示例
示例 1:局部换物(小白友好)
示例 2:多区域精准标注
用多边形标注人物衣服 + 点标注帽子位置 + 矩形标注背景区域,然后用 prompt:示例 3:视觉问答 / 理解
配合 Gemini / Qwen-VL:让模型解释”被框出来的物体是什么、在图里起什么作用”,标注提供精确的视觉锚点。常见问题
为什么推荐给「不会写提示词」的用户?
为什么推荐给「不会写提示词」的用户?
传统改图需要你用文字精确描述”改哪里、怎么改”。对非英语用户、不熟 AI prompt 的小白非常不友好。有了这个节点,位置信息由鼠标标注直接给出,prompt 只需描述”改成什么”即可。原本需要 3-5 句话的精确描述,现在一句简单英文就能搞定。
标注后的图片会影响生成质量吗?
标注后的图片会影响生成质量吗?
会,而且是往好的方向影响。大部分多模态模型(Nano Banana、Gemini、Qwen-VL)都能理解图上的标注符号,把它们识别为”用户指示的目标区域”,从而更精准地按指令编辑。若担心标注样式干扰最终输出,可在节点内调低描边宽度、使用半透明填充。
节点装完找不到?
节点装完找不到?
- 确认目录是
ComfyUI/custom_nodes/comfyui-image-annotator - 完全重启 ComfyUI(刷新前端不够)
- 检查 ComfyUI 控制台有无报错
可以只输出 JSON 不渲染标注吗?
可以只输出 JSON 不渲染标注吗?
可以。把下游节点只接
annotations_json 端口即可。适合需要把坐标传给自定义脚本做后处理的场景。和 Luck Nano Banana Pro 搭配的最佳实践?
和 Luck Nano Banana Pro 搭配的最佳实践?
推荐流水线:
LoadImage → ImageAnnotator → Luck Nano Banana ProLuck Nano Banana Pro的image_01接ImageAnnotator的annotated_image输出- prompt 中用自然语言描述”对标注区域做什么”
- 首次效果不理想时,用
Luck Nano Banana Pro的retry_times或 seed 模式多跑几次
相关资源
Luck Nano Banana Pro 节点
同作者的 API 调用节点,与本节点完美搭配
Nano Banana Pro API
了解 Nano Banana Pro 的完整能力
ComfyUI 节点合集
查看所有 Nano Banana ComfyUI 节点
API易控制台
管理密钥、用量与分组