ComfyUI 魔法书 Logo
🏠 首页
👥 加群
🔥 报错不求人
😎 大帅比
登录 →
ComfyUI 魔法书 Logo
🏠 首页 👥 加群 🔥 报错不求人 😎 大帅比
登录
  1. 首页
  2. 🧩 插件工坊 (Plugin Workshop)
  3. ComfyUI插件教程:用Gemini实现图片转Prompt一键生成

ComfyUI插件教程:用Gemini实现图片转Prompt一键生成

0
  • 🧩 插件工坊 (Plugin Workshop)
  • 发布于 2025-07-06
  • 9 次阅读
编程界的小学生
编程界的小学生

ComfyUI-GeminiImageToPrompt 插件教程 - 让 Gemini 帮你看图说话

1. 插件简介

这是一个能让 Google 家的 Gemini 人工智能帮你"看图说话"的小帮手。它能看懂你给它的图片,然后用文字详细地描述出来,就像一个细心的图片解说员。

GitHub 地址:https://github.com/santiagosamuel3455/ComfyUI-GeminiImageToPrompt

2. 安装方法

有两种方式可以安装这个插件:

方法一:直接用 Git 克隆(推荐)

  1. 打开你的 ComfyUI 文件夹
  2. 找到 custom_nodes 文件夹
  3. 在这个文件夹里打开命令行
  4. 输入下面这行命令:
git clone https://github.com/santiago/ComfyUI-GeminiImageToPrompt

方法二:手动下载

  1. 访问上面的 GitHub 地址
  2. 点击绿色的 "Code" 按钮,选择 "Download ZIP"
  3. 解压下载的文件
  4. 把解压出来的文件夹放到 ComfyUI 的 custom_nodes 目录下

3. 节点解析

3.1 GeminiImageToPrompt 节点

这个节点就像一个会说话的望远镜,你给它看一张图片,它就能给你详细描述这张图片里有什么。

参数详解

参数名(显示) 参数名(代码) 参数值 建议值 通俗解释 专业解释 使用示例
Image image 图片输入 - 你想让 AI 描述的图片 输入的图像数据 连接一张图片到这里
Api Key api_key 文本 - 你的 Gemini API 密钥 Google Gemini API 认证密钥 填入你从 Google AI Studio 获得的 API 密钥
Maximum Tokens max_tokens 数字 2048 AI 回答的最大字数限制 生成文本的最大标记数 一般用默认值就好
Language language 文本 en 想要 AI 用什么语言回答 输出文本的语言代码 "en"表示英文,"zh"表示中文

3.2 GeminiImageToPromptBasic 节点

这是一个简化版的图片描述节点,功能和上面那个差不多,但是更简单一些。

参数详解

参数名(显示) 参数名(代码) 参数值 建议值 通俗解释 专业解释 使用示例
Image image 图片输入 - 需要描述的图片 输入的图像数据 连接一张图片到这里
Api Key api_key 文本 - Gemini API 密钥 Google Gemini API 认证密钥 填入你的 API 密钥

4. 使用技巧和建议

  • 在使用前,先去 Google AI Studio 申请一个免费的 API 密钥
  • 图片最好清晰一些,这样 AI 描述得会更准确
  • 如果想要中文描述,记得在高级版节点把 Language 改成 "zh"
  • 建议从小图片开始测试,因为大图片处理起来会比较慢

5. 常见问题解答

Q:为什么节点显示错误? A:最常见的原因是 API 密钥没填对,或者忘记填了。检查一下密钥是否正确输入。

Q:描述的内容不够准确怎么办? A:可以试试用更清晰、主题更突出的图片,或者调整 max_tokens 参数让 AI 说得更详细一些。

Q:处理大图片特别慢怎么办? A:建议先把图片压缩一下再使用,一般 1024px 宽度就足够了。

6. 补充说明

  • 这个插件完全免费,但需要使用 Google 的 API
  • API 有每天的使用限额,建议注意控制使用频率
  • 描述的质量会因图片质量和清晰度而异
  • 支持多种图片格式,包括 JPG、PNG 等常见格式
标签: #插件 2338
相关文章

ComfyUI错误修复插件详解:轻松解决常见问题 2025-07-10 18:25

ComfyUI-CustomMenu插件使用教程:高效自定义工作流指南 2025-07-10 17:50

ComfyUI图像合并插件comfyui-merge使用教程 2025-07-03 22:44

ComfyUI 图像合并插件教程 (comfyui-merge) 1. 插件简介 这是一个专门用来合并图片的 ComfyUI 插件,就像用 PS 把多张图片叠在一起那样。它的特别之处在于你精确控制每张图片的混合方式。 GitHub 地址:https://github.com/LingSss9/com

ComfyUI WAN 2.2视频插件教程:万相AI提示词全攻略 2025-07-31 11:47

ComfyUI WAN 2.2视频插件教程:万相AI提示词实战指南 2025-07-29 20:10

ComfyUI HeyGem数字人插件教程:零基础快速精通指南 2025-07-22 14:10

目录

从节点基础到高阶工作流,我们为你绘制最清晰的 ComfyUI 学习路径。告别困惑,让每一次连接都充满创造的魔力,轻松驾驭 AI 艺术的无限可能。

  • 微信
  • B站
  • GitHub
Copyright © 2025 AIX All Rights Reserved. Powered by AIX.
隐私政策
津ICP备2024019312号