ComfyUI-OreX 插件完整使用教程
1. 插件简介
ComfyUI-OreX 是一个专门为 ComfyUI 设计的插件包,主要用来和大语言模型(就是那些会聊天的机器人)进行交流的工具。这个插件就像是给你的 ComfyUI 安装了一个超级聪明的小助手,可以帮你做很多事情:
- 让机器人帮你写更好的画画提示词(就像你告诉它"画个猫",它能帮你扩展成"画一只可爱的橘色小猫,坐在窗台上,阳光洒在它身上")
- 让机器人看图片并告诉你图片里有什么内容
- 批量处理图片,就像流水线一样一张接一张地处理
- 更强大的图片保存功能,可以自动整理文件夹
插件原地址: https://github.com/orex2121/comfyui-OreX
2. 如何安装
方法一:使用 ComfyUI Manager(推荐)
- 打开 ComfyUI,点击右侧的"Manager"按钮
- 点击"Install Custom Nodes"
- 在搜索框输入"OreX"
- 找到"comfyui-OreX",点击"Install"
- 重启 ComfyUI
方法二:手动安装
- 找到你的 ComfyUI 安装文件夹
- 进入
custom_nodes文件夹 - 在这里打开命令行工具
- 输入命令:
git clone https://github.com/orex2121/comfyui-OreX.git - 重启 ComfyUI
3. 节点详细解析
3.1 OreX Load Image 节点
这个节点就像是一个智能的图片加载器,比普通的加载图片功能更强大。
用途: 加载图片,同时还能告诉你图片的文件名,方便后续使用。
参数详解
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| 图片路径 | image_path | 文件路径 | 按需选择 | 选择你要加载的图片位置 | 指定图像文件的完整路径 | 点击选择你电脑里的图片文件 |
| 移除扩展名 | remove_extension | True/False | True | 是否把文件名后面的.jpg、.png去掉 | 从输出的文件名中移除文件扩展名 | 选True的话,"猫咪.jpg"会变成"猫咪" |
3.2 OreX Load Image Batch 节点
这个节点就像是一个批量图片处理机器,可以一次性加载很多张图片。
用途: 一次性加载多张图片,按顺序处理,节省时间。
参数详解
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| 文件夹路径 | folder_path | 文件夹路径 | 按需选择 | 选择装着很多图片的文件夹 | 指定包含图像文件的目录路径 | 选择你放了很多图片的文件夹 |
| 文件数量 | batch_count | 数字 | 10 | 告诉机器一次处理多少张图片 | 指定批处理的图像数量 | 如果设置5,就只处理前5张图片 |
| 文件名模式 | file_mask | 文本 | * | 选择特定名字的文件,*表示所有文件 | 用于过滤文件的通配符模式 | 输入"cat*"只处理以"cat"开头的图片 |
| 随机种子 | seed | 数字 | 随机 | 控制处理顺序的随机性 | 用于可重复性的随机数生成种子 | 固定数字让每次处理顺序一样 |
3.3 OreX Save Image 节点
这个节点就像是一个超级智能的图片保存管家,可以帮你把图片整理得井井有条。
用途: 保存图片时自动整理文件夹,给文件起好名字。
参数详解
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| 文件名前缀1 | filename_prefix1 | 文本 | 空 | 给文件名加个开头标识 | 文件名的第一个前缀标识符 | 输入"风景",文件名变成"风景_xxx.jpg" |
| 文件名前缀2 | filename_prefix2 | 文本 | 空 | 给文件名加第二个标识 | 文件名的第二个前缀标识符 | 输入"蓝天",文件名变成"风景_蓝天_xxx.jpg" |
| 文件名前缀3 | filename_prefix3 | 文本 | 空 | 给文件名加第三个标识 | 文件名的第三个前缀标识符 | 输入"高清",文件名变成"风景_蓝天_高清_xxx.jpg" |
| 保存路径 | save_path | 文件路径 | output | 选择图片保存的位置 | 指定图像保存的目录路径 | 可以是完整路径或相对路径 |
| 创建处理文件夹 | create_processed_folder | True/False | True | 是否创建"已处理"文件夹避免重复 | 是否创建Processed子文件夹 | 避免批量处理时重复处理同一张图 |
| 创建日期文件夹 | create_date_folder | True/False | False | 是否按日期创建文件夹 | 是否按当前日期创建子文件夹 | 每天的图片自动放到当天日期的文件夹里 |
| 移除工作流 | remove_workflow | True/False | True | 是否删除图片里的工作流信息 | 是否从PNG文件中移除工作流元数据 | 让图片文件更小,不包含额外信息 |
3.4 io.net Chat 节点
这个节点就像是一个聊天机器人,可以和你对话,帮你改写画画提示词。
用途: 和机器人聊天,让它帮你写更好的画画提示词。
参数详解
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| API密钥 | api_key | 文本 | 必填 | 你的聊天机器人通行证 | io.net服务的API访问密钥 | 从io.net网站获取的密钥 |
| 模型名称 | model_name | 选择列表 | deepseek-ai/DeepSeek-R1 | 选择你要用的聊天机器人类型 | 选择使用的大语言模型 | 不同模型有不同的聊天风格 |
| 系统提示 | system_prompt | 文本 | 空 | 告诉机器人它应该怎么表现 | 设置AI助手的角色和行为规则 | "你是一个专业的提示词专家" |
| 用户输入 | user_input | 文本 | 必填 | 你想对机器人说的话 | 用户向AI发送的消息内容 | "帮我把'猫'扩展成详细的提示词" |
| 温度 | temperature | 0.1-1.0 | 0.7 | 控制机器人回答的创意程度 | 控制生成文本的随机性和创造性 | 数字越高回答越有创意,越低越准确 |
| 最大长度 | max_tokens | 数字 | 1000 | 限制机器人回答的字数 | 限制生成文本的最大令牌数 | 设置2000可以得到更长的回答 |
3.5 io.net Vision URL 节点
这个节点就像是一个会看图说话的机器人,你给它一个图片链接,它就能告诉你图片里有什么。
用途: 输入图片网址,让机器人描述图片内容。
参数详解
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| API密钥 | api_key | 文本 | 必填 | 你的聊天机器人通行证 | io.net服务的API访问密钥 | 从io.net网站获取的密钥 |
| 模型名称 | model_name | 选择列表 | meta-llama/Llama-3.2-90B-Vision-Instruct | 选择会看图的机器人类型 | 选择支持视觉理解的模型 | 专门处理图片的机器人 |
| 图片链接 | image_url | 文本 | 必填 | 网上图片的地址 | 可公开访问的图像URL | https://example.com/image.jpg |
| 用户提示 | user_prompt | 文本 | "描述这张图片" | 告诉机器人你想了解图片的什么 | 用户对图像的查询或指令 | "这张图片里有多少只猫?" |
| 温度 | temperature | 0.1-1.0 | 0.7 | 控制机器人回答的创意程度 | 控制生成文本的随机性和创造性 | 数字越高回答越有创意,越低越准确 |
| 最大长度 | max_tokens | 数字 | 1000 | 限制机器人回答的字数 | 限制生成文本的最大令牌数 | 设置2000可以得到更长的回答 |
3.6 io.net Vision 节点
这个节点和上面的很像,但它是直接看你上传的图片,而不是网上的图片链接。
用途: 直接分析你上传的图片,告诉你图片里有什么。
参数详解
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| API密钥 | api_key | 文本 | 必填 | 你的聊天机器人通行证 | io.net服务的API访问密钥 | 从io.net网站获取的密钥 |
| 模型名称 | model_name | 选择列表 | meta-llama/Llama-3.2-90B-Vision-Instruct | 选择会看图的机器人类型 | 选择支持视觉理解的模型 | 专门处理图片的机器人 |
| 输入图片 | image | 图片 | 必填 | 从其他节点传来的图片 | 来自上游节点的图像数据 | 连接Load Image节点的输出 |
| 用户提示 | user_prompt | 文本 | "描述这张图片" | 告诉机器人你想了解图片的什么 | 用户对图像的查询或指令 | "帮我为这张图片写一个提示词" |
| 温度 | temperature | 0.1-1.0 | 0.7 | 控制机器人回答的创意程度 | 控制生成文本的随机性和创造性 | 数字越高回答越有创意,越低越准确 |
| 最大长度 | max_tokens | 数字 | 1000 | 限制机器人回答的字数 | 限制生成文本的最大令牌数 | 设置2000可以得到更长的回答 |
4. 使用技巧和建议
4.1 获取免费API密钥
- 访问 https://ai.io.net/ai/api-keys
- 注册账号并获取免费的API密钥
- 把密钥复制到节点的API密钥框里
4.2 提示词优化技巧
- 在io.net Chat节点中,系统提示可以写:"你是一个专业的Stable Diffusion提示词专家,请帮我优化提示词"
- 用户输入可以写简单的词,比如"猫",让机器人帮你扩展成详细的提示词
4.3 批量处理建议
- 使用批量加载时,建议先用小数量测试,确保效果满意后再大批量处理
- 开启"创建处理文件夹"选项,避免重复处理同一批图片
4.4 图片描述优化
- 使用Vision节点时,可以问具体问题,比如"这张图片适合什么风格的提示词?"
- 温度设置建议:描述图片用0.3-0.5(更准确),创意写作用0.7-0.9(更有创意)
5. 常见问题解答
5.1 API密钥无效怎么办?
- 确认你的API密钥是从正确的网站获取的
- 检查密钥是否完整复制,没有多余的空格
- 确认API密钥还没有过期
5.2 图片处理失败怎么办?
- 检查图片格式是否支持(jpg、png等)
- 确认图片文件没有损坏
- 检查文件路径是否正确
5.3 批量处理卡住怎么办?
- 减少批次数量,分多次处理
- 确认网络连接正常
- 检查是否有文件正在被其他程序使用
5.4 机器人回答不理想怎么办?
- 调整温度参数:想要更准确的回答就调低,想要更有创意的回答就调高
- 修改系统提示,给机器人更具体的角色定义
- 尝试不同的模型,每个模型有不同的特点
6. 工作流示例
6.1 基础提示词优化工作流
- 使用io.net Chat节点
- 系统提示设置为:"你是专业的AI画图提示词专家"
- 用户输入写你想画的简单描述
- 机器人会给你详细的提示词
- 把输出的提示词连接到你的画图节点
6.2 图片批量分析工作流
- 使用OreX Load Image Batch节点加载多张图片
- 连接到io.net Vision节点
- 设置合适的提示,比如"为这张图片生成标签"
- 使用OreX Save Image节点保存结果,并自动整理文件夹
6.3 图片到提示词工作流
- 使用OreX Load Image加载你的参考图片
- 连接到io.net Vision节点
- 用户提示设置为:"根据这张图片生成详细的Stable Diffusion提示词"
- 输出的提示词可以用于生成相似风格的图片
这个插件特别适合那些想要提高画图效率,或者需要批量处理图片的朋友。通过和机器人的对话,你可以得到更好的提示词,让你的AI画图效果更加出色!