ComfyUI-IF_AI_tools 插件完整教程
插件简介
插件地址: https://github.com/if-ai/ComfyUI-IF_AI_tools
这个插件是一个超级强大的 AI 工具包,就像给你的 ComfyUI 装上了一个智能大脑。它能让你:
- 和各种 AI 模型聊天对话(就像和朋友聊天一样)
- 把图片变成文字描述(看图说话)
- 自动生成各种风格的提示词(创意助手)
- 管理和搜索大量文档(智能图书管理员)
- 处理文本和图片的各种操作
如何安装
- 打开你的 ComfyUI 文件夹
- 进入
custom_nodes文件夹 - 用 git 下载:
git clone https://github.com/if-ai/ComfyUI-IF_AI_tools.git - 重启 ComfyUI
节点详细解析
3.1 IF Chat Prompt 节点 - AI 聊天大师
这个节点就像一个万能的 AI 助手,能和各种 AI 模型对话。
参数详解
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| 提示词 | prompt | 文本 | "描述一个美丽的风景" | 你想问 AI 的问题或要求 | 用户输入的主要文本提示 | 输入"画一个可爱的小猫",AI 会生成相关描述 |
| AI 提供商 | llm_provider | 下拉选择 | ollama | 选择用哪家的 AI 大脑 | 语言模型服务提供商 | 选择 ollama 用本地模型,选择 openai 用 GPT |
| AI 模型 | llm_model | 下拉选择 | 自动获取 | 具体用哪个 AI 模型 | 特定的语言模型名称 | llama3.2 适合日常对话,gpt-4 适合复杂任务 |
| 服务器地址 | base_ip | 文本 | localhost | AI 服务器的网址 | API 服务器的 IP 地址 | 本地用 localhost,远程用具体 IP |
| 端口号 | port | 文本 | 11434 | 连接 AI 服务的门牌号 | API 服务器的端口号 | ollama 默认 11434,其他服务有不同端口 |
| 图片输入 | images | 图片 | 可选 | 给 AI 看的图片 | 输入图像数据 | 上传风景照,让 AI 描述图片内容 |
| 助手角色 | assistant | 下拉选择 | Cortana | AI 扮演什么角色 | 预定义的助手人格 | 选择"诗人"让 AI 用诗歌回答 |
| 温度 | temperature | 数字 | 1.0 | 控制 AI 回答的创意程度 | 生成随机性控制参数 | 0.1 很严谨,1.5 很有创意 |
| 最大字数 | max_tokens | 整数 | 2048 | AI 回答的最大长度 | 生成文本的最大令牌数 | 设置 100 得到简短回答,2048 得到详细回答 |
| 随机种子 | seed | 整数 | 94687328150 | 让结果可以重复的魔法数字 | 随机数生成种子 | 用相同种子和参数会得到相同结果 |
| 历史记录步数 | history_steps | 整数 | 10 | 记住多少轮对话 | 保留的对话历史数量 | 设置 5 只记住最近 5 轮对话 |
| 启用 RAG | enable_RAG | 开关 | False | 是否使用文档搜索功能 | 检索增强生成开关 | 开启后 AI 能搜索你的文档来回答 |
3.2 IF Image Prompt 节点 - 看图说话专家
这个节点能看懂图片并生成描述,就像一个专业的图片解说员。
参数详解
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| 图片 | images | 图片列表 | 必需 | 要分析的图片 | 输入图像数据列表 | 上传多张照片让 AI 逐一描述 |
| AI 提供商 | llm_provider | 下拉选择 | ollama | 选择哪家的视觉 AI | 多模态语言模型提供商 | 选择支持图像理解的模型 |
| 用户提示 | user_prompt | 文本 | "描述这张图片" | 告诉 AI 你想要什么样的描述 | 用户自定义提示文本 | "用诗歌形式描述这张图片" |
| 策略 | strategy | 下拉选择 | normal | 选择处理方式 | 图像处理策略 | normal 普通描述,omost 生成构图信息 |
| 遮罩 | mask | 遮罩 | 可选 | 标记图片的特定区域 | 图像遮罩数据 | 圈出图片中的人物让 AI 重点描述 |
| 批次数量 | batch_count | 整数 | 4 | 一次处理多少张图片 | 批处理数量 | 设置 10 可以一次处理 10 张图片 |
| 自动模式 | auto | 开关 | False | 是否自动生成提示词 | 自动提示生成开关 | 开启后根据预设自动生成描述 |
3.3 IF Prompt Maker 节点 - 提示词制造机
专门用来制作和优化提示词的工具,就像一个创意写作助手。
参数详解
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| 图片 | images | 图片列表 | 必需 | 参考的图片 | 输入图像数据 | 上传参考图让 AI 生成相似风格的提示词 |
| 用户提示 | user_prompt | 文本 | "生成提示词" | 你想要什么样的提示词 | 用户输入的提示文本 | "生成科幻风格的提示词" |
| 配置文件 | profiles | 下拉选择 | None | 选择预设的风格模板 | 预定义的提示模板 | 选择"摄影师"模板生成摄影风格提示词 |
| 装饰提示 | embellish_prompt | 下拉选择 | Default | 给提示词加装饰词汇 | 提示词增强选项 | 添加"高质量、精美"等修饰词 |
| 风格提示 | style_prompt | 下拉选择 | Default | 指定艺术风格 | 风格化提示选项 | 选择"油画风格"或"动漫风格" |
| 负面提示 | neg_prompt | 下拉选择 | Default | 告诉 AI 不要什么 | 负面提示词选项 | 避免"模糊、低质量"等不想要的效果 |
3.4 IF Display Text Wildcard 节点 - 智能文本显示器
能显示文本并支持通配符替换,就像一个智能的文本处理器。
参数详解
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| 文本 | text | 文本 | 必需 | 要显示的文本内容 | 输入文本数据 | 输入包含通配符的文本模板 |
| 选择 | select | 整数 | 0 | 选择显示第几行 | 文本行选择索引 | 设置 2 显示第三行文本 |
| 计数器 | counter | 整数 | -1 | 控制执行次数 | 执行计数控制 | 设置 5 只执行 5 次后停止 |
| 动态提示 | dynamic_prompt | 文本 | 可选 | 动态变量定义 | 动态变量配置 | 定义 color={red|blue} 随机选择颜色 |
| 最大变体 | max_variants | 整数 | 10 | 生成多少个不同版本 | 最大变体数量 | 设置 20 生成 20 个不同的文本版本 |
| 通配符模式 | wildcard_mode | 开关 | False | 是否启用通配符功能 | 通配符处理开关 | 开启后 color 会被随机颜色替换 |
3.5 IF Save Text 节点 - 文本保存管家
专门用来保存文本内容到文件,就像一个贴心的文档管理员。
参数详解
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| 问题输入 | question_input | 文本 | 必需 | 要保存的问题内容 | 问题文本输入 | 保存用户提出的问题 |
| 回答输入 | response_input | 文本 | 必需 | 要保存的回答内容 | 响应文本输入 | 保存 AI 生成的回答 |
| 负面输入 | negative_input | 文本 | 必需 | 要保存的负面提示 | 负面提示文本输入 | 保存不想要的效果描述 |
| 保存文件 | save_file | 开关 | False | 是否真的保存到文件 | 文件保存开关 | 开启后才会真正保存文件 |
| 文件格式 | file_format | 下拉选择 | csv | 选择保存的文件格式 | 输出文件格式 | csv 表格格式,txt 纯文本,json 结构化数据 |
| 保存模式 | save_mode | 下拉选择 | create | 选择保存方式 | 文件写入模式 | create 新建,append 追加,overwrite 覆盖 |
3.6 IF Display Text 节点 - 文本展示台
简单的文本显示工具,就像一个电子显示屏。
参数详解
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| 文本 | text | 文本 | 必需 | 要显示的文本 | 输入文本数据 | 显示 AI 生成的结果 |
| 选择 | select | 整数 | 0 | 选择显示第几行 | 行选择索引 | 多行文本时选择显示特定行 |
3.7 IF Display Omni 节点 - 万能显示器
能显示各种类型的数据,就像一个万能的信息展示板。
参数详解
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| 万能输入 | omni_input | OMNI | 可选 | 可以接收任何类型的数据 | 通用数据输入接口 | 连接任何节点的输出来显示内容 |
3.8 IF Text Typer 节点 - 文本输入器
简单的文本输入工具,就像一个打字机。
参数详解
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| 文本 | text | 文本 | 空 | 输入任意文本内容 | 多行文本输入 | 输入长篇文章或复杂提示词 |
3.9 IF Visualize Graph 节点 - 图表可视化器
能把数据变成图表,就像一个图表制作专家。
参数详解
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| 图表数据 | graph_data | 文本 | 必需 | 图表数据文件的位置 | GraphML 文件路径 | 输入 data.graphml 文件路径 |
| 布局 | layout | 下拉选择 | spring | 选择图表的排列方式 | 图形布局算法 | spring 弹簧布局,circular 圆形布局 |
3.10 IF Step Counter 节点 - 步数计数器
能计数和控制执行次数,就像一个智能计数器。
参数详解
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| 数字类型 | number_type | 下拉选择 | integer | 选择整数还是小数 | 数值数据类型 | integer 计数用,float 精确计算用 |
| 模式 | mode | 下拉选择 | increment | 选择计数方式 | 计数操作模式 | increment 递增,decrement 递减 |
| 开始值 | start | 数字 | 0 | 从哪个数字开始计数 | 起始数值 | 从 1 开始计数设置为 1 |
| 结束值 | stop | 数字 | 0 | 计数到哪个数字停止 | 终止数值 | 计数到 100 停止设置为 100 |
| 步长 | step | 数字 | 1 | 每次增加多少 | 步进值 | 设置 2 表示每次加 2 |
| 重置 | reset_bool | 数字 | 可选 | 重置计数器的开关 | 重置控制信号 | 输入 1 重置计数器到开始值 |
3.11 IF Join Text 节点 - 文本拼接器
能把多个文本拼接在一起,就像一个文本胶水。
参数详解
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| 分隔符 | separator | 文本 | " " | 文本之间的连接符号 | 文本分隔字符 | 用 "," 连接得到 "苹果,香蕉,橙子" |
| 文本1 | text1 | 文本 | 可选 | 第一段文本 | 第一个文本输入 | 输入 "美丽的" |
| 文本2 | text2 | 文本 | 可选 | 第二段文本 | 第二个文本输入 | 输入 "风景" |
| 文本3 | text3 | 文本 | 可选 | 第三段文本 | 第三个文本输入 | 输入 "画面" |
| 文本4 | text4 | 文本 | 可选 | 第四段文本 | 第四个文本输入 | 输入 "效果" |
3.12 IF tools Load Images S 节点 - 智能图片加载器
专业的图片批量加载工具,就像一个图片管理专家。
参数详解
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| 图片 | image | 下拉选择 | 必需 | 选择要加载的图片 | 图像文件选择 | 从缩略图列表中选择图片 |
| 输入路径 | input_path | 文本 | 空 | 图片文件夹的位置 | 图像目录路径 | 输入 "photos/vacation" |
| 开始索引 | start_index | 整数 | 0 | 从第几张图片开始加载 | 起始图像索引 | 设置 10 从第 11 张图片开始 |
| 结束索引 | stop_index | 整数 | 10 | 加载到第几张图片 | 终止图像索引 | 设置 20 加载到第 20 张 |
| 加载限制 | load_limit | 下拉选择 | 1000 | 最多加载多少张图片 | 最大加载数量 | 选择 100 最多加载 100 张 |
| 包含子文件夹 | include_subfolders | 开关 | True | 是否搜索子文件夹里的图片 | 递归目录搜索 | 开启后会搜索所有子文件夹 |
| 排序方式 | sort_method | 下拉选择 | alphabetical | 选择图片排列顺序 | 文件排序算法 | numerical 按数字排序,date_created 按创建时间 |
| 过滤类型 | filter_type | 下拉选择 | none | 只加载特定格式的图片 | 文件类型过滤 | 选择 jpg 只加载 JPG 格式图片 |
| 通道 | channel | 下拉选择 | alpha | 选择图片的颜色通道 | 图像通道选择 | alpha 透明通道,red 红色通道 |
使用技巧和建议
- 新手入门:先从 IF Text Typer 和 IF Display Text 开始,熟悉基本操作
- AI 对话:使用 IF Chat Prompt 时,先设置好 AI 提供商和模型
- 图片处理:IF Image Prompt 需要支持视觉的 AI 模型,如 llava
- 批量处理:IF tools Load Images S 适合处理大量图片
- 文本管理:用 IF Save Text 保存重要的对话记录
常见问题解答
Q: 为什么连接不上 AI 模型?
A: 检查服务器地址和端口号是否正确,确保 AI 服务正在运行。
Q: 图片加载失败怎么办?
A: 确认图片路径正确,图片格式支持,文件没有损坏。
Q: 如何使用 RAG 功能?
A: 先初始化 RAG 文件夹,上传文档,运行索引,然后启用 RAG 开关。
Q: 通配符怎么使用?
A: 用 关键词 格式,如 颜色 会随机替换为预设的颜色词汇。
Q: 节点执行出错怎么办?
A: 检查所有必需参数是否填写,网络连接是否正常,查看控制台错误信息。
总结
这个插件包含 12 个强大的节点,涵盖了 AI 对话、图像处理、文本管理、数据可视化等多个方面。每个节点都有其独特的用途,组合使用能创造出无限可能。建议从简单节点开始学习,逐步掌握高级功能。