ComfyUI 魔法书 Logo
🏠 首页
👥 加群
🔥 报错不求人
😎 大帅比
登录 →
ComfyUI 魔法书 Logo
🏠 首页 👥 加群 🔥 报错不求人 😎 大帅比
登录
  1. 首页
  2. 🧩 插件工坊 (Plugin Workshop)
  3. ComfyUI-IF_LLM插件使用教程 从安装到精通完整指南

ComfyUI-IF_LLM插件使用教程 从安装到精通完整指南

0
  • 🧩 插件工坊 (Plugin Workshop)
  • 发布于 2025-07-01
  • 17 次阅读
编程界的小学生
编程界的小学生

ComfyUI-IF_LLM 插件保姆级教程

1. 插件简介

插件地址: https://github.com/if-ai/ComfyUI-IF_LLM

这个插件就像一个超级智能的"AI助手工具箱"!想象一下,你有一个万能的AI朋友,它不仅能看图说话,还能帮你写文案、生成图片、处理文本,甚至能连接各种不同的AI大脑(比如ChatGPT、Claude、Gemini等)。

能带来什么效果:

  • 🤖 连接多种AI服务:就像有个万能遥控器,能控制OpenAI、Claude、Gemini等各种AI
  • 🖼️ 看图说话:给AI一张图,它能告诉你图里有什么,还能根据图片写故事
  • ✍️ 智能文案生成:自动生成各种风格的提示词和文案
  • 🎨 图片生成:通过文字描述让AI画出你想要的图片
  • 📝 文本处理:拼接、保存、显示各种文本内容
  • 🔄 批量处理:一次性处理多张图片或多段文字

2. 如何安装

方法一:通过 ComfyUI Manager(推荐)

  1. 打开 ComfyUI Manager
  2. 搜索 "IF_LLM" 或 "IF AI"
  3. 点击安装即可

方法二:手动安装

  1. 打开终端/命令提示符
  2. 进入你的 ComfyUI 安装目录下的 custom_nodes 文件夹
cd ComfyUI/custom_nodes
  1. 下载插件
git clone https://github.com/if-ai/ComfyUI-IF_LLM.git
  1. 安装依赖
cd ComfyUI-IF_LLM
pip install -r requirements.txt
  1. 重启 ComfyUI

注意: 使用前需要设置相应的API密钥,比如OpenAI的API_KEY等。

3. 节点详细解析

3.1 IF LLM🎨 节点

这是插件的核心节点,就像一个"AI大脑指挥中心"。你可以通过它连接各种AI服务,让AI看图片、回答问题、生成内容。

3.2 参数详解

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释 (能干嘛的)专业解释怎么用/举个例子
llm_providerllm_providertransformers/ollama/openai等ollama选择你要用哪个AI服务,就像选择打电话给哪个朋友指定使用的大语言模型提供商本地用ollama,云端用openai
llm_modelllm_model模型名称-具体选择哪个AI模型,就像选择找哪个专家指定具体的模型名称llama3.2、gpt-4o等
base_ipbase_ipIP地址localhostAI服务运行在哪台电脑上,本机就填localhost服务器IP地址本地服务用localhost
portport端口号11434AI服务的"门牌号",不同服务有不同端口服务端口号ollama默认11434
user_promptuser_prompt文本-你想问AI的问题或给AI的指令用户输入的提示词"描述这张图片"
imagesimages图片-要让AI分析的图片,可以是单张或多张输入的图像数据连接Load Image节点
strategystrategynormal/omost/create等normal选择AI的工作模式,就像选择不同的工作方式处理策略模式normal用于对话,create用于生成图片
maskmask蒙版-图片的遮罩,告诉AI重点关注哪些区域图像遮罩数据用于图片编辑时指定区域
prime_directivesprime_directives文本-给AI的"人设"或基本指令,就像告诉它扮演什么角色系统提示词"你是一个专业的摄影师"
profilesprofiles预设选项None预设的AI角色模板,就像选择不同的专家模式预定义的系统提示词模板选择"摄影师"、"作家"等
embellish_promptembellish_prompt装饰选项-让回答更丰富的装饰词,就像给文章加修饰语提示词增强模板添加"详细描述"、"创意表达"
style_promptstyle_prompt风格选项-指定回答的风格,就像选择说话的语气风格化提示词模板"正式"、"幽默"、"诗意"
neg_promptneg_prompt负面提示-告诉AI不要包含什么内容,就像说"不要这样做"负面提示词"不要包含暴力内容"
stop_stringstop_string停止词-让AI在遇到特定词语时停止生成停止标记遇到"结束"就停止
max_tokensmax_tokens1-81922048AI最多能说多少个词,就像限制回答的长度最大生成令牌数短回答用512,长文章用4096
randomrandomTrue/FalseFalse是否让AI的回答有随机性,开启后每次回答可能不同是否使用随机种子创作时开启,分析时关闭
seedseed数字0随机数种子,相同种子会产生相同结果随机种子值固定种子可重现结果
keep_alivekeep_aliveTrue/FalseTrue是否保持AI在内存中,就像让专家待命是否保持模型加载状态频繁使用时开启节省时间
clear_historyclear_historyTrue/FalseTrue是否清除对话历史,就像重新开始聊天是否清除对话上下文新话题时开启
history_stepshistory_steps1-99910记住多少轮对话,就像记忆力的长短保留的对话轮数长对话用20,短对话用5
aspect_ratioaspect_ratio1:1/16:9等1:1生成图片的长宽比例,就像选择照片尺寸图像宽高比头像用1:1,横屏用16:9
autoautoTrue/FalseFalse是否自动生成提示词,就像让AI自己想问题自动提示词生成模式批量处理时开启
batch_countbatch_count数字1一次生成多少个结果,就像一次拍多少张照片批次处理数量需要多个选择时增加
external_api_keyexternal_api_key文本-外部API密钥,就像你的会员卡号API访问密钥输入OpenAI的API密钥
OmniOmni万能输入-万能接口,可以接收各种类型的数据通用数据接口连接其他节点的输出
attentionattentionsdpa/flash_attention_2等sdpa注意力机制类型,影响AI的处理效率注意力计算方式默认用sdpa即可

输出说明:

  • question:你问的问题
  • response:AI的回答
  • negative:负面提示词
  • omni:万能输出数据
  • generated_images:生成的图片
  • mask:生成的遮罩

3.3 IF Save Text📝 节点

这个节点就像一个"文档管理员",帮你把AI的对话内容保存成文件,方便以后查看。

3.4 参数详解

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释 (能干嘛的)专业解释怎么用/举个例子
question_inputquestion_input文本-要保存的问题内容,就像记录你问了什么输入的问题文本连接LLM节点的question输出
response_inputresponse_input文本-要保存的回答内容,就像记录AI说了什么输入的回答文本连接LLM节点的response输出
negative_inputnegative_input文本-要保存的负面提示,就像记录不要的内容输入的负面提示文本连接LLM节点的negative输出
save_filesave_fileTrue/FalseFalse是否真的保存文件,就像决定是否按下保存按钮是否执行文件保存需要保存时开启
file_formatfile_formatcsv/txt/jsontxt保存成什么格式的文件,就像选择文档类型文件保存格式txt最简单,csv便于表格处理
save_modesave_modecreate/overwrite/appendcreate保存方式:新建、覆盖还是追加文件保存模式新内容用create,续写用append

输出说明:

  • Question:问题文本
  • Response:回答文本
  • Negative:负面提示文本
  • Turn:完整的对话记录

3.5 IF Display Text📟 节点

这个节点就像一个"显示屏",把文本内容清晰地展示出来,还能选择显示哪一行。

3.6 参数详解

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释 (能干嘛的)专业解释怎么用/举个例子
texttext文本-要显示的文本内容,可以是单行或多行输入的文本数据连接其他节点的文本输出
selectselect数字0选择显示第几行,就像选择看第几页选择显示的行索引0表示第一行,1表示第二行

输出说明:

  • text:完整文本
  • text_list:按行分割的文本列表
  • count:总行数
  • selected:选中的那一行文本

3.7 IF Display Text Wildcard📟 节点

这个节点就像一个"智能文本生成器",能够使用通配符和变量来生成各种变化的文本内容。

3.8 参数详解

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释 (能干嘛的)专业解释怎么用/举个例子
texttext文本-包含通配符的文本模板,就像填空题的模板带有通配符的文本模板"一个__颜色__的__动物__"
selectselect数字0选择显示第几个生成的变体选择显示的变体索引0显示第一个变体
countercounter-1到999999-1计数器,控制生成次数,-1表示无限制执行计数器设为5表示只执行5次
dynamic_promptdynamic_prompt文本-动态变量定义,就像定义填空的选项动态变量定义文本"颜色={红色|蓝色|绿色}"
max_variantsmax_variants1-100010最多生成多少个不同的变体最大变体生成数量需要更多选择时增加
wildcard_modewildcard_modeTrue/FalseFalse是否启用通配符模式,就像开启智能填空功能是否启用通配符处理使用通配符时开启

输出说明:

  • text:原始文本
  • text_list:生成的所有变体列表
  • count:生成的变体数量
  • selected:选中的变体文本

3.9 IF Display Omni🔍 节点

这个节点就像一个"万能显示器",能够显示各种类型的数据,特别适合显示复杂的AI输出结果。

3.10 参数详解

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释 (能干嘛的)专业解释怎么用/举个例子
omni_inputomni_input万能类型-万能输入,可以接收任何类型的数据进行显示通用数据输入接口连接LLM节点的omni输出

输出说明:

  • canvas_conditioning:画布条件数据(用于OMOST)
  • text_output:提取的文本内容

3.11 IF Text Typer✍️ 节点

这个节点就像一个"打字机",让你直接输入文本内容,是最简单的文本输入工具。

3.12 参数详解

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释 (能干嘛的)专业解释怎么用/举个例子
texttext文本-直接输入的文本内容,支持多行输入多行文本输入输入提示词或说明文字

输出说明:

  • STRING:输入的文本内容

3.13 IF Join Text📝 节点

这个节点就像一个"文本拼接器",能把多段文字用指定的连接符拼接成一段完整的文字。

3.14 参数详解

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释 (能干嘛的)专业解释怎么用/举个例子
separatorseparator文本空格用什么符号连接文字,就像用胶水粘东西文本分隔符用逗号、空格或换行符
text1text1文本-第一段要拼接的文字第一个文本输入"美丽的"
text2text2文本-第二段要拼接的文字第二个文本输入"风景"
text3text3文本-第三段要拼接的文字第三个文本输入"照片"
text4text4文本-第四段要拼接的文字第四个文本输入"高清"

输出说明:

  • STRING:拼接后的完整文本

3.15 IF LLM Load Images S🖼️ 节点

这个节点就像一个"智能相册管理器",能够批量加载、预览和管理图片文件,支持各种筛选和排序功能。

3.16 参数详解

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释 (能干嘛的)专业解释怎么用/举个例子
imageimage图片选择-从缩略图中选择特定的图片图像选择器点击缩略图选择图片
input_pathinput_path路径-图片文件夹的路径,就像告诉程序去哪找图片输入目录路径"images/photos"
start_indexstart_index0-99990从第几张图片开始加载,就像翻到第几页起始索引0表示从第一张开始
stop_indexstop_index1-999910加载到第几张图片结束结束索引10表示加载前10张
load_limitload_limit10/100/1000等1000最多加载多少张图片,防止内存不够加载数量限制大批量处理用1000
image_selectedimage_selectedTrue/FalseFalse是否只加载选中的图片是否仅加载选中图像只处理特定图片时开启
available_image_countavailable_image_count数字-显示可用图片的总数量可用图像计数只读显示,无需设置
include_subfoldersinclude_subfoldersTrue/FalseTrue是否包含子文件夹中的图片是否包含子目录深度搜索时开启
sort_methodsort_methodalphabetical/numerical等alphabetical图片排序方式,就像整理相册的方法排序方法按名称、数字或日期排序
filter_typefilter_typenone/png/jpg等none只加载特定格式的图片文件格式过滤器只要JPG图片时选jpg
channelchannelalpha/red/green/bluealpha选择图片的哪个颜色通道作为遮罩颜色通道选择alpha用于透明度

输出说明:

  • images:加载的图片列表
  • masks:对应的遮罩列表
  • image_paths:图片文件路径列表
  • filenames:文件名列表
  • count_str:计数字符串(如"5/100")
  • count_int:计数数字

3.17 IF LLM List Models📚 节点

这个节点就像一个"AI模型目录",能够列出指定AI服务提供商的所有可用模型,帮你选择合适的AI大脑。

3.18 参数详解

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释 (能干嘛的)专业解释怎么用/举个例子
llm_providerllm_providerollama/openai等ollama选择要查看哪个AI服务的模型列表LLM服务提供商查看ollama有哪些模型
base_ipbase_ipIP地址localhostAI服务运行的IP地址服务器IP地址本地服务用localhost
portport端口号11434AI服务的端口号服务端口ollama默认11434
external_api_keyexternal_api_key文本-外部API密钥,查看云端服务时需要API访问密钥OpenAI的API密钥
refreshrefreshTrue/FalseFalse是否刷新模型列表,获取最新信息是否刷新列表安装新模型后开启

输出说明:

  • model_list:格式化的模型列表文本

4. 使用技巧和建议

4.1 新手入门建议

  1. 从简单开始

    • 先用Text Typer节点输入简单问题
    • 连接到LLM节点,选择ollama作为提供商
    • 用Display Text节点查看结果
  2. API密钥设置

    • 在系统环境变量中设置API密钥
    • 格式:OPENAI_API_KEY、ANTHROPIC_API_KEY等
    • 或者直接在external_api_key参数中输入
  3. 本地vs云端选择

    • 新手推荐先用ollama(本地,免费)
    • 需要更强能力时使用OpenAI、Claude等云端服务

4.2 进阶使用技巧

  1. 批量图片处理

    • 使用Load Images S节点加载多张图片
    • 开启auto模式让AI自动生成描述
    • 用batch_count参数控制每张图生成多少个描述
  2. 通配符系统

    • 在Display Text Wildcard中使用__关键词__格式
    • 创建动态提示词模板
    • 批量生成不同风格的内容
  3. 对话历史管理

    • 合理设置history_steps保持上下文
    • 新话题时开启clear_history
    • 使用keep_alive提高响应速度

4.3 性能优化

  1. 内存管理

    • 大批量处理时适当降低load_limit
    • 不需要时关闭keep_alive释放内存
    • 合理设置max_tokens避免过长输出
  2. 速度优化

    • 本地模型选择合适的精度(fp16/fp32)
    • 使用合适的attention机制
    • 批量处理时调整batch_count

5. 常见问题解答

Q1: 为什么连接不上AI服务?

A: 检查以下几点:

  • IP地址和端口是否正确
  • 本地服务(如ollama)是否已启动
  • API密钥是否正确设置
  • 网络连接是否正常

Q2: 如何设置API密钥?

A: 有两种方法:

  • 方法1:在系统环境变量中设置(推荐)
  • 方法2:直接在节点的external_api_key参数中输入

Q3: 为什么AI回答很慢?

A: 可能的原因:

  • 本地模型配置不够高
  • max_tokens设置过大
  • 网络连接较慢(云端服务)
  • 可以尝试使用更小的模型或降低max_tokens

Q4: 如何批量处理图片?

A: 使用以下流程:

  1. Load Images S节点加载图片
  2. LLM节点开启auto模式
  3. 设置合适的batch_count
  4. 连接Display Text查看结果

Q5: 通配符怎么使用?

A: 格式:关键词

  • 例如:颜色__的__动物
  • 在dynamic_prompt中定义:颜色={红色|蓝色|绿色}
  • 系统会自动替换生成不同组合

Q6: 如何保存对话记录?

A: 使用Save Text节点:

  1. 连接LLM节点的输出
  2. 开启save_file
  3. 选择合适的文件格式
  4. 设置保存模式(新建/追加)

6. 实际应用案例

案例1:批量图片描述生成

  1. 用Load Images S加载图片文件夹
  2. LLM节点设置为"描述这张图片"
  3. 开启auto模式自动处理
  4. 用Save Text保存所有描述

案例2:创意文案生成

  1. Text Typer输入基础描述
  2. Display Text Wildcard添加通配符变化
  3. LLM节点润色和扩展
  4. Join Text拼接最终文案

案例3:多模态AI对话

  1. Load Images提供图片
  2. Text Typer提供问题
  3. LLM节点进行图文对话
  4. Display Text展示结果

7. 总结

ComfyUI-IF_LLM插件是一个功能强大的AI集成工具,它的最大优势是:

核心优势:

  • 支持多种AI服务提供商
  • 强大的图文处理能力
  • 灵活的文本处理工具
  • 批量处理功能
  • 丰富的自定义选项

使用要点:

  • 合理选择AI服务提供商
  • 正确设置API密钥
  • 根据需求调整参数
  • 善用批量处理功能
  • 活用通配符系统

现在你已经掌握了这个插件的所有功能,可以开始创造属于你的AI工作流程了!🚀✨

标签: #插件 2338
相关文章

ComfyUI错误修复插件详解:轻松解决常见问题 2025-07-10 18:25

ComfyUI-CustomMenu插件使用教程:高效自定义工作流指南 2025-07-10 17:50

ComfyUI图像合并插件comfyui-merge使用教程 2025-07-03 22:44

ComfyUI 图像合并插件教程 (comfyui-merge) 1. 插件简介 这是一个专门用来合并图片的 ComfyUI 插件,就像用 PS 把多张图片叠在一起那样。它的特别之处在于你精确控制每张图片的混合方式。 GitHub 地址:https://github.com/LingSss9/com

ComfyUI WAN 2.2视频插件教程:万相AI提示词全攻略 2025-07-31 11:47

ComfyUI WAN 2.2视频插件教程:万相AI提示词实战指南 2025-07-29 20:10

ComfyUI HeyGem数字人插件教程:零基础快速精通指南 2025-07-22 14:10

目录

从节点基础到高阶工作流,我们为你绘制最清晰的 ComfyUI 学习路径。告别困惑,让每一次连接都充满创造的魔力,轻松驾驭 AI 艺术的无限可能。

  • 微信
  • B站
  • GitHub
Copyright © 2025 AIX All Rights Reserved. Powered by AIX.
隐私政策
津ICP备2024019312号