## 1. 插件简介 ComfyUI_LLM_Schools 是一个专门为 ComfyUI 设计的大语言模型训练插件,项目地址:https://github.com/heshengtao/comfyui_LLM_schools 这个插件就像是给 ComfyUI 装上了一个"语言模型训练工厂"。想象一下,你有一个聪明的 AI 助手,但它对某些特定领域的知识不够了解,这个插件就能帮你"教会"它新知识,让它变得更加专业和贴合你的需求。 **这个插件能带来什么效果?** - 让你可以用自己的数据训练专属的 AI 语言模型 - 就像给 AI 上私人定制课程,让它学会你想要的说话风格和专业知识 - 把复杂的 AI 训练过程变成像搭积木一样简单的可视化操作 ## 2. 如何安装 ### 方法一:通过 ComfyUI Manager 安装(推荐) 1. 打开 ComfyUI,找到右下角的 "Manager" 按钮 2. 点击后选择 "Install Custom Nodes" 3. 在搜索框输入 "LLM_schools" 4. 找到对应插件,点击 "Install" 5. 重启 ComfyUI 即可 ### 方法二:手动安装 1. 打开终端或命令行工具 2. 切换到 ComfyUI 的 custom_nodes 文件夹 3. 执行命令:`git clone https://github.com/heshengtao/comfyui_LLM_schools.git` 4. 重启 ComfyUI ## 3. 节点详细解析 基于目前可获取的信息,这个插件主要包含以下核心训练节点: ### 3.1 LLM 数据加载节点 这个节点就像是一个"图书管理员",负责整理和准备你要用来训练 AI 的资料。 #### 参数详解 | 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 | | :--- | :--- | :--- | :--- | :--- | :--- | :--- | | 数据路径 | data_path | 文件路径 | 你的训练数据文件路径 | 告诉节点去哪里找你的训练资料 | 指定训练数据集的文件系统路径 | 比如填入 "C:/my_data/training.txt" | | 文件格式 | file_format | json/txt/csv | json | 选择你的资料是什么格式的 | 指定数据文件的格式类型 | 如果你的资料是问答对话,选择 json 格式 | | 最大长度 | max_length | 数字 | 512 | 限制每条训练资料的长度 | 设置输入序列的最大令牌数 | 设置为 512 意味着每条资料最多包含 512 个字符单位 | ### 3.2 模型配置节点 这个节点就像是"AI 的身份证办理处",你需要在这里选择要训练的基础模型。 #### 参数详解 | 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 | | :--- | :--- | :--- | :--- | :--- | :--- | :--- | | 模型名称 | model_name | 文本 | "gpt2" | 选择你要用哪个基础模型来训练 | 指定要微调的预训练模型 | 比如填入 "microsoft/DialoGPT-medium" | | 模型路径 | model_path | 文件路径 | 本地模型路径 | 如果你有本地模型文件,在这里指定位置 | 本地预训练模型的存储路径 | 比如 "D:/models/my_model/" | | 设备类型 | device | cpu/cuda | cuda | 选择用电脑的哪个部分来训练 | 指定计算设备类型 | 有独立显卡选 cuda,没有选 cpu | ### 3.3 训练参数节点 这个节点就像是"训练教练",控制训练的强度和方式。 #### 参数详解 | 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 | | :--- | :--- | :--- | :--- | :--- | :--- | :--- | | 学习率 | learning_rate | 小数 | 0.0001 | 控制 AI 学习的快慢 | 优化器的学习步长 | 0.0001 是温和的学习速度,不容易出错 | | 训练轮数 | num_epochs | 整数 | 3 | 决定要把资料重复学习多少遍 | 训练数据集的完整遍历次数 | 设置为 3 意味着所有资料会被学习 3 遍 | | 批次大小 | batch_size | 整数 | 4 | 每次喂给 AI 多少条资料 | 每个训练批次包含的样本数量 | 设置为 4 意味着每次同时处理 4 条资料 | | 保存间隔 | save_steps | 整数 | 500 | 每训练多少步就保存一次模型 | 模型检查点保存的步骤间隔 | 设置为 500 意味着每 500 步保存一次进度 | ### 3.4 优化器配置节点 这个节点就像是"学习方法指导员",告诉 AI 用什么方法来学习。 #### 参数详解 | 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 | | :--- | :--- | :--- | :--- | :--- | :--- | :--- | | 优化器类型 | optimizer_type | adamw/sgd | adamw | 选择 AI 的学习方法 | 指定梯度下降优化算法 | adamw 是目前最常用的优化方法 | | 权重衰减 | weight_decay | 小数 | 0.01 | 防止 AI 过度依赖某些特征 | L2 正则化系数 | 0.01 是常用的防止过拟合的设置 | | 预热步数 | warmup_steps | 整数 | 100 | 让 AI 慢慢进入学习状态 | 学习率线性增长的步数 | 设置为 100 让学习率在前 100 步逐渐增加 | ### 3.5 模型保存节点 这个节点就像是"毕业证书打印机",负责保存训练好的模型。 #### 参数详解 | 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 | | :--- | :--- | :--- | :--- | :--- | :--- | :--- | | 保存路径 | save_path | 文件路径 | "./trained_model" | 决定训练好的模型保存在哪里 | 模型检查点的保存目录 | 比如 "D:/my_models/chat_bot/" | | 模型格式 | save_format | pytorch/safetensors | safetensors | 选择模型文件的保存格式 | 指定模型权重的序列化格式 | safetensors 更安全,pytorch 兼容性更好 | | 是否压缩 | compress | True/False | True | 决定是否压缩模型文件 | 是否对保存的模型进行压缩 | 选择 True 可以节省硬盘空间 | ### 3.6 训练监控节点 这个节点就像是"学习进度监视器",让你看到训练过程中的各种指标。 #### 参数详解 | 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 | | :--- | :--- | :--- | :--- | :--- | :--- | :--- | | 监控间隔 | log_interval | 整数 | 50 | 每多少步显示一次训练信息 | 训练日志输出的步骤间隔 | 设置为 50 意味着每 50 步显示一次损失值 | | 显示损失 | show_loss | True/False | True | 是否显示训练效果好坏的指标 | 是否在界面中显示损失函数值 | 选择 True 可以看到训练是否在正常进行 | | 显示学习率 | show_lr | True/False | True | 是否显示当前的学习速度 | 是否显示当前的学习率数值 | 选择 True 可以监控学习率的变化 | ## 4. 使用技巧和建议 ### 4.1 数据准备技巧 - **数据质量比数量重要**:宁可要 100 条高质量的训练数据,也不要 1000 条乱七八糟的数据 - **格式统一很重要**:确保所有训练数据的格式都一样,就像整理衣柜一样,同类型的衣服放在一起 - **适当清洗数据**:去掉特殊符号、重复内容,就像洗菜一样要洗干净 ### 4.2 参数调整技巧 - **学习率从小开始**:就像学开车一样,先慢慢来,等熟练了再加速 - **批次大小看显存**:显存小就用小批次,显存大可以用大批次 - **训练轮数不要太多**:一般 3-5 轮就够了,太多容易"学傻" ### 4.3 训练监控技巧 - **密切关注损失值**:损失值应该逐渐下降,如果一直不变或者上升,说明有问题 - **定期检查保存的模型**:每隔一段时间测试一下模型效果,避免白白训练 ## 5. 常见问题解答 ### Q1:训练过程中出现内存不足怎么办? **A1:** 就像电脑运行程序太多会卡顿一样,这时候需要: - 减小批次大小(batch_size) - 选择更小的基础模型 - 关闭其他占用内存的程序 ### Q2:训练很久但效果不好怎么办? **A2:** 这就像学习方法不对一样,可以尝试: - 检查训练数据质量 - 调整学习率(试试更小的值) - 增加训练数据量 - 检查数据格式是否正确 ### Q3:模型保存失败怎么办? **A3:** 这通常是存储空间或权限问题: - 检查硬盘空间是否足够 - 确保保存路径有写入权限 - 尝试保存到其他位置 ### Q4:如何判断训练是否成功? **A4:** 主要看这几个指标: - 损失值是否在下降 - 模型是否能正常保存 - 用测试数据验证效果是否符合预期 ## 6. 进阶使用建议 ### 6.1 数据集构建建议 在准备训练数据时,建议按照以下原则: - **领域专业性**:确保数据与你的目标应用领域相关 - **多样性平衡**:包含不同类型的对话或文本样本 - **长度适中**:每条数据不要太长也不要太短,保持在合理范围内 ### 6.2 模型选择策略 - **小模型快速试验**:先用小模型验证流程和数据质量 - **大模型提升效果**:确认流程无误后再使用大模型进行正式训练 - **增量训练**:可以在已有模型基础上继续训练,而不是从零开始 ### 6.3 训练策略优化 - **梯度检查**:定期检查梯度是否正常,避免梯度爆炸或消失 - **早停策略**:当验证集效果不再提升时及时停止训练 - **模型融合**:可以尝试将多个训练好的模型进行融合 这个插件为 ComfyUI 用户提供了一个强大而友好的语言模型训练工具,通过可视化的节点操作,让原本复杂的 AI 训练过程变得简单易懂。无论你是 AI 初学者还是有一定基础的用户,都能通过这个插件快速上手语言模型的训练工作。
ComfyUI图像合并插件comfyui-merge使用教程 2025-07-03 22:44 ComfyUI 图像合并插件教程 (comfyui-merge) 1. 插件简介 这是一个专门用来合并图片的 ComfyUI 插件,就像用 PS 把多张图片叠在一起那样。它的特别之处在于你精确控制每张图片的混合方式。 GitHub 地址:https://github.com/LingSss9/com