ComfyUI 魔法书 Logo
🏠 首页
👥 加群
😎 大帅比
登录 →
ComfyUI 魔法书 Logo
🏠 首页 👥 加群 😎 大帅比
登录
  1. 首页
  2. 🧩 插件工坊 (Plugin Workshop)
  3. ComfyUI插件ExtraModels安装使用全攻略

ComfyUI插件ExtraModels安装使用全攻略

0
  • 🧩 插件工坊 (Plugin Workshop)
  • 发布于 2025-07-03
  • 14 次阅读
编程界的小学生
编程界的小学生

ComfyUI_ExtraModels 插件完整教程

1. 插件简介

ComfyUI_ExtraModels 是一个超级强大的插件,它的 GitHub 地址是:https://github.com/city96/ComfyUI_ExtraModels

这个插件就像一个万能转换器,能让你的 ComfyUI 支持更多种类的 AI 绘画模型。想象一下,如果说原本的 ComfyUI 只能用一种笔来画画,那么这个插件就给你提供了油画笔、水彩笔、蜡笔等各种不同的绘画工具。

目前支持的模型包括:DiT、PixArt、HunYuanDiT、MiaoBi 和一些自定义的 VAE 模型。每一种模型都有自己的特色,比如有的擅长画写实风格,有的擅长画动漫风格,有的专门处理中文提示词。

2. 如何安装

方法一:使用 Git 命令(推荐)

  1. 打开命令行工具
  2. 进入你的 ComfyUI 目录下的 custom_nodes 文件夹
  3. 运行下面的命令:
git clone https://github.com/city96/ComfyUI_ExtraModels custom_nodes/ComfyUI_ExtraModels

方法二:Windows 便携版安装

  1. 找到你的 ComfyUI 文件夹(有 run_nvidia_gpu.bat 文件的地方)
  2. 按住 Ctrl+Shift+右键,选择"在此处打开 PowerShell 窗口"
  3. 输入:
git clone https://github.com/city96/ComfyUI_ExtraModels .\ComfyUI\custom_nodes\ComfyUI_ExtraModels
  1. 安装依赖:
.\python_embeded\python.exe -s -m pip install -r .\ComfyUI\custom_nodes\ComfyUI_ExtraModels\requirements.txt

3. 节点详细解析

3.1 DiT 模型相关节点

3.1.1 DiT 加载器节点

这个节点就像一个专门读取 DiT 模型的读卡器。DiT 模型比较特殊,它不像其他模型那样用文字来描述图片,而是用类别标签(就像给图片贴标签一样)。

参数详解:

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释 (能干嘛的)专业解释怎么用/举个例子
模型文件model_path文件路径DiT-XL-2-512x512.pt选择你要用的 DiT 模型文件指定 DiT 模型的文件路径从下拉菜单选择已下载的 DiT 模型
精度类型dtypefp16/fp32fp16控制模型运算精度,fp16 更省显存浮点数精度设置显存不够选 fp16,显存充足选 fp32

3.1.2 DiT 类别标签节点

这个节点就像一个标签制作机,你告诉它你想要什么类型的图片,它就给你制作相应的标签。

参数详解:

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释 (能干嘛的)专业解释怎么用/举个例子
类别标签class_label0-999根据需要选择你想生成的图片类别ImageNet 类别标签编码选择 285 生成埃及猫的图片
引导强度guidance_scale1.0-20.04.0控制模型有多听话地按照标签生成无分类器引导强度数值越高图片越符合标签,但可能过于死板

3.1.3 DiT 空标签节点

这个节点就像一个空白标签,专门用来做负面提示(告诉模型你不想要什么)。

参数详解:

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释 (能干嘛的)专业解释怎么用/举个例子
批次大小batch_size1-101一次处理多少张图片批处理数量想同时生成 4 张图就设置为 4

3.2 PixArt 模型相关节点

3.2.1 PixArt 检查点加载器节点

这个节点就像一个专门为 PixArt 模型定制的读卡器,PixArt 模型的特点是能理解很长的文字描述。

参数详解:

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释 (能干嘛的)专业解释怎么用/举个例子
模型文件ckpt_name文件路径PixArt-XL-2-1024-MS.pth选择 PixArt 模型文件PixArt 模型文件路径选择已下载的 PixArt 模型
模型类型model_typealpha/sigmaalpha选择 PixArt 的版本类型PixArt 模型版本alpha 版本用 SD1.5 VAE,sigma 版本用 SDXL VAE
精度类型dtypefp16/fp32fp16控制运算精度浮点数精度fp16 省显存但可能影响质量

3.2.2 PixArt T5 文本编码器节点

这个节点就像一个超级翻译机,能把你的文字描述翻译成 PixArt 模型能理解的语言。

参数详解:

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释 (能干嘛的)专业解释怎么用/举个例子
文本内容text字符串详细描述输入你想要的图片描述文本提示词"一只可爱的小猫坐在花园里,阳光明媚"
最大长度max_length120-300120文本描述的最大字符数文本序列最大长度长描述用 300,短描述用 120

3.2.3 PixArt DPM 采样器节点

这个节点就像一个专门为 PixArt 模型调配的画笔,能更好地控制绘画过程。

参数详解:

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释 (能干嘛的)专业解释怎么用/举个例子
采样步数steps10-5020画多少步才完成,步数越多越细致去噪步数快速预览用 10 步,精细作品用 30-50 步
引导强度cfg1.0-20.04.5控制模型有多听话地按照文字生成无分类器引导强度数值越高越符合描述,但可能过于死板
采样器类型sampler_namedpm-solverdpm-solver选择不同的绘画算法采样算法保持默认的 dpm-solver 即可

3.3 HunYuan DiT 模型相关节点

3.3.1 HunYuan DiT 加载器节点

这个节点就像一个专门读取混元 DiT 模型的读卡器,混元模型是腾讯开发的,特别擅长理解中文。

参数详解:

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释 (能干嘛的)专业解释怎么用/举个例子
模型文件model_path文件路径HunYuanDiT.pt选择混元模型文件HunYuan DiT 模型路径选择已下载的混元模型
精度类型dtypefp16/fp32fp16控制运算精度浮点数精度fp16 省显存

3.3.2 HunYuan DiT 文本编码器节点

这个节点就像一个中英文双语翻译机,能同时处理中文和英文的描述。

参数详解:

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释 (能干嘛的)专业解释怎么用/举个例子
中文文本text_cn字符串中文描述输入中文的图片描述中文提示词"一个美丽的古代宫殿,金碧辉煌"
英文文本text_en字符串英文描述输入英文的图片描述英文提示词"A beautiful ancient palace, golden and brilliant"

3.3.3 HunYuan DiT 简单文本编码器节点

这个节点就像一个简化版的翻译机,只需要输入一种语言就可以了。

参数详解:

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释 (能干嘛的)专业解释怎么用/举个例子
文本内容text字符串详细描述输入图片描述(中英文都可以)混合语言提示词"一只cute cat坐在花园里"

3.4 MiaoBi 模型相关节点

3.4.1 MiaoBi 检查点加载器节点

这个节点就像一个专门为妙笔模型定制的读卡器,妙笔是专门为中文优化的 AI 绘画模型。

参数详解:

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释 (能干嘛的)专业解释怎么用/举个例子
UNet 模型unet_name文件路径MiaoBi.safetensors选择妙笔的主模型文件UNet 模型路径选择已下载的妙笔模型
CLIP 模型clip_name文件路径MiaoBi_CLIP.safetensors选择妙笔的文本理解模型CLIP 模型路径选择配套的 CLIP 模型

3.4.2 MiaoBi Diffusers 加载器节点

这个节点就像一个整合包读取器,能一次性读取整个妙笔模型包。

参数详解:

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释 (能干嘛的)专业解释怎么用/举个例子
模型路径model_path文件夹路径MiaoBi 文件夹选择妙笔模型的完整文件夹Diffusers 格式模型路径选择包含所有文件的妙笔文件夹
精度类型dtypefp16/fp32fp16控制运算精度浮点数精度fp16 省显存

3.5 T5 文本编码器相关节点

3.5.1 T5 文本编码器节点

这个节点就像一个超级强大的文字理解机,能理解非常长和复杂的文字描述。

参数详解:

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释 (能干嘛的)专业解释怎么用/举个例子
文本内容text字符串详细描述输入你想要的图片描述文本提示词可以写很长的描述,比如一整段故事
设备类型devicecpu/cudacpu选择用CPU还是显卡来处理计算设备显存不够选 cpu,显存充足选 cuda
数据类型dtypefp16/fp32/bf16fp16控制运算精度浮点数精度fp16 省显存,bf16 更稳定
量化模式quantizationnone/bnb4bitnone是否压缩模型来省显存模型量化方式显存不够选 bnb4bit

3.5.2 T5 加载器节点

这个节点就像一个 T5 模型的专用读卡器,负责加载 T5 模型到内存中。

参数详解:

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释 (能干嘛的)专业解释怎么用/举个例子
模型名称model_name文件路径t5-v1_1-xxl选择 T5 模型文件T5 模型路径选择已下载的 T5 模型
设备类型devicecpu/cudacpu选择计算设备计算设备显存紧张选 cpu
数据类型dtypefp16/fp32/bf16fp16控制运算精度浮点数精度根据显存情况选择

3.6 VAE 相关节点

3.6.1 ExtraVAE 加载器节点

这个节点就像一个万能的图片编解码器读卡器,能加载各种特殊的 VAE 模型。

参数详解:

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释 (能干嘛的)专业解释怎么用/举个例子
VAE 名称vae_name文件路径根据需要选择要使用的 VAE 模型VAE 模型文件路径选择适合当前主模型的 VAE
数据类型dtypefp16/fp32fp16控制运算精度浮点数精度fp16 省显存

3.6.2 一致性解码器节点

这个节点就像一个特殊的图片解码器,能让图片看起来更一致、更稳定。

参数详解:

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释 (能干嘛的)专业解释怎么用/举个例子
潜在图像samples潜在空间从上游节点输入需要解码的潜在图像潜在空间表示连接从采样器输出的潜在图像
分块解码tiledtrue/falsetrue是否分块处理来省显存分块解码开关显存不够选 true

3.7 空潜在图像生成节点

3.7.1 空 Sana 潜在图像节点

这个节点就像一个为 Sana 模型定制的画布制作机,创建特定尺寸的空白画布。

参数详解:

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释 (能干嘛的)专业解释怎么用/举个例子
宽度width像素值1024设置图片宽度图像宽度像素常用 1024 或 512
高度height像素值1024设置图片高度图像高度像素与宽度保持一致比例
批次大小batch_size1-101一次生成多少张图批处理数量想要多张图设置更大值

3.7.2 空 DCAE 潜在图像节点

这个节点就像一个为 DCAE 模型定制的画布制作机,创建特定压缩格式的空白画布。

参数详解:

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释 (能干嘛的)专业解释怎么用/举个例子
宽度width像素值1024设置图片宽度图像宽度像素根据模型要求设置
高度height像素值1024设置图片高度图像高度像素保持合适比例
批次大小batch_size1-101一次生成多少张图批处理数量根据显存情况调整

3.8 Gemma 加载器节点

3.8.1 Gemma 加载器节点

这个节点就像一个专门为 Gemma 文本模型定制的读卡器,Gemma 是 Google 开发的轻量级文本理解模型。

参数详解:

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释 (能干嘛的)专业解释怎么用/举个例子
模型名称model_name模型标识gemma-2-2b-it选择 Gemma 模型版本Gemma 模型标识符2b 版本比较轻量,适合普通用户
设备类型devicecpu/cudacpu选择计算设备计算设备显存紧张选 cpu
量化模式quantizationnone/4bit4bit是否压缩模型模型量化方式4bit 能大幅降低显存占用

4. 使用技巧和建议

4.1 显存优化技巧

  1. 优先使用 fp16 精度:在大多数情况下,fp16 既能节省显存又能保持良好的图片质量。

  2. 合理选择设备:如果你有多张显卡,可以把 T5 模型放在第二张卡上(选择 cuda:1)。

  3. 使用量化模式:显存不够时,选择 bnb4bit 或 4bit 量化可以大幅减少显存占用。

  4. 分块处理:对于大尺寸图片,开启分块解码(tiled)功能。

4.2 模型搭配建议

  1. PixArt Alpha + SD1.5 VAE:适合生成高质量的艺术作品。

  2. PixArt Sigma + SDXL VAE:适合生成更大尺寸的图片。

  3. HunYuan DiT + SDXL VAE:适合处理中文提示词。

  4. MiaoBi + SD1.5 VAE:专门为中文优化,兼容现有插件。

4.3 参数调优建议

  1. 采样步数:

    • 快速预览:10-15 步
    • 正常质量:20-30 步
    • 高质量:40-50 步
  2. 引导强度(CFG):

    • 创意自由:1.5-3.0
    • 平衡效果:4.0-7.0
    • 严格遵循:8.0-15.0
  3. 批次大小:

    • 单卡 8GB:建议 1-2
    • 单卡 12GB:建议 2-4
    • 单卡 24GB:建议 4-8

5. 常见问题解答

5.1 模型加载问题

问题:模型加载失败或找不到文件
解决:

  1. 检查模型文件是否放在正确的文件夹中
  2. 确认文件名是否正确
  3. 检查文件是否完整下载

5.2 显存不足问题

问题:生成图片时显存不足
解决:

  1. 降低批次大小到 1
  2. 使用 fp16 精度
  3. 开启量化模式(bnb4bit)
  4. 将 T5 模型放在 CPU 上

5.3 图片质量问题

问题:生成的图片质量不佳
解决:

  1. 检查是否安装了 xformers
  2. 调整采样步数(增加到 30-50 步)
  3. 调整引导强度(CFG)
  4. 确保使用了正确的 VAE 模型

5.4 中文提示词问题

问题:中文提示词效果不好
解决:

  1. 使用 HunYuan DiT 或 MiaoBi 模型
  2. 检查文本编码器是否正确加载
  3. 尝试中英文混合描述

6. 高级使用技巧

6.1 多模型组合使用

你可以在同一个工作流中使用多个模型:

  1. 用 PixArt 生成基础图片
  2. 用 MiaoBi 进行中文风格调整
  3. 用特殊 VAE 进行最终优化

6.2 自定义预设配置

为常用的模型组合创建预设:

  1. 保存常用的参数组合
  2. 创建模板工作流
  3. 使用 ComfyUI Manager 管理预设

6.3 性能监控

关注以下指标:

  1. 显存使用量
  2. 生成时间
  3. 图片质量评分

这个插件功能非常强大,建议从单个模型开始熟悉,然后逐步尝试更复杂的组合。记住,每个模型都有自己的特点,多实验多尝试才能找到最适合你需求的配置!

标签: #插件 2338
相关文章

ComfyUI错误修复插件详解:轻松解决常见问题 2025-07-10 18:25

ComfyUI-CustomMenu插件使用教程:高效自定义工作流指南 2025-07-10 17:50

ComfyUI图像合并插件comfyui-merge使用教程 2025-07-03 22:44

ComfyUI 图像合并插件教程 (comfyui-merge) 1. 插件简介 这是一个专门用来合并图片的 ComfyUI 插件,就像用 PS 把多张图片叠在一起那样。它的特别之处在于你精确控制每张图片的混合方式。 GitHub 地址:https://github.com/LingSss9/com

ComfyUI WAN 2.2视频插件教程:万相AI提示词全攻略 2025-07-31 11:47

ComfyUI WAN 2.2视频插件教程:万相AI提示词实战指南 2025-07-29 20:10

ComfyUI HeyGem数字人插件教程:零基础快速精通指南 2025-07-22 14:10

目录

从节点基础到高阶工作流,我们为你绘制最清晰的 ComfyUI 学习路径。告别困惑,让每一次连接都充满创造的魔力,轻松驾驭 AI 艺术的无限可能。

  • 微信
  • B站
  • GitHub
Copyright © 2025 AIX All Rights Reserved. Powered by AIX.
隐私政策
津ICP备2024019312号