ComfyUI 魔法书 Logo
🏠 首页
👥 加群
😎 大帅比
❤️‍🔥 Monster 社区
登录 →
ComfyUI 魔法书 Logo
🏠 首页 👥 加群 😎 大帅比 ❤️‍🔥 Monster 社区
登录
  1. 首页
  2. 🧩 插件工坊 (Plugin Workshop)
  3. ComfyUI插件ExtraModels安装使用教程 手把手教你玩转AI模型

ComfyUI插件ExtraModels安装使用教程 手把手教你玩转AI模型

0
  • 🧩 插件工坊 (Plugin Workshop)
  • 发布于 2025-06-28
  • 27 次阅读
编程界的小学生
编程界的小学生

ComfyUI_ExtraModels 插件完整教程

1. 插件简介

插件地址: https://github.com/city96/ComfyUI_ExtraModels

这个插件就像是给 ComfyUI 装了一个超级模型扩展包,让你能使用各种各样的新型 AI 模型。如果说原版 ComfyUI 只能用标准的 Stable Diffusion 模型,那这个插件就像是给你的工具箱里添加了各种专业工具,让你能玩转更多类型的 AI 模型。

主要功能:

  • 支持 PixArt 模型:专门用 T5 文本编码器的高质量图片生成模型
  • 支持 DiT 模型:用类别标签而不是文字描述来生成图片的模型
  • 支持 HunYuan DiT:腾讯开发的中英文双语图片生成模型
  • 支持 Sana 模型:新一代高效图片生成模型
  • 支持 MiaoBi 模型:专门针对中文优化的图片生成模型
  • 支持各种特殊 VAE:包括一致性解码器等高级图片解码器
  • 支持 T5 文本编码器:比 CLIP 更强大的文本理解模型
  • 支持 Gemma 文本模型:用于高级文本处理

2. 如何安装

  1. 打开命令行/终端
  2. 进入 ComfyUI 的 custom_nodes 文件夹
  3. 运行命令:git clone https://github.com/city96/ComfyUI_ExtraModels.git
  4. 安装依赖:pip install -r requirements.txt
  5. 重启 ComfyUI

3. 节点详细解析

3.1 DiT 模型节点

DiT 模型是一种特殊的图片生成模型,它不用文字描述,而是用类别标签来生成图片,就像给 AI 一个分类目录,让它按照类别来画图。

3.1.1 DitCheckpointLoader 节点

这个节点就像一个专门的 DiT 模型加载器,把 DiT 模型文件读取到内存里准备使用。

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释专业解释怎么用/举个例子
模型文件名ckpt_name模型文件列表根据需要选择选择要加载的 DiT 模型文件DiT checkpoint文件路径选择下载的 DiT 模型文件
模型类型modelDiT模型配置列表根据模型选择选择对应的模型配置模型架构配置根据下载的模型选择对应配置
图片尺寸image_size256/512512生成图片的尺寸大小输出图像分辨率512表示生成512x512的图片

3.1.2 DiTCondLabelSelect 节点

这个节点就像一个类别选择器,从 ImageNet 的1000个类别中选择一个,告诉 AI 要画什么类型的东西。

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释专业解释怎么用/举个例子
模型modelMODEL类型连接输入从 DiT 加载器接收模型DiT模型输入连接 DitCheckpointLoader 输出
标签名称label_nameImageNet类别列表根据需要选择选择要生成的物体类别ImageNet分类标签选择"狗"、"猫"、"汽车"等

3.1.3 DiTCondLabelEmpty 节点

这个节点就像一个空白标签,用于负面条件,告诉 AI 不要生成什么。

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释专业解释怎么用/举个例子
模型modelMODEL类型连接输入从 DiT 加载器接收模型DiT模型输入连接 DitCheckpointLoader 输出

3.2 PixArt 模型节点

PixArt 是一个使用 T5 文本编码器的高质量图片生成模型,它能更好地理解复杂的文字描述。

3.2.1 PixArtCheckpointLoader 节点

这个节点是 PixArt 模型的专用加载器,就像一个专门读取 PixArt 模型的阅读器。

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释专业解释怎么用/举个例子
模型文件名ckpt_name模型文件列表根据需要选择选择要加载的 PixArt 模型文件PixArt checkpoint文件选择 PixArt-XL-2-1024-MS.pth
模型类型modelPixArt配置列表根据模型选择选择对应的模型配置模型架构配置选择对应的模型版本配置

3.2.2 PixArtCheckpointLoaderSimple 节点

这是简化版的 PixArt 加载器,会自动识别模型类型,使用更简单。

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释专业解释怎么用/举个例子
模型文件名ckpt_name模型文件列表根据需要选择选择要加载的 PixArt 模型文件PixArt checkpoint文件选择 PixArt 模型文件

3.2.3 PixArtResolutionSelect 节点

这个节点就像一个分辨率选择器,帮你选择 PixArt 模型支持的标准分辨率。

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释专业解释怎么用/举个例子
模型类型modelPixArt模型列表根据使用的模型选择对应的 PixArt 模型类型PixArt模型版本选择 PixArtMS_XL_2
宽高比ratio比例列表1.00选择图片的宽高比例图像宽高比1.00表示正方形,其他为长方形

3.2.4 PixArtLoraLoader 节点

这个节点就像一个 LoRA 插件安装器,给 PixArt 模型安装额外的风格插件。

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释专业解释怎么用/举个例子
模型modelMODEL类型连接输入从 PixArt 加载器接收模型PixArt模型输入连接 PixArt 加载器输出
LoRA名称lora_nameLoRA文件列表根据需要选择选择要使用的 LoRA 文件LoRA权重文件选择风格 LoRA 文件
强度strength-20.0到20.01.0LoRA 的影响强度LoRA权重强度1.0表示100%强度

3.2.5 PixArtResolutionCond 节点

这个节点就像一个分辨率信息添加器,告诉模型要生成多大的图片。

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释专业解释怎么用/举个例子
条件condCONDITIONING类型连接输入从文本编码器接收条件条件输入连接 T5 文本编码器输出
宽度width0-81921024图片宽度像素图像宽度1024表示1024像素宽
高度height0-81921024图片高度像素图像高度1024表示1024像素高

3.2.6 PixArtControlNetCond 节点

这个节点是为 PixArt 的 ControlNet 功能准备的条件处理器。

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释专业解释怎么用/举个例子
条件condCONDITIONING类型连接输入从文本编码器接收条件条件输入连接文本编码器输出
潜在空间latentLATENT类型连接输入控制图的潜在表示潜在张量输入连接控制图的潜在空间

3.2.7 PixArtT5TextEncode 节点

这个节点是 PixArt 专用的文本编码器,使用 T5 模型来理解文字描述。

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释专业解释怎么用/举个例子
文本text文本空输入要生成图片的文字描述文本提示词"一只可爱的小猫在花园里玩耍"
T5模型T5T5类型连接输入从 T5 加载器接收模型T5文本编码器连接 T5 加载器输出

3.2.8 PixArtT5FromSD3CLIP 节点

这个节点可以从 SD3 的 CLIP 模型中提取 T5 部分给 PixArt 使用。

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释专业解释怎么用/举个例子
SD3 CLIPsd3_clipCLIP类型连接输入SD3 的 CLIP 模型SD3 CLIP模型输入连接 SD3 CLIP 加载器
填充长度padding1-3001文本填充的最小长度文本填充参数1表示最小填充

3.3 T5 文本编码器节点

T5 是比 CLIP 更强大的文本理解模型,能更好地理解复杂的文字描述。

3.3.1 T5v11Loader 节点

这个节点就像一个 T5 模型的专用加载器,把 T5 模型读取到内存里。

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释专业解释怎么用/举个例子
T5模型名称t5v11_nameT5文件列表根据需要选择选择要加载的 T5 模型文件T5模型文件路径选择下载的 T5 模型
T5版本t5v11_verxxlxxlT5 模型的版本T5模型版本使用 xxl 版本
路径类型path_typefolder/filefolder模型文件的存储方式文件路径类型folder表示文件夹形式
设备device设备列表cpu模型运行的设备计算设备cpu表示用CPU运行
数据类型dtype数据类型列表default模型的数据精度数据类型default表示默认精度

3.3.2 T5TextEncode 节点

这个节点是 T5 的文本编码器,把文字转换成 AI 能理解的格式。

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释专业解释怎么用/举个例子
文本text文本空输入要编码的文字描述文本输入"美丽的风景画,有山有水"
T5模型T5T5类型连接输入从 T5 加载器接收模型T5模型输入连接 T5v11Loader 输出

3.4 VAE 相关节点

VAE 是负责图片编码和解码的组件,这个插件支持多种特殊的 VAE 模型。

3.4.1 ExtraVAELoader 节点

这个节点就像一个万能 VAE 加载器,能加载各种特殊的 VAE 模型。

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释专业解释怎么用/举个例子
VAE名称vae_nameVAE文件列表根据需要选择选择要加载的 VAE 文件VAE模型文件选择对应的 VAE 文件
VAE类型vae_typeVAE类型列表kl-f8选择 VAE 的类型配置VAE架构类型kl-f8 是常用类型
数据类型dtype数据类型列表autoVAE 的数据精度数据类型auto 表示自动选择

3.4.2 EmptyDCAELatentImage 节点

这个节点创建 DCAE 类型的空白潜在空间,用于特殊模型的图片生成。

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释专业解释怎么用/举个例子
宽度width16-16384512图片宽度像素图像宽度512表示512像素宽
高度height16-16384512图片高度像素图像高度512表示512像素高
批次大小batch_size1-40961一次生成几张图批处理大小1表示生成1张图

3.5 HunYuan DiT 节点

HunYuan DiT 是腾讯开发的中英文双语图片生成模型。

3.5.1 HYDiTCheckpointLoader 节点

这个节点是 HunYuan DiT 模型的专用加载器。

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释专业解释怎么用/举个例子
模型文件名ckpt_name模型文件列表根据需要选择选择 HunYuan DiT 模型文件HunYuan模型文件选择下载的模型文件
模型类型model模型配置列表G/2选择模型配置模型架构配置G/2 是推荐配置

3.5.2 HYDiTTextEncoderLoader 节点

这个节点加载 HunYuan DiT 需要的双文本编码器。

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释专业解释怎么用/举个例子
CLIP名称clip_nameCLIP文件列表根据需要选择选择 CLIP 编码器文件CLIP模型文件选择中文 CLIP 模型
mT5名称mt5_nameT5文件列表根据需要选择选择 mT5 编码器文件mT5模型文件选择 mT5 模型
设备device设备列表cpu模型运行设备计算设备cpu 表示用CPU运行
数据类型dtype数据类型列表default模型数据精度数据类型default 表示默认精度

3.5.3 HYDiTTextEncode 节点

这个节点使用双文本编码器处理中英文文本。

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释专业解释怎么用/举个例子
文本text文本空CLIP 处理的文本CLIP文本输入输入中文或英文描述
T5文本text_t5文本空T5 处理的文本T5文本输入输入详细的文本描述
CLIPCLIPCLIP类型连接输入CLIP 编码器CLIP模型输入连接 CLIP 加载器
T5T5T5类型连接输入T5 编码器T5模型输入连接 T5 加载器

3.5.4 HYDiTTextEncodeSimple 节点

这是简化版的 HunYuan 文本编码器,用同一段文本给两个编码器。

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释专业解释怎么用/举个例子
文本text文本空输入的文本描述文本输入"一幅美丽的山水画"
CLIPCLIPCLIP类型连接输入CLIP 编码器CLIP模型输入连接 CLIP 加载器
T5T5T5类型连接输入T5 编码器T5模型输入连接 T5 加载器

3.5.5 HYDiTSrcSizeCond 节点

这个节点为 HunYuan DiT 添加尺寸条件信息。

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释专业解释怎么用/举个例子
条件condCONDITIONING类型连接输入从文本编码器接收条件条件输入连接文本编码器输出
宽度width0-81921024图片宽度像素图像宽度1024表示1024像素宽
高度height0-81921024图片高度像素图像高度1024表示1024像素高

3.6 MiaoBi 模型节点

MiaoBi 是专门针对中文优化的图片生成模型。

3.6.1 MiaoBiCLIPLoader 节点

这个节点加载 MiaoBi 专用的中文 CLIP 编码器。

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释专业解释怎么用/举个例子
CLIP名称clip_nameCLIP文件列表根据需要选择选择 MiaoBi CLIP 文件MiaoBi CLIP模型选择 MiaoBi_CLIP.safetensors

3.6.2 MiaoBiDiffusersLoader 节点

这个节点从 Diffusers 格式加载完整的 MiaoBi 模型。

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释专业解释怎么用/举个例子
模型路径model_path模型路径列表根据需要选择选择 MiaoBi 模型文件夹Diffusers模型路径选择 MiaoBi 模型文件夹

3.7 Sana 模型节点

Sana 是新一代高效的图片生成模型。

3.7.1 SanaCheckpointLoader 节点

这个节点加载 Sana 模型文件。

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释专业解释怎么用/举个例子
模型文件名ckpt_name模型文件列表根据需要选择选择 Sana 模型文件Sana模型文件选择下载的 Sana 模型
模型类型model模型配置列表根据模型选择选择对应的模型配置模型架构配置根据模型选择配置

3.7.2 EmptySanaLatentImage 节点

这个节点创建 Sana 专用的空白潜在空间。

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释专业解释怎么用/举个例子
宽度width16-16384512图片宽度像素图像宽度512表示512像素宽
高度height16-16384512图片高度像素图像高度512表示512像素高
批次大小batch_size1-40961一次生成几张图批处理大小1表示生成1张图

3.7.3 SanaResolutionSelect 节点

这个节点选择 Sana 模型支持的标准分辨率。

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释专业解释怎么用/举个例子
模型类型modelSana模型列表根据使用的模型选择对应的 Sana 模型类型Sana模型版本选择 1024px 版本
宽高比ratio比例列表1.00选择图片的宽高比例图像宽高比1.00表示正方形

3.7.4 SanaResolutionCond 节点

这个节点为 Sana 添加分辨率条件信息。

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释专业解释怎么用/举个例子
条件condCONDITIONING类型连接输入从文本编码器接收条件条件输入连接文本编码器输出
宽度width0-81921024图片宽度像素图像宽度1024表示1024像素宽
高度height0-81921024图片高度像素图像高度1024表示1024像素高

3.7.5 SanaTextEncode 节点

这个节点使用 Gemma 模型为 Sana 编码文本。

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释专业解释怎么用/举个例子
文本text文本空输入要生成图片的文字描述文本提示词"一幅美丽的风景画"
GEMMAGEMMAGEMMA类型连接输入Gemma 文本编码器Gemma模型输入连接 Gemma 加载器

3.8 Gemma 文本模型节点

Gemma 是用于高级文本处理的语言模型。

3.8.1 GemmaLoader 节点

这个节点加载 Gemma 语言模型。

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释专业解释怎么用/举个例子
模型名称model_name模型名称列表根据需要选择选择要使用的 Gemma 模型Gemma模型版本选择 gemma-2-2b-it
设备device设备列表cpu模型运行设备计算设备cpu 表示用CPU运行
数据类型dtype数据类型列表default模型数据精度数据类型default 表示默认精度

3.8.2 GemmaTextEncode 节点

这个节点使用 Gemma 模型编码文本。

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释专业解释怎么用/举个例子
文本text文本空输入要编码的文字文本输入"生成一幅美丽的画"
GEMMAGEMMAGEMMA类型连接输入Gemma 模型Gemma模型输入连接 GemmaLoader 输出

3.9 设备控制节点

这些节点用于控制模型运行在哪个设备上。

3.9.1 OverrideCLIPDevice 节点

这个节点强制指定 CLIP 模型运行的设备。

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释专业解释怎么用/举个例子
CLIPclipCLIP类型连接输入要控制的 CLIP 模型CLIP模型输入连接 CLIP 加载器
设备device设备列表cpu指定运行设备计算设备cpu 表示强制用CPU

3.9.2 OverrideVAEDevice 节点

这个节点强制指定 VAE 模型运行的设备。

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释专业解释怎么用/举个例子
VAEvaeVAE类型连接输入要控制的 VAE 模型VAE模型输入连接 VAE 加载器
设备device设备列表cpu指定运行设备计算设备cpu 表示强制用CPU

4. 使用技巧和建议

4.1 模型选择建议

  • PixArt:适合需要高质量图片和复杂文字描述的场景
  • DiT:适合按类别生成图片,不需要复杂描述
  • HunYuan DiT:适合中文用户,支持中英文双语
  • Sana:新一代模型,效率更高
  • MiaoBi:专门针对中文优化,中文理解能力强

4.2 设备配置建议

  • CPU 运行:适合显存不足的情况,速度较慢但稳定
  • GPU 运行:速度快但占用显存多
  • 多 GPU:可以用第二块显卡运行文本编码器

4.3 内存管理

  • T5 模型很大,建议使用 4bit 量化版本节省显存
  • 可以使用设备控制节点将不同模型分配到不同设备

5. 常见问题解答

Q1: 为什么 T5 模型加载很慢?

A: T5 模型文件很大(约22GB),建议使用转换后的 FP16 或 BF16 版本,文件更小加载更快。

Q2: PixArt 生成的图片质量不好怎么办?

A: 建议安装 xformers 优化库,没有优化的话图片质量会明显下降。

Q3: DiT 模型只能生成固定类别的图片吗?

A: 是的,DiT 模型基于 ImageNet 的1000个类别,不能生成任意内容,适合特定用途。

Q4: HunYuan DiT 需要下载哪些文件?

A: 需要下载中文 CLIP 编码器、mT5 编码器和主模型文件,还需要 SDXL VAE。

Q5: Sana 模型有什么特殊要求?

A: Sana 需要特殊的 DCAE VAE 和 Gemma 文本编码器,压缩比例是32倍。

Q6: 如何选择合适的数据类型?

A: CPU 只能用 FP32,GPU 可以用 FP16 节省显存,BF16 兼容性更好。

6. 高级功能

6.1 多模型组合

  • 可以组合使用不同的文本编码器和图片生成模型
  • 支持 LoRA 微调模型的加载和使用
  • 可以使用 ControlNet 进行精确控制

6.2 分辨率优化

  • 每个模型都有推荐的分辨率设置
  • 使用分辨率选择节点可以获得最佳效果
  • 注意不同模型的分辨率要求不同

6.3 性能优化

  • 合理分配模型到不同设备
  • 使用量化版本节省显存
  • 根据需要选择合适的数据类型

这个插件为 ComfyUI 带来了丰富的模型支持,让你能体验各种最新的 AI 图片生成技术。每个模型都有其特色和适用场景,建议根据具体需求选择合适的模型使用。

标签: #插件 2338
相关文章

ComfyUI错误修复插件详解:轻松解决常见问题 2025-07-10 18:25

ComfyUI-CustomMenu插件使用教程:高效自定义工作流指南 2025-07-10 17:50

ComfyUI图像合并插件comfyui-merge使用教程 2025-07-03 22:44

ComfyUI 图像合并插件教程 (comfyui-merge) 1. 插件简介 这是一个专门用来合并图片的 ComfyUI 插件,就像用 PS 把多张图片叠在一起那样。它的特别之处在于你精确控制每张图片的混合方式。 GitHub 地址:https://github.com/LingSss9/com

ComfyUI WAN 2.2视频插件教程:万相AI提示词全攻略 2025-07-31 11:47

ComfyUI WAN 2.2视频插件教程:万相AI提示词实战指南 2025-07-29 20:10

ComfyUI HeyGem数字人插件教程:零基础快速精通指南 2025-07-22 14:10

目录

从节点基础到高阶工作流,我们为你绘制最清晰的 ComfyUI 学习路径。告别困惑,让每一次连接都充满创造的魔力,轻松驾驭 AI 艺术的无限可能。

  • 微信
  • B站
  • GitHub
Copyright © 2025 AIX All Rights Reserved. Powered by AIX.
隐私政策
津ICP备2024019312号