ComfyUI-Kolors-MZ 插件完整教程
插件简介
插件地址: https://github.com/MinusZoneAI/ComfyUI-Kolors-MZ
这个插件就像给你的 ComfyUI 装上了一个超级厉害的中文画师大脑!它能让你:
- 用最自然的中文描述画出超级逼真的图片(就像和一个懂中文的专业画家对话)
- 支持快手可图(Kolors)这个国产顶级 AI 绘画模型
- 比其他模型更懂中文语境,画出更符合中国人审美的作品
- 支持各种高级功能:人脸替换、风格控制、精确控制等
- 提供完整的工作流程,从模型加载到图片生成一条龙服务
简单来说,这就是一个专门为中文用户打造的超级 AI 画图工具包!
如何安装
- 打开你的 ComfyUI 文件夹
- 进入
custom_nodes文件夹 - 用 git 下载:
git clone https://github.com/MinusZoneAI/ComfyUI-Kolors-MZ.git - 安装依赖:在插件文件夹里运行
pip install -r requirements.txt - 重启 ComfyUI
节点详细解析
3.1 MZ_ChatGLM3Loader 节点 - 中文理解大脑加载器
这个节点就像一个智能管家,专门负责加载能理解中文的 AI 大脑。
参数详解
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| ChatGLM3 模型文件 | chatglm3_checkpoint | 下拉选择 | 根据你的文件 | 选择中文理解模型文件 | ChatGLM3 模型检查点文件 | 选择你下载的 .safetensors 格式的模型文件 |
3.2 MZ_ChatGLM3_V2 节点 - 中文文本编码器V2
这个节点就像一个超级翻译官,把你的中文描述翻译成 AI 能理解的"画图指令"。
参数详解
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| ChatGLM3 模型 | chatglm3_model | 连接输入 | 必需 | 连接上面加载的中文理解模型 | ChatGLM3 模型实例 | 从 ChatGLM3 加载器连一根线过来 |
| 文本 | text | 文本框 | "一个美丽的女孩" | 输入你想要画的中文描述 | 文本提示输入 | "穿着汉服的古典美女,在桃花树下翩翩起舞" |
3.3 MZ_ChatGLM3Embeds2Conditioning 节点 - 编码转换器
这个节点就像一个格式转换器,把编码好的文本信息转换成绘画系统能用的格式。
参数详解
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| Kolors 编码 | kolors_embeds | 连接输入 | 必需 | 连接编码好的文本信息 | Kolors 文本嵌入数据 | 从文本编码器连线过来 |
| 宽度 | width | 数字 | 1024 | 生成图片的宽度(像素) | 图像宽度参数 | 1024 适合大部分用途,512 更快 |
| 高度 | height | 数字 | 1024 | 生成图片的高度(像素) | 图像高度参数 | 1024 生成正方形,768 生成竖图 |
| 裁剪宽度 | crop_w | 数字 | 0 | 从左边裁掉多少像素 | 水平裁剪偏移 | 通常保持 0,特殊需求时调整 |
| 裁剪高度 | crop_h | 数字 | 0 | 从上边裁掉多少像素 | 垂直裁剪偏移 | 通常保持 0,特殊需求时调整 |
| 目标宽度 | target_width | 数字 | 1024 | 最终输出图片的宽度 | 目标图像宽度 | 和 width 保持一致即可 |
| 目标高度 | target_height | 数字 | 1024 | 最终输出图片的高度 | 目标图像高度 | 和 height 保持一致即可 |
3.4 MZ_ChatGLM3_Advance_V2 节点 - 高级中文文本编码器
这个节点是文本编码器的升级版,能处理更复杂的中文描述和更大的图片尺寸。
参数详解
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| ChatGLM3 模型 | chatglm3_model | 连接输入 | 必需 | 连接中文理解模型 | ChatGLM3 模型实例 | 从 ChatGLM3 加载器连线 |
| 文本 | text | 文本框 | "详细描述" | 输入详细的中文描述 | 文本提示输入 | "一位身穿红色旗袍的优雅女子,站在江南水乡的石桥上" |
| 宽度 | width | 数字 | 1024 | 生成图片的宽度 | 图像宽度参数 | 支持最大 16384 像素 |
| 高度 | height | 数字 | 1024 | 生成图片的高度 | 图像高度参数 | 支持最大 16384 像素 |
| 裁剪宽度 | crop_w | 数字 | 0 | 水平裁剪偏移量 | 水平裁剪偏移 | 高级用户调整构图用 |
| 裁剪高度 | crop_h | 数字 | 0 | 垂直裁剪偏移量 | 垂直裁剪偏移 | 高级用户调整构图用 |
| 目标宽度 | target_width | 数字 | 1024 | 最终图片宽度 | 目标图像宽度 | 通常和宽度一致 |
| 目标高度 | target_height | 数字 | 1024 | 最终图片高度 | 目标图像高度 | 通常和高度一致 |
3.5 MZ_KolorsCheckpointLoaderSimple 节点 - Kolors 模型加载器
这个节点就像一个专业的模型管理员,负责加载 Kolors 绘画模型。
参数详解
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| 模型文件名 | ckpt_name | 下拉选择 | 根据你的文件 | 选择 Kolors 绘画模型文件 | 检查点文件名称 | 选择你下载的 Kolors 模型文件 |
3.6 MZ_KolorsControlNetLoader 节点 - 控制网络加载器
这个节点就像一个精确控制器,加载能精确控制图片生成的辅助模型。
参数详解
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| 控制网络名称 | control_net_name | 下拉选择 | 根据需求 | 选择控制网络模型文件 | ControlNet 模型文件 | 选择 canny、depth 等不同类型的控制模型 |
3.7 MZ_KolorsUNETLoaderV2 节点 - UNET 模型加载器V2
这个节点是绘画引擎的核心加载器,负责加载实际进行图片生成的核心模型。
参数详解
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| UNET 名称 | unet_name | 下拉选择 | 根据你的文件 | 选择绘画引擎模型文件 | UNET 模型文件名 | 选择你下载的 UNET 模型文件 |
3.8 MZ_KolorsControlNetPatch 节点 - 控制网络补丁
这个节点就像一个适配器,让控制网络能和 Kolors 模型完美配合工作。
参数详解
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| 控制网络 | control_net | 连接输入 | 必需 | 连接控制网络模型 | ControlNet 模型实例 | 从控制网络加载器连线 |
| 模型 | model | 连接输入 | 必需 | 连接主绘画模型 | 主模型实例 | 从模型加载器连线 |
3.9 MZ_KolorsCLIPVisionLoader 节点 - 视觉理解模型加载器(遗留版本)
这个节点负责加载能理解图片内容的视觉模型,标记为遗留版本。
参数详解
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| CLIP 名称 | clip_name | 下拉选择 | 根据你的文件 | 选择视觉理解模型文件 | CLIP Vision 模型文件 | 选择对应的视觉模型文件 |
3.10 MZ_ApplySDXLSamplingSettings 节点 - SDXL 采样设置应用器
这个节点就像一个专业调音师,为模型应用最适合的采样设置。
参数详解
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| 模型 | model | 连接输入 | 必需 | 连接要优化的模型 | 模型实例 | 从模型加载器连线过来 |
3.11 MZ_ApplyCUDAGenerator 节点 - CUDA 生成器应用器
这个节点就像一个性能优化器,让模型在 GPU 上运行得更快更稳定。
参数详解
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| 模型 | model | 连接输入 | 必需 | 连接要优化的模型 | 模型实例 | 从模型加载器连线过来 |
3.12 MZ_IPAdapterModelLoaderKolors 节点 - IP 适配器模型加载器(遗留版本)
这个节点负责加载 IP 适配器模型,用于图片风格转换和人脸替换。
参数详解
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| IP 适配器文件 | ipadapter_file | 下拉选择 | 根据需求 | 选择 IP 适配器模型文件 | IPAdapter 模型文件 | 选择对应功能的适配器文件 |
3.13 MZ_IPAdapterAdvancedKolors 节点 - 高级 IP 适配器(遗留版本)
这个节点是 IP 适配器的高级版本,提供更精细的控制选项。
参数详解
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| 模型 | model | 连接输入 | 必需 | 连接主绘画模型 | 模型实例 | 从模型加载器连线 |
| IP 适配器 | ipadapter | 连接输入 | 必需 | 连接 IP 适配器模型 | IPAdapter 实例 | 从适配器加载器连线 |
| 图片 | image | 连接输入 | 必需 | 连接参考图片 | 输入图像 | 连接你想要模仿的参考图片 |
| 权重 | weight | 小数 | 1.0 | 控制参考图片的影响强度 | 适配器权重 | 1.0 是满强度,0.5 是一半影响 |
3.14 MZ_IPAdapterInsightFaceLoader 节点 - 人脸识别加载器(遗留版本)
这个节点专门加载人脸识别模型,用于精确的人脸替换功能。
参数详解
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| 提供商 | provider | 下拉选择 | CPU | 选择运行设备 | 推理提供商 | CPU 兼容性好,CUDA 速度快 |
3.15 MZ_IPAdapterFaceID 节点 - 人脸 ID 适配器(遗留版本)
这个节点专门用于人脸 ID 替换,能保持人脸特征的同时改变其他属性。
参数详解
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| 模型 | model | 连接输入 | 必需 | 连接主绘画模型 | 模型实例 | 从模型加载器连线 |
| IP 适配器 | ipadapter | 连接输入 | 必需 | 连接人脸适配器 | IPAdapter 实例 | 从适配器加载器连线 |
| 图片 | image | 连接输入 | 必需 | 连接人脸参考图片 | 输入图像 | 连接包含目标人脸的图片 |
| 权重 | weight | 小数 | 1.0 | 控制人脸替换的强度 | 适配器权重 | 调整人脸相似度 |
3.16 MZ_ChatGLM3 节点 - ChatGLM3 文本编码器(遗留版本)
这是早期版本的文本编码器,需要额外的投影层配合使用。
参数详解
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| ChatGLM3 模型 | chatglm3_model | 连接输入 | 必需 | 连接中文理解模型 | ChatGLM3 模型实例 | 从加载器连线 |
| 文本 | text | 文本框 | "描述文本" | 输入中文描述 | 文本提示输入 | 输入你想要的画面描述 |
| 隐藏层投影 | hid_proj | 连接输入 | 必需 | 连接投影层 | 线性投影层 | 从 UNET 加载器的第二个输出连线 |
3.17 MZ_KolorsUNETLoader 节点 - Kolors UNET 加载器(遗留版本)
这是早期版本的 UNET 加载器,会同时输出模型和投影层。
参数详解
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| UNET 名称 | unet_name | 下拉选择 | 根据文件 | 选择 UNET 模型文件 | UNET 模型文件名 | 选择对应的模型文件 |
3.18 MZ_FakeCond 节点 - 假条件生成器(开发版本)
这是一个开发测试用的节点,用于生成假的条件数据进行测试。
参数详解
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| 随机种子 | seed | 数字 | 0 | 控制随机性的种子 | 随机数种子 | 用于测试的固定值 |
| 数据类型 | dtype | 下拉选择 | fp32 | 选择数据精度类型 | 浮点数精度 | fp16 省显存,fp32 精度高 |
使用技巧和建议
-
新手入门路线:
- 先用 MZ_ChatGLM3Loader 加载中文理解模型
- 再用 MZ_KolorsCheckpointLoaderSimple 加载绘画模型
- 然后用 MZ_ChatGLM3_V2 编码中文提示词
- 最后连接到标准的 KSampler 进行生成
-
中文提示词技巧:
- 这个模型特别擅长理解中文,可以用很自然的表达
- 比如"一位身穿白色汉服的古典美女,在竹林中抚琴"
- 可以加入具体的中国文化元素,效果会更好
-
版本选择建议:
- 新用户建议用 V2 版本的节点(如 MZ_ChatGLM3_V2)
- Legacy(遗留)版本主要为兼容性保留
- 开发版本节点仅供测试使用
-
性能优化:
- 使用 MZ_ApplyCUDAGenerator 可以提升 GPU 性能
- MZ_ApplySDXLSamplingSettings 能优化采样质量
- 大图生成建议使用 Advance 版本的编码器
-
高级功能:
- IP 适配器系列节点可以实现风格转换和人脸替换
- 控制网络节点可以精确控制图片生成
- 可以组合多个节点实现复杂的创作需求
常见问题解答
Q: 为什么中文提示词效果不好?
A: 确保使用了 ChatGLM3 相关的编码器,这是专门为中文优化的。避免使用标准的 CLIP 文本编码器。
Q: 模型加载失败怎么办?
A: 检查模型文件是否放在正确的文件夹(checkpoints、unet、LLM 等),确保文件格式正确。
Q: V2 版本和遗留版本有什么区别?
A: V2 版本更简单易用,自动处理很多细节;遗留版本需要手动连接更多组件,但提供更多控制选项。
Q: 如何使用人脸替换功能?
A: 使用 IP 适配器相关节点,加载对应的人脸模型,然后连接参考人脸图片即可。
Q: 生成的图片质量不够好?
A: 尝试使用 MZ_ApplySDXLSamplingSettings 优化采样设置,或者增加采样步数。
Q: 显存不够用怎么办?
A: 可以降低图片分辨率,或者使用较小的模型文件。避免同时加载过多模型。
Q: 控制网络怎么使用?
A: 先用 MZ_KolorsControlNetLoader 加载控制模型,再用 MZ_KolorsControlNetPatch 进行适配,最后在采样时连接控制图片。
工作流程示例
基础中文文生图流程:
- MZ_ChatGLM3Loader → MZ_ChatGLM3_V2
- MZ_KolorsCheckpointLoaderSimple → KSampler
- MZ_ChatGLM3_V2 → KSampler
- KSampler → VAE Decode → 保存图片
高级控制流程:
- 加载所有必要模型(ChatGLM3、Kolors、ControlNet)
- 使用 MZ_KolorsControlNetPatch 适配控制网络
- 准备控制图片和文本提示词
- 使用 ControlNet Apply 节点应用控制
- 进行采样和解码
人脸替换流程:
- 加载基础模型和 IP 适配器
- 准备参考人脸图片
- 使用 MZ_IPAdapterFaceID 进行人脸适配
- 结合文本提示词进行生成
总结
ComfyUI-Kolors-MZ 插件包含 18 个功能强大的节点,为中文用户提供了完整的 AI 绘画解决方案。从基础的文本编码到高级的人脸替换,从简单的图片生成到精确的风格控制,这个插件都能满足。
插件的最大优势是对中文的深度理解和优化,让中文用户能够用最自然的语言描述来创作出高质量的 AI 艺术作品。无论是新手还是专业用户,都能在这个插件中找到适合自己的工具和工作流程。
对于想要使用中文进行 AI 绘画创作的用户来说,这是一个不可多得的专业工具包。