ComfyUI-KwaiKolorsWrapper 插件完整教程
插件简介
插件地址: https://github.com/kijai/ComfyUI-KwaiKolorsWrapper
这个插件就像给你的 ComfyUI 装上了一个超级厉害的中文画师大脑!它能让你:
- 用中文描述画出超级逼真的图片(就像有个专业画家听懂你的中文指令)
- 支持快手可图(Kolors)这个国产 AI 绘画模型
- 比其他模型更懂中文,画出的人物和场景更符合中国人的审美
- 可以从文字生成图片,也可以基于现有图片进行修改
简单来说,这就是一个专门为中文用户优化的 AI 画图工具!
如何安装
- 打开你的 ComfyUI 文件夹
- 进入
custom_nodes文件夹 - 用 git 下载:
git clone https://github.com/kijai/ComfyUI-KwaiKolorsWrapper.git - 安装依赖:在插件文件夹里运行
pip install -r requirements.txt - 重启 ComfyUI
节点详细解析
3.1 DownloadAndLoadKolorsModel 节点 - 模型下载和加载器
这个节点就像一个智能管家,帮你自动下载和准备 Kolors 绘画模型。
参数详解
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| 模型 | model | 下拉选择 | Kwai-Kolors/Kolors | 选择要使用的 Kolors 模型版本 | 指定要下载的模型仓库地址 | 目前只有一个选项,直接用默认的就行 |
| 精度 | precision | 下拉选择 | fp16 | 控制模型运行时占用显存的大小 | 模型数值精度设置 | fp16 占用显存少但精度稍低,适合大部分显卡 |
3.2 DownloadAndLoadChatGLM3 节点 - 文本理解模型下载器
这个节点负责下载和加载专门理解中文的 AI 大脑,就像给画师配了个中文翻译。
参数详解
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| 精度 | precision | 下拉选择 | fp16 | 控制文本模型的运行精度和显存占用 | 文本编码器的数值精度 | fp16 平衡性能,quant4/quant8 更省显存但可能影响理解能力 |
3.3 LoadChatGLM3 节点 - 本地文本模型加载器
如果你已经下载了 ChatGLM3 模型文件,用这个节点可以直接加载,就像从本地文件夹打开一个程序。
参数详解
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| ChatGLM3 模型文件 | chatglm3_checkpoint | 下拉选择 | 根据你的文件 | 选择本地保存的 ChatGLM3 模型文件 | 本地模型检查点文件路径 | 选择你下载到 models/LLM/checkpoints 文件夹里的模型文件 |
3.4 KolorsTextEncode 节点 - 中文提示词编码器
这个节点就像一个超级翻译官,把你的中文描述翻译成 AI 能理解的"画图指令"。
参数详解
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| ChatGLM3 模型 | chatglm3_model | 连接输入 | 必需 | 连接上面加载的中文理解模型 | ChatGLM3 模型实例 | 从上面的加载节点连一根线过来 |
| 正面提示词 | prompt | 文本框 | "一个美丽的女孩" | 描述你想要画什么 | 正向提示文本 | "穿着汉服的古典美女,在桃花树下" |
| 负面提示词 | negative_prompt | 文本框 | "模糊,低质量" | 描述你不想要的效果 | 负向提示文本 | "模糊,变形,多余的手指,低质量" |
| 每个提示词生成图片数 | num_images_per_prompt | 数字 | 1 | 用同一个描述生成几张不同的图 | 单个提示的图像生成数量 | 设置 4 可以一次生成 4 张风格相似的图 |
3.5 KolorsSampler 节点 - 图片生成采样器
这个节点就像真正的画师,根据前面翻译好的指令开始作画。
参数详解
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| Kolors 模型 | kolors_model | 连接输入 | 必需 | 连接加载好的 Kolors 绘画模型 | Kolors 模型实例 | 从模型加载节点连线过来 |
| Kolors 编码 | kolors_embeds | 连接输入 | 必需 | 连接编码好的提示词信息 | 编码后的提示词嵌入 | 从文本编码节点连线过来 |
| 宽度 | width | 数字 | 1024 | 生成图片的宽度(像素) | 输出图像宽度 | 1024 适合大部分用途,512 更快但质量稍低 |
| 高度 | height | 数字 | 1024 | 生成图片的高度(像素) | 输出图像高度 | 1024 生成正方形图,768 生成竖图 |
| 随机种子 | seed | 数字 | 0 | 控制图片生成的随机性 | 随机数生成种子 | 相同种子+相同参数=相同图片,0 表示每次随机 |
| 步数 | steps | 数字 | 25 | AI 画图时的精细程度 | 推理迭代步数 | 25 步平衡质量和速度,50 步质量更好但更慢 |
| CFG 强度 | cfg | 小数 | 5.0 | 控制 AI 多严格按照你的描述画图 | 分类器自由引导强度 | 5.0 平衡,7.0 更严格按描述,3.0 更有创意 |
| 调度器 | scheduler | 下拉选择 | EulerDiscreteScheduler | 选择 AI 画图的算法方式 | 噪声调度算法 | Euler 速度快,DPM 质量好,根据需要选择 |
| 潜在空间输入 | latent | 连接输入 | 可选 | 如果要基于现有图片修改,连接这里 | 潜在空间表示 | 图生图时连接 VAE 编码后的图片 |
| 去噪强度 | denoise_strength | 小数 | 1.0 | 控制对原图的修改程度 | 去噪强度系数 | 1.0 完全重画,0.5 保留一半原图特征 |
使用技巧和建议
-
新手入门:
- 先用 DownloadAndLoadKolorsModel 和 DownloadAndLoadChatGLM3 下载模型
- 然后按顺序连接:文本编码 → 采样器 → VAE 解码
- 建议先用默认参数试试效果
-
中文提示词技巧:
- 这个模型特别擅长理解中文,可以用很自然的中文描述
- 比如"穿着红色旗袍的优雅女子,站在江南水乡的小桥上"
- 负面提示词建议加上"模糊,变形,多余的肢体,低质量"
-
参数调优:
- CFG 5-7 之间效果最好,太高会过度拟合
- 步数 25-50 之间,质量和速度的平衡点
- 图片尺寸建议用 64 的倍数,如 1024x1024、768x1024
-
显存优化:
- 显存不够可以选择 quant4 或 quant8 精度
- 生成完图片后模型会自动卸载到 CPU 节省显存
常见问题解答
Q: 为什么下载模型很慢?
A: 模型文件比较大(几个 GB),建议用稳定的网络环境,或者手动下载后放到对应文件夹。
Q: 显存不够怎么办?
A: 选择 quant4 或 quant8 精度,或者降低图片分辨率到 512x512。
Q: 生成的图片质量不好?
A: 检查提示词是否清晰具体,尝试增加步数到 50,调整 CFG 到 7.0。
Q: 中文提示词不生效?
A: 确保使用了 ChatGLM3 模型进行文本编码,这个模型专门优化了中文理解。
Q: 如何进行图生图?
A: 先用 VAE 编码器把原图编码成潜在空间,然后连接到采样器的 latent 输入,调整去噪强度。
Q: 模型文件保存在哪里?
A: 自动下载的模型保存在 ComfyUI/models/diffusers/ 文件夹下。
工作流程示例
基础文生图流程:
- DownloadAndLoadKolorsModel → KolorsSampler
- DownloadAndLoadChatGLM3 → KolorsTextEncode → KolorsSampler
- KolorsSampler → VAE Decode → 保存图片
图生图流程:
- 加载原图 → VAE Encode → KolorsSampler
- 其他步骤同文生图
- 调整去噪强度控制修改程度
总结
ComfyUI-KwaiKolorsWrapper 插件包含 5 个核心节点,专门为中文用户优化的 AI 绘画体验。它的最大优势是对中文提示词的理解能力,能够生成更符合中文语境和审美的图片。虽然节点数量不多,但每个节点都有明确的分工,组合使用能实现从文本到图片的完整生成流程。
对于想要使用中文进行 AI 绘画的用户来说,这个插件是一个很好的选择,特别适合生成具有中国文化特色的人物和场景。