ComfyUI 魔法书 Logo
🏠 首页
👥 加群
🔥 报错不求人
😎 大帅比
登录 →
ComfyUI 魔法书 Logo
🏠 首页 👥 加群 🔥 报错不求人 😎 大帅比
登录
  1. 首页
  2. 🧩 插件工坊 (Plugin Workshop)
  3. ComfyUI-Kandinsky22插件新手入门教程:从零开始轻松掌握

ComfyUI-Kandinsky22插件新手入门教程:从零开始轻松掌握

0
  • 🧩 插件工坊 (Plugin Workshop)
  • 发布于 2025-07-03
  • 9 次阅读
编程界的小学生
编程界的小学生
# ComfyUI-Kandinsky22 插件完全新手指南 **插件地址:** https://github.com/vsevolod-oparin/comfyui-kandinsky22 ## 1. 插件简介 ComfyUI-Kandinsky22 插件就像是给你的 ComfyUI 安装了一个俄罗斯画家助手!这个插件能让你在 ComfyUI 里面使用 Kandinsky 2.2 这个超厉害的画图模型。想象一下,这就像给你的画图软件添加了一个新的画笔套装,而且这套画笔特别擅长画出非常有艺术感的图片。 这个插件可以让你使用发布在 HuggingFace 上的 Kandinsky 2.2 模型,提供了组合前置模型和解码器模型的选项。简单说就是: - **能画文字描述的图**:你写个描述,它就能画出来 - **能模仿现有图片风格**:给它一张图,它能按这个风格画新图 - **能进行图片修改**:把一张图改成另一种样子 - **支持深度控制**:可以根据物体的远近关系来画图 ## 2. 如何安装 ### 方法一:推荐方法(使用ComfyUI管理器) 1. 打开你的 ComfyUI 2. 点击右下角的"Manager"(管理器) 3. 搜索"kandinsky" 4. 找到这个插件并点击安装 ### 方法二:手动安装 1. 打开命令行(就是黑色窗口那个) 2. 进入你的 ComfyUI 文件夹里的 `custom_nodes` 目录 3. 输入这个命令: ```bash git clone https://github.com/vsevolod-oparin/comfyui-kandinsky22 ``` 4. 然后安装依赖: ```bash python -s -m pip install -r requirements.txt ``` ### 下载模型文件 你还需要下载画图用的"大脑"(模型文件): ```bash git clone --depth 1 https://huggingface.co/kandinsky-community/kandinsky-2-2-prior git clone --depth 1 https://huggingface.co/kandinsky-community/kandinsky-2-2-decoder git clone --depth 1 https://huggingface.co/kandinsky-community/kandinsky-2-2-controlnet-depth ``` ## 3. 节点逐一解析 ### 3.1 Kandinsky2.2 Text Encoder(文字编码器)- 把文字变成电脑能懂的语言 这个节点就像一个翻译官,它把你写的文字描述翻译成电脑能理解的"画图指令"。 #### 3.2 参数详解 | 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 | | :-- | :-- | :-- | :-- | :-- | :-- | :-- | | text_encoder | text_encoder | TEXT_ENCODER | - | 就像选择哪个翻译官来翻译 | 指定文本编码模型 | 连接加载好的文本编码器模型 | | num_inference_steps | num_inference_steps | INT | 50-100 | 画图时思考多少步,步数越多画得越精细 | 推理步数,影响生成质量 | 新手用50步就够了,要精细就用100步 | | guidance_scale | guidance_scale | FLOAT | 4.0-8.0 | 听话程度,数字越大越按你的描述画 | 引导强度,控制文本指导程度 | 想要严格按描述画就用7-8,想要创意就用4-5 | | seed | seed | INT | -1 | 随机种子,像抽奖号码,同样的号码画出同样的图 | 控制随机性的种子值 | 用-1就是随机,想复现就记住这个数字 | | prompt | prompt | STRING | - | 你想画什么的描述,比如"一只可爱的猫" | 正向提示词 | 写你想要的:'beautiful sunset over mountains' | | negative_prior | negative_prior | STRING | - | 你不想画什么,比如"丑陋的,模糊的" | 负向提示词 | 写你不要的:'blurry, ugly, distorted' | ### 3.3 Kandinsky2.2 Image Encoder(图片编码器)- 把图片变成电脑能懂的信息 这个节点就像一个看图专家,它能"看懂"一张图片,然后告诉电脑这张图有什么特点。 #### 3.4 参数详解 | 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 | | :-- | :-- | :-- | :-- | :-- | :-- | :-- | | encoder | encoder | IMAGE_ENCODER | - | 选择哪个看图专家来分析图片 | 指定图像编码模型 | 连接加载好的图像编码器 | | image | image | IMAGE | - | 要分析的图片 | 输入的参考图像 | 拖入一张图片,让AI学习它的风格 | ### 3.5 Kandinsky2.2 Latents(画布准备器)- 准备画图的画布 这个节点就像准备画布,决定你要画多大的图,画几张图。 #### 3.6 参数详解 | 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 | | :-- | :-- | :-- | :-- | :-- | :-- | :-- | | lat_info | lat_info | LATENT_INFO | - | 画布的基本信息,从解码器那里来 | 潜在空间信息 | 从Unet Decoder的输出连过来 | | batch_size | batch_size | INT | 1-4 | 一次画几张图 | 批次大小 | 1张就够了,多了电脑会累 | | height | height | INT | 512-1024 | 图片的高度,像素点数量 | 图像高度 | 512适合快速测试,1024更清晰 | | width | width | INT | 512-1024 | 图片的宽度,像素点数量 | 图像宽度 | 建议和高度一样,比如都是512 | | seed | seed | INT | -1 | 随机种子,控制画图的随机性 | 控制随机性的种子值 | -1是完全随机,固定数字能重复结果 | ### 3.7 Kandinsky2.2 Unet Decoder(主画家)- 真正开始画图的地方 这个节点就是主画家,它根据前面准备好的所有信息,真正开始在画布上画图。 #### 3.8 参数详解 | 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 | | :-- | :-- | :-- | :-- | :-- | :-- | :-- | | decoder | decoder | DECODER | - | 选择哪个画家来画图 | 解码器模型 | 连接加载好的解码器模型 | | latents | latents | LATENT | - | 画布,从Latents节点来 | 潜在空间张量 | 从Kandinsky2.2 Latents连过来 | | strength | strength | FLOAT | 0.5-1.0 | 改图时的力度,1.0是完全重画 | 图像修改强度 | 轻微修改用0.5,大改用0.8+ | | image_embeds | image_embeds | PRIOR_LATENT | - | 正面指导,告诉AI画什么 | 正向图像嵌入 | 从文字或图片编码器连过来 | | negative_image_embeds | negative_image_embeds | PRIOR_LATENT | - | 反面指导,告诉AI不要画什么 | 负向图像嵌入 | 可以留空,或者连接负面指导 | | num_inference_steps | num_inference_steps | INT | 50-100 | 画图时思考多少步 | 推理步数 | 越多越精细,但也越慢 | | guidance_scale | guidance_scale | FLOAT | 4.0-8.0 | 听话程度,数字越大越按指导画 | 引导强度 | 想要严格按要求就调高 | | seed | seed | INT | -1 | 随机种子 | 控制随机性 | 建议和其他节点用一样的数字 | ### 3.9 Kandinsky2.2 MovQ Decoder(图片输出器)- 把画好的图变成你能看的 这个节点就像照片冲洗师,把画家画好的"半成品"变成你能看到的最终图片。 #### 3.10 参数详解 | 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 | | :-- | :-- | :-- | :-- | :-- | :-- | :-- | | movq | movq | MOVQ | - | 选择哪个冲洗师来处理图片 | MovQ解码器模型 | 连接加载好的MovQ模型 | | latents | latents | LATENT | - | 从主画家那里来的半成品 | 经过处理的潜在空间数据 | 从Unet Decoder的输出连过来 | ## 4. 使用技巧和建议 ### 基础工作流程 1. **文字生图**:文字编码器 → Unet解码器 → MovQ解码器 → 保存图片 2. **图片风格转换**:图片编码器 + 文字编码器 → Unet解码器 → MovQ解码器 3. **图片修改**:准备画布时加载原图,调整strength参数 ### 参数调优建议 - **新手入门**:所有step用50,guidance_scale用4.0,图片尺寸512x512 - **追求质量**:step增加到100,guidance_scale用7.0,图片尺寸768x768 - **快速测试**:step用25,小尺寸如256x256 ### 常见搭配 - **写实风格**:guidance_scale = 6-8,steps = 80-100 - **艺术创作**:guidance_scale = 3-5,steps = 50-70 - **风格模仿**:使用图片编码器,strength = 0.6-0.8 ## 5. 常见问题解答 **Q: 为什么我的图片很模糊?** A: 试试增加steps数量到80-100,或者提高图片分辨率。 **Q: 生成的图和我的描述差别很大?** A: 增加guidance_scale到7-8,让AI更严格按你的描述画。 **Q: 电脑内存不够怎么办?** A: 减小图片尺寸,比如用512x512,batch_size设为1。 **Q: 想要重复生成同样的图怎么办?** A: 记住seed数字,下次用同样的seed、同样的参数和描述就能重现。 **Q: 负面提示词应该写什么?** A: 常用的有:blurry(模糊)、ugly(丑陋)、distorted(扭曲)、low quality(低质量) ## 6. 进阶玩法 ### 深度控制 如果你下载了depth模型,可以控制图片的前景后景关系,让画面更有立体感。 ### 批量生成 把batch_size调到2-4,可以一次生成多张不同的图,然后挑选最好的。 ### 混合风格 同时使用文字描述和参考图片,可以创造出独特的混合风格效果。 --- 这个插件就像给你的ComfyUI装上了一个俄罗斯艺术家的大脑,虽然参数看起来多,但其实就是在告诉这个艺术家:"我想要什么样的图"、"画多大"、"画得多精细"这些基本问题。多试几次,你就能掌握这个强大的画图工具了!
标签: #插件 2338
相关文章

ComfyUI错误修复插件详解:轻松解决常见问题 2025-07-10 18:25

ComfyUI-CustomMenu插件使用教程:高效自定义工作流指南 2025-07-10 17:50

ComfyUI图像合并插件comfyui-merge使用教程 2025-07-03 22:44

ComfyUI 图像合并插件教程 (comfyui-merge) 1. 插件简介 这是一个专门用来合并图片的 ComfyUI 插件,就像用 PS 把多张图片叠在一起那样。它的特别之处在于你精确控制每张图片的混合方式。 GitHub 地址:https://github.com/LingSss9/com

ComfyUI WAN 2.2视频插件教程:万相AI提示词全攻略 2025-07-31 11:47

ComfyUI WAN 2.2视频插件教程:万相AI提示词实战指南 2025-07-29 20:10

ComfyUI HeyGem数字人插件教程:零基础快速精通指南 2025-07-22 14:10

目录

从节点基础到高阶工作流,我们为你绘制最清晰的 ComfyUI 学习路径。告别困惑,让每一次连接都充满创造的魔力,轻松驾驭 AI 艺术的无限可能。

  • 微信
  • B站
  • GitHub
Copyright © 2025 AIX All Rights Reserved. Powered by AIX.
隐私政策
津ICP备2024019312号