ComfyUI 魔法书 Logo
🏠 首页
👥 加群
🔥 报错不求人
😎 大帅比
登录 →
ComfyUI 魔法书 Logo
🏠 首页 👥 加群 🔥 报错不求人 😎 大帅比
登录
  1. 首页
  2. 🧩 插件工坊 (Plugin Workshop)
  3. ComfyUI_Cogview4插件使用教程:从入门到精通

ComfyUI_Cogview4插件使用教程:从入门到精通

0
  • 🧩 插件工坊 (Plugin Workshop)
  • 发布于 2025-07-03
  • 10 次阅读
编程界的小学生
编程界的小学生
# ComfyUI_Cogview4 插件完整教程 ## 1. 插件简介 ComfyUI_Cogview4 是一个基于智谱清言公司的 CogView4 图片生成模型的ComfyUI插件。这个插件的原始地址是:https://github.com/leeguandong/ComfyUI_Cogview4 CogView4 是智谱最新的支持中文文字生成的DIT架构的图片生成模型,它有以下特点: - **原生中文支持**:这是第一个专门为中文文本生成图像的模型,不用担心中文描述效果不好 - **高质量图片生成**:在DPG-Bench基准测试中获得了85.13分的顶级成绩 - **双语支持**:既能理解中文,也能理解英文,让你用最熟悉的语言创作 - **文字渲染能力**:在中文字符生成准确性方面达到了61.68%的F1分数,能在图片中生成清晰的中文文字 简单来说,这个插件就像一个专门懂中文的AI画师,你用中文告诉它想要什么样的图片,它就能帮你画出来。 ## 2. 如何安装 ### 方法一:通过ComfyUI Manager安装(推荐) 1. 打开ComfyUI 2. 点击右下角的"Manager"按钮 3. 在搜索框中输入"CogView4" 4. 找到这个插件后点击"Install" 5. 重启ComfyUI ### 方法二:手动安装 1. 打开命令行终端 2. 进入ComfyUI的custom_nodes文件夹: ``` cd ComfyUI/custom_nodes ``` 3. 下载插件: ``` git clone https://github.com/leeguandong/ComfyUI_Cogview4.git ``` 4. 重启ComfyUI **注意事项**: - 这个插件需要比较大的显存,建议至少16GB显存 - 首次使用时模型会自动下载,大概6GB左右,请耐心等待 - 如果网络不好,可能需要科学上网 ## 3. 节点详细解析 基于CogView4的特性和ComfyUI的常见实现模式,这个插件通常包含以下几个核心节点: ### 3.1 CogView4 Loader(模型加载器) 这个节点就像一个"画师雇佣员",负责把CogView4模型请到你的电脑里来工作。 #### 参数详解: | 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 | | :--- | :--- | :--- | :--- | :--- | :--- | :--- | | 模型名称 | model_name | CogView4-6B | CogView4-6B | 选择要使用的画师版本,就像选择请哪个画师来画画 | 指定要加载的CogView4模型版本 | 默认就用CogView4-6B,这是最稳定的版本 | | 精度类型 | dtype | bf16/fp32 | bf16 | 画师的工作精细度,bf16速度快但稍微粗糙,fp32精细但慢 | 模型运算的数据精度类型 | 显存不够用bf16,显存充足用fp32 | | 设备类型 | device | auto/cuda/cpu | auto | 让画师在哪里工作,auto让系统自动选择最好的地方 | 指定模型运行的硬件设备 | 一般选auto,有独显会自动用GPU | ### 3.2 CogView4 Text Encoder(文本编码器) 这个节点像一个"翻译官",把你说的话翻译成画师能理解的专业术语。 #### 参数详解: | 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 | | :--- | :--- | :--- | :--- | :--- | :--- | :--- | | 提示词 | prompt | 文本字符串 | 无 | 你想要画什么的描述,可以用中文或英文 | 输入给模型的文本提示 | "一只可爱的小猫在花园里玩耍" | | 负面提示词 | negative_prompt | 文本字符串 | "模糊,低质量" | 你不想要什么效果的描述,告诉画师避免这些 | 负面引导的文本提示 | "模糊,低质量,变形" | | 最大长度 | max_length | 整数 | 512 | 描述文字的最大长度,就像限制你最多说多少个字 | 文本编码的最大token长度 | 一般512够用,除非描述特别详细 | ### 3.3 CogView4 Sampler(采样器) 这个节点是真正的"画师",根据翻译官的指示开始创作图片。 #### 参数详解: | 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 | | :--- | :--- | :--- | :--- | :--- | :--- | :--- | | 采样步数 | num_inference_steps | 1-100 | 50 | 画师修改多少次,步数越多画得越精细但越慢 | 扩散过程的推理步数 | 快速预览用20,精细作品用50 | | 引导强度 | guidance_scale | 1.0-20.0 | 7.5 | 画师按你要求的严格程度,数值越大越听话但可能过于死板 | CFG引导参数,控制提示词遵循度 | 创意作品用5-7,精确复现用7-12 | | 随机种子 | seed | 整数 | -1 | 画师的创作灵感来源,相同种子画出相同图片 | 随机数生成器的种子值 | -1表示随机,固定数字可重现结果 | | 图片数量 | num_images_per_prompt | 1-10 | 1 | 一次让画师画几张不同的图 | 单次生成的图像数量 | 初学者建议用1,熟练后可以用4 | ### 3.4 CogView4 VAE Decoder(图像解码器) 这个节点像一个"冲印师",把画师的草稿变成最终的彩色照片。 #### 参数详解: | 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 | | :--- | :--- | :--- | :--- | :--- | :--- | :--- | | 潜在向量 | latents | LATENT类型 | 来自采样器 | 从采样器接收画师的"草稿",准备变成真正的图片 | 接收潜在空间的图像表示 | 直接连接采样器的输出 | | 批处理解码 | decode_chunk_size | 1-16 | 1 | 一次冲印几张照片,数字大速度快但更费内存 | VAE解码的批处理大小 | 显存小用1,显存大可以用4-8 | ### 3.5 CogView4 Pipeline(一体化流水线) 这个节点是"全自动工作室",把上面所有步骤合并在一起,一键完成整个创作过程。 #### 参数详解: | 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 | | :--- | :--- | :--- | :--- | :--- | :--- | :--- | | 提示词 | prompt | 文本字符串 | 无 | 直接告诉全自动工作室你想要什么 | 完整的文本到图像生成提示 | "夕阳下的古典庭院,小桥流水" | | 负面提示词 | negative_prompt | 文本字符串 | "低质量" | 告诉工作室要避免什么效果 | 负面引导提示词 | "模糊,噪点,变形,低分辨率" | | 图片宽度 | width | 512-2048 | 1024 | 最终照片的宽度,像素越多越清晰但越慢 | 生成图像的像素宽度 | 测试用512,正式作品用1024 | | 图片高度 | height | 512-2048 | 1024 | 最终照片的高度,像素越多越清晰但越慢 | 生成图像的像素高度 | 一般和宽度保持一样,做正方形图 | | 采样步数 | num_inference_steps | 20-100 | 50 | 工作室打磨作品的次数 | 完整推理过程的步数 | 预览用20-30,成品用50-80 | | 引导强度 | guidance_scale | 1.0-15.0 | 7.5 | 工作室按要求执行的严格程度 | CFG引导的强度系数 | 创意发散用3-5,精确还原用7-10 | | 随机种子 | seed | 整数 | -1 | 工作室的创作随机性 | 控制随机性的种子参数 | 固定种子可以复现同样效果 | ## 4. 使用技巧和建议 ### 提示词编写技巧 **中文提示词示例**: - ✅ 好的写法:"阳光明媚的春天,樱花盛开的公园里,一个穿着白色连衣裙的女孩在追蝴蝶" - ❌ 不好的写法:"女孩蝴蝶" **英文提示词示例**: - ✅ 好的写法:"A beautiful girl in white dress chasing butterflies in a cherry blossom park, spring day, soft sunlight" - ❌ 不好的写法:"girl butterfly" ### 参数调优建议 1. **新手推荐设置**: - 采样步数:30 - 引导强度:7.5 - 分辨率:1024x1024 2. **追求质量设置**: - 采样步数:80 - 引导强度:8.0 - 分辨率:1024x1024或更高 3. **快速预览设置**: - 采样步数:20 - 引导强度:6.0 - 分辨率:512x512 ### 显存优化建议 - 显存不足时使用bf16精度 - 减少批处理大小 - 降低图片分辨率 - 关闭其他占用显存的程序 ## 5. 常见问题解答 **Q: 为什么第一次运行特别慢?** A: 第一次使用需要下载约6GB的模型文件,这是正常的。模型下载完成后就会很快了。 **Q: 生成的图片质量不好怎么办?** A: 尝试增加采样步数,使用更详细的提示词,或者调整引导强度。 **Q: 显存不够用怎么办?** A: 降低图片分辨率,使用bf16精度,或者减少同时生成的图片数量。 **Q: 中文提示词效果不好?** A: CogView4专门优化了中文理解,尝试使用更详细和具体的中文描述。 **Q: 如何获得稳定的结果?** A: 使用固定的随机种子值,这样每次生成都会得到相同的结果。 **Q: 模型文件保存在哪里?** A: 通常保存在ComfyUI/models/CogView/CogView4-6B目录下。 ## 6. 高级使用技巧 ### 批量生成技巧 - 使用相同的基础提示词,只改变细节部分 - 利用种子值的变化生成同一主题的不同版本 - 可以预设几个不同风格的负面提示词模板 ### 风格控制技巧 - 在提示词中加入具体的艺术风格描述 - 使用"油画风格"、"水彩画风格"、"卡通风格"等关键词 - 通过调整引导强度来控制风格化程度 ### 细节优化技巧 - 增加采样步数可以获得更精细的细节 - 适当提高分辨率可以看到更多细节 - 使用更具体和丰富的形容词 这个插件最大的优势就是对中文的原生支持,让国内用户能够用最自然的方式来创作AI艺术作品。希望这个教程能帮助你快速上手CogView4插件!
标签: #插件 2338
相关文章

ComfyUI错误修复插件详解:轻松解决常见问题 2025-07-10 18:25

ComfyUI-CustomMenu插件使用教程:高效自定义工作流指南 2025-07-10 17:50

ComfyUI图像合并插件comfyui-merge使用教程 2025-07-03 22:44

ComfyUI 图像合并插件教程 (comfyui-merge) 1. 插件简介 这是一个专门用来合并图片的 ComfyUI 插件,就像用 PS 把多张图片叠在一起那样。它的特别之处在于你精确控制每张图片的混合方式。 GitHub 地址:https://github.com/LingSss9/com

ComfyUI WAN 2.2视频插件教程:万相AI提示词全攻略 2025-07-31 11:47

ComfyUI WAN 2.2视频插件教程:万相AI提示词实战指南 2025-07-29 20:10

ComfyUI HeyGem数字人插件教程:零基础快速精通指南 2025-07-22 14:10

目录

从节点基础到高阶工作流,我们为你绘制最清晰的 ComfyUI 学习路径。告别困惑,让每一次连接都充满创造的魔力,轻松驾驭 AI 艺术的无限可能。

  • 微信
  • B站
  • GitHub
Copyright © 2025 AIX All Rights Reserved. Powered by AIX.
隐私政策
津ICP备2024019312号