ComfyUI 魔法书 Logo
🏠 首页
👥 加群
🔥 报错不求人
😎 大帅比
登录 →
ComfyUI 魔法书 Logo
🏠 首页 👥 加群 🔥 报错不求人 😎 大帅比
登录
  1. 首页
  2. 🧩 插件工坊 (Plugin Workshop)
  3. ComfyUI-DAAM插件新手入门指南 从零开始学AI绘画

ComfyUI-DAAM插件新手入门指南 从零开始学AI绘画

0
  • 🧩 插件工坊 (Plugin Workshop)
  • 发布于 2025-07-03
  • 10 次阅读
编程界的小学生
编程界的小学生
# ComfyUI-DAAM 插件完全新手教程 ## 1. 插件简介 ComfyUI-DAAM 是一个帮你"看透"AI 画图过程的神奇插件。你知道吗,当你输入文字让 AI 画图时,AI 其实会把注意力分配到图片的不同区域。这个插件就像给 AI 戴上了一副透视眼镜,让你能看到 AI 在画图时,每个关键词对应图片的哪个部分。 **插件原地址:** https://github.com/nisaruj/comfyui-daam **能带来什么效果:** - 你可以看到"小狗"这个词对应图片中的哪个区域 - 你可以知道"帽子"这个词 AI 画在了哪里 - 帮你分析为什么有些词没有被很好地表现出来 - 让你更好地调试和优化你的提示词 就像用荧光笔在图片上高亮显示每个关键词的"势力范围"一样! ## 2. 如何安装 ### 方法一:通过 ComfyUI Manager 安装(推荐) 1. 打开 ComfyUI Manager 2. 搜索 "comfyui-daam" 3. 点击安装 4. 重启 ComfyUI ### 方法二:手动安装 1. 找到你的 ComfyUI 文件夹 2. 进入 `custom_nodes` 文件夹 3. 在这里打开命令行窗口 4. 输入:`git clone https://github.com/nisaruj/comfyui-daam.git` 5. 进入新创建的文件夹:`cd comfyui-daam` 6. 安装依赖:`python3 -s -m pip install -r requirements.txt` 7. 重启 ComfyUI ## 3. 节点逐一解析 这个插件包含 3 个主要节点,每个都有特定的作用: ### 3.1 CLIPTextEncodeWithTokens 节点 - 文字编码增强器 这个节点就像一个"文字翻译加记录器"。普通的文字编码器只是把你的文字翻译成 AI 能理解的语言,但这个增强版还会记录下每个词在哪个位置,为后面的分析做准备。 #### 参数详解: | 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 | | :--- | :--- | :--- | :--- | :--- | :--- | :--- | | text | text | 文本字符串 | 根据需要 | 这里输入你想让 AI 画的内容描述 | 输入用于生成图像的提示词文本 | 输入 "a cute dog wearing a hat" | | clip | clip | CLIP 模型 | 必须连接 | 把你的文字翻译成 AI 能理解的语言的翻译器 | 用于文本编码的 CLIP 模型 | 从 Load CLIP 节点连接过来 | **输出说明:** - `CONDITIONING`:翻译好的文字信息,给后面的画图节点用 - `TOKENS`:记录的词汇位置信息,给分析节点用 ### 3.2 KSamplerDAAM 节点 - 画图监控器 这个节点就像一个"画图过程监控器"。它不仅能像普通的画图节点一样生成图片,还会在画图过程中偷偷记录 AI 把注意力放在哪里,为后面的热力图分析准备数据。 #### 参数详解: | 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 | | :--- | :--- | :--- | :--- | :--- | :--- | :--- | | model | model | 模型 | 必须连接 | 用来画图的 AI 大脑 | 用于生成图像的扩散模型 | 从 Load Checkpoint 连接 | | positive | positive | 正面提示词 | 必须连接 | 你想要的东西的描述 | 正面条件输入 | 从 CLIPTextEncodeWithTokens 连接 | | negative | negative | 负面提示词 | 可选连接 | 你不想要的东西的描述 | 负面条件输入 | 连接负面提示词编码 | | latent_image | latent_image | 潜在图像 | 必须连接 | 画图的起始画布 | 初始噪声或图像的潜在表示 | 从 Empty Latent Image 连接 | | seed | seed | 整数 | 随机或固定 | 随机种子,控制画图的随机性 | 控制生成过程随机性的种子值 | 设置为 -1 表示随机 | | steps | steps | 整数 | 20-50 | 画图的精细程度,数字越大越精细但越慢 | 去噪步数 | 一般设置 20-30 | | cfg | cfg | 小数 | 7.0 | 听话程度,数字越大越听你的话 | 分类器自由引导强度 | 一般设置 7.0-8.0 | | sampler_name | sampler_name | 选择列表 | euler | 画图的方法选择 | 采样器算法选择 | 选择 euler 或 dpm++ | | scheduler | scheduler | 选择列表 | normal | 画图节奏的控制方式 | 噪声调度器选择 | 选择 normal 或 karras | | denoise | denoise | 小数 | 1.0 | 去噪强度,1.0 表示完全重画 | 去噪程度控制 | 一般设置 1.0 | **输出说明:** - `LATENT`:生成的图片(还需要解码才能看到) - `POS_HEATMAPS`:正面提示词的注意力热力图数据 - `NEG_HEATMAPS`:负面提示词的注意力热力图数据 ### 3.3 DAAMHeatmapOverlay 节点 - 热力图叠加器 这个节点就像一个"高亮笔",它会根据你指定的关键词,在图片上用不同颜色高亮显示 AI 注意力最集中的区域。 #### 参数详解: | 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 | | :--- | :--- | :--- | :--- | :--- | :--- | :--- | | clip | clip | CLIP 模型 | 必须连接 | 理解文字的翻译器 | 用于文本编码的 CLIP 模型 | 从 Load CLIP 节点连接 | | tokens | tokens | 词汇信息 | 必须连接 | 记录的词汇位置信息 | 从编码器获取的词汇标记 | 从 CLIPTextEncodeWithTokens 连接 | | heatmaps | heatmaps | 热力图数据 | 必须连接 | 画图过程中记录的注意力数据 | 注意力热力图数据 | 从 KSamplerDAAM 的 POS_HEATMAPS 连接 | | images | images | 图像 | 必须连接 | 要分析的图片 | 需要叠加热力图的图像 | 从 VAE Decode 连接解码后的图片 | | attention_words | attention_words | 文本输入框 | 根据需要 | 你想看哪些词的注意力分布 | 需要分析的关键词列表 | 输入 "dog,hat,park" | **输出说明:** - `IMAGE`:叠加了热力图的图片,可以直接查看 ## 4. 使用技巧和建议 ### 基本工作流程 1. **准备阶段**:加载模型和 CLIP → 设置正负面提示词 2. **编码阶段**:用 `CLIPTextEncodeWithTokens` 编码提示词 3. **生成阶段**:用 `KSamplerDAAM` 生成图片并记录注意力 4. **分析阶段**:用 `DAAMHeatmapOverlay` 生成热力图 ### 实用技巧 - **关键词选择**:在 `attention_words` 中输入最重要的 3-5 个词即可 - **词汇分隔**:多个词用英文逗号分隔,如 "dog,hat,skateboard" - **颜色理解**:热力图中红色区域表示 AI 注意力最集中的地方 - **对比分析**:可以同时分析正面和负面提示词的注意力分布 ### 调试建议 - 如果某个词没有明显的热力图,可能是这个词在图片中没有很好地表现 - 可以尝试调整提示词的顺序或表达方式 - 对于复杂场景,建议分批分析不同类型的词汇 ## 5. 常见问题解答 **Q:为什么我的热力图看起来很模糊?** A:这是正常现象。注意力分布本身就是渐变的,不是清晰的边界。模糊的热力图说明 AI 的注意力是分散的。 **Q:某些词汇没有显示热力图怎么办?** A:可能是这些词在图片中没有对应的视觉元素,或者 AI 没有很好地理解这些词。尝试换个更直观的词汇描述。 **Q:可以同时分析多张图片吗?** A:可以,这个插件支持批量处理。确保你的输入图片是批量格式即可。 **Q:热力图的颜色有什么含义?** A:通常红色表示注意力最强,黄色次之,蓝色最弱。具体颜色映射可能因版本而异。 **Q:插件支持哪些模型?** A:支持 SDXL、SD1.5、SD3,以及 Flux Dev(测试版)。 ## 6. 进阶应用 ### LoRA 训练分析 这个插件特别适合分析 LoRA 训练效果: - 可以看到 LoRA 是否正确学习了特定概念 - 帮助优化训练数据集 - 分析不同权重下的效果差异 ### 提示词优化 通过热力图分析,你可以: - 发现哪些词汇被 AI 忽略了 - 优化词汇顺序和组合 - 找到最有效的描述方式 ### 模型对比 使用相同提示词在不同模型上生成热力图: - 比较不同模型的理解能力 - 找到最适合特定风格的模型 - 分析模型的偏好和局限性 --- 这个插件就像给 AI 装上了一个"思维可视化器",让原本神秘的 AI 画图过程变得透明可见。通过热力图分析,你不仅能创作出更好的图片,还能更好地理解 AI 的工作原理。记住,多实验、多观察,你会发现更多有趣的现象!
标签: #插件 2338
相关文章

ComfyUI错误修复插件详解:轻松解决常见问题 2025-07-10 18:25

ComfyUI-CustomMenu插件使用教程:高效自定义工作流指南 2025-07-10 17:50

ComfyUI图像合并插件comfyui-merge使用教程 2025-07-03 22:44

ComfyUI 图像合并插件教程 (comfyui-merge) 1. 插件简介 这是一个专门用来合并图片的 ComfyUI 插件,就像用 PS 把多张图片叠在一起那样。它的特别之处在于你精确控制每张图片的混合方式。 GitHub 地址:https://github.com/LingSss9/com

ComfyUI WAN 2.2视频插件教程:万相AI提示词全攻略 2025-07-31 11:47

ComfyUI WAN 2.2视频插件教程:万相AI提示词实战指南 2025-07-29 20:10

ComfyUI HeyGem数字人插件教程:零基础快速精通指南 2025-07-22 14:10

目录

从节点基础到高阶工作流,我们为你绘制最清晰的 ComfyUI 学习路径。告别困惑,让每一次连接都充满创造的魔力,轻松驾驭 AI 艺术的无限可能。

  • 微信
  • B站
  • GitHub
Copyright © 2025 AIX All Rights Reserved. Powered by AIX.
隐私政策
津ICP备2024019312号