ComfyUI 魔法书 Logo
🏠 首页
👥 加群
😎 大帅比
❤️‍🔥 Monster 社区
登录 →
ComfyUI 魔法书 Logo
🏠 首页 👥 加群 😎 大帅比 ❤️‍🔥 Monster 社区
登录
  1. 首页
  2. 🧩 插件工坊 (Plugin Workshop)
  3. ComfyUI WD14-Tagger插件使用教程 手把手教你AI绘画打标

ComfyUI WD14-Tagger插件使用教程 手把手教你AI绘画打标

0
  • 🧩 插件工坊 (Plugin Workshop)
  • 发布于 2025-06-28
  • 202 次阅读
编程界的小学生
编程界的小学生

【版权严正声明】

本文系作者 [编程界的小学生] 原创,并拥有完整、独立的著作权。

未经本人 书面授权 ,任何单位、平台或个人, 严禁 以任何形式(包括但不限于转载、复制、摘编、修改、链接、转贴、建立镜像等)使用本文的全部或部分内容。

任何无视本声明的侵权行为,本人将依据《中华人民共和国著作权法》等相关法律法规,采取一切必要的法律手段,追究其侵权责任,要求其 立即停止侵权、赔礼道歉、消除影响,并赔偿因此造成的一切经济损失及维权成本(包括但不限于律师费、诉讼费、公证费等)。

侵权必究,切勿以身试法!

插件简介

ComfyUI-WD14-Tagger 是一个专门用于图像标签识别的智能插件。

插件地址: https://github.com/pythongosssss/ComfyUI-WD14-Tagger

主要功能:

  • 自动识别图片中的内容并生成标签

  • 支持动漫、二次元图片的精确标签识别

  • 可以识别角色、物体、风格、动作等多种元素

  • 支持多种不同的识别模型

  • 可以过滤不需要的标签

这个插件就像一个专业的图片内容分析师,能够"看懂"你的图片里有什么东西,然后用文字标签告诉你。比如你有一张动漫女孩的图片,它能告诉你图片里有"长发"、"蓝色眼睛"、"校服"、"微笑"等等标签。这些标签可以用来训练AI模型,或者帮你更好地管理图片。

如何安装

方法一:通过 ComfyUI Manager 安装(推荐)

  1. 打开 ComfyUI Manager

  2. 搜索 "WD14-Tagger"

  3. 点击安装

  4. 重启 ComfyUI

方法二:手动安装

  1. 进入 ComfyUI 的 custom_nodes 文件夹

  2. 运行命令:git clone https://github.com/pythongosssss/ComfyUI-WD14-Tagger.git

  3. 进入插件文件夹:cd ComfyUI-WD14-Tagger

  4. 安装依赖:pip install -r requirements.txt

  5. 重启 ComfyUI

节点详细解析

插件总节点数:1个 本次已分析:1个 剩余未分析:0个

3.1 WD14 Tagger 节点 - 图像标签识别器

这个节点就像一个专业的图片内容识别专家,能够仔细观察你的图片,然后告诉你图片里都有什么东西。它特别擅长识别动漫、二次元风格的图片内容。

参数详解

参数名 (UI显示)

参数名 (代码里)

参数值

建议值

通俗解释 (能干嘛的)

专业解释

怎么用/举个例子

输入图像

image

IMAGE类型

-

要分析的图片

图像输入数据

连接图片加载节点

识别模型

model

模型列表

"wd-v1-4-moat-tagger-v2"

选择用哪个AI大脑来识别图片

标签识别模型选择

MOAT是最新的,ConvNextV2最受欢迎

识别阈值

threshold

0.0-1.0

0.35

设定识别的严格程度,像调节敏感度

标签置信度阈值

0.35表示35%确信度以上才认为有这个标签

角色识别阈值

character_threshold

0.0-1.0

0.85

专门针对角色识别的严格程度

角色标签置信度阈值

0.85表示85%确信度以上才认为是这个角色

替换下划线

replace_underscore

true/false

false

是否把标签中的下划线改成空格

下划线替换开关

true会把"long_hair"变成"long hair"

末尾逗号

trailing_comma

true/false

false

每个标签后面是否加逗号

标签格式化选项

true会在每个标签后加逗号

排除标签

exclude_tags

字符串

""

不想要的标签,用逗号分隔

标签过滤列表

填入"nsfw,nude"会过滤掉这些标签

前端JavaScript功能

这个插件还包含一个前端JavaScript文件,提供了额外的便利功能:

右键菜单功能

  • 快速标签识别:在任何显示图片的节点上右键,选择"WD14 Tagger"可以快速识别图片标签

  • 状态显示:在节点上方显示下载进度和处理状态

  • 结果展示:识别完成后会弹出对话框显示标签结果

界面增强功能

  • 动态标签显示:识别结果会以只读文本框的形式显示在节点上

  • 进度条显示:模型下载时会显示进度条

  • 状态标签:节点顶部会显示当前处理状态

使用技巧和建议

4.1 模型选择技巧

  • wd-v1-4-moat-tagger-v2:最新最准确的模型,推荐使用

  • wd-v1-4-convnext-tagger-v2:最受欢迎的模型,平衡性好

  • wd-v1-4-convnextv2-tagger-v2:ConvNext的升级版

  • wd-v1-4-vit-tagger-v2:基于Vision Transformer的模型

4.2 阈值设置建议

  • 一般标签阈值(threshold):

    • 0.2-0.3:识别更多标签,但可能有误判

    • 0.35:默认值,平衡准确性和完整性

    • 0.5-0.6:只识别最确定的标签

  • 角色阈值(character_threshold):

    • 0.8-0.85:默认范围,适合大多数情况

    • 0.9以上:只识别非常确定的角色

4.3 标签处理技巧

  • 使用排除标签功能过滤不需要的内容

  • 根据用途选择是否替换下划线

  • 末尾逗号功能适合直接复制到提示词

4.4 性能优化建议

  • 首次使用会自动下载模型,需要网络连接

  • 模型下载后会缓存,离线也能使用

  • CPU运行速度已经很快,不一定需要GPU

常见问题解答

5.1 安装和模型问题

Q:为什么提示缺少onnxruntime? A:需要安装依赖包,运行pip install -r requirements.txt安装所需依赖。

Q:模型下载失败怎么办? A:检查网络连接,或者手动下载模型文件到models文件夹。

Q:可以离线使用吗? A:可以,首次联网下载模型后,后续可以离线使用。

5.2 识别效果问题

Q:识别出来的标签不准确? A:尝试调整阈值,或者换用不同的模型,MOAT模型通常最准确。

Q:为什么有些明显的特征没有识别出来? A:降低threshold阈值,或者检查是否在排除标签中过滤了。

Q:角色识别不准确? A:调整character_threshold,或者使用专门训练过该角色的模型。

5.3 使用和输出问题

Q:如何快速识别图片? A:在任何显示图片的节点上右键,选择"WD14 Tagger"即可快速识别。

Q:标签格式不符合需求? A:使用replace_underscore和trailing_comma参数调整输出格式。

Q:如何过滤不想要的标签? A:在exclude_tags参数中填入要过滤的标签,用逗号分隔。

5.4 性能和兼容性

Q:处理速度很慢? A:WD14模型在CPU上运行已经很快,如果需要更快速度可以尝试GPU版本。

Q:支持哪些图片格式? A:支持常见的图片格式,如PNG、JPG、WEBP等。

实用工作流程示例

6.1 基础标签识别流程

  1. 加载图片 → Load Image 节点

  2. 标签识别 → WD14 Tagger 节点

  3. 查看结果 → 节点会显示识别出的标签

6.2 快速识别流程

  1. 加载图片 → Load Image 节点

  2. 右键识别 → 在图片上右键选择"WD14 Tagger"

  3. 查看弹窗 → 在弹出的对话框中查看标签

6.3 标签处理流程

  1. 识别标签 → WD14 Tagger 节点

  2. 处理格式 → 设置replace_underscore和trailing_comma

  3. 过滤标签 → 使用exclude_tags过滤不需要的标签

  4. 输出使用 → 将标签用于其他节点或复制使用

支持的模型列表

6.1 官方预设模型

  • wd-v1-4-moat-tagger-v2:最新的MOAT架构模型

  • wd-v1-4-convnext-tagger-v2:ConvNext架构模型

  • wd-v1-4-convnextv2-tagger-v2:ConvNext V2架构模型

  • wd-v1-4-vit-tagger-v2:Vision Transformer架构模型

  • wd-v1-4-swinv2-tagger-v2:Swin Transformer V2架构模型

6.2 模型特点对比

  • MOAT:最新最准确,推荐首选

  • ConvNext:经典稳定,广泛使用

  • ViT:Transformer架构,适合复杂场景

  • Swin:窗口注意力机制,平衡性能和准确性

总结

ComfyUI-WD14-Tagger 是一个简单而强大的图像标签识别插件,只包含1个核心节点,但功能非常实用。它能够准确识别图片内容并生成标签,特别适合动漫、二次元图片的分析。

记住几个关键点:

  1. 选择合适的模型(推荐MOAT)

  2. 根据需求调整识别阈值

  3. 善用排除标签功能过滤内容

  4. 利用右键快速识别功能提高效率

  5. 首次使用需要联网下载模型

  6. 合理设置输出格式满足不同需求

希望这个教程能帮助你更好地使用这个实用的图像标签识别插件!

标签: #插件 2338
相关文章

ComfyUI错误修复插件详解:轻松解决常见问题 2025-07-10 18:25

ComfyUI-CustomMenu插件使用教程:高效自定义工作流指南 2025-07-10 17:50

ComfyUI图像合并插件comfyui-merge使用教程 2025-07-03 22:44

ComfyUI 图像合并插件教程 (comfyui-merge) 1. 插件简介 这是一个专门用来合并图片的 ComfyUI 插件,就像用 PS 把多张图片叠在一起那样。它的特别之处在于你精确控制每张图片的混合方式。 GitHub 地址:https://github.com/LingSss9/com

ComfyUI WAN 2.2视频插件教程:万相AI提示词全攻略 2025-07-31 11:47

ComfyUI WAN 2.2视频插件教程:万相AI提示词实战指南 2025-07-29 20:10

ComfyUI HeyGem数字人插件教程:零基础快速精通指南 2025-07-22 14:10

目录

从节点基础到高阶工作流,我们为你绘制最清晰的 ComfyUI 学习路径。告别困惑,让每一次连接都充满创造的魔力,轻松驾驭 AI 艺术的无限可能。

  • 微信
  • B站
  • GitHub
Copyright © 2025 AIX All Rights Reserved. Powered by AIX.
隐私政策
津ICP备2024019312号