ComfyUI DINO 目标检测插件详细教程
1. 插件简介
DINO-X-ComfyUI 插件([GitHub地址](https://github.com/Style-Mosaic/dino-x-comfyui-一个帮助我们在图片中找出物体位置的神奇工具。就像你玩"找不同"游戏一样,它可以自动帮你在图片中圈出你想找的东西,比如人、猫、狗、椅子等等。
2. 安装方法
就像安装手机应用一样简单,跟着下面的步骤来:
- 打开你的 ComfyUI 文件夹
- 找到
custom_nodes文件夹(如果没有就新建一个) - 端或命令提示符中输入:
git clone https://github.com/Style-Mosaic/dino-x-comfyui-node
- 重启 ComfyUI,就像重启手机一样,关了再开
3. 节点详解
3.1 DINO检测节点
功能说明
这个节点就像一个超级放大镜,你给它一张图片,它就能帮你找出图片里的各种物体在哪里。
参数详解
| 参数名(UI显示) | 参数名(代码) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 使用举例 |
|---|---|---|---|---|---|---|
| 图片输入 | image | 图片数据 | - | 你想要检测的图片 | 输入图像数据 | 把你想找东西的图片接到这里 |
| 文字提示 | text | 字符串 | "cat, dog" | 你想找的东西的名字 | 目标检测提示词 | 想找猫就写"cat",想找狗就写"dog" |
| 置信度阈值 | box_threshold | 0-1之间的数 | 0.3 | 要多确定才算找到 | 检测框阈值 | 数字越大要求越严格 |
| 文本匹配度 | text_threshold | 0-1之间的数 | 0.25 | 名字要多匹配才算对 | 文本相似度阈值 | 数字越大匹配越严格 |
3.2 画框节点(Draw Boxes)
功能说明
这个节点就像一个画笔,可以在图片上把找到的东西用框框圈出来。
参数详解
| 参数名(UI显示) | 参数名(代码) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 使用举例 |
|---|---|---|---|---|---|---|
| 原始图片 | image | 图片数据 | - | 要在上面画框的图片 | 输入图像 | 把原图接进来 |
| 检测结果 | boxes | 数组 | - | DINO找到的位置信息 | 检测框数据 | 接DINO节点的输出 |
| 框的颜色 | box_color | RGB颜色值 | [255,0,0] | 框框的颜色 | 边框RGB颜色 | 想要红色就[255,0,0] |
| 文字颜色 | text_color | RGB颜色值 | [255,255,255] | 文字的颜色 | 文本RGB颜色 | 想要白色就[255,255,255] |
4. 使用技巧和建议
- 找东西不准确?试试调高"置信度阈值"
- 想找多种东西?文字提示用逗号分开,比如"猫,狗,人"
- 框框太多?提高文本匹配度,让它更挑剔一点
5. 常见问题解答
Q: 为什么有时候找不到明明在图片里的东西? A: 可能是你的文字描述不够准确,或者置信度要求太高了。试着降低一下置信度阈值。
Q: 框框的颜色怎么改? A: 在画框节点里设置框的颜色,用[红,绿,蓝]的格式,数字范围是0-255。
Q: 检测太慢怎么办? A: 可以试着用小一点的图片,大图片处理起来确实会慢一些。
6. 补充说明
- 这个插件最适合用来:
- 自动找出图片中的特定物体
- 在图片处理前定位目标区域
-
做图片分析和标注
-
小贴士:第一次使用时,建议从简单的场景开始尝试,比如只找一种物体,等熟悉了再试复杂的。