# ComfyUI 插件保姆级教程 ## 1. 插件简介 ComfyUI-moondream2 是一个能让你的 ComfyUI 拥有"看图说话"能力的神奇小帮手。它就像一个细心的观察者,可以帮你分析图片里有什么,并用文字告诉你。 GitHub 地址:https://github.com/zhilemann/ComfyUI-moondream2 ## 2. 安装方法 就像安装其他 ComfyUI 插件一样,你有两种方法可以选择: ### 方法一:直接复制(推荐新手使用) 1. 打开你的 ComfyUI 文件夹 2. 找到 `custom_nodes` 文件夹 3. 在这个文件夹里新建一个叫 `ComfyUI-` 的文件夹 4. 把 GitHub 上的所有文件都下载下来,放进这个新文件夹 ### 方法二:用 Git 克隆(适合熟悉命令行的朋友) 1. 打开命令行 2. 进入到 ComfyUI 的 custom_nodes 文件夹 3. 输入:`git clone https://github.com/zhilemann/ComfyUI-moondream2.git` ## 3. 节点详解 ### 3.1 LoadMoondreamPipeline 节点 这个节点就像是启动引擎一样,需要先运行它,才能使用其他功能。 参数表格: | 参数名(UI显示) | 参数名(代码) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 使用建议 | |----------------|--------------|---------|---------|------------|------------|------------| | device | device | "cuda" / "cpu" | "cuda" | 选择用显卡还是CPU来运行 | 设备选择参数 | 有显卡就选cuda,没有就选cpu | ### 3.2 MoondreamDetect 节点 这就是我们的"看图说话"主角,它能分析图片并告诉你里面有什么内容。 参数表格: | 参数名(UI显示) | 参数名(代码) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 使用建议 | |----------------|--------------|---------|---------|------------|------------|------------| | prompt | prompt | 文字输入 | "What's in this image?" | 你想问图片的问题 | 查询提示词 | 可以问"图里有什么"、"物体的颜色是什么"等 | ## 4. 使用技巧和建议 - 问题要具体:比如不要问"这是什么",而是问"这张图片里的人在做什么" - 一次只问一个问题,这样回答会更准确 - 图片最好清晰一些,模糊的图片可能会影响识别效果 ## 5. 常见问题解答 Q: 为什么我的节点没反应? A: 检查一下是否先运行了 LoadMoondreamPipeline 节点 Q: 为什么回答很慢? A: 如果你用的是 CPU,速度会比较慢,建议使用显卡(cuda) Q: 可以识别中文吗? A: 建议用英文提问,效果会更好 ## 6. 进阶使用提示 - 可以把这个插件和其他生成图片的节点配合使用 - 先用它分析图片内容,再用其他节点进行创作 - 适合做图片分类、内容理解等任务 记住,这个插件就像是你的"人工眼睛",帮你看懂图片里的内容。开始时可以问些简单的问题,熟悉了再逐步尝试更复杂的提问!
ComfyUI图像合并插件comfyui-merge使用教程 2025-07-03 22:44 ComfyUI 图像合并插件教程 (comfyui-merge) 1. 插件简介 这是一个专门用来合并图片的 ComfyUI 插件,就像用 PS 把多张图片叠在一起那样。它的特别之处在于你精确控制每张图片的混合方式。 GitHub 地址:https://github.com/LingSss9/com