# ComfyUI_zfkun 插件完全使用指南 ## 1. 插件简介 ComfyUI_zfkun 是一个功能丰富的 ComfyUI 插件包,专门为日常工作流程提供实用工具。这个插件就像一个"万能工具箱",里面装了各种好用的小工具,能让你的 AI 图片制作过程更加便捷。 **插件原地址:** https://github.com/zfkun/ComfyUI_zfkun **主要功能包括:** - 文本预览(就像一个放大镜,让你看清楚文本内容) - 多语言翻译(就像一个翻译官,支持多个翻译平台) - 图片加载工具(就像一个图片管理器) - 摄像头捕捉功能(就像一个拍照助手) - 屏幕截图分享(就像一个截屏工具) 这个插件能让你更轻松地处理文本、图片和实时画面,特别适合需要多语言支持或者实时画面处理的朋友。 ## 2. 如何安装 ### 方法一:使用 ComfyUI Manager(推荐) 1. 打开 ComfyUI Manager(就像一个应用商店) 2. 搜索 "ComfyUI_zfkun" 3. 点击安装按钮 4. 重启 ComfyUI ### 方法二:手动安装 1. 打开命令行工具(Windows 用户按 Win+R,输入 cmd) 2. 输入以下命令: ```bash cd ComfyUI/custom_nodes/ git clone https://github.com/zfkun/ComfyUI_zfkun pip install -r requirements.txt ``` 3. 重启 ComfyUI ## 3. 节点详细解析 ### 3.1 ZF Text Preview(文本预览节点) 这个节点就像一个"文本显示器",可以把文本内容清楚地展示出来,方便你查看和确认文本信息。 **参数详解:** | 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 | | :--- | :--- | :--- | :--- | :--- | :--- | :--- | | 文本内容 | text | 任意文本 | 根据需要输入 | 就像在记事本里输入文字一样 | 接收文本输入进行预览显示 | 输入"你好世界"就会显示这个文本 | | 显示模式 | mode | 预览/编辑 | 预览 | 选择是只看文字还是可以修改文字 | 控制文本的显示和编辑状态 | 选择"预览"只能看,选择"编辑"可以改 | ### 3.2 ZF Text Translation(文本翻译节点) 这个节点就像一个"多语言翻译机",支持多个翻译平台,能把一种语言的文字翻译成另一种语言。 **参数详解:** | 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 | | :--- | :--- | :--- | :--- | :--- | :--- | :--- | | 原文本 | text | 任意文本 | 根据需要输入 | 就像告诉翻译官你要翻译什么 | 输入需要翻译的源文本 | 输入"Hello"准备翻译成中文 | | 翻译平台 | platform | 百度/阿里/腾讯/火山/小牛/智谱/硅基流动 | 百度 | 选择哪个翻译服务商,就像选择去哪家翻译公司 | 指定使用的翻译服务提供商 | 选择"百度"使用百度翻译服务 | | 源语言 | source_lang | 语言代码 | auto | 告诉翻译官原文是什么语言,auto就是自动识别 | 指定源文本的语言类型 | 设置为"en"表示英文,"auto"自动识别 | | 目标语言 | target_lang | 语言代码 | zh | 告诉翻译官你要翻译成什么语言 | 指定翻译后的目标语言 | 设置为"zh"翻译成中文 | | 模型选择 | model | 模型名称 | 默认模型 | 选择翻译的"大脑",不同大脑翻译效果不同 | 选择特定的翻译模型 | 智谱平台可选择glm-4-flash等模型 | ### 3.3 ZF Load Image Path(图片路径加载节点) 这个节点就像一个"图片管家",能从电脑里的任何位置加载图片,支持网络图片。 **参数详解:** | 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 | | :--- | :--- | :--- | :--- | :--- | :--- | :--- | | 图片路径 | path | 文件路径或网址 | 根据需要设置 | 告诉程序图片放在哪里,就像告诉快递员地址 | 指定图片文件的位置或URL | 输入"/home/user/pic.jpg"或"https://example.com/pic.jpg" | | 默认图片 | default_image | 图片文件 | 无 | 当找不到指定图片时显示的备用图片 | 设置加载失败时的后备图片 | 设置一张默认图片防止加载失败 | | 输出格式 | format | RGB/RGBA | RGBA | 选择图片的颜色格式,RGBA支持透明 | 指定输出图片的颜色通道格式 | 选择RGBA如果需要透明背景 | ### 3.4 ZF Camera Capture(摄像头捕捉节点) 这个节点就像一个"拍照助手",能从摄像头实时捕捉画面,配合其他节点实现实时处理。 **参数详解:** | 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 | | :--- | :--- | :--- | :--- | :--- | :--- | :--- | | 摄像头编号 | camera_id | 数字(0,1,2...) | 0 | 选择用哪个摄像头,0通常是默认摄像头 | 指定摄像头设备的索引号 | 0是内置摄像头,1可能是外接摄像头 | | 输出目录 | output_dir | 文件夹路径 | ~/ai/output | 设置拍摄的照片保存在哪个文件夹 | 指定捕获图像的保存目录 | 设置为"/home/user/photos" | | 文件名模式 | filename_pattern | 文件名格式 | capture_* | 设置照片文件名的规则,*会被替换成时间 | 定义输出文件的命名规则 | "photo_*"会生成"photo_20240101_120000.jpg" | | 捕获间隔 | capture_interval | 秒数 | 1 | 设置多长时间拍一张照片 | 控制图像捕获的时间间隔 | 设置为0.5表示每半秒拍一张 | ### 3.5 ZF Share Screen(屏幕共享节点) 这个节点就像一个"屏幕录像机",能捕捉屏幕内容,支持窗口、标签页或整个屏幕。 **参数详解:** | 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 | | :--- | :--- | :--- | :--- | :--- | :--- | :--- | | 捕获模式 | capture_mode | 窗口/标签页/屏幕 | 屏幕 | 选择要录制的范围,就像选择拍照的范围 | 指定屏幕捕获的范围类型 | 选择"窗口"只录制特定窗口 | | 剪切区域 | clip_area | 坐标范围 | 全屏 | 选择屏幕的特定区域进行录制 | 定义屏幕捕获的具体区域 | 设置(0,0,800,600)录制左上角800x600区域 | | 刷新频率 | refresh_duration | 毫秒 | 100 | 设置多长时间更新一次画面 | 控制屏幕捕获的刷新间隔 | 设置为50表示每50毫秒更新一次 | | 默认图片 | default_image | 图片文件 | 无 | 当无法捕获屏幕时显示的图片 | 设置捕获失败时的默认图像 | 设置一张提示图片 | | 输出格式 | format | RGB/RGBA | RGBA | 选择输出图片的格式 | 指定输出图像的颜色格式 | 选择RGBA支持透明效果 | | 权重 | weight | 数值 | 1.0 | 控制这个节点在整个流程中的影响力 | 设置节点输出的权重系数 | 设置为0.5降低影响,2.0增强影响 | | 提示词 | prompt | 文本 | 空 | 为截图内容添加文字描述 | 为捕获的图像添加提示信息 | 输入"屏幕截图"作为描述 | ### 3.6 ZF Window Capture Simple(简单窗口捕获节点) 这个节点就像一个"专业拍照师",专门用来拍摄特定窗口的内容。 **参数详解:** | 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 | | :--- | :--- | :--- | :--- | :--- | :--- | :--- | | 窗口标题 | window_title | 窗口名称 | 根据需要设置 | 告诉程序要拍摄哪个窗口 | 指定要捕获的窗口标题 | 输入"记事本"捕获记事本窗口 | | 捕获模式 | capture_mode | 自动/手动 | 自动 | 选择是自动拍摄还是手动控制 | 控制窗口捕获的触发方式 | 选择"自动"会持续捕获窗口 | | 更新间隔 | update_interval | 毫秒 | 1000 | 设置多长时间更新一次窗口截图 | 控制窗口捕获的更新频率 | 设置为500表示每0.5秒更新一次 | | 输出格式 | output_format | PNG/JPG | PNG | 选择保存图片的格式 | 指定输出图像的文件格式 | 选择PNG保持最佳质量 | ## 4. 使用技巧和建议 ### 4.1 翻译节点使用技巧 - **配置文件设置**:第一次使用翻译功能时,需要创建 `config.yaml` 文件(从 `config.yaml.example` 复制),就像填写一张申请表。 - **平台选择**:不同翻译平台有不同的优势,百度适合中英互译,智谱GLM适合专业内容。 - **免费模型**:如果预算有限,可以选择带有"免费"标记的模型,如智谱的 glm-4-flash。 ### 4.2 图片加载技巧 - **路径格式**:支持相对路径(./images/pic.jpg)、绝对路径(/home/user/pic.jpg)和网络地址(https://example.com/pic.jpg)。 - **备用图片**:建议设置默认图片,防止加载失败时流程中断。 - **格式选择**:如果需要透明背景,选择RGBA格式。 ### 4.3 实时捕获技巧 - **摄像头编号**:从0开始尝试,通常0是内置摄像头,1是外接摄像头。 - **性能考虑**:捕获间隔不要设置得太小,避免占用过多系统资源。 - **文件管理**:定期清理输出目录,防止占用过多硬盘空间。 ### 4.4 屏幕共享技巧 - **权限设置**:首次使用时可能需要授权屏幕录制权限。 - **区域选择**:使用剪切区域功能可以只捕获需要的部分,提高效率。 - **刷新频率**:根据实际需要调整,流畅度和性能之间找平衡。 ## 5. 常见问题解答 ### Q1: 翻译功能报错怎么办? **A:** 首先检查 `config.yaml` 文件是否正确配置,确保文件编码为 UTF-8。如果使用付费平台,确认账户余额充足。 ### Q2: 摄像头无法打开怎么办? **A:** 检查摄像头是否被其他程序占用,尝试更换摄像头编号(0、1、2等)。 ### Q3: 屏幕捕获显示黑屏怎么办? **A:** 检查系统是否授权了屏幕录制权限,某些安全软件可能会阻止屏幕捕获。 ### Q4: 图片加载失败怎么办? **A:** 检查图片路径是否正确,网络图片需要确保网络连接正常。建议设置默认图片作为备用。 ### Q5: 插件安装后找不到节点怎么办? **A:** 确认插件安装完成后重启了 ComfyUI,检查依赖包是否正确安装。 ## 6. 实际应用场景 ### 6.1 多语言内容创作 结合翻译节点和文本预览节点,可以快速创建多语言版本的提示词,适合做国际化的AI内容。 ### 6.2 实时直播工作流 使用摄像头捕获节点配合其他AI处理节点,可以创建实时美颜、风格转换等直播效果。 ### 6.3 教学演示 利用屏幕共享节点记录操作过程,配合AI处理可以自动生成教学素材。 ### 6.4 内容本地化 使用图片加载节点批量处理本地图片,配合翻译节点可以实现图片文字的多语言转换。 这个插件就像一个"瑞士军刀",虽然每个工具看起来简单,但组合起来就能创造出很多实用的工作流程。建议新手朋友从简单的文本预览和图片加载开始,逐步尝试更复杂的实时捕获功能。
ComfyUI图像合并插件comfyui-merge使用教程 2025-07-03 22:44 ComfyUI 图像合并插件教程 (comfyui-merge) 1. 插件简介 这是一个专门用来合并图片的 ComfyUI 插件,就像用 PS 把多张图片叠在一起那样。它的特别之处在于你精确控制每张图片的混合方式。 GitHub 地址:https://github.com/LingSss9/com