# ComfyUI 音件 (ComfyUI-Whisper-Translator) 保姆级教程 ## 1. 插件简介 这是一个能让 ComfyUI 具备语音识别和翻译功能的超强插件!它就像是给 ComfyUI 安装了一个会"听"和"翻译"的小助手。 GitHub 地址:https://github.com/civen-cn/ComfyUI-Whisper-Translator 主要功能: - 把成文字(就像语音输入法一样) - 把一种语言翻译成另一种语言(就像有道词典) - 可以处理各种音频文件(MP3、WAV 等都没问题) ## 2. 安装方法 ### 基础安装: 1. 打开你的 ComfyUI 文件夹 2. 找到 `custom_nodes` 文件夹(没有就新建一个) 3. 在终端或命令提示符中输入: ```bash git clone https://github.com/civen-cn/ComfyUI-Whisper-Translator ``` ### 需要的额外东西: ```bash pip install -r requirements.txt ``` ## 3. 节点详解 ### 3.1 音频加载节点 (LoadAudioFile) 这个节点就像是一个音乐播放器的"打开文件"按钮,帮你把音频文件装载进来。 参数表: | 参数名(界面显示) | 参数名(代码) | 参数类型 | 建议值 | 通俗解释 | 专业解释 | 使用举例 | |-----------------|-------------|----------|--------|----------|----------|----------| | 音频文件路径 | file_path | 文本输入 | - | 你要处理的音频文件在电脑里的位置 | 音频文件的绝对或相对路径 | "C:/音乐/demo.mp3" | ### 3.2 语音转文字节点 (WhisperModel) 就像一个超厉害的听写员,能把听到的声音变成文字。 参数表: | 参数名(界面显示) | 参数名(代码) | 参数类型 | 建议值 | 通俗解释 | 专业解释 | 使用举例 | |-----------------|-------------|----------|--------|----------|----------|----------| | 模型大小 | model_size | 选项 | "base" | 选择识别的精确程度 | Whisper模型的规格 | 普通用"base"就够了 | | 设备 | device | 选项 | "cuda" | 用什么配件来处理 | 计算设备选择 | 有显卡选"cuda",没有就"cpu" | | 语言 | language | 文本 | "en" | 音频使用的语言 | 输入音频的语言代码 | 英语用"en",中文用"zh" | ### 3.3 翻译节点 (TextTranslator) 像个翻译官,可以把一种语言转成另一种语言。 参数表: | 参数名(界面显示) | 参数名(代码) | 参数类型 | 建议值 | 通俗解释 | 专业解释 | 使用举例 | |-----------------|-------------|----------|--------|----------|----------|----------| | 目标语言 | target_language | 文本 | "zh" | 想翻译成什么语言 | 目标语言代码 | 想翻译成中文就填"zh" | ## 4. 使用技巧和建议 1. 音频小贴士: - 尽量用清晰的音频 - 文件最好不要太大 - 支持常见格式:MP3、WAV、M4A 等 2. 识别效果提升: - 选择合适的语言设置 - 噪音少的音频效果更好 - 说话清晰的音频识别更准 3. 翻译建议: - 短句子翻译效果更好 - 专业术语可能需要人工校对 ## 5. 常见问题解答 Q: 为什么我的音频加载不了? A: 检查一下文件路径是否正确,文件格式是否支持。 Q: 识别很慢怎么办? A: 试试换小一点的模型,或者确认是否在用显卡运行。 Q: 翻译结果很奇怪? A: 这是正常的,机器翻译还不够完美,复杂的句子可能需要人工调整。 ## 6. 补充说明 1. 所有操作都是自动的,不需要额外设置 2. 插件会自动下载需要的模型文件 3. 第一次运行可能会比较慢,因为要下载模型 4. 建议配合其他 ComfyUI 节点使用,发挥更大作用 记住:这个插件就像是给你的 ComfyUI 加了个会听会说的小助手,用起来很简单,不要被那些专业术语吓到啦!
ComfyUI图像合并插件comfyui-merge使用教程 2025-07-03 22:44 ComfyUI 图像合并插件教程 (comfyui-merge) 1. 插件简介 这是一个专门用来合并图片的 ComfyUI 插件,就像用 PS 把多张图片叠在一起那样。它的特别之处在于你精确控制每张图片的混合方式。 GitHub 地址:https://github.com/LingSss9/com