# ComfyUI-ZonosTTS 插件保姆级教程 - 让你的 AI 开口说话 ## 1. 插件简介 ComfyUI-ZonosTTS 是一个能让你在 ComfyUI 中实现文字转语音功能的神奇工具。就像是给你的 AI 加上了一个会说话的嘴巴,可以把你写的文字变成自然的语音。 GitHub 地址:https://github.com/BahaC/ComfyUI-ZonosTTS ## 2. 安装方法 就像安装手机 APP 一样简单,按照下面的步骤操作: 1. 打开你的 ComfyUI 文件夹 2. 找到 `custom_nodes` 文件夹(就像手机里的应用文件夹) 3. 在这里输入下面的指令(就像复制粘贴一样): ```bash git clone https://github.com/BahaC/ComfyUI-ZonosTTS ``` 4. 安装需要的配件(就像给手机装配件一样): ```bash pip install TTS ``` ## 3. 节点详解 ### 3.1 ZonosTTS_LoadModel 节点 这个节点就像是打开录音设备的开关,在使用语音功能前必须先用它。 #### 参数详解: | 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 使用建议 | |----------------|----------------|--------|--------|----------|----------|----------| | Model Name | model_name | 字符串 | "tts_models/multilingual/multi-dataset/xtts_v2" | 选择说话的声音类型 | TTS模型选择 | 建议使用默认值,效果最自然 | ### 3.2 ZonosTTS_TextToSpeech 节点 这个节点就像是一个魔法变声器,把文字变成声音。 #### 参数详解: | 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 使用建议 | |----------------|----------------|--------|--------|----------|----------|----------| | Text | text | 字符串 | "Hello World" | 想要转换成语音的文字 | 输入文本 | 可以输入任何语言的文字 | | Language | language | 选项 | "en" | 说话的语言 | 语言代码 | 根据文字内容选择对应语言 | | Sample Rate | sample_rate | 数字 | 44100 | 声音的清晰度 | 采样率 | 一般用默认值就好 | | Save File | save_file | 布尔值 | true | 是否保存声音文件 | 音频保存选项 | 建议开启以便重复使用 | ### 3.3 ZonosTTS_PlayAudio 节点 就像是按下播放键一样,让声音响起来。 #### 参数详解: | 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 使用建议 | |----------------|----------------|--------|--------|----------|----------|----------| | Audio | audio | 音频数据 | - | 要播放的声音 | 音频数据 | 直接连接 TextToSpeech 节点的输出 | ## 4. 使用技巧和建议 - 像调音量一样,可以通过调整采样率来改变声音质量 - 第一次使用时可能需要下载模型,要耐心等待一下 - 建议先用短句子测试,确认效果后再试长文本 - 保存的音频文件会在 ComfyUI 的输出文件夹里 ## 5. 常见问题解答 Q: 为什么没有声音输出? A: 检查你的电脑声音是否开启,以及播放设备是否正确。 Q: 语音听起来不自然怎么办? A: 试试换个语言设置,或者调整文本的标点符号。 Q: 生成速度很慢怎么办? A: 这是正常的,就像烤面包需要时间一样,转换语音也需要一点时间。 ## 6. 额外小贴士 - 可以把这个插件和其他 ComfyUI 功能组合使用 - 适合用来制作配音、语音提示等 - 支持多种语言,可以实现多语言配音需求 记住:使用这个插件就像是给你的作品加上了声音,让它们更生动有趣!
ComfyUI图像合并插件comfyui-merge使用教程 2025-07-03 22:44 ComfyUI 图像合并插件教程 (comfyui-merge) 1. 插件简介 这是一个专门用来合并图片的 ComfyUI 插件,就像用 PS 把多张图片叠在一起那样。它的特别之处在于你精确控制每张图片的混合方式。 GitHub 地址:https://github.com/LingSss9/com