ComfyUI Gemini TTS 插件教程 - 让你的 AI 作品会说话!
1. 插件简介
这是一个能让你的 AI 作品"开口说话"的神奇插件!它利用谷歌的 Gemini 务,可以把文字变成自然的语音。就像给你的作品配上了专业配音一样!
GitHub 地址:https://github.com/ShmuelRonen/ComfyUI-Gemini_TTS
2. 安装方法
就像安装其他 ComfyUI 插件一样简单:
1. 打开你的 ComfyUI 文件夹
2. 进入 custom_nodes 文件夹
3. 在终端/命令提示符中输入:
git clone https://github.com/ShmuelRonen/ComfyUI-Gemini_TTS
3. 节点详解
3.1 Gemini_TTS 节点
这是插件的主要节点,就像一个神奇的变声器,可以把你写的文字变成好听的语音!
参数详解
| 参数名(显示) | 参数名(代码) | 参数值类型 | 建议值 | 通俗解释 | 专业解释 | 使用举例 |
|---|---|---|---|---|---|---|
| Text | text | 字符串 | "Hello World" | 你想要转换成语音的文字 | 需要转换为语音的输入文本 | 输入"你好,世界" |
| Language Code | language_code | 字符串 | "en-US" | 语音的语言和口音 | 语言地区代码 | "zh-CN"代表中文 |
| Voice Name | voice_name | 字符串 | "en-US-Standard-A" | 选择说话的声音 | 语音模型标识符 | 可以选择不同的声音类型 |
| Speaking Rate | speaking_rate | 数字 | 1.0 | 说话的速度快慢 | 语速倍率 | 1.0是正常速度,2.0是两倍速 |
| Pitch | pitch | 数字 | 0.0 | 声音的高低 | 音高调节 | 0是正常音调,正数升调,负数降调 |
| Volume Gain DB | volume_gain_db | 数字 | 0.0 | 声音的大小 | 音量增益分贝值 | 0是正常音量,正数更大,负数更小 |
4. 使用技巧和建议
- 开始时建议用默认设置,慢慢调整找到最合适的参数
- 中文使用推荐设置 language_code 为 "zh-CN"
- 如果觉得语速太快或太慢,可以通过 Speaking Rate 来调整
- 想要语音更有趣可以试试调整 Pitch,但不要调太极端
5. 常见问题解答
Q: 为什么我的语音听起来很机械? A: 试试调整 Speaking Rate 和 Pitch,让语音更自然。Speaking Rate 建议在 0.8-1.2 之间。
Q: 可以同时使用多种语言吗? A: 可以!但需要分别设置不同的 Language Code。
Q: 声音太小听不清怎么办? A: 调高 Volume Gain DB,建议从 3.0 开始试。
6. 补充说明
- 这个插件需要联网才能使用
- 建议准备好文本再生成语音,避免重复操作
- 可以把生成的语音保存下来重复使用
记住:玩转这个插件的关键是多尝试不同的参数组合。就像调音响一样,找到最适合你的声音!