SenseVoice-ComfyUI 插件保姆级教程
1. 插件简介
SenseVoice-ComfyUI 是一个能让你在 ComfyUI 里直接使用语音相关功能的小帮手。它就像是给 ComfyUI 装了一个会说话的小喇叭,可以把文字变成语音,让你的创作更生动有趣。
GitHub 地址:https://github.com/AIFSH/SenseVoice-ComfyUI
2. 安装方法
就像安装其他 ComfyUI 插件一样简单,只需要三步:
1. 打开你的 ComfyUI 文件夹
2. 进入 custom_nodes 文件夹(如果没有就新建一个)
3. 在这里运行以下命令:
git clone https://github.com/AIFSH/SenseVoice-ComfyUI
3. 节点详解
3.1 SensVoiceTTS 节点
这是一个能把文字变成语音的魔法盒子,就像是给文字注入了灵魂,让它们能开口说话。
参数详解:
| 参数名(UI显示) | 参数名(代码) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 使用举例 |
|---|---|---|---|---|---|---|
| Text | text | 字符串 | "你好世界" | 想要转换成语音的文字 | 需要转换为语音的输入文本 | 输入"今天天气真好"就会生成这句话的语音 |
| Speaker ID | speaker_id | 0-1000 | 0 | 说话人的声音类型 | 用于选择不同说话人音色的ID | 设置为0是默认音色,换成其他数字会有不同的声音效果 |
| Language | language | "ZH"/"EN" | "ZH" | 语言选择 | 文本语言类型选择 | 中文选"ZH",英文选"EN" |
| Length Scale | length_scale | 0.1-2.0 | 1.0 | 语速调节 | 语音长度缩放因子 | 1.0是正常语速,小于1变快,大于1变慢 |
| Noise Scale | noise_scale | 0.1-2.0 | 0.6 | 声音自然度 | 噪声缩放参数 | 0.6比较自然,越大声音越有变化 |
| Noise Scale W | noise_w | 0.1-2.0 | 0.8 | 音色多样性 | 噪声宽度参数 | 0.8是比较好的平衡点 |
3.2 SensVoiceOutput 节点
这个节点就像是一个音乐播放器,负责把生成的语音保存成文件或者直接播放出来。
参数详解:
| 参数名(UI显示) | 参数名(代码) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 使用举例 |
|---|---|---|---|---|---|---|
| Filename | filename | 字符串 | "output" | 保存的文件名 | 输出音频文件名称 | 输入"my_voice"就会保存为"my_voice.wav" |
| Output Path | output_path | 字符串 | "output" | 保存的文件夹 | 输出目录路径 | 默认保存在"output"文件夹 |
4. 使用技巧和建议
- 开始时用默认参数试试水,等熟悉了再调整
- 语速调节要适中,太快太慢都不自然
- 多试几个 Speaker ID,找到最适合的声音
- 保存文件时用有意义的名字,方便管理
5. 常见问题解答
Q: 为什么生成的语音听起来不自然? A: 试着调整 noise_scale 和 noise_w 参数,一般建议 noise_scale 设为 0.6,noise_w 设为 0.8
Q: 语音生成太慢怎么办? A: 这个跟电脑配置有关,建议使用较短的文本先测试
Q: 支持哪些语言? A: 目前主要支持中文(ZH)和英文(EN)
6. 补充说明
- 插件会自动下载需要的语音模型
- 生成的语音文件默认是 wav 格式
- 建议定期备份重要的语音文件
希望这份教程能帮助你轻松上手 SenseVoice-ComfyUI 插件!如果还有问题,随时在评论区提出来哦~