ComfyUI 魔法书 Logo
🏠 首页
👥 加群
😎 大帅比
❤️‍🔥 Monster 社区
登录 →
ComfyUI 魔法书 Logo
🏠 首页 👥 加群 😎 大帅比 ❤️‍🔥 Monster 社区
登录
  1. 首页
  2. 🧩 插件工坊 (Plugin Workshop)
  3. ComfyUI语音插件Geeky Kokoro TTS使用教程

ComfyUI语音插件Geeky Kokoro TTS使用教程

0
  • 🧩 插件工坊 (Plugin Workshop)
  • 发布于 2025-07-03
  • 16 次阅读
编程界的小学生
编程界的小学生
# ComfyUI-Geeky-Kokoro-TTS 插件完全入门指南 ## 1. 插件简介 **插件地址:** https://github.com/GeekyGhost/ComfyUI-Geeky-Kokoro-TTS 这个插件就像是给你的 ComfyUI 安装了一个「会说话的嘴巴」。它能把你写的文字变成各种不同声音的语音,就像手机里的语音助手一样。不仅如此,它还能给声音加各种特效,比如让声音听起来像机器人、怪物、小孩子,或者加上回声效果等等。 **插件的神奇之处:** - 支持 27 种以上不同的声音(有男有女、有美式英语有英式英语) - 可以把两种不同的声音混合在一起,创造出独特的声音 - 可以调节说话速度(慢慢说或者快快说) - 支持各种声音特效(回声、混响、机器人声等) - 可以用电脑显卡加速,处理速度更快 ## 2. 如何安装 ### 方法一:ComfyUI 管理器安装(推荐) 1. 打开 ComfyUI,找到菜单栏的「Manager」(管理器) 2. 点击「Install Custom Nodes」(安装自定义节点) 3. 在搜索框输入「Geeky Kokoro TTS」 4. 点击「Install」(安装) 5. 安装完成后重启 ComfyUI ### 方法二:手动安装 1. 找到你的 ComfyUI 文件夹,进入 `custom_nodes` 文件夹 2. 在这里下载插件文件 3. 安装必要的依赖包(这一步可能需要一些技术知识) 4. 重启 ComfyUI ## 3. 节点详细解析 这个插件包含两个主要节点: ### 3.1 文字转语音节点(GeekyKokoroTTS) 这个节点就像一个「朗读器」,把你输入的文字读出来。 #### 3.2 参数详解 | 参数名 (界面显示) | 参数名 (代码中) | 参数值范围 | 建议值 | 通俗解释 | 专业解释 | 使用举例 | | :--- | :--- | :--- | :--- | :--- | :--- | :--- | | 文本 | text | 多行文本 | 任意文本 | 你想要转换成语音的文字内容,就像在便条上写字一样 | 输入待转换的文本内容,支持换行和标点符号 | 输入「你好,欢迎使用语音合成功能」 | | 声音 | voice | 27+ 种选择 | Heart ❤️ | 选择谁来读这段文字,就像选择不同的播音员 | 选择语音合成使用的声音模型,包含美式和英式英语 | 选择「🇺🇸 🚺 Heart ❤️」来获得温暖的女声 | | 语速 | speed | 0.5-2.0 | 1.0 | 说话的快慢程度,1.0 是正常速度,像日常聊天一样 | 控制语音播放的速度倍率,1.0为原始速度 | 设置 0.8 让声音慢一点,更清晰 | | 使用显卡加速 | use_gpu | 开启/关闭 | 开启 | 用显卡来处理,就像用跑车代替自行车,速度更快 | 启用GPU加速计算,提高处理速度 | 处理长文本时建议开启 | | 启用声音混合 | enable_blending | 开启/关闭 | 关闭 | 是否要把两种不同的声音混合在一起 | 启用双声音混合功能 | 想要独特声音时开启 | | 第二个声音 | second_voice | 27+ 种选择 | Sarah | 混合时使用的第二种声音 | 声音混合时的辅助声音源 | 选择「🇺🇸 🚺 Sarah」与主声音混合 | | 混合比例 | blend_ratio | 0.0-1.0 | 0.5 | 两种声音的混合程度,0.5 表示各占一半 | 主声音与辅助声音的混合权重 | 设置 0.7 表示主声音占 70%,辅助声音占 30% | ### 3.3 语音特效节点(GeekyKokoroVoiceMod) 这个节点就像一个「变声器」,可以给声音加上各种特效。 #### 3.4 参数详解 | 参数名 (界面显示) | 参数名 (代码中) | 参数值范围 | 建议值 | 通俗解释 | 专业解释 | 使用举例 | | :--- | :--- | :--- | :--- | :--- | :--- | :--- | | 音频输入 | audio | 音频数据 | 来自 TTS 节点 | 需要加特效的原始声音,就像原材料 | 输入的音频信号数据 | 连接文字转语音节点的输出 | | 特效混合程度 | effect_blend | 0.0-1.0 | 1.0 | 特效的强弱程度,0 表示没有特效,1 表示特效最强 | 原始音频与处理后音频的混合比例 | 设置 0.5 让特效不那么明显 | | 输出音量 | output_volume | -60.0-60.0 | 0.0 | 最终声音的大小声,就像调节音响音量 | 输出音频的音量调节(分贝) | 设置 -6.0 让声音小一点 | | 声音风格 | voice_profile | 7 种选择 | None | 预设的声音风格,就像美颜滤镜一样 | 预定义的声音处理配置文件 | 选择「Robot」让声音像机器人 | | 风格强度 | profile_intensity | 0.0-1.0 | 0.7 | 选择的风格效果有多强 | 声音风格的应用强度 | 设置 0.4 让机器人效果淡一点 | | 手动模式 | manual_mode | 开启/关闭 | 关闭 | 是否要自己调节每个特效参数 | 启用手动参数控制模式 | 想要精确控制时开启 | | 音调调节 | pitch_shift | -12.0-12.0 | 0.0 | 声音的高低变化,正数变高,负数变低 | 音调偏移(半音为单位) | 设置 2.0 让声音变高一点 | | 声道调节 | formant_shift | -5.0-5.0 | 0.0 | 改变声音的「厚度」,正数变细,负数变厚 | 共振峰频率偏移 | 设置 -1.0 让声音更厚重 | | 回声强度 | reverb_amount | 0.0-1.0 | 0.0 | 像在大房间里说话的回声效果 | 混响效果的强度 | 设置 0.3 增加空间感 | | 延迟回声 | echo_delay | 0.0-1.0 | 0.0 | 像在山谷里喊话的回声效果 | 延迟回声的强度 | 设置 0.2 增加回声效果 | | 失真度 | distortion | 0.0-1.0 | 0.0 | 让声音变得粗糙,像老旧收音机 | 谐波失真的程度 | 设置 0.1 让声音略显粗糙 | | 压缩强度 | compression | 0.0-1.0 | 0.0 | 让声音的大小声更均匀 | 动态范围压缩强度 | 设置 0.4 让声音更稳定 | | 低音调节 | eq_bass | -1.0-1.0 | 0.0 | 调节声音的低音部分 | 低频段均衡器调节 | 设置 0.3 增加低音效果 | | 中音调节 | eq_mid | -1.0-1.0 | 0.0 | 调节声音的中音部分(人声主要部分) | 中频段均衡器调节 | 设置 0.2 让人声更突出 | | 高音调节 | eq_treble | -1.0-1.0 | 0.0 | 调节声音的高音部分 | 高频段均衡器调节 | 设置 -0.1 减少刺耳感 | | 使用显卡加速 | use_gpu | 开启/关闭 | 关闭 | 是否用显卡来处理特效 | 启用GPU加速特效处理 | 处理复杂特效时可以开启 | ## 4. 使用技巧和建议 ### 4.1 声音选择建议 **美式英语女声:** - Heart ❤️:温暖亲切,适合讲故事 - Bella 🔥:活泼有力,适合广告配音 - Nicole 🎧:清晰标准,适合教学内容 **美式英语男声:** - Michael:深沉权威,适合正式场合 - Puck:轻松幽默,适合娱乐内容 - Echo:富有磁性,适合艺术类内容 **英式英语:** - Emma:优雅知性,适合正式文档 - George:专业严肃,适合商务内容 ### 4.2 特效组合建议 **机器人声音:** - 声音风格:Robot - 风格强度:0.6 - 失真度:0.2 **小孩声音:** - 声音风格:Child - 风格强度:0.4 - 音调调节:+2.0 **怪物声音:** - 声音风格:Monster - 风格强度:0.5 - 音调调节:-3.0 **广播主持人声音:** - 压缩强度:0.7 - 中音调节:0.3 - 低音调节:0.2 ### 4.3 文本处理技巧 1. **使用标点符号:** 句号、逗号、问号会产生自然的停顿 2. **分段处理:** 长文本分成短段落,效果更好 3. **避免特殊符号:** 尽量不要使用奇怪的符号 4. **控制长度:** 每次处理的文字不要超过 1000 字 ## 5. 常见问题解答 ### Q1:为什么声音听起来很机械? **答:** 可能是特效参数设置过强,试试把「风格强度」调低到 0.3-0.5。 ### Q2:处理速度很慢怎么办? **答:** 短文本建议关闭显卡加速,长文本建议开启显卡加速。 ### Q3:声音太小/太大怎么调? **答:** 调节「输出音量」参数,-6.0 表示变小,+6.0 表示变大。 ### Q4:两种声音混合效果不好? **答:** 建议选择同一种语言的声音(都是美式或都是英式),混合比例从 0.7 开始尝试。 ### Q5:特效听起来很奇怪? **答:** 所有特效都从小数值开始(0.1-0.3),逐渐增加到合适的效果。 ## 6. 实际应用案例 ### 案例 1:制作故事配音 1. 使用 Heart ❤️ 声音 2. 语速设置为 0.9(稍慢一点) 3. 添加轻微回声效果(0.2) 4. 输出音量调节到 -3.0 ### 案例 2:制作机器人配音 1. 使用任意男声 2. 声音风格选择 Robot 3. 风格强度设置为 0.6 4. 添加轻微失真效果(0.1) ### 案例 3:制作专业播报 1. 使用 Michael 或 George 声音 2. 压缩强度设置为 0.5 3. 中音调节设置为 0.3 4. 保持其他参数默认 ## 7. 进阶技巧 ### 7.1 多声音叙事 可以为不同角色使用不同的声音设置,然后用音频编辑软件合并,创造出多角色对话效果。 ### 7.2 情感表达 通过调节语速和音调来表达不同情感: - 开心:语速 1.1,音调 +0.5 - 悲伤:语速 0.8,音调 -0.5 - 紧张:语速 1.3,轻微失真 0.05 ### 7.3 环境音效 结合回声和混响参数来模拟不同环境: - 室内:回声 0.1,混响 0.2 - 户外:回声 0.3,混响 0.1 - 洞穴:回声 0.5,混响 0.6 记住,最好的参数组合需要通过实际试验来找到,每个人的需求和喜好都不同。建议从基础设置开始,逐步调整到满意的效果!
标签: #插件 2338
相关文章

ComfyUI错误修复插件详解:轻松解决常见问题 2025-07-10 18:25

ComfyUI-CustomMenu插件使用教程:高效自定义工作流指南 2025-07-10 17:50

ComfyUI图像合并插件comfyui-merge使用教程 2025-07-03 22:44

ComfyUI 图像合并插件教程 (comfyui-merge) 1. 插件简介 这是一个专门用来合并图片的 ComfyUI 插件,就像用 PS 把多张图片叠在一起那样。它的特别之处在于你精确控制每张图片的混合方式。 GitHub 地址:https://github.com/LingSss9/com

ComfyUI WAN 2.2视频插件教程:万相AI提示词全攻略 2025-07-31 11:47

ComfyUI WAN 2.2视频插件教程:万相AI提示词实战指南 2025-07-29 20:10

ComfyUI HeyGem数字人插件教程:零基础快速精通指南 2025-07-22 14:10

目录

从节点基础到高阶工作流,我们为你绘制最清晰的 ComfyUI 学习路径。告别困惑,让每一次连接都充满创造的魔力,轻松驾驭 AI 艺术的无限可能。

  • 微信
  • B站
  • GitHub
Copyright © 2025 AIX All Rights Reserved. Powered by AIX.
隐私政策
津ICP备2024019312号