ComfyUI 魔法书 Logo
🏠 首页
👥 加群
😎 大帅比
❤️‍🔥 Monster 社区
登录 →
ComfyUI 魔法书 Logo
🏠 首页 👥 加群 😎 大帅比 ❤️‍🔥 Monster 社区
登录
  1. 首页
  2. 🧩 插件工坊 (Plugin Workshop)
  3. ComfyUI插件DJZ-KokoroTTS语音合成详细使用教程

ComfyUI插件DJZ-KokoroTTS语音合成详细使用教程

0
  • 🧩 插件工坊 (Plugin Workshop)
  • 发布于 2025-07-03
  • 16 次阅读
编程界的小学生
编程界的小学生
# DJZ-KokoroTTS ComfyUI 插件保姆级教程 ## 1. 插件简介 DJZ-KokoroTTS 是一个为 ComfyUI 设计的文字转语音插件,它使用了 KokoroTTS 技术来把文字变成语音。简单来说,就像是给你的 ComfyUI 添加了一个"朗读员",你输入文字,它就能给你读出来。 **插件地址:** https://github.com/MushroomFleet/DJZ-KokoroTTS **能带来什么效果:** - 把你写的文字变成真人一样的语音 - 可以调整语音的速度、音调等 - 支持多种声音类型 - 可以混合不同的声音创造独特效果 ## 2. 如何安装 ### 方法一:手动安装 1. 打开你的 ComfyUI 安装文件夹 2. 找到 `custom_nodes` 文件夹 3. 把整个 DJZ-KokoroTTS 文件夹复制到 custom_nodes 文件夹里 ### 方法二:Windows 便携版自动安装 1. 双击运行 install-portable.bat 文件 2. 等待安装完成 3. 重启 ComfyUI ### 必需文件下载 你需要下载模型文件并放到 /comfyui/models/kokoro/ 文件夹中。这就像给朗读员准备"嗓子"一样: - 下载地址:https://github.com/taylorchu/kokoro-onnx/releases/download/v0.2.0/kokoro.onnx - 放置位置:`ComfyUI/models/kokoro/kokoro.onnx` ## 3. 节点逐一解析 ### 3.1 KokoroTTS_v2 节点(基础版朗读员) 这个节点就像是一个基础版的朗读员,它使用加权求和的方式来混合不同的声音。 #### 3.2 参数详解 | 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 | | :--- | :--- | :--- | :--- | :--- | :--- | :--- | | 文本输入 | text | 文本字符串 | 任意文本 | 这是你想要朗读的文字,就像给朗读员看的稿子 | 待转换的文本内容 | 输入"你好世界",朗读员就会读出"你好世界" | | 语音类型 | voice | 声音选项 | 默认声音 | 选择朗读员的声音类型,就像选择男声女声一样 | 声音模型配置 | 选择"女声"会用女性声音朗读 | | 语速 | speed | 数值 | 1.0 | 控制朗读的快慢,就像调节播放速度 | 语音合成速度倍率 | 设置0.5读得慢,设置2.0读得快 | | 音调 | pitch | 数值 | 1.0 | 控制声音的高低,就像调节音调高低 | 基础频率调节 | 设置1.5声音更尖,设置0.5声音更低沉 | | 输出方式 | output_method | 选择项 | 直接播放 | 选择是直接播放还是保存成文件 | 音频输出处理方式 | 选择"保存文件"会在指定位置生成音频文件 | ### 3.3 KokoroTTS_v3 节点(高级版朗读员) 这个节点是升级版的朗读员,它使用球面插值的方式来混合声音,效果更好。 #### 3.4 参数详解 | 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 | | :--- | :--- | :--- | :--- | :--- | :--- | :--- | | 文本输入 | text | 文本字符串 | 任意文本 | 这是你想要朗读的文字,和v2一样 | 待转换的文本内容 | 输入"今天天气真好",朗读员会读出来 | | 主要声音 | primary_voice | 声音选项 | 默认声音 | 选择主要的声音类型,就像选择主唱 | 主要声音模型 | 选择"成熟女声"作为主要声音 | | 次要声音 | secondary_voice | 声音选项 | 无 | 选择次要的声音类型,就像选择和音 | 辅助声音模型 | 选择"温柔男声"作为混合声音 | | 混合比例 | blend_ratio | 0.0-1.0 | 0.5 | 控制两种声音的混合比例,就像调节音量平衡 | 声音混合权重 | 设置0.3主要声音占70%,次要声音占30% | | 混合方式 | blend_method | 选择项 | 球面插值 | 选择声音混合的方法,球面插值效果更自然 | 声音融合算法 | 选择"球面插值"让声音混合更自然 | | 语速 | speed | 数值 | 1.0 | 控制朗读的快慢,和v2一样 | 语音合成速度倍率 | 设置0.8读得稍慢一些 | | 音调 | pitch | 数值 | 1.0 | 控制声音的高低,和v2一样 | 基础频率调节 | 设置1.2让声音稍微高一点 | | 输出格式 | output_format | 选择项 | WAV | 选择输出的音频格式,就像选择照片格式 | 音频文件格式 | 选择"MP3"生成更小的文件 | | 采样率 | sample_rate | 数值 | 22050 | 控制音频质量,就像调节图片清晰度 | 音频采样频率 | 设置44100获得更高质量 | | 输出路径 | output_path | 路径 | 默认路径 | 设置音频文件保存的位置 | 文件保存目录 | 设置"D:/语音文件/"保存到D盘 | ## 4. 使用技巧和建议 ### 4.1 声音混合技巧 - 如果想要温柔的声音:主要声音选女声,次要声音选温柔男声,混合比例设置0.3 - 如果想要有力的声音:主要声音选男声,次要声音选女声,混合比例设置0.7 - 新手建议先用 v2 版本,熟练后再试 v3 版本 ### 4.2 参数调节建议 - 语速建议范围:0.5-2.0,超出这个范围可能听起来很奇怪 - 音调建议范围:0.7-1.3,调节太大会失真 - 如果生成的语音有杂音,试试降低采样率 ### 4.3 文本处理建议 - 长文本建议分段处理,每段不超过200字 - 标点符号会影响语音的停顿,合理使用 - 英文和中文混合时,建议分开处理 ## 5. 常见问题解答 ### Q1:为什么我的节点不显示? **A1:** 检查以下几点: - 是否正确安装了插件 - 是否下载了必需的模型文件 - 是否重启了 ComfyUI ### Q2:为什么生成的语音没有声音? **A2:** 可能的原因: - 模型文件路径不正确 - 输出路径没有权限 - 文本内容为空或包含特殊字符 ### Q3:语音听起来很机械怎么办? **A3:** 尝试以下方法: - 使用 v3 版本的球面插值混合 - 适当调节语速和音调 - 混合不同的声音类型 ### Q4:如何提高语音质量? **A4:** 建议: - 提高采样率到 44100 - 使用 WAV 格式输出 - 确保文本语法正确 ## 6. 高级用法示例 ### 6.1 制作有感情的朗读 1. 使用 v3 版本 2. 主要声音选择"温柔女声" 3. 次要声音选择"磁性男声" 4. 混合比例设置 0.6 5. 语速设置 0.9 6. 音调设置 1.1 ### 6.2 制作播客风格的语音 1. 使用 v3 版本 2. 主要声音选择"成熟男声" 3. 语速设置 1.1 4. 音调设置 0.9 5. 输出格式选择 MP3 ### 6.3 批量制作语音内容 1. 准备多个文本节点 2. 连接到多个 KokoroTTS 节点 3. 设置不同的输出路径 4. 一次性生成多个语音文件 ## 7. 结语 DJZ-KokoroTTS 插件是一个功能强大的文字转语音工具,通过合理的参数设置和声音混合,可以创造出非常自然的语音效果。建议新手从基础功能开始,逐步探索高级特性。 记住:多试多练,每个人的喜好不同,找到最适合自己需求的参数组合是关键!
标签: #插件 2338
相关文章

ComfyUI错误修复插件详解:轻松解决常见问题 2025-07-10 18:25

ComfyUI-CustomMenu插件使用教程:高效自定义工作流指南 2025-07-10 17:50

ComfyUI图像合并插件comfyui-merge使用教程 2025-07-03 22:44

ComfyUI 图像合并插件教程 (comfyui-merge) 1. 插件简介 这是一个专门用来合并图片的 ComfyUI 插件,就像用 PS 把多张图片叠在一起那样。它的特别之处在于你精确控制每张图片的混合方式。 GitHub 地址:https://github.com/LingSss9/com

ComfyUI WAN 2.2视频插件教程:万相AI提示词全攻略 2025-07-31 11:47

ComfyUI WAN 2.2视频插件教程:万相AI提示词实战指南 2025-07-29 20:10

ComfyUI HeyGem数字人插件教程:零基础快速精通指南 2025-07-22 14:10

目录

从节点基础到高阶工作流,我们为你绘制最清晰的 ComfyUI 学习路径。告别困惑,让每一次连接都充满创造的魔力,轻松驾驭 AI 艺术的无限可能。

  • 微信
  • B站
  • GitHub
Copyright © 2025 AIX All Rights Reserved. Powered by AIX.
隐私政策
津ICP备2024019312号