# ComfyUITDT 插件保姆级教程 ## 简介 Parakeet-TDT 是一个让你在 ComfyUI 里能玩转文本转语音(就是把写好的文字变成说话声音)的神奇工具箱。项目地址:https://github.com/billwuhao/ComfyUI_parakeet-tdt 这个插件就像是一个智能配音员,可以: - 把你写的文字变成自然的语音 - 让你调整声音的各种特点,比如说话的快慢、语气等 - 支持中文和英文的配音 ## 2. 安装方法 就像安装其他 ComfyUI 插件一样,有这么几步: 1. 找到你的 ComfyUI 安装文件夹 2. 打开 `custom_nodes` 文件夹 3. 在终端或命令提示符中输入: ```bash git clone https://github.com/billwuhao/ComfyUI_parakeet-tdt cd ComfyUI_parakeet-tdt pip install -r requirements.txt ``` ## 3. 节点详解 ### 3.1 TTS 文本转语音节点 这就像是一个超级语音转换器,把你输入的文字变成语音。 #### 参数详解: | 参数名(显示) | 参数名(代码) | 参数值类型 | 建议值 | 通俗解释 | 专业解释 | 使用举例 | |-------------|-------------|-----------|--------|----------|----------|----------| | 输入文本 | text | 字符串 | "你好世界" | 你想要电脑说的话 | 待转换的文本输入 | 输入"今天天气真好",就会读出这句话 | | 说话速度 | speed | 数字 | 1.0 | 说话快慢的程度 | 语音播放速率 | 1.0是正常速度,0.5就是慢一半,2.0就是快一倍 | | 音调 | pitch | 数字 | 1.0 | 声音的高低 | 音高调节参数 | 1.0是正常音调,小于1变低沉,大于1变尖细 | ### 3.2 语音模型加载节点 这个就像是给机器人装上不同的声音包。 #### 参数详解: | 参数名(显示) | 参数名(代码) | 参数值类型 | 建议值 | 通俗解释 | 专业解释 | 使用举例 | |-------------|-------------|-----------|--------|----------|----------|----------| | 模型选择 | model_name | 选项列表 | "中文女声" | 选择说话的声音类型 | TTS模型选择 | 想要女声就选"中文女声",想要男声就选"中文男声" | | 设备 | device | 选项列表 | "cuda" | 用什么来处理声音 | 运算设备选择 | 有显卡就选"cuda",没有就用"cpu" | ## 4. 使用技巧和建议 - 文字不要太长,建议一次不超过100字 - 中文和英文最好分开处理 - 调整速度和音调时,建议小幅度改动,避免声音失真 - 生成语音前先用小段文字测试 ## 5. 常见问题解答 Q: 为什么生成的声音听起来不自然? A: 试试调整说话速度接近1.0,音调也保持在1.0附近。 Q: 英文发音不准怎么办? A: 可以在英文单词之间加一些空格,让机器有更多时间处理。 Q: 生成速度很慢怎么办? A: 检查一下是不是选对了设备,有显卡的话记得选"cuda"。 ## 6. 额外小贴士 - 这个插件特别适合做视频配音、有声小说制作 - 可以把生成的语音保存下来重复使用 - 不同的声音模型有不同的特点,可以多试试找到最适合的 记住:就像学习任何新东西一样,从简单的开始,慢慢调整,直到找到最适合你的设置!
ComfyUI图像合并插件comfyui-merge使用教程 2025-07-03 22:44 ComfyUI 图像合并插件教程 (comfyui-merge) 1. 插件简介 这是一个专门用来合并图片的 ComfyUI 插件,就像用 PS 把多张图片叠在一起那样。它的特别之处在于你精确控制每张图片的混合方式。 GitHub 地址:https://github.com/LingSss9/com