ComfyUI-Audio_Quality_Enhancer 插件完全新手指南
1. 插件简介
ComfyUI-Audio_Quality_Enhancer 是一个专门为 ComfyUI 设计的音频处理增强插件,就像给你的音频加上了一个专业的音响师。这个插件能让你的音频听起来更清晰、更有质感,就像把普通的耳机升级成了专业监听设备。
插件原地址: https://github.com/ShmuelRonen/ComfyUI-Audio_Quality_Enhancer
这个插件能给你带来什么效果?
- 让说话声音更清晰,就像电台主播一样
- 调整音调,让声音变高变低,像变声器一样
- 加回音效果,就像在大教堂里说话
- 分离人声和背景音乐,就像KTV的原唱伴唱切换
- 让音频整体听起来更专业,就像录音室制作的一样
2. 如何安装
就像在手机上安装app一样,这个插件也需要几个步骤:
第一步:下载插件文件
cd ComfyUI/custom_nodes
git clone https://github.com/ShmuelRonen/ComfyUI-Audio-Quality-Enhancer.git
cd ComfyUI-Audio-Quality-Enhancer
pip install -r requirements.txt
第二步:安装音频处理工具(SoX)
- Windows用户:从官方网站下载SoX安装包,就像安装QQ一样简单
- Mac用户:用brew install sox命令安装
- Linux用户:用sudo apt-get install sox命令安装
第三步:安装可选功能包(如果你想要最强效果)
pip install demucs pedalboard
安装完成后,重启ComfyUI就能看到新的音频处理节点了。
3. 节点逐一解析
3.1 AI Audio Effects 节点 - 音频特效魔法师
这个节点就像一个音频特效工厂,能给你的音频加上各种酷炫效果,比如让你的声音听起来像机器人、像在山洞里说话,或者像电台DJ。
3.2 AI Audio Effects 节点参数详解
| 参数名 (界面显示) | 参数名 (代码里) | 参数值范围 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| 音频输入 | audio | 音频数据 | - | 这就像插音响的那根线,把要处理的音频接进来 | 接收来自其他节点的音频流数据 | 连接语音合成或音频加载节点的输出 |
| 音调调整 | pitch_shift | -12到+12 | 0 | 就像调音器一样,让声音变高变低,-12最低+12最高 | 以半音为单位调整音频的基础频率 | 设置-4让男声变得更低沉,设置+4让声音变得像小孩 |
| 播放速度 | speed_factor | 0.5到2.0 | 1.0 | 就像播放器的倍速功能,0.5是慢半拍,2.0是快一倍 | 调整音频播放速度而不影响音调 | 设置0.9让语音慢一点更清晰,设置1.1让语音快一点 |
| SoX程序路径 | sox_path | 文件路径 | 自动检测 | 告诉电脑SoX程序装在哪里,就像告诉导航目的地在哪 | 指定SoX音频处理程序的安装路径 | 如果自动找不到就填:C:\Program Files (x86)\sox-14-4-2\sox.exe |
| 音量调节 | gain_db | -20到+20 | 0 | 就像音响的音量旋钮,正数变大声,负数变小声 | 以分贝为单位调整音频增益 | 设置+5让声音大一点,设置-3让声音小一点 |
| 防爆音保护 | use_limiter | True/False | True | 就像音响的保护装置,防止声音太大爆掉 | 启用音频限制器防止削波失真 | 调大音量时建议开启,防止声音破音 |
| 音量平衡 | normalize_audio | True/False | False | 就像自动调节音量,让大声小声都变得差不多 | 自动调整音频电平使其达到标准响度 | 处理音量忽大忽小的录音时很有用 |
| 开启混响 | add_reverb | True/False | False | 就像在浴室里说话的回音效果开关 | 启用或禁用混响效果处理 | 想要空间感时开启,普通对话建议关闭 |
| 混响强度 | reverb_amount | 0到100 | 50 | 控制回音有多明显,0是没有,100是很明显 | 设置混响效果的强度和深度 | 轻微回音设置20,教堂效果设置80 |
| 混响空间大小 | reverb_room_scale | 0到100 | 50 | 模拟房间大小,0是小房间,100是大教堂 | 设置虚拟空间的大小参数 | 小房间设置25,大礼堂设置80 |
| 开启回声 | add_echo | True/False | False | 就像在山谷里喊话的回声效果开关 | 启用或禁用回声延迟效果 | 想要回声效果时开启,正常使用关闭 |
| 回声延迟 | echo_delay | 0.1到2.0 | 0.5 | 控制回声间隔时间,数字越大回声来得越晚 | 设置回声重复的时间间隔 | 0.3是快速回声,1.0是慢回声 |
| 回声衰减 | echo_decay | 0.1到0.9 | 0.5 | 控制回声消失速度,数字越大回声越持久 | 设置回声逐渐减弱的速度 | 0.3回声消失快,0.7回声消失慢 |
3.3 AI Audio Enhancer Pro 节点 - 音频质量提升大师
这个节点就像一个专业的音频工程师,能够智能地分析你的音频并且针对性地提升质量。它可以把人声、鼓声、贝斯等不同部分分开处理,就像调音台上每个推杆都能单独调节一样。
3.4 AI Audio Enhancer Pro 节点参数详解
| 参数名 (界面显示) | 参数名 (代码里) | 参数值范围 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| 音频输入 | audio | 音频数据 | - | 这就像插音响的那根线,把要处理的音频接进来 | 接收来自其他节点的音频流数据 | 连接语音合成或音频加载节点的输出 |
| 整体增强程度 | enhancement_level | 0.0到1.0 | 0.5 | 就像总开关,控制整体处理有多强烈,0是不处理,1是最强 | 控制整体音频增强处理的强度 | 轻微增强设置0.3,明显增强设置0.8 |
| 使用音轨分离 | use_source_separation | True/False | True | 就像把乐队成员分开录音,能单独处理人声、鼓等 | 启用AI音轨分离技术进行精确处理 | 处理音乐建议开启,纯人声可关闭 |
| 分离模型选择 | demucs_model | 模型名称 | htdemucs | 就像选择不同的音轨分离师,各有专长 | 选择用于音轨分离的AI模型 | 一般音频用htdemucs,高质量用htdemucs_ft |
| 处理设备 | device | cuda/cpu | cuda | 就像选择用跑车还是自行车,cuda是跑车速度快 | 选择使用GPU加速还是CPU处理 | 有显卡选cuda,没有选cpu |
| 人声增强 | vocals_enhance | 0.0到1.0 | 0.5 | 专门让说话唱歌的声音更清晰,就像给话筒加了美颜 | 针对人声频段进行增强处理 | 播客设置0.7,音乐人声设置0.6 |
| 鼓声增强 | drums_enhance | 0.0到1.0 | 0.5 | 让鼓点更有力,就像给鼓加了放大器 | 针对鼓声节拍进行增强处理 | 想要动感强烈设置0.8,轻音乐设置0.3 |
| 贝斯增强 | bass_enhance | 0.0到1.0 | 0.5 | 让低音更浑厚,就像给音响加了重低音炮 | 针对低频贝斯进行增强处理 | 想要重低音设置0.8,清淡音乐设置0.2 |
| 其他乐器增强 | other_enhance | 0.0到1.0 | 0.5 | 处理除了人声鼓贝斯之外的其他声音,像吉他键盘等 | 针对其他乐器进行增强处理 | 乐器丰富设置0.6,简单编曲设置0.4 |
| 清晰度 | clarity | 0.0到1.0 | 0.5 | 让声音听起来更清楚,就像擦干净了眼镜 | 增强中频段的清晰度和分离度 | 语音清晰度设置0.7,音乐设置0.5 |
| 动态范围 | dynamics | 0.0到1.0 | 0.5 | 让大声小声的对比更明显,就像调节电视的对比度 | 调整音频的动态范围和压缩比 | 想要更有层次设置0.7,平稳输出设置0.3 |
| 温暖度 | warmth | 0.0到1.0 | 0.5 | 让声音更温暖厚重,就像从冰冷变温暖 | 增强低频段的温暖感和饱满度 | 想要温暖感设置0.7,清冷感设置0.2 |
| 空气感 | air | 0.0到1.0 | 0.5 | 让声音更通透明亮,就像打开了窗户 | 增强高频段的空气感和透明度 | 想要明亮设置0.7,柔和设置0.3 |
| 立体声效果 | dolby_effect | 0.0到1.0 | 0.5 | 让声音更有立体感,就像从单声道变成环绕声 | 增强立体声宽度和空间感 | 想要宽广感设置0.7,普通设置0.4 |
| 简化模式 | simple_mode | Standard/Aggressive | Standard | 不用分离音轨的简单处理模式,Standard温和,Aggressive强烈 | 选择非分离处理的算法模式 | 快速处理选Standard,强烈效果选Aggressive |
| 应用限制器 | apply_limiter | True/False | True | 防止最终输出太大声爆音的保护装置 | 在处理链末端应用限制器 | 建议始终开启,防止输出过载 |
4. 使用技巧和建议
4.1 新手入门建议
刚开始使用时,建议你这样做:
- 先用 AI Audio Effects 节点熟悉基本操作,就像先学会开车再学漂移
- 所有参数先用默认值,然后一个一个慢慢调整
- 每调整一个参数就听听效果,就像做菜一样边做边尝
4.2 常用效果组合
让声音更专业(播客/演讲)
- 使用AI Audio Enhancer Pro节点
- vocals_enhance设置0.7,clarity设置0.7,dynamics设置0.5
- 就像给声音加了专业话筒的效果
制作电台主播声音
- 使用AI Audio Effects节点
- pitch_shift设置-2,speed_factor设置0.9
- add_reverb开启,reverb_amount设置20
- 就像那些磁性的电台声音
制作回音效果
- add_echo开启,echo_delay设置0.5,echo_decay设置0.5
- 就像在山洞里说话的效果
4.3 节点连接顺序
最佳连接顺序就像流水线一样:
音频输入 → AI Audio Enhancer Pro(提升质量) → AI Audio Effects(添加效果) → 音频输出
这样先提升质量,再添加特效,效果最好。
5. 常见问题解答
Q: 为什么我的SoX找不到?
A: 就像找不到遥控器一样,检查一下SoX是否正确安装在默认位置,或者在sox_path参数里手动指定路径。
Q: 处理速度很慢怎么办?
A: 就像电脑卡顿一样,如果你有独立显卡,确保device选择cuda;如果没有,可以把use_source_separation关闭。
Q: 声音变得奇怪了怎么办?
A: 就像调色调过头了一样,试试把所有参数都调回默认值,然后一个一个慢慢调整。
Q: 需要安装额外的包吗?
A: 如果你想要最强效果,建议安装demucs和pedalboard,就像给手机装上最新的app一样。
6. 进阶使用技巧
6.1 不同音频类型的最佳设置
人声对话优化
- 重点调整vocals_enhance和clarity
- 其他乐器增强可以关闭或调低
- 就像专门为说话声音定制的设置
音乐增强
- 平衡调整所有乐器增强参数
- 根据音乐类型调整warmth和air
- 就像给音乐做了专业混音
老旧录音修复
- 使用较高的clarity和dynamics设置
- 适当增加warmth减少噪音感
- 就像给老照片做了修复一样
6.2 性能优化建议
如果你的电脑配置一般,可以这样优化:
- 关闭use_source_separation使用simple_mode
- 选择cpu而不是cuda
- 降低enhancement_level的值
- 就像降低游戏画质来提高帧率一样
这个插件就像给你的ComfyUI添加了一个专业音频工作室,虽然参数很多,但是每个都有明确的作用。记住,最好的设置就是听起来最舒服的设置,不要被参数绑架,用耳朵来判断效果!