ComfyUI 魔法书 Logo
🏠 首页
👥 加群
😎 大帅比
❤️‍🔥 Monster 社区
登录 →
ComfyUI 魔法书 Logo
🏠 首页 👥 加群 😎 大帅比 ❤️‍🔥 Monster 社区
登录
  1. 首页
  2. 🧩 插件工坊 (Plugin Workshop)
  3. ComfyUI音频分离插件使用教程 轻松提取人声和背景音乐

ComfyUI音频分离插件使用教程 轻松提取人声和背景音乐

0
  • 🧩 插件工坊 (Plugin Workshop)
  • 发布于 2025-06-30
  • 46 次阅读
编程界的小学生
编程界的小学生

ComfyUI 音频分离插件完全教程

1. 插件简介

插件地址: https://github.com/christian-byrne/audio-separation-nodes-comfyui

这个插件就像一个超级厉害的音频魔法师!它能帮你做很多神奇的音频处理工作:

这个插件能干什么?

  • 音频分离:把一首歌拆分成人声、贝斯、鼓声、其他乐器四个部分,就像把一个蛋糕切成四块
  • 音频剪辑:像剪视频一样剪音频,想要哪一段就剪哪一段
  • 音频合并:把两个音频混合在一起,就像调鸡尾酒一样
  • 节拍匹配:让两首歌的节拍速度变得一样,方便混音
  • 变速播放:让音频播放变快或变慢,但音调不变
  • 视频配音:给视频换背景音乐或配音
  • 节拍检测:自动识别音乐的节拍速度

能给我们带来什么效果?

  • 制作卡拉OK伴奏(去掉人声留下音乐)
  • 提取歌曲中的人声部分
  • 给视频换背景音乐
  • 制作音乐混音作品
  • 分析音乐的节拍和结构

2. 如何安装

方法一:ComfyUI Manager 安装(推荐)

  1. 打开 ComfyUI Manager
  2. 搜索 "audio-separation"
  3. 点击安装即可

方法二:手动安装

  1. 进入 ComfyUI 的 custom_nodes 文件夹
  2. 运行命令:git clone https://github.com/christian-byrne/audio-separation-nodes-comfyui.git
  3. 进入插件文件夹:cd audio-separation-nodes-comfyui
  4. 安装依赖:pip install -r requirements.txt
  5. 重启 ComfyUI

需要的依赖包

  • librosa==0.10.2(音频处理库)
  • torchaudio>=2.3.0(音频处理库)
  • numpy(数学计算库)
  • moviepy(视频处理库)

3. 节点详细解析

3.1 AudioSeparation 节点 - 音频分离魔法师

这个节点就像一个超级厉害的音频分析师,能把一首完整的歌曲拆分成四个独立的部分:贝斯、鼓声、其他乐器和人声。就像把一个混合果汁分离成不同的水果成分。

输出结果:

  • Bass(贝斯):低音部分,就像音乐的地基
  • Drums(鼓声):节拍部分,就像音乐的心跳
  • Other(其他):除了贝斯、鼓声、人声以外的所有乐器
  • Vocals(人声):歌手唱歌的声音
参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释 (能干嘛的)专业解释怎么用/举个例子
audioaudioAUDIO类型-要分离的音频文件输入的音频数据连接一个音频文件,比如一首完整的歌
chunk_fade_shapechunk_fade_shapelinear/half_sine/logarithmic/exponentiallinear音频切片的淡入淡出方式音频分段处理时的淡化形状linear是均匀淡化,half_sine是平滑曲线
chunk_lengthchunk_length浮点数10.0每个音频片段的长度(秒)音频分段处理的片段长度10.0表示每次处理10秒的音频
chunk_overlapchunk_overlap浮点数0.1音频片段之间的重叠时间(秒)相邻音频片段的重叠长度0.1表示片段间重叠0.1秒,避免断裂

3.2 AudioTempoMatch 节点 - 节拍同步器

这个节点就像一个音乐指挥家,能让两首不同节拍的歌曲变成相同的节拍速度。比如一首歌是120拍,另一首是100拍,它会让两首歌都变成110拍。

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释 (能干嘛的)专业解释怎么用/举个例子
audio_1audio_1AUDIO类型-第一个音频文件第一个输入音频连接第一首要同步节拍的歌
audio_2audio_2AUDIO类型-第二个音频文件第二个输入音频连接第二首要同步节拍的歌

3.3 AudioCrop 节点 - 音频剪刀

这个节点就像一把精确的剪刀,能从一段长音频中剪出你想要的部分。就像从一部电影中剪出精彩片段。

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释 (能干嘛的)专业解释怎么用/举个例子
audioaudioAUDIO类型-要剪辑的音频文件输入的音频数据连接一个完整的音频文件
start_timestart_time字符串"0:00"开始时间剪辑的起始时间点"1:30"表示从1分30秒开始剪
end_timeend_time字符串"1:00"结束时间剪辑的结束时间点"3:45"表示剪到3分45秒结束

3.4 AudioCombine 节点 - 音频调音师

这个节点就像一个调音师,能把两个音频文件混合在一起。就像把两种颜料混合成新颜色。

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释 (能干嘛的)专业解释怎么用/举个例子
audio_1audio_1AUDIO类型-第一个音频文件第一个输入音频连接第一个要混合的音频
audio_2audio_2AUDIO类型-第二个音频文件第二个输入音频连接第二个要混合的音频
methodmethodadd/mean/subtract/multiply/divideadd混合方式音频波形的数学运算方式add是叠加,mean是平均,subtract是相减

3.5 AudioVideoCombine 节点 - 视频配音师

这个节点就像一个视频编辑师,能给视频换上新的音频。就像给电影配音或换背景音乐。

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释 (能干嘛的)专业解释怎么用/举个例子
audioaudioAUDIO类型-新的音频文件要添加到视频的音频连接一个音频文件作为新配音
video_pathvideo_path字符串"/path/to/video.mp4"视频文件路径目标视频文件的完整路径输入视频文件的完整路径,如"/Users/name/video.mp4"
video_start_timevideo_start_time字符串"0:00"视频开始时间视频剪辑的起始时间"0:30"表示从30秒开始
video_end_timevideo_end_time字符串"1:00"视频结束时间视频剪辑的结束时间"2:15"表示到2分15秒结束
auto_openauto_opentrue/falsefalse自动打开完成的视频处理完成后是否自动播放true会自动用播放器打开新视频

3.6 AudioSpeedShift 节点 - 音频变速器

这个节点就像一个时间控制器,能让音频播放变快或变慢,但音调保持不变。就像调节播放器的倍速功能,但更专业。

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释 (能干嘛的)专业解释怎么用/举个例子
audioaudioAUDIO类型-要变速的音频文件输入的音频数据连接一个音频文件
raterate0.1-10.01.0变速倍率时间拉伸的倍率2.0是2倍速,0.5是半速播放

3.7 AudioGetTempo 节点 - 节拍探测器

这个节点就像一个音乐分析师,能自动检测音乐的节拍速度(BPM)。就像音乐软件显示的"120 BPM"那样。

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释 (能干嘛的)专业解释怎么用/举个例子
audioaudioAUDIO类型-要分析的音频文件输入的音频数据连接一个音频文件进行节拍分析

输出结果:

  • tempo_string:节拍速度的文字形式(如"120")
  • tempo_float:节拍速度的小数形式(如120.5)
  • tempo_integer:节拍速度的整数形式(如120)

4. 使用技巧和建议

音频分离技巧

  • 选择合适的音频:清晰录制的音乐效果最好,现场录音可能效果不佳
  • 调整片段长度:如果内存不够,可以减少chunk_length到5.0秒
  • 重叠设置:如果音频变化很快,可以增加chunk_overlap到0.2秒

音频剪辑技巧

  • 时间格式:支持"分:秒"格式,如"2:30"表示2分30秒
  • 纯秒数:也可以直接输入秒数,如"150"表示150秒
  • 精确剪辑:可以精确到秒,适合制作铃声或片段

音频合并技巧

  • 音量平衡:使用"mean"方法可以避免音量过大
  • 创意混音:尝试"multiply"或"subtract"创造特殊效果
  • 长度匹配:系统会自动裁剪到较短音频的长度

节拍匹配技巧

  • 适合混音:制作DJ混音时特别有用
  • 保持音质:轻微的节拍调整音质损失最小
  • 配合使用:可以和AudioCombine节点配合制作混音

5. 常见问题解答

Q: 为什么音频分离效果不好?
A: 可能原因:1)音频质量不高 2)乐器混合太复杂 3)可以尝试调整chunk_length参数

Q: 视频配音时找不到文件怎么办?
A: 确保视频文件路径是完整的绝对路径,如"/Users/用户名/Desktop/video.mp4"

Q: 音频变速后声音变奇怪了?
A: 不要设置过极端的倍率,建议在0.5-2.0之间,超出范围可能产生异常

Q: 节拍检测不准确怎么办?
A: 某些音乐类型(如古典音乐、环境音)可能检测困难,电子音乐和流行音乐效果最好

Q: 处理大文件时内存不够?
A: 减少chunk_length参数,或者先用AudioCrop节点分段处理

Q: 合并音频时长度不一致?
A: 系统会自动以较短的音频为准,如需保持完整长度,请先用其他工具调整到相同长度

6. 实用应用场景

制作卡拉OK

  1. 使用AudioSeparation分离音频
  2. 取出除Vocals外的其他三个输出
  3. 用AudioCombine合并成伴奏

提取纯人声

  1. 使用AudioSeparation分离音频
  2. 直接使用Vocals输出
  3. 可用于学习唱歌或分析演唱技巧

视频换背景音乐

  1. 用AudioSeparation提取原视频的人声
  2. 准备新的背景音乐
  3. 用AudioCombine混合人声和新音乐
  4. 用AudioVideoCombine合成最终视频

制作混音作品

  1. 用AudioGetTempo检测两首歌的节拍
  2. 用AudioTempoMatch统一节拍
  3. 用AudioCombine混合音频
  4. 用AudioCrop剪辑精彩部分

教程完成!共分析了7个节点,涵盖了音频分离、剪辑、合并、变速、节拍检测等全部功能。

节点统计:

  • AudioSeparation:音频分离
  • AudioTempoMatch:节拍匹配
  • AudioCrop:音频剪辑
  • AudioCombine:音频合并
  • AudioVideoCombine:视频配音
  • AudioSpeedShift:音频变速
  • AudioGetTempo:节拍检测
标签: #插件 2338
相关文章

ComfyUI错误修复插件详解:轻松解决常见问题 2025-07-10 18:25

ComfyUI-CustomMenu插件使用教程:高效自定义工作流指南 2025-07-10 17:50

ComfyUI图像合并插件comfyui-merge使用教程 2025-07-03 22:44

ComfyUI 图像合并插件教程 (comfyui-merge) 1. 插件简介 这是一个专门用来合并图片的 ComfyUI 插件,就像用 PS 把多张图片叠在一起那样。它的特别之处在于你精确控制每张图片的混合方式。 GitHub 地址:https://github.com/LingSss9/com

ComfyUI WAN 2.2视频插件教程:万相AI提示词全攻略 2025-07-31 11:47

ComfyUI WAN 2.2视频插件教程:万相AI提示词实战指南 2025-07-29 20:10

ComfyUI HeyGem数字人插件教程:零基础快速精通指南 2025-07-22 14:10

目录

从节点基础到高阶工作流,我们为你绘制最清晰的 ComfyUI 学习路径。告别困惑,让每一次连接都充满创造的魔力,轻松驾驭 AI 艺术的无限可能。

  • 微信
  • B站
  • GitHub
Copyright © 2025 AIX All Rights Reserved. Powered by AIX.
隐私政策
津ICP备2024019312号