ComfyUI 魔法书 Logo
🏠 首页
👥 加群
🔥 报错不求人
😎 大帅比
登录 →
ComfyUI 魔法书 Logo
🏠 首页 👥 加群 🔥 报错不求人 😎 大帅比
登录
  1. 首页
  2. 🧩 插件工坊 (Plugin Workshop)
  3. ComfyUI AudioTools插件教程 手把手教你玩转音频处理

ComfyUI AudioTools插件教程 手把手教你玩转音频处理

0
  • 🧩 插件工坊 (Plugin Workshop)
  • 发布于 2025-07-03
  • 25 次阅读
编程界的小学生
编程界的小学生

ComfyUI AudioTools 插件完整使用教程

1. 插件简介

ComfyUI AudioTools(原地址:https://github.com/billwuhao/ComfyUI_AudioTools)是一个专门处理音频的神奇工具箱。就像你平时用的各种音频处理软件一样,它能帮你处理音频文件的各种需求。

这个插件就像一个万能的音频处理厨房,里面有各种各样的工具,可以帮你:

  • 把音乐和人声分开(就像把蛋黄和蛋清分开一样)
  • 给视频自动配字幕(就像给电影配字幕一样)
  • 调节音频的音量、速度、音调(就像调节收音机的音量和频率)
  • 录制音频和去除静音部分(就像录音机一样)
  • 给音频加上水印(就像给照片加水印防盗用)
  • 让工作流程暂停(就像遥控器的暂停键)

2. 如何安装

安装很简单,就像下载一个手机APP一样:

  1. 打开你的ComfyUI文件夹
  2. 找到 custom_nodes 文件夹
  3. 在这个文件夹里打开命令行工具
  4. 输入以下命令:
git clone https://github.com/billwuhao/ComfyUI_AudioTools.git
cd ComfyUI_AudioTools
pip install -r requirements.txt

特别注意:

  • 需要把 extra_help_file.yaml.example 改名为 extra_help_file.yaml
  • 在这个文件里添加你的音频文件夹路径,比如:audios_dir: D:\AIGC\ComfyUI-Data\audios_input

3. 节点逐一解析

3.1 音频降噪增强节点 (Audio Denoising Enhancement)

这个节点就像一个音频清洁工,专门清理音频里的噪音,让声音变得更清晰,就像给音频洗澡一样。

3.2 参数详解

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释专业解释怎么用/举个例子
输入音频audio_input音频文件任意音频就像把脏衣服放进洗衣机需要处理的原始音频数据连接从其他节点来的音频
模型路径model_path文件路径默认路径就像选择用哪种洗衣粉降噪模型的存储位置使用默认的MossFormer2模型
增强强度enhancement_strength0.1-1.00.5就像调节洗衣机的清洁强度控制降噪处理的强度0.3轻微降噪,0.8强力降噪

3.3 暂停工作流节点 (Pause Workflow)

这个节点就像遥控器的暂停键,让整个工作流程停下来等你检查,就像看电视时按暂停键一样。

3.4 参数详解

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释专业解释怎么用/举个例子
暂停条件pause_conditionTrue/FalseTrue就像开关灯的开关决定是否暂停工作流程True时暂停,False时继续
提示信息message文本"请检查"就像便签纸上的提醒暂停时显示的提示文字"请检查音频质量"
输入数据input_data任意数据来自前面节点就像传递接力棒需要暂停检查的数据连接需要检查的音频或其他数据

3.5 音频加载节点 (Audio Loading)

这个节点就像一个音频文件管家,帮你从电脑里找到并加载音频文件,就像从抽屉里找东西一样。

3.6 参数详解

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释专业解释怎么用/举个例子
文件路径file_path文件路径空就像告诉别人你的家庭地址音频文件的完整路径"C:\Music\song.wav"
自动搜索子文件夹include_subdirsTrue/FalseTrue就像翻遍所有抽屉找东西是否在子文件夹中搜索True会搜索所有子文件夹
文件格式file_formatwav/mp3/flac等auto就像选择听哪种类型的音乐指定加载的音频格式auto自动识别所有格式
开始时间start_time秒数0就像快进到电影的某个时间点从音频的第几秒开始加载30表示从第30秒开始
结束时间end_time秒数-1就像设置闹钟的结束时间加载到音频的第几秒结束-1表示加载到最后

3.7 字符串编辑节点 (String Editing)

这个节点就像一个文本编辑器,帮你修改和处理文字,就像用记事本改文章一样。

3.8 参数详解

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释专业解释怎么用/举个例子
输入文本input_text文本空就像在纸上写字需要编辑的原始文本"这是原始文本"
替换旧文本old_text文本空就像找到要改的错别字需要被替换的文本部分"错别字"
替换新文本new_text文本空就像用正确的字替换错字用来替换的新文本"正确字"
大小写转换case_conversionupper/lower/titlenone就像把字母变大写或小写文本大小写转换方式upper全部大写,lower全部小写
去除空格strip_spacesTrue/FalseFalse就像删除文字前后的空白是否去除文本前后的空格True删除多余空格

3.9 视频自动加字幕节点 (Auto Add Subtitles)

这个节点就像一个聪明的字幕师,自动听声音然后给视频配上字幕,就像看外语电影时的字幕一样。

3.10 参数详解

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释专业解释怎么用/举个例子
输入视频video_input视频文件任意视频就像把DVD放进播放器需要添加字幕的视频文件连接视频文件
语言识别language语言代码auto就像选择听哪种语言识别音频中的语言类型"zh"中文,"en"英文,auto自动识别
字幕大小subtitle_size数字24就像调节电视字幕的大小字幕文字的显示大小24是中等大小,36是大字幕
字幕位置subtitle_positiontop/bottom/centerbottom就像选择字幕显示在哪里字幕在视频中的位置bottom在底部,top在顶部
字幕颜色subtitle_color颜色代码white就像选择用什么颜色的笔写字字幕文字的颜色white白色,yellow黄色
背景透明度background_opacity0.0-1.00.5就像调节背景的透明程度字幕背景的透明度0.0完全透明,1.0完全不透明

3.11 音频裁剪节点 (Audio Cropping)

这个节点就像一把剪刀,能把音频按照你想要的时间段剪出来,就像剪视频片段一样。

3.12 参数详解

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释专业解释怎么用/举个例子
输入音频audio_input音频文件任意音频就像把一整卷胶带放到桌上需要裁剪的原始音频连接音频文件
开始时间start_time秒数0就像找到剪刀要剪的起始位置裁剪开始的时间点30表示从第30秒开始剪
结束时间end_time秒数10就像找到剪刀要剪的结束位置裁剪结束的时间点60表示剪到第60秒
淡入时间fade_in_duration秒数0就像音量慢慢从小变大音频开始时的淡入时间2表示2秒内音量逐渐增大
淡出时间fade_out_duration秒数0就像音量慢慢从大变小音频结束时的淡出时间3表示3秒内音量逐渐减小

3.13 音频处理节点 (Audio Processing)

这个节点就像一个音频调节台,可以调整音量、速度、音调等,就像DJ调音台一样。

3.14 参数详解

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释专业解释怎么用/举个例子
输入音频audio_input音频文件任意音频就像把音响连到调音台需要处理的音频数据连接音频文件
音量调节volume0.1-2.01.0就像调节收音机的音量旋钮音频音量的倍数调节0.5降低一半音量,2.0提高一倍音量
速度调节speed0.5-2.01.0就像调节播放器的播放速度音频播放速度的倍数0.8慢速播放,1.5快速播放
音调调节pitch-12到120就像调节钢琴的音调高低音频音调的半音调节-3降低3个半音,+5升高5个半音
回声强度echo_strength0.0-1.00.0就像在山谷里喊话的回声添加回声效果的强度0.3轻微回声,0.7强烈回声
回声延迟echo_delay毫秒500就像回声隔多久才听到回声延迟的时间300毫秒较短,1000毫秒较长

3.15 去除静音节点 (Remove Silence)

这个节点就像一个智能编辑器,自动找出音频中的静音部分并删除,就像剪辑视频时去掉空白片段。

3.16 参数详解

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释专业解释怎么用/举个例子
输入音频audio_input音频文件任意音频就像把录音带放进机器需要处理的音频数据连接音频文件
静音阈值silence_threshold-60到0-30就像设置多小的声音算静音判断静音的音量阈值-20比较严格,-40比较宽松
最短静音时长min_silence_duration毫秒500就像设置多长时间的安静算静音删除静音的最短时间300毫秒删除短暂静音,1000毫秒删除长静音
保留静音长度keep_silence_duration毫秒100就像在删除静音时留一点点删除静音后保留的时间100毫秒留一点点,0毫秒完全删除

3.17 录音节点 (Recording)

这个节点就像一个录音机,可以录制声音,就像用手机录音一样。

3.18 参数详解

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释专业解释怎么用/举个例子
录音时长duration秒数10就像设置录音机录多长时间录音的持续时间30表示录30秒
采样率sample_rate数字44100就像设置录音的清晰度音频采样频率44100是CD质量,22050是一般质量
声道数channels1或21就像选择单声道还是立体声音频声道数量1是单声道,2是立体声
音频格式audio_formatwav/mp3等wav就像选择保存成什么格式录音文件的保存格式wav质量高,mp3文件小
保存路径save_path文件路径默认路径就像选择录音保存在哪里录音文件的保存位置"C:\Recordings\record.wav"

3.19 音频水印嵌入节点 (Audio Watermark Embedding)

这个节点就像给音频盖章,在音频里加入隐藏的标记,就像给照片加水印防止盗用。

3.20 参数详解

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释专业解释怎么用/举个例子
输入音频audio_input音频文件任意音频就像把要盖章的文件拿出来需要嵌入水印的音频连接音频文件
水印信息watermark_message文本空就像选择盖什么样的章要嵌入的水印信息"版权所有"
水印强度watermark_strength0.1-1.00.5就像选择盖章的深浅水印嵌入的强度0.3不明显,0.8很明显
是否启用enable_watermarkTrue/FalseTrue就像选择是否要盖章是否启用水印嵌入True启用,False不启用
检测模式detection_modeTrue/FalseFalse就像选择是检测还是添加是否为检测水印模式True检测水印,False添加水印

3.21 音乐人声分离节点 (Music/Vocal Separation)

这个节点就像一个音乐分离器,能把歌曲中的人声和背景音乐分开,就像把混合的颜料分开一样。

3.22 参数详解

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释专业解释怎么用/举个例子
输入音频audio_input音频文件任意音频就像把混合的汤放进分离器需要分离的音频文件连接包含人声和音乐的音频
分离模式separation_modevocal/music/bothboth就像选择要分离出什么分离输出的类型vocal只要人声,music只要音乐,both都要
分离质量separation_qualitylow/medium/highmedium就像选择分离的精细程度分离处理的质量级别high质量最好但速度慢
模型选择model_type模型名称默认模型就像选择用哪种分离工具使用的分离算法模型不同模型适合不同音乐类型

3.23 人声提取节点 (Vocal Extraction)

这个节点专门提取人声,就像用筛子把人声从音乐中筛选出来。

3.24 参数详解

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释专业解释怎么用/举个例子
输入音频audio_input音频文件任意音频就像把要筛选的材料放进筛子包含人声的音频文件连接音频文件
提取强度extraction_strength0.1-1.00.8就像调节筛子的密度人声提取的强度0.5温和提取,0.9强力提取
背景抑制background_suppression0.0-1.00.7就像调节过滤背景噪音的程度背景音乐的抑制程度0.3保留部分背景,0.9几乎去除背景
频率范围frequency_rangeHz范围80-8000就像选择听哪个频率范围的声音人声频率的处理范围80-8000覆盖大部分人声

3.25 音频合并节点 (Audio Merging)

这个节点就像一个音频混合器,把多个音频文件混合成一个,就像调制鸡尾酒一样。

3.26 参数详解

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释专业解释怎么用/举个例子
音频1audio_input1音频文件任意音频就像准备第一种饮料第一个音频输入连接第一个音频文件
音频2audio_input2音频文件任意音频就像准备第二种饮料第二个音频输入连接第二个音频文件
混合比例1mix_ratio10.0-1.00.5就像调节第一种饮料的分量第一个音频的音量比例0.7表示第一个音频较大声
混合比例2mix_ratio20.0-1.00.5就像调节第二种饮料的分量第二个音频的音量比例0.3表示第二个音频较小声
混合模式mix_modeoverlay/sequentialoverlay就像选择是同时混合还是依次播放音频混合的方式overlay同时播放,sequential依次播放

3.27 音频连接节点 (Audio Concatenation)

这个节点就像胶水,把多个音频文件首尾相连,就像把多段录音连成一个长录音。

3.28 参数详解

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释专业解释怎么用/举个例子
音频列表audio_list音频文件数组空数组就像把要连接的磁带排成一列需要连接的音频文件列表连接多个音频输入
间隔时间gap_duration秒数0就像设置磁带之间的空隙音频之间的间隔时间1表示每个音频间隔1秒
淡入淡出crossfade秒数0就像两段音乐之间的过渡效果音频连接处的交叉淡化0.5表示0.5秒的淡入淡出
音量均衡volume_normalizeTrue/FalseFalse就像调节所有音频的音量一致是否统一所有音频的音量True让所有音频音量相同

3.29 多行提示节点 (Multi-Line Prompt)

这个节点就像一个大的文本框,可以输入很长的文字,就像写日记一样。

3.30 参数详解

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释专业解释怎么用/举个例子
文本内容text_content多行文本空就像在一张大纸上写很多文字多行文本输入内容可以写很多行的说明文字
文本编码text_encodingutf-8/ascii等utf-8就像选择用什么语言写字文本的编码格式utf-8支持中文
换行符处理line_break_handlingkeep/remove/replacekeep就像选择怎么处理换行对换行符的处理方式keep保持原样,remove删除换行

4. 使用技巧和建议

4.1 音频质量优化技巧

  • 使用高质量的原始音频文件(44.1kHz采样率或更高)
  • 在处理前先用降噪节点清理音频
  • 调节参数时从小数值开始,逐步增加到合适的效果

4.2 工作流程建议

  • 先用暂停节点检查中间结果,确保每步都正确
  • 使用音频加载节点时,建议把音频文件放在统一的文件夹中
  • 处理长音频时,可以先用裁剪节点分段处理

4.3 性能优化建议

  • 大文件处理时,关闭不必要的实时预览
  • 批量处理时,使用较低的处理质量设置先测试
  • 定期清理临时文件,保持系统流畅

5. 常见问题解答

Q1: 为什么音频加载失败?

A: 检查文件路径是否正确,确保音频文件格式支持(wav、mp3、flac等),文件没有损坏。

Q2: 人声分离效果不好怎么办?

A: 尝试调整分离质量设置,或者使用不同的模型。有些歌曲的人声和音乐混合得很紧密,分离效果会受限。

Q3: 水印嵌入后听不出来正常吗?

A: 正常的,水印是隐藏的,肉耳听不出来。可以用检测模式验证水印是否成功嵌入。

标签: #插件 2338
相关文章

ComfyUI错误修复插件详解:轻松解决常见问题 2025-07-10 18:25

ComfyUI-CustomMenu插件使用教程:高效自定义工作流指南 2025-07-10 17:50

ComfyUI图像合并插件comfyui-merge使用教程 2025-07-03 22:44

ComfyUI 图像合并插件教程 (comfyui-merge) 1. 插件简介 这是一个专门用来合并图片的 ComfyUI 插件,就像用 PS 把多张图片叠在一起那样。它的特别之处在于你精确控制每张图片的混合方式。 GitHub 地址:https://github.com/LingSss9/com

ComfyUI WAN 2.2视频插件教程:万相AI提示词全攻略 2025-07-31 11:47

ComfyUI WAN 2.2视频插件教程:万相AI提示词实战指南 2025-07-29 20:10

ComfyUI HeyGem数字人插件教程:零基础快速精通指南 2025-07-22 14:10

目录

从节点基础到高阶工作流,我们为你绘制最清晰的 ComfyUI 学习路径。告别困惑,让每一次连接都充满创造的魔力,轻松驾驭 AI 艺术的无限可能。

  • 微信
  • B站
  • GitHub
Copyright © 2025 AIX All Rights Reserved. Powered by AIX.
隐私政策
津ICP备2024019312号