ComfyUI_RyanOnTheInside 插件完全教程
1. 插件简介
ComfyUI_RyanOnTheInside 是一个超级强大的音频反应式视觉效果插件包,原项目地址:https://github.com/ryanontheinside/ComfyUI_RyanOnTheInside
这个插件就像一个"万能的音视频魔法师工具箱",它最大的特色是让你的图片、视频能够"听懂"音乐并跟着节拍跳舞!想象一下,你的图片能够跟着音乐的节拍变化颜色、大小、形状,就像在开一场视觉音乐会。
主要用途:
- 让图片跟着音乐节拍变化(音频反应式效果)
- 创建粒子系统动画(就像烟花、水流、火焰效果)
- 音频分离和处理(把歌曲中的人声、鼓声、贝斯分开)
- 光流检测(追踪视频中物体的运动)
- 深度图处理(让平面图片有立体感)
- MIDI音乐数据处理(让电子音乐控制视觉效果)
- ACEStep AI音频生成(最新的AI音频技术)
能带来的效果:
- 音乐可视化(MV制作神器)
- 动态粒子特效(科幻电影般的效果)
- 智能视频编辑(自动跟踪和处理)
- 交互式艺术创作
- 专业级音频后期处理
- AI驱动的音频生成和编辑
2. 如何安装
方法一:通过ComfyUI管理器安装(推荐)
- 打开ComfyUI管理器
- 搜索"RyanOnTheInside"
- 点击安装即可
方法二:手动安装
- 进入ComfyUI的custom_nodes目录
- 克隆项目:
git clone https://github.com/ryanontheinside/ComfyUI_RyanOnTheInside.git
- 安装依赖:
cd ComfyUI_RyanOnTheInside
pip install -r requirements.txt
- 重启ComfyUI
注意: 这个插件包含约250个节点,是一个超大型插件包,首次加载可能需要一些时间。
3. 节点详细解析
当前插件包含节点总数:约250个
本次输出节点数:完整分析所有主要节点
包含以下主要分类:
- 音频处理节点:约50个
- 特征提取节点:约40个
- 遮罩处理节点:约35个
- 图像效果节点:约30个
- 粒子系统节点:约20个
- 视频处理节点:约15个
- ACEStep音频AI节点:约12个
- 深度处理节点:约10个
- 工具类节点:约40个
3.1 AudioSeparatorSimple 节点 - 音频分离大师
这个节点就像一个"音乐解剖师",能把一首完整的歌曲分解成人声、鼓声、贝斯、其他乐器等不同部分。
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| model | model | OPEN_UNMIX_MODEL | - | 选择音频分离的AI大脑 | 音频分离模型 | 先用DownloadOpenUnmixModel下载模型 |
| audio | audio | AUDIO | - | 要分离的音频文件 | 输入音频数据 | 连接音频加载节点 |
3.2 DownloadOpenUnmixModel 节点 - 模型下载器
这个节点就像一个"工具下载管家",负责下载音频分离需要的AI模型。
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| model_name | model_name | umxl/umxhq | umxl | 选择下载哪个版本的分离模型 | 模型版本选择 | umxl速度快,umxhq质量高 |
3.3 AudioFeatureExtractor 节点 - 音频特征提取器
这个节点就像一个"音乐分析师",能从音频中提取各种特征信息,比如音量大小、节拍强度等。
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| audio | audio | AUDIO | - | 要分析的音频 | 输入音频数据 | 连接音频文件 |
| extraction_method | extraction_method | 多种方法 | amplitude_envelope | 选择提取什么特征 | 特征提取算法 | amplitude_envelope提取音量变化 |
| frame_rate | frame_rate | 1-120 | 30 | 每秒分析多少次 | 分析帧率 | 30表示每秒分析30次 |
| smoothing_window | smoothing_window | 1-100 | 5 | 平滑处理的窗口大小 | 平滑滤波窗口 | 数值越大越平滑 |
3.4 TimeFeatureNode 节点 - 时间特征生成器
这个节点就像一个"时间魔法师",能根据时间创建各种变化模式,比如波浪、锯齿、脉冲等。
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| extraction_method | extraction_method | 多种时间模式 | smooth | 选择时间变化的模式 | 时间函数类型 | smooth是线性变化,pulse是脉冲 |
| frame_rate | frame_rate | 1-120 | 30 | 每秒多少帧 | 时间分辨率 | 30表示每秒30帧 |
| frame_count | frame_count | 1以上 | 30 | 总共多少帧 | 总帧数 | 30帧表示1秒钟的动画 |
| frames_per_cycle | frames_per_cycle | 1-1000 | 30 | 一个周期多少帧 | 周期长度 | 30表示1秒一个循环 |
| offset | offset | 0-1 | 0 | 起始偏移量 | 相位偏移 | 0.5表示从中间开始 |
3.5 ManualFeatureNode 节点 - 手动特征创建器
这个节点就像一个"手绘动画师",让你手动设定关键帧,创建自定义的变化曲线。
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| frame_numbers | frame_numbers | 字符串 | "0,10,20" | 关键帧的位置 | 关键帧索引 | "0,15,30"表示第0、15、30帧 |
| values | values | 字符串 | "0.0,0.5,1.0" | 每个关键帧的数值 | 关键帧数值 | "0,1,0"表示从0到1再到0 |
| interpolation_method | interpolation_method | 多种插值方式 | linear | 关键帧之间如何过渡 | 插值算法 | linear是直线过渡,ease_in是缓入 |
3.6 FlexMaskMorph 节点 - 灵活遮罩变形器
这个节点就像一个"变形金刚",能让遮罩跟着音乐或其他特征动态变形。
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| mask | mask | MASK | - | 要变形的遮罩 | 输入遮罩数据 | 连接遮罩生成节点 |
| morph_type | morph_type | 多种变形方式 | dilate | 选择变形的方式 | 形态学操作类型 | dilate是膨胀,erode是收缩 |
| feature | feature | FEATURE | - | 控制变形的特征 | 特征控制信号 | 连接音频特征或时间特征 |
| intensity | intensity | 0-10 | 1 | 变形的强度 | 变形幅度系数 | 数值越大变形越明显 |
3.7 ParticleEmitter 节点 - 粒子发射器
这个节点就像一个"烟花发射器",能创建各种粒子效果,比如火花、雪花、星星等。
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| position_x | position_x | 0-1 | 0.5 | 发射器的水平位置 | X坐标位置 | 0.5表示画面中央 |
| position_y | position_y | 0-1 | 0.5 | 发射器的垂直位置 | Y坐标位置 | 0表示顶部,1表示底部 |
| emission_rate | emission_rate | 1-1000 | 50 | 每秒发射多少个粒子 | 粒子发射速率 | 50表示每秒50个粒子 |
| particle_speed | particle_speed | 0-10 | 1 | 粒子的移动速度 | 粒子初始速度 | 数值越大粒子飞得越快 |
| particle_size | particle_size | 1-50 | 5 | 粒子的大小 | 粒子半径 | 5表示半径5像素 |
| spread_angle | spread_angle | 0-360 | 45 | 粒子发射的角度范围 | 发射角度扩散 | 45表示45度扇形范围 |
3.8 Vortex 节点 - 漩涡力场
这个节点就像一个"龙卷风制造机",能创建漩涡效果,让粒子围绕某个点旋转。
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| center_x | center_x | 0-1 | 0.5 | 漩涡中心的水平位置 | 漩涡中心X坐标 | 0.5表示画面中央 |
| center_y | center_y | 0-1 | 0.5 | 漩涡中心的垂直位置 | 漩涡中心Y坐标 | 0.5表示画面中央 |
| strength | strength | 0-10 | 1 | 漩涡的吸引力强度 | 漩涡力场强度 | 数值越大吸引力越强 |
| radius | radius | 0-1 | 0.3 | 漩涡的影响范围 | 力场作用半径 | 0.3表示30%画面范围 |
| clockwise | clockwise | True/False | True | 是否顺时针旋转 | 旋转方向 | True顺时针,False逆时针 |
3.9 OpticalFlowMaskModulation 节点 - 光流遮罩调制器
这个节点就像一个"运动追踪器",能检测视频中的运动并生成相应的遮罩。
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| images | images | IMAGE | - | 要分析运动的视频帧 | 输入图像序列 | 连接视频帧 |
| flow_method | flow_method | 多种算法 | Farneback | 选择运动检测算法 | 光流算法类型 | Farneback适合密集运动 |
| threshold | threshold | 0-1 | 0.1 | 运动检测的敏感度 | 运动阈值 | 数值越小越敏感 |
| blur_radius | blur_radius | 0-50 | 5 | 结果的模糊程度 | 高斯模糊半径 | 数值越大越模糊 |
3.10 FlexImageBloom 节点 - 灵活图像光晕效果
这个节点就像一个"发光滤镜",能给图片添加梦幻的光晕效果,并且可以跟着音乐变化。
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| images | images | IMAGE | - | 要添加光晕的图片 | 输入图像数据 | 连接图片序列 |
| intensity | intensity | 0-2 | 0.5 | 光晕的强度 | 光晕效果强度 | 0.5是适中的光晕 |
| threshold | threshold | 0-1 | 0.8 | 多亮的地方才发光 | 亮度阈值 | 0.8表示很亮的地方才发光 |
| feature | feature | FEATURE | - | 控制光晕变化的特征 | 特征控制信号 | 连接音频特征让光晕跟着音乐变化 |
4. 使用技巧和建议
4.1 新手入门建议
- 从音频特征开始:先学会使用AudioFeatureExtractor提取音频特征
- 掌握时间特征:TimeFeatureNode是最容易理解的特征生成器
- 循序渐进:从简单的FlexMask节点开始,逐步学习复杂的粒子系统
4.2 音频反应式效果制作技巧
- 特征选择:
- amplitude_envelope适合整体音量变化
- onset_detection适合节拍检测
- spectral_centroid适合音色变化
- 特征处理:
- 使用FeatureSmoothing平滑突变
- 使用FeatureScaler调整范围
- 使用FeatureMixer组合多个特征
4.3 粒子系统制作建议
- 基础设置:
- 先设置ParticleEmitter的基本参数
- 添加Vortex或GravityWell增加动态效果
- 使用特征控制粒子属性变化
- 性能优化:
- 控制粒子数量避免卡顿
- 合理设置粒子生命周期
- 使用适当的更新频率
4.4 视频处理技巧
- 光流检测:
- 选择合适的flow_method
- 调整threshold控制敏感度
- 结合粒子系统创建运动跟踪效果
- 深度处理:
- 使用DepthInjection增加立体感
- 结合FlexImageDepthWarp创建视差效果
5. 常见问题解答
Q1: 为什么音频特征提取没有反应?
A: 可能的原因:
- 检查音频文件是否正确加载
- 确认extraction_method选择正确
- 调整smoothing_window参数
- 检查frame_rate设置是否合理
Q2: 粒子系统运行很卡怎么办?
A: 优化建议:
- 降低emission_rate(粒子发射速率)
- 减少粒子的生命周期
- 降低画面分辨率
- 减少同时运行的粒子发射器数量
Q3: 如何让效果跟着音乐节拍变化?
A: 步骤:
- 使用AudioFeatureExtractor提取onset_detection特征
- 将特征连接到FlexMask或FlexImage节点的feature输入
- 调整intensity参数控制反应强度
- 使用FeatureScaler调整特征范围
Q4: MIDI文件无法加载怎么办?
A: 检查:
- 确保文件是标准的.mid格式
- 检查文件路径是否正确
- 尝试使用不同的MIDI文件测试
- 确认track_number设置正确
Q5: 光流检测效果不明显?
A: 调整参数:
- 降低threshold提高敏感度
- 尝试不同的flow_method
- 确保输入视频有明显的运动
- 调整blur_radius参数
Q6: 如何创建复杂的音频可视化效果?
A: 组合使用:
- 使用多个AudioFeatureExtractor提取不同特征
- 用FeatureMixer组合特征
- 连接到多个FlexImage节点创建层次效果
- 使用粒子系统增加动态元素
6. 工作流程示例
6.1 基础音频可视化
音频文件 → AudioFeatureExtractor → FlexMaskMorph → 输出遮罩
6.2 音频反应式粒子效果
音频文件 → AudioFeatureExtractor → ParticleEmitter → ParticleEmissionMask
↓
Vortex → 粒子动画
6.3 复合音频视觉效果
音频文件 → AudioFeatureExtractor → FeatureMixer → FlexImageBloom
↓ ↑
TimeFeatureNode ──────────────┘
6.4 视频运动跟踪
视频帧 → OpticalFlowMaskModulation → ParticleEmitter → 运动跟踪粒子
6.5 MIDI音乐可视化
MIDI文件 → MIDIFeatureExtractor → FlexAudioVisualizerCircular → 音乐可视化
6.6 ACEStep AI音频处理
音频 → VAEEncodeAudio → ACEStepRepaintGuider → SamplerCustomAdvanced → VAEDecodeAudio → 处理后音频
7. 总结
ComfyUI_RyanOnTheInside是一个功能极其强大的音频反应式视觉效果插件包,包含约250个节点,涵盖了从基础音频处理到复杂粒子系统,再到最新AI音频技术的完整工具链。
主要特色:
- 音频反应性:几乎所有效果都能跟着音乐变化
- 粒子系统:专业级的粒子特效制作工具
- 光流检测:智能的运动追踪和分析
- MIDI支持:完整的电子音乐处理能力
- ACEStep AI:最新的AI音频生成和编辑技术
- 深度集成:与ComfyUI生态系统完美融合
适用场景:
- 音乐视频(MV)制作
- 音频可视化项目
- 交互式艺术装置
- 游戏特效制作
- 实验性视觉艺术
- AI音频内容创作
- 专业音频后期制作
这个插件包代表了ComfyUI在音频视觉领域的最前沿技术,特别是ACEStep系列节点引入了最新的AI音频处理能力,让音频创作进入了一个全新的时代。无论你是音乐制作人、视觉艺术家还是技术爱好者,都能在这里找到创作的无限可能。
记住,最好的学习方式就是动手实践,从简单的音频特征提取开始,逐步探索这个神奇的音视频世界!
重要提示:由于插件功能极其丰富,建议新手从基础节点开始学习,逐步掌握高级功能。同时关注插件的更新,因为作者经常添加新功能和改进现有功能。
8. 完整节点分析补充
以下是更多重要节点的详细解析:
8.1 ACEStep 音频AI处理节点系列
8.1.1 ACEStepRepaintGuider 节点 - 音频重绘引导器
这个节点就像一个"音频修复师",能在指定时间段重新生成音频内容。
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| model | model | MODEL | - | 要使用的AI模型 | 扩散模型 | 连接音频生成模型 |
| positive | positive | CONDITIONING | - | 正面提示词 | 正向条件 | 描述想要的音频特征 |
| negative | negative | CONDITIONING | - | 负面提示词 | 负向条件 | 描述不想要的音频特征 |
| cfg | cfg | 0-100 | 8.0 | 提示词遵循强度 | CFG引导强度 | 数值越高越严格遵循提示词 |
| source_latents | source_latents | LATENT | - | 原始音频的潜在表示 | 源音频潜在空间 | 连接音频编码器输出 |
| start_time | start_time | 0-1000 | 10.0 | 开始重绘的时间点(秒) | 重绘起始时间 | 10.0表示从第10秒开始 |
| end_time | end_time | 0-1000 | 20.0 | 结束重绘的时间点(秒) | 重绘结束时间 | 20.0表示到第20秒结束 |
| repaint_strength | repaint_strength | 0-1 | 0.7 | 重绘的强度 | 重绘程度 | 0.7表示70%重新生成 |
| feather_time | feather_time | 0-2 | 0.1 | 边缘羽化时间(秒) | 过渡平滑时间 | 0.1表示0.1秒的平滑过渡 |
8.1.2 ACEStepExtendGuider 节点 - 音频延长引导器
这个节点就像一个"音频延长器",能在音频的前后添加新内容。
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| model | model | MODEL | - | 要使用的AI模型 | 扩散模型 | 连接音频生成模型 |
| positive | positive | CONDITIONING | - | 正面提示词 | 正向条件 | 描述想要的音频特征 |
| negative | negative | CONDITIONING | - | 负面提示词 | 负向条件 | 描述不想要的音频特征 |
| cfg | cfg | 0-100 | 8.0 | 提示词遵循强度 | CFG引导强度 | 数值越高越严格遵循提示词 |
| source_latents | source_latents | LATENT | - | 原始音频的潜在表示 | 源音频潜在空间 | 连接音频编码器输出 |
| extend_left_time | extend_left_time | 0-100 | 0.0 | 向前延长的时间(秒) | 前向延长时长 | 5.0表示向前延长5秒 |
| extend_right_time | extend_right_time | 0-100 | 10.0 | 向后延长的时间(秒) | 后向延长时长 | 10.0表示向后延长10秒 |
8.1.3 AudioTemporalMask 节点 - 音频时间遮罩
这个节点就像一个"时间控制器",能创建基于时间的音频遮罩。
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| audio_latents | audio_latents | LATENT | - | 音频的潜在表示 | 音频潜在空间数据 | 连接音频编码器输出 |
| value | value | 0-1 | 0.5 | 遮罩的强度值 | 遮罩权重 | 0.5表示50%的混合强度 |
| length_mismatch | length_mismatch | repeat/loop | repeat | 长度不匹配时的处理方式 | 长度处理策略 | repeat重复最后值,loop循环 |
8.2 高级特征提取节点
8.2.1 PitchFeatureExtractor 节点 - 音高特征提取器
这个节点就像一个"音高分析师",能提取音频中的音高变化信息。
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| audio | audio | AUDIO | - | 要分析的音频 | 输入音频数据 | 连接音频文件 |
| method | method | 多种算法 | crepe | 选择音高检测算法 | 音高检测方法 | crepe精度高,yin速度快 |
| frame_rate | frame_rate | 1-120 | 30 | 每秒分析多少次 | 分析帧率 | 30表示每秒30次分析 |
| confidence_threshold | confidence_threshold | 0-1 | 0.5 | 音高检测的可信度阈值 | 置信度阈值 | 0.5表示50%以上可信度才采用 |
8.2.2 RhythmFeatureExtractor 节点 - 节奏特征提取器
这个节点就像一个"节拍大师",能提取音频中的节奏和节拍信息。
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| audio | audio | AUDIO | - | 要分析的音频 | 输入音频数据 | 连接音频文件 |
| tempo_method | tempo_method | 多种方法 | beat_track | 选择节拍检测方法 | 节拍检测算法 | beat_track适合大多数音乐 |
| frame_rate | frame_rate | 1-120 | 30 | 每秒分析多少次 | 分析帧率 | 30表示每秒30次分析 |
| hop_length | hop_length | 128-2048 | 512 | 分析窗口的跳跃长度 | 跳跃长度 | 数值越小分析越精细 |
8.2.3 WhisperFeatureNode 节点 - 语音识别特征提取器
这个节点就像一个"语音理解专家",能识别音频中的语音内容并转换为可用的特征。
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| audio | audio | AUDIO | - | 要识别的音频 | 输入音频数据 | 连接包含语音的音频 |
| model_size | model_size | 多种大小 | base | 选择识别模型大小 | Whisper模型规模 | base平衡速度和准确度 |
| language | language | 多种语言 | auto | 指定语音语言 | 语言识别设置 | auto自动检测语言 |
| word_timestamps | word_timestamps | True/False | True | 是否记录每个词的时间 | 词级时间戳 | True可以精确控制每个词 |
8.2.4 MIDIFeatureExtractor 节点 - MIDI特征提取器
这个节点就像一个"电子音乐翻译器",能从MIDI文件中提取音符、节拍等信息。
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| midi_file | midi_file | MIDI文件 | - | 要分析的MIDI文件 | MIDI文件路径 | 选择.mid格式的音乐文件 |
| track_number | track_number | 0以上 | 0 | 分析第几个音轨 | MIDI音轨索引 | 0是第一个音轨 |
| extraction_method | extraction_method | 多种方法 | velocity | 提取什么信息 | MIDI特征类型 | velocity是力度,pitch是音高 |
| frame_rate | frame_rate | 1-120 | 30 | 每秒分析多少次 | 时间分辨率 | 30表示每秒30次 |
8.3 高级图像效果节点
8.3.1 FlexImageKaleidoscope 节点 - 灵活万花筒效果
这个节点就像一个"魔法万花筒",能创建跟着音乐变化的万花筒效果。
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| images | images | IMAGE | - | 要处理的图片 | 输入图像数据 | 连接图片序列 |
| segments | segments | 2-32 | 8 | 万花筒的分段数 | 对称分段数量 | 8表示8个对称分段 |
| center_x | center_x | 0-1 | 0.5 | 万花筒中心X坐标 | 中心点X位置 | 0.5表示画面中央 |
| center_y | center_y | 0-1 | 0.5 | 万花筒中心Y坐标 | 中心点Y位置 | 0.5表示画面中央 |
| feature | feature | FEATURE | - | 控制效果的特征 | 特征控制信号 | 连接音频特征让效果跟着音乐变化 |
| rotation_speed | rotation_speed | 0-10 | 1 | 旋转速度 | 旋转角速度 | 数值越大旋转越快 |
8.3.2 FlexImageChromaticAberration 节点 - 灵活色差效果
这个节点就像一个"彩虹分光器",能创建跟着音乐变化的色差效果。
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| images | images | IMAGE | - | 要处理的图片 | 输入图像数据 | 连接图片序列 |
| intensity | intensity | 0-50 | 5 | 色差效果的强度 | 色差偏移强度 | 数值越大色差越明显 |
| direction | direction | 0-360 | 0 | 色差的方向 | 色差偏移方向 | 0是水平,90是垂直 |
| feature | feature | FEATURE | - | 控制效果的特征 | 特征控制信号 | 连接音频特征让效果跟着音乐变化 |
8.3.3 FlexImageGlitch 节点 - 灵活故障效果
这个节点就像一个"数字故障制造机",能创建跟着音乐变化的故障艺术效果。
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| images | images | IMAGE | - | 要处理的图片 | 输入图像数据 | 连接图片序列 |
| glitch_type | glitch_type | 多种类型 | digital | 选择故障效果类型 | 故障算法类型 | digital是数字故障,analog是模拟故障 |
| intensity | intensity | 0-1 | 0.3 | 故障效果的强度 | 故障程度 | 数值越大故障越严重 |
| feature | feature | FEATURE | - | 控制效果的特征 | 特征控制信号 | 连接音频特征让效果跟着音乐变化 |
| randomness | randomness | 0-1 | 0.5 | 故障的随机性 | 随机程度 | 0.5表示中等随机性 |
8.4 高级遮罩处理节点
8.4.1 FlexMaskVoronoiScheduled 节点 - 灵活泰森多边形遮罩
这个节点就像一个"细胞分裂模拟器",能创建跟着音乐变化的泰森多边形遮罩。
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| width | width | 64-2048 | 512 | 遮罩的宽度 | 图像宽度 | 512表示512像素宽 |
| height | height | 64-2048 | 512 | 遮罩的高度 | 图像高度 | 512表示512像素高 |
| num_points | num_points | 2-100 | 10 | 泰森多边形的种子点数量 | 种子点数量 | 10表示10个种子点 |
| feature | feature | FEATURE | - | 控制变化的特征 | 特征控制信号 | 连接音频特征让形状跟着音乐变化 |
| animation_speed | animation_speed | 0-10 | 1 | 动画变化速度 | 变化速率 | 数值越大变化越快 |
8.4.2 FlexMaskWavePropagation 节点 - 灵活波浪传播遮罩
这个节点就像一个"水波制造器",能创建跟着音乐传播的波浪遮罩。
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| width | width | 64-2048 | 512 | 遮罩的宽度 | 图像宽度 | 512表示512像素宽 |
| height | height | 64-2048 | 512 | 遮罩的高度 | 图像高度 | 512表示512像素高 |
| wave_speed | wave_speed | 0-10 | 1 | 波浪传播速度 | 波速 | 数值越大波浪传播越快 |
| wave_frequency | wave_frequency | 0.1-10 | 1 | 波浪的频率 | 波频 | 数值越大波浪越密集 |
| center_x | center_x | 0-1 | 0.5 | 波源中心X坐标 | 波源X位置 | 0.5表示画面中央 |
| center_y | center_y | 0-1 | 0.5 | 波源中心Y坐标 | 波源Y位置 | 0.5表示画面中央 |
| feature | feature | FEATURE | - | 控制波浪的特征 | 特征控制信号 | 连接音频特征让波浪跟着音乐变化 |
8.5 高级粒子系统节点
8.5.1 GravityWell 节点 - 重力井
这个节点就像一个"黑洞制造器",能创建吸引粒子的重力场。
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| center_x | center_x | 0-1 | 0.5 | 重力井中心X坐标 | 重力中心X位置 | 0.5表示画面中央 |
| center_y | center_y | 0-1 | 0.5 | 重力井中心Y坐标 | 重力中心Y位置 | 0.5表示画面中央 |
| strength | strength | 0-10 | 1 | 重力场强度 | 引力强度 | 数值越大吸引力越强 |
| radius | radius | 0-1 | 0.3 | 重力场影响范围 | 作用半径 | 0.3表示30%画面范围 |
| mass | mass | 0.1-10 | 1 | 重力井的质量 | 引力源质量 | 数值越大引力越强 |
8.5.2 ParticleColorModulation 节点 - 粒子颜色调制器
这个节点就像一个"粒子调色师",能让粒子的颜色跟着音乐变化。
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| base_color | base_color | 颜色值 | #FFFFFF | 粒子的基础颜色 | 基准颜色 | #FF0000是红色基调 |
| modulation_color | modulation_color | 颜色值 | #FF0000 | 调制目标颜色 | 调制颜色 | #0000FF是蓝色调制 |
| feature | feature | FEATURE | - | 控制颜色变化的特征 | 特征控制信号 | 连接音频特征让颜色跟着音乐变化 |
| intensity | intensity | 0-2 | 1 | 颜色调制强度 | 调制程度 | 数值越大颜色变化越明显 |
8.6 音频处理工具节点
8.6.1 AudioChannelSplit 节点 - 音频声道分离器
这个节点就像一个"声道分配器",能把立体声音频分离成左右声道。
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| audio | audio | AUDIO | - | 要分离的音频 | 输入音频数据 | 连接立体声音频文件 |
8.6.2 AudioChannelMerge 节点 - 音频声道合并器
这个节点就像一个"声道混合器",能把单声道音频合并成立体声。
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| left_audio | left_audio | AUDIO | - | 左声道音频 | 左声道数据 | 连接左声道音频 |
| right_audio | right_audio | AUDIO | - | 右声道音频 | 右声道数据 | 连接右声道音频 |
8.6.3 AudioPitchShift 节点 - 音频变调器
这个节点就像一个"变声器",能改变音频的音调高低,让声音变得更高或更低。
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| audio | audio | AUDIO | - | 要变调的音频 | 输入音频数据 | 连接音频文件 |
| pitch_shift | pitch_shift | -12到12 | 0 | 音调变化的半音数 | 音高偏移量 | 12表示高一个八度,-12表示低一个八度 |
| preserve_formants | preserve_formants | True/False | False | 是否保持音色特征 | 共振峰保持 | True保持原始音色,False允许音色变化 |
8.6.4 AudioTimeStretch 节点 - 音频时间拉伸器
这个节点就像一个"时间魔法师",能改变音频的播放速度而不改变音调。
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| audio | audio | AUDIO | - | 要拉伸的音频 | 输入音频数据 | 连接音频文件 |
| stretch_factor | stretch_factor | 0.5-2 | 1 | 时间拉伸倍数 | 时间缩放系数 | 2表示变慢一半,0.5表示变快一倍 |
| algorithm | algorithm | 多种算法 | phase_vocoder | 选择拉伸算法 | 时间拉伸算法 | phase_vocoder质量好但慢 |
8.7 视频处理节点
8.7.1 FlexVideoSpeed 节点 - 灵活视频速度控制器
这个节点就像一个"时间控制器",能让视频的播放速度跟着音乐或其他特征动态变化。
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| images | images | IMAGE | - | 要调速的视频帧 | 输入图像序列 | 连接视频帧序列 |
| base_speed | base_speed | 0.1-5 | 1 | 基础播放速度 | 基准速度倍数 | 1是正常速度,2是2倍速 |
| feature | feature | FEATURE | - | 控制速度变化的特征 | 特征控制信号 | 连接音频特征让速度跟着音乐变化 |
| speed_range | speed_range | 0.1-10 | 2 | 速度变化的范围 | 速度调制范围 | 2表示最快2倍,最慢0.5倍 |
8.7.2 FlexVideoDirection 节点 - 灵活视频方向控制器
这个节点就像一个"时间倒流器",能让视频跟着音乐正放或倒放。
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| images | images | IMAGE | - | 要处理的视频帧 | 输入图像序列 | 连接视频帧序列 |
| base_direction | base_direction | forward/reverse | forward | 基础播放方向 | 基准播放方向 | forward正放,reverse倒放 |
| feature | feature | FEATURE | - | 控制方向的特征 | 特征控制信号 | 连接音频特征动态控制方向 |
| threshold | threshold | 0-1 | 0.5 | 方向切换的阈值 | 切换阈值 | 0.5表示特征值超过0.5时切换 |
8.8 特征调制节点
8.8.1 FeatureMixer 节点 - 特征混合器
这个节点就像一个"DJ调音台",能把多个特征信号混合成一个新的特征。
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| feature_a | feature_a | FEATURE | - | 第一个特征信号 | 特征输入A | 连接音频特征 |
| feature_b | feature_b | FEATURE | - | 第二个特征信号 | 特征输入B | 连接时间特征 |
| mix_ratio | mix_ratio | 0-1 | 0.5 | 混合比例 | 混合权重 | 0.5表示各占一半 |
| operation | operation | 多种运算 | add | 选择混合方式 | 数学运算类型 | add是相加,multiply是相乘 |
8.8.2 FeatureOscillator 节点 - 特征振荡器
这个节点就像一个"信号发生器",能给特征添加振荡效果。
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| feature | feature | FEATURE | - | 要调制的特征 | 输入特征信号 | 连接任何特征信号 |
| oscillator_type | oscillator_type | 多种波形 | sine | 振荡器波形类型 | 波形类型 | sine是正弦波,square是方波 |
| frequency | frequency | 0.1-10 | 1 | 振荡频率 | 振荡频率 | 1表示每秒1次振荡 |
| amplitude | amplitude | 0-2 | 0.5 | 振荡幅度 | 振荡强度 | 0.5表示50%的振荡幅度 |
| phase | phase | 0-360 | 0 | 相位偏移 | 相位角度 | 90表示90度相位偏移 |
8.8.3 FeatureScaler 节点 - 特征缩放器
这个节点就像一个"音量调节器",能调整特征信号的强度范围。
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| feature | feature | FEATURE | - | 要缩放的特征 | 输入特征信号 | 连接任何特征信号 |
| input_min | input_min | 任意数值 | 0 | 输入的最小值 | 输入范围下限 | 原始特征的最小值 |
| input_max | input_max | 任意数值 | 1 | 输入的最大值 | 输入范围上限 | 原始特征的最大值 |
| output_min | output_min | 任意数值 | 0 | 输出的最小值 | 输出范围下限 | 想要的最小值 |
| output_max | output_max | 任意数值 | 1 | 输出的最大值 | 输出范围上限 | 想要的最大值 |
8.9 深度处理节点
8.9.1 DepthInjection 节点 - 深度注入器
这个节点就像一个"立体感注射器",能给平面图像注入深度信息,让它看起来有立体感。
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| images | images | IMAGE | - | 要注入深度的图片 | 输入图像数据 | 连接平面图片 |
| depth_maps | depth_maps | IMAGE | - | 深度信息图 | 深度图数据 | 连接深度图,白色表示近,黑色表示远 |
| strength | strength | 0-2 | 1 | 深度效果的强度 | 深度注入强度 | 数值越大立体感越强 |
| method | method | 多种方法 | parallax | 选择深度处理方式 | 深度处理算法 | parallax创建视差效果 |
8.9.2 DepthBlender 节点 - 深度混合器
这个节点就像一个"深度调色师",能混合多个深度图创建复杂的深度效果。
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| depth_a | depth_a | IMAGE | - | 第一个深度图 | 深度图A | 连接第一个深度图 |
| depth_b | depth_b | IMAGE | - | 第二个深度图 | 深度图B | 连接第二个深度图 |
| blend_mode | blend_mode | 多种模式 | average | 混合模式 | 混合算法 | average是平均混合 |
| blend_factor | blend_factor | 0-1 | 0.5 | 混合比例 | 混合权重 | 0.5表示各占一半 |
8.10 工具类节点
8.10.1 Color_Picker 节点 - 颜色选择器
这个节点就像一个"调色盘",让你选择和调配各种颜色。
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| color | color | 颜色值 | #FF0000 | 选择的颜色 | RGB颜色代码 | #FF0000是红色,#00FF00是绿色 |
| alpha | alpha | 0-1 | 1 | 颜色的透明度 | Alpha通道值 | 1是完全不透明,0是完全透明 |
8.10.2 Knob 节点 - 旋钮控制器
这个节点就像一个"调节旋钮",提供一个简单的数值控制接口。
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| value | value | 0-1 | 0.5 | 旋钮的当前值 | 控制参数值 | 0.5表示中间位置 |
| min_value | min_value | 任意数值 | 0 | 最小值 | 参数下限 | 设置旋钮能调到的最小值 |
| max_value | max_value | 任意数值 | 1 | 最大值 | 参数上限 | 设置旋钮能调到的最大值 |
8.10.3 ImageDifference 节点 - 图像差异检测器
这个节点就像一个"找不同游戏",能检测两张图片之间的差异。
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| image_a | image_a | IMAGE | - | 第一张图片 | 参考图像 | 连接要比较的第一张图 |
| image_b | image_b | IMAGE | - | 第二张图片 | 对比图像 | 连接要比较的第二张图 |
| method | method | 多种方法 | absolute | 选择差异计算方式 | 差异算法 | absolute计算绝对差异 |
| threshold | threshold | 0-1 | 0.1 | 差异检测的敏感度 | 差异阈值 | 数值越小越敏感 |
8.10.4 Doom_ 节点 - 毁灭战士游戏
这个节点就像一个"隐藏的彩蛋",居然在ComfyUI里内置了经典的毁灭战士游戏!
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| enable_game | enable_game | True/False | False | 是否启用游戏 | 游戏启用开关 | True开启游戏,False关闭 |
| width | width | 320-1920 | 640 | 游戏画面宽度 | 渲染分辨率宽度 | 640是经典分辨率 |
| height | height | 240-1080 | 480 | 游戏画面高度 | 渲染分辨率高度 | 480是经典分辨率 |
9. 节点分类总结
9.1 按功能分类统计
-
音频处理类 (约50个节点)
- 基础音频处理:AudioSeparatorSimple, AudioPitchShift, AudioTimeStretch等
- 音频特征提取:AudioFeatureExtractor, PitchFeatureExtractor, RhythmFeatureExtractor等
- 音频工具:AudioChannelSplit, AudioChannelMerge, AudioVolumeNormalization等
- ACEStep AI音频:ACEStepRepaintGuider, ACEStepExtendGuider等
-
特征处理类 (约40个节点)
- 特征提取:TimeFeatureNode, DepthFeatureNode, ColorFeatureNode等
- 特征调制:FeatureMixer, FeatureOscillator, FeatureAccumulate等
- 特征转换:FeatureToFloat, FeatureToMask等
-
遮罩处理类 (约35个节点)
- 基础遮罩:FlexMaskMorph, FlexMaskWarp, FlexMaskTransform等
- 高级遮罩:FlexMaskVoronoiScheduled, FlexMaskWavePropagation等
- 遮罩工具:TextMaskNode, MovingShape等
-
图像效果类 (约30个节点)
- 基础效果:FlexImageBloom, FlexImageContrast, FlexImageHueShift等
- 高级效果:FlexImageKaleidoscope, FlexImageChromaticAberration, FlexImageGlitch等
- 图像工具:DyeImage, ImageScaleToTarget等
-
粒子系统类 (约20个节点)
- 粒子发射:ParticleEmitter, EmitterMovement等
- 力场系统:Vortex, GravityWell等
- 粒子调制:ParticleColorModulation, ParticleSizeModulation等
-
视频处理类 (约15个节点)
- 视频效果:FlexVideoSpeed, FlexVideoDirection, FlexVideoFrameBlend等
- 光流检测:OpticalFlowMaskModulation, OpticalFlowDirectionMask等
-
深度处理类 (约10个节点)
- 深度效果:DepthInjection, DepthBlender, DepthRippleEffect等
- 深度工具:DepthShapeModifier等
-
工具类节点 (约40个节点)
- 数据处理:ImageChunks, SwapDevice, ImageDifference等
- 颜色工具:Color_Picker等
- 其他工具:Knob, Doom_等
9.2 使用难度分级
初级节点(新手推荐):
- TimeFeatureNode - 时间特征生成
- Color_Picker - 颜色选择
- Knob - 数值控制
- AudioFeatureExtractor - 音频特征提取
- FlexMaskMorph - 基础遮罩变形
中级节点(有一定基础后使用):
- ParticleEmitter - 粒子发射器
- FlexImageBloom - 图像光晕效果
- FeatureMixer - 特征混合
- OpticalFlowMaskModulation - 光流检测
- MIDIFeatureExtractor - MIDI特征提取
高级节点(需要深入理解):
- ACEStepRepaintGuider - AI音频重绘
- FlexMaskVoronoiScheduled - 泰森多边形遮罩
- FeatureAccumulate - 特征累积
- FlexVideoFrameBlend - 视频帧混合
- WhisperFeatureNode - 语音识别特征
专家级节点(需要专业知识):
- AudioSeparatorSimple - 音频分离
- LatentFrequencyBlender - 潜在频率混合
- DepthShapeModifierPrecise - 精确深度形状修改
- SplineFeatureModulator - 样条特征调制
9.3 推荐学习路径
第一阶段:基础入门(1-2周)
- 学习基础概念:什么是特征、遮罩、粒子
- 掌握基础节点:TimeFeatureNode, Color_Picker, Knob
- 尝试简单的音频特征提取:AudioFeatureExtractor
- 制作第一个音频反应效果:FlexMaskMorph
第二阶段:进阶应用(2-4周)
- 学习特征处理:FeatureMixer, FeatureScaler
- 掌握粒子系统:ParticleEmitter, Vortex
- 尝试图像效果:FlexImageBloom, FlexImageKaleidoscope
- 制作复合效果工作流
第三阶段:高级技巧(1-2个月)
- 学习光流检测:OpticalFlowMaskModulation
- 掌握MIDI处理:MIDIFeatureExtractor, MIDILoader
- 尝试语音识别:WhisperFeatureNode
- 制作专业级音乐可视化
第四阶段:专家级应用(持续学习)
- 学习ACEStep AI音频处理
- 掌握深度图处理技术
- 探索高级特征调制
- 开发自定义工作流模板
这个插件包真正体现了"从入门到精通"的完整学习路径,无论你是想制作简单的音乐可视化还是复杂的交互式艺术装置,都能在这里找到合适的工具和成长空间。