ComfyUI 魔法书 Logo
🏠 首页
👥 加群
😎 大帅比
❤️‍🔥 Monster 社区
登录 →
ComfyUI 魔法书 Logo
🏠 首页 👥 加群 😎 大帅比 ❤️‍🔥 Monster 社区
登录
  1. 首页
  2. 🧩 插件工坊 (Plugin Workshop)
  3. ComfyUI Mixlab插件使用教程:从入门到精通

ComfyUI Mixlab插件使用教程:从入门到精通

0
  • 🧩 插件工坊 (Plugin Workshop)
  • 发布于 2025-06-27
  • 431 次阅读
编程界的小学生
编程界的小学生

【版权严正声明】

本文系作者 [编程界的小学生] 原创,并拥有完整、独立的著作权。

未经本人 书面授权 ,任何单位、平台或个人, 严禁 以任何形式(包括但不限于转载、复制、摘编、修改、链接、转贴、建立镜像等)使用本文的全部或部分内容。

任何无视本声明的侵权行为,本人将依据《中华人民共和国著作权法》等相关法律法规,采取一切必要的法律手段,追究其侵权责任,要求其 立即停止侵权、赔礼道歉、消除影响,并赔偿因此造成的一切经济损失及维权成本(包括但不限于律师费、诉讼费、公证费等)。

侵权必究,切勿以身试法!

插件简介

ComfyUI Mixlab 插件是一个功能强大的 ComfyUI 扩展包,提供了超过 100 个实用节点,涵盖图像处理、音频处理、视频处理、AI 对话、3D 处理等多个领域。

GitHub 地址: https://github.com/MixLabPro/comfyui-mixlab-nodes

这个插件就像一个超级工具箱,里面装满了各种好用的小工具。无论你是想做图片美化、音频处理,还是想玩转 AI 对话,这个插件都能帮到你。

如何安装

方法一:通过 ComfyUI Manager 安装(推荐)

  1. 打开 ComfyUI Manager

  2. 搜索 "mixlab"

  3. 找到 "comfyui-mixlab-nodes" 点击安装

  4. 重启 ComfyUI

方法二:手动安装

  1. 进入 ComfyUI 的 custom_nodes 目录

  2. 运行命令:git clone https://github.com/MixLabPro/comfyui-mixlab-nodes.git

  3. 进入插件目录:cd comfyui-mixlab-nodes

  4. 安装依赖:pip install -r requirements.txt

  5. 重启 ComfyUI

节点详细解析

当前插件包含节点总数:约 120+ 个节点

1. 提示词相关节点

1.1 Random Prompt(随机提示词)

这个节点就像一个提示词生成器,能帮你快速生成各种组合的提示词。

参数名 (UI显示)

参数名 (代码里)

参数值

建议值

通俗解释

专业解释

怎么用/举个例子

最大数量

max_count

1-1000

9

最多生成多少个提示词

控制输出提示词的数量上限

设置为10,就会生成10个不同的提示词组合

可变提示词

mutable_prompt

文本

默认游乐场设备列表

会变化的部分,每行一个

用于替换的可变内容列表

输入"红色\n蓝色\n绿色",每行一个颜色

固定提示词

immutable_prompt

文本

"sticker, Cartoon, " | 不变的部分,用标记替换位置

固定的提示词模板

"一个的苹果",会被可变内容替换

随机采样

random_sample

enable/disable

enable

是否随机选择组合

控制是否随机选择生成的组合

开启后会随机选择,关闭后按顺序选择

1.2 Embedding Prompt(嵌入提示词)

这个节点帮你使用训练好的嵌入文件来增强提示词效果。

参数名 (UI显示)

参数名 (代码里)

参数值

建议值

通俗解释

专业解释

怎么用/举个例子

嵌入文件

embedding

文件列表

选择已有文件

选择你要用的嵌入文件

选择预训练的embedding文件

选择"badhandv4"来改善手部生成

权重

weight

-2到2

1

这个嵌入的影响强度

控制embedding的影响程度

设置1.2会增强效果,0.8会减弱效果

1.3 Prompt Slide(提示词滑块)

这个节点让你可以调节单个关键词的权重,就像调音量一样简单。

参数名 (UI显示)

参数名 (代码里)

参数值

建议值

通俗解释

专业解释

怎么用/举个例子

提示词关键词

prompt_keyword

文本

空

你要调节的关键词

需要调整权重的提示词

输入"beautiful"来调节美丽程度

权重

weight

-3到3

1

这个词的重要程度

关键词的权重值

1.5表示加强,0.5表示减弱

1.4 Prompt Simplification(提示词简化)

这个节点帮你把复杂的提示词简化成不同长度的版本。

参数名 (UI显示)

参数名 (代码里)

参数值

建议值

通俗解释

专业解释

怎么用/举个例子

提示词

prompt

文本

空

你要简化的长提示词

输入的原始提示词

输入一长串用逗号分隔的提示词

长度

length

1-100

5

简化后保留多少个词

简化后的提示词长度

设置5就保留前5个最重要的词

2. 输入相关节点

2.1 Grid Input(网格输入)

这个节点让你可以在图片上画框框,标记不同的区域。

参数名 (UI显示)

参数名 (代码里)

参数值

建议值

通俗解释

专业解释

怎么用/举个例子

网格数据

grids

JSON文本

空

包含框框位置信息的数据

网格区域的坐标数据

从其他节点传入的区域坐标信息

边距

padding

-500到5000

24

框框周围的空白距离

网格区域的内边距

设置24会在框框周围留24像素的空白

2.2 Images Input(图片输入)

这个节点让你直接输入base64格式的图片数据。

参数名 (UI显示)

参数名 (代码里)

参数值

建议值

通俗解释

专业解释

怎么用/举个例子

图片base64

image_base64

文本

空

图片的编码数据

base64编码的图片数据

粘贴从网页复制的图片数据

文本

text

文本

空

配合图片的描述文字

与图片相关的文本信息

输入对图片的描述或标签

2.3 API Key Input(API密钥输入)

这个节点专门用来输入各种API的密钥,保护你的隐私信息。

参数名 (UI显示)

参数名 (代码里)

参数值

建议值

通俗解释

专业解释

怎么用/举个例子

密钥

key

文本

空

你的API访问密钥

API服务的认证密钥

输入OpenAI的API密钥来使用GPT

2.4 Float Slider Input(浮点数滑块输入)

这个节点提供一个可调节的滑块,用来输入小数。

参数名 (UI显示)

参数名 (代码里)

参数值

建议值

通俗解释

专业解释

怎么用/举个例子

数值

number

浮点数

0

当前的数值

滑块的当前值

调节到0.75表示75%的强度

最小值

min_value

浮点数

0

滑块的最小值

允许的最小数值

设置0表示最小不能低于0

最大值

max_value

浮点数

1

滑块的最大值

允许的最大数值

设置2表示最大不能超过2

步长

step

浮点数

0.001

每次调节的最小单位

滑块调节的精度

0.01表示每次调节0.01

2.5 Int Input(整数输入)

这个节点用来输入整数,比如图片尺寸、步数等。

参数名 (UI显示)

参数名 (代码里)

参数值

建议值

通俗解释

专业解释

怎么用/举个例子

数值

number

整数

0

当前的整数值

输入的整数数值

输入512表示512像素

最小值

min_value

整数

0

允许的最小整数

数值的下限

设置1表示最小为1

最大值

max_value

整数

1

允许的最大整数

数值的上限

设置2048表示最大2048

步长

step

整数

1

每次增减的数量

调节的步进值

设置8表示每次调节8的倍数

3. 图像处理节点

3.1 Mirrored Image(镜像图片)

这个节点就像照镜子一样,把图片左右翻转。

参数名 (UI显示)

参数名 (代码里)

参数值

建议值

通俗解释

专业解释

怎么用/举个例子

图片

image

IMAGE

必需

要翻转的图片

输入的图像数据

连接任何图片输出到这里

3.2 Noise Image(噪声图片)

这个节点创建带有随机噪点的图片,就像老电视的雪花屏。

参数名 (UI显示)

参数名 (代码里)

参数值

建议值

通俗解释

专业解释

怎么用/举个例子

宽度

width

1-8192

512

图片的宽度

生成图像的宽度像素

设置1024生成1024像素宽的图

高度

height

1-8192

512

图片的高度

生成图像的高度像素

设置768生成768像素高的图

噪声强度

noise_level

0-8192

128

噪点的强烈程度

噪声的强度级别

128是中等噪声,255是最强噪声

背景颜色

color_hex

颜色代码

#FFFFFF

图片的底色

背景颜色的十六进制值

#FF0000是红色,#00FF00是绿色

3.3 Gradient Image(渐变图片)

这个节点创建颜色渐变的图片,就像彩虹一样从一种颜色慢慢变成另一种颜色。

参数名 (UI显示)

参数名 (代码里)

参数值

建议值

通俗解释

专业解释

怎么用/举个例子

宽度

width

1-8192

512

图片宽度

渐变图像的宽度

设置800创建800像素宽的渐变

高度

height

1-8192

512

图片高度

渐变图像的高度

设置600创建600像素高的渐变

起始颜色

start_color_hex

颜色代码

#FFFFFF

渐变开始的颜色

渐变起点的颜色值

#FF0000表示从红色开始

结束颜色

end_color_hex

颜色代码

#000000

渐变结束的颜色

渐变终点的颜色值

#0000FF表示到蓝色结束

3.4 Transparent Image(透明图片)

这个节点根据蒙版把图片的某些部分变透明,就像用橡皮擦擦掉一样。

参数名 (UI显示)

参数名 (代码里)

参数值

建议值

通俗解释

专业解释

怎么用/举个例子

图片

images

IMAGE

必需

要处理的图片

输入的图像数据

连接任何图片到这里

蒙版

masks

MASK

必需

决定哪里透明的蒙版

控制透明度的遮罩

白色区域保留,黑色区域变透明

反转

invert

yes/no

yes

是否反转蒙版效果

是否反转遮罩的作用

yes表示黑色变透明,no表示白色变透明

保存

save

yes/no

yes

是否保存到文件

是否将结果保存为文件

yes会保存到输出文件夹

3.5 Resize Image(调整图片大小)

这个节点就像拉伸或缩小图片,可以改变图片的尺寸。

参数名 (UI显示)

参数名 (代码里)

参数值

建议值

通俗解释

专业解释

怎么用/举个例子

宽度

width

1-8192

512

目标宽度

调整后的图像宽度

设置1024把图片宽度改为1024

高度

height

1-8192

512

目标高度

调整后的图像高度

设置768把图片高度改为768

缩放选项

scale_option

width/height/overall/center

width

按什么方式缩放

图像缩放的方式

width按宽度比例,height按高度比例

平均颜色

average_color

on/off

on

是否使用图片平均色填充

是否用平均色填充空白区域

on会用图片主色调填充空白

填充颜色

fill_color

颜色代码

#FFFFFF

空白区域的填充色

填充区域的颜色

#000000用黑色填充空白区域

4. 音频处理节点

4.1 Speech Recognition(语音识别)

这个节点就像一个听写员,能把语音转换成文字。

参数名 (UI显示)

参数名 (代码里)

参数值

建议值

通俗解释

专业解释

怎么用/举个例子

音频上传

upload

AUDIOINPUTMIX

必需

要识别的音频文件

输入的音频数据

上传一段录音或音频文件

开始时间

start_by

0-2048

0

从第几秒开始识别

音频识别的起始时间点

设置10表示从第10秒开始识别

4.2 Speech Synthesis(语音合成)

这个节点就像一个播音员,能把文字转换成语音。

参数名 (UI显示)

参数名 (代码里)

参数值

建议值

通俗解释

专业解释

怎么用/举个例子

文本

text

STRING

必需

要转换成语音的文字

需要合成语音的文本

输入"你好世界"生成对应语音

4.3 Preview Audio(音频预览)

这个节点让你可以直接在ComfyUI里播放音频,就像音乐播放器。

参数名 (UI显示)

参数名 (代码里)

参数值

建议值

通俗解释

专业解释

怎么用/举个例子

音频

audio

AUDIO

必需

要播放的音频数据

输入的音频流数据

连接任何音频输出到这里播放

5. 视频处理节点

5.1 Load Video And Segment(加载并分割视频)

这个节点就像视频剪辑师,能把长视频切成小段。

参数名 (UI显示)

参数名 (代码里)

参数值

建议值

通俗解释

专业解释

怎么用/举个例子

视频

video

文件列表

选择文件

要处理的视频文件

输入的视频文件

选择一个MP4或其他视频文件

视频段帧数

video_segment_frames

-1以上

10

每段包含多少帧

每个视频片段的帧数

设置30表示每段30帧(约1秒)

过渡帧数

transition_frames

0以上

0

段与段之间重叠的帧数

片段间的过渡帧数量

设置5表示段间有5帧重叠

5.2 Video Combine(视频合成)

这个节点就像视频制作软件,能把图片序列合成为视频。

参数名 (UI显示)

参数名 (代码里)

参数值

建议值

通俗解释

专业解释

怎么用/举个例子

图片批次

image_batch

IMAGE

必需

要合成的图片序列

输入的图像批次数据

连接一系列图片到这里

帧率

frame_rate

1以上

8

每秒播放多少张图片

视频的帧率设置

设置24表示每秒24帧,更流畅

循环次数

loop_count

0-100

0

视频重复播放次数

视频循环播放的次数

0表示无限循环,1表示播放一次

文件名前缀

filename_prefix

文本

Comfyui

输出文件的名字开头

生成文件的命名前缀

设置"MyVideo"生成MyVideo_xxx.mp4

格式

format

格式列表

image/gif

输出什么格式的文件

输出视频的文件格式

选择video/mp4生成MP4视频

6. AI对话节点

6.1 ChatGPT & Local LLM(ChatGPT和本地大语言模型)

这个节点就像一个聊天机器人,能和AI进行对话。

参数名 (UI显示)

参数名 (代码里)

参数值

建议值

通俗解释

专业解释

怎么用/举个例子

提示词

prompt

文本

空

你想问AI的问题

发送给AI的提示内容

输入"请帮我写一首诗"

系统内容

system_content

文本

默认系统提示

告诉AI它的角色定位

AI的系统角色设定

"你是一个专业的翻译助手"

模型

model

模型列表

gpt-3.5-turbo

选择使用哪个AI模型

选择的语言模型

gpt-4更聪明但更贵

种子

seed

0以上

0

控制回答的随机性

随机种子值

相同种子会得到相似回答

上下文大小

context_size

0-30

1

记住多少轮对话

保持的对话历史长度

设置5会记住最近5轮对话

API地址

api_url

地址列表

openai

选择API服务商

API服务的地址

选择不同的服务商

6.2 LLM Siliconflow(硅基流动大语言模型)

这个节点专门连接硅基流动的免费AI服务。

参数名 (UI显示)

参数名 (代码里)

参数值

建议值

通俗解释

专业解释

怎么用/举个例子

API密钥

api_key

文本

必需

硅基流动的访问密钥

SiliconFlow的API密钥

在硅基流动官网申请免费密钥

提示词

prompt

文本

空

你的问题或指令

发送给模型的提示

"帮我总结这段文字的要点"

系统内容

system_content

文本

默认

AI的角色设定

系统级别的角色提示

"你是一个代码助手"

模型

model

模型列表

Qwen2.5-7B

选择使用的模型

具体的语言模型

Qwen2.5更新更强大

最大令牌数

max_tokens

512-200000

512

回答的最大长度

生成文本的最大长度

1000表示最多生成1000个字符

7. 蒙版处理节点

7.1 Smooth Mask(平滑蒙版)

这个节点就像给蒙版边缘磨砂,让边缘更柔和。

参数名 (UI显示)

参数名 (代码里)

参数值

建议值

通俗解释

专业解释

怎么用/举个例子

蒙版

mask

MASK

必需

要平滑的蒙版

输入的遮罩数据

连接任何蒙版到这里

平滑度

smoothness

0-150

1

边缘模糊的程度

高斯模糊的强度

数值越大边缘越模糊

7.2 Feathered Mask(羽化蒙版)

这个节点给蒙版添加羽化效果,让边缘有渐变过渡。

参数名 (UI显示)

参数名 (代码里)

参数值

建议值

通俗解释

专业解释

怎么用/举个例子

蒙版

mask

MASK

必需

要羽化的蒙版

输入的遮罩数据

连接蒙版到这里处理

起始偏移

start_offset

-150到150

1

羽化开始的位置

羽化效果的起始偏移

正数向外羽化,负数向内羽化

羽化权重

feathering_weight

0-1

0.1

羽化效果的强度

羽化混合的权重

0.5表示50%的羽化强度

7.3 Face To Mask(人脸转蒙版)

这个节点能自动识别图片中的人脸,并创建对应的蒙版。

参数名 (UI显示)

参数名 (代码里)

参数值

建议值

通俗解释

专业解释

怎么用/举个例子

图片

image

IMAGE

必需

包含人脸的图片

输入的图像数据

连接一张有人脸的照片

8. 工具类节点

8.1 Math Operation(数学运算)

这个节点就像计算器,能对数字进行加减乘除运算。

参数名 (UI显示)

参数名 (代码里)

参数值

建议值

通俗解释

专业解释

怎么用/举个例子

数字A

numberA

任意类型

必需

要计算的第一个数

输入的数值A

可以是整数或小数

乘以

multiply_by

浮点数

1

乘法运算的数

乘数值

设置2表示乘以2

加上

add_by

浮点数

0

加法运算的数

加数值

设置10表示加上10

8.2 Text To Number(文本转数字)

这个节点能从文本中提取数字,就像从句子里找数字。

参数名 (UI显示)

参数名 (代码里)

参数值

建议值

通俗解释

专业解释

怎么用/举个例子

文本

text

文本

"1"

包含数字的文本

输入的文本字符串

"我有5个苹果"会提取出5

随机数字

random_number

enable/disable

disable

是否生成随机数

是否启用随机数生成

开启后会生成随机数而不是提取

最大数

max_num

2以上

10

随机数的最大值

随机数生成的上限

设置100会生成1-100的随机数

8.3 Dynamic Delay By Text(文本动态延迟)

这个节点根据文本长度来控制延迟时间,文字越多延迟越长。

参数名 (UI显示)

参数名 (代码里)

参数值

建议值

通俗解释

专业解释

怎么用/举个例子

延迟秒数

delay_seconds

0-1000000

1

基础延迟时间

固定的延迟时间

设置3表示至少延迟3秒

延迟文本

delay_by_text

文本

空

用来计算延迟的文本

根据长度计算延迟的文本

输入长文本会增加延迟时间

每秒字数

words_per_seconds

0-1000

1.5

每秒处理多少字

文本处理的速度

1.5表示每秒处理1.5个字

9. 3D处理节点

9.1 3D Image(3D图像)

这个节点处理3D模型和相关的图像数据。

参数名 (UI显示)

参数名 (代码里)

参数值

建议值

通俗解释

专业解释

怎么用/举个例子

3D上传

upload

THREED

必需

3D模型文件

3D模型数据

上传GLB或其他3D格式文件

材质

material

IMAGE

可选

3D模型的贴图材质

3D对象的纹理贴图

连接一张纹理图片

9.2 Depth Viewer(深度查看器)

这个节点用来可视化深度图,就像看3D电影的深度效果。

参数名 (UI显示)

参数名 (代码里)

参数值

建议值

通俗解释

专业解释

怎么用/举个例子

图片

image

IMAGE

必需

原始图片

参考图像

连接彩色图片

深度图

depth_map

IMAGE

必需

对应的深度信息

深度图数据

连接深度图或法线图

10. 屏幕分享节点

10.1 Screen Share(屏幕分享)

这个节点能捕获屏幕内容,就像录屏软件。

参数名 (UI显示)

参数名 (代码里)

参数值

建议值

通俗解释

专业解释

怎么用/举个例子

图片base64

image_base64

CHEESE

必需

屏幕截图数据

屏幕捕获的图像数据

自动捕获当前屏幕内容

刷新率

refresh_rate

0以上

500

多久更新一次屏幕

屏幕刷新的间隔时间

500表示每500毫秒更新一次

11. 背景移除节点

11.1 Remove Background(背景移除)

这个节点就像魔术橡皮擦,能自动识别并移除图片背景。

参数名 (UI显示)

参数名 (代码里)

参数值

建议值

通俗解释

专业解释

怎么用/举个例子

图片

image

IMAGE

必需

要去背景的图片

输入的图像数据

连接任何图片到这里

模型名称

model_name

模型列表

u2net

选择去背景的AI模型

背景移除使用的模型

u2net适合一般图片,isnet适合复杂背景

12. 提示词生成节点

12.1 Prompt Generate(提示词生成)

这个节点就像一个创意助手,能根据简单的词语生成丰富的提示词。

参数名 (UI显示)

参数名 (代码里)

参数值

建议值

通俗解释

专业解释

怎么用/举个例子

文本

text

文本

空

简单的关键词

用于生成的种子文本

输入"cat"生成关于猫的详细描述

多条输出

multiple

on/off

off

是否输出多个版本

是否生成多个变体

on会生成多个不同的提示词

种子

seed

100以上

100

控制生成的随机性

随机种子值

相同种子生成相同结果

12.2 Chinese Prompt(中文提示词)

这个节点专门处理中文提示词,能把中文转换成英文并优化。

参数名 (UI显示)

参数名 (代码里)

参数值

建议值

通俗解释

专业解释

怎么用/举个例子

文本

text

文本

空

中文提示词

输入的中文文本

输入"一只可爱的小猫"

生成模式

generation

on/off

off

是否扩展生成更多内容

是否启用文本生成

on会基于翻译结果生成更多描述

种子

seed

100以上

100

控制翻译和生成的随机性

随机种子值

固定种子确保结果一致

13. 图像分析节点

13.1 Clip Interrogator(图像反推提示词)

这个节点就像一个图片解说员,能看图说话,分析图片内容并生成对应的提示词。

参数名 (UI显示)

参数名 (代码里)

参数值

建议值

通俗解释

专业解释

怎么用/举个例子

图片

image

IMAGE

必需

要分析的图片

输入的图像数据

连接任何图片进行分析

提示词模式

prompt_mode

fast/classic/best/negative

fast

分析的详细程度

不同的分析算法

fast速度快,best质量高但慢

图像分析

image_analysis

on/off

off

是否进行深度分析

是否分析艺术风格等

on会分析艺术家风格、流派等

14. 文本处理节点

14.1 Show Text(显示文本)

这个节点就像一个文本显示器,能把文字内容保存到文件并显示。

参数名 (UI显示)

参数名 (代码里)

参数值

建议值

通俗解释

专业解释

怎么用/举个例子

文本

text

文本

必需

要显示的文字内容

输入的文本数据

连接任何文本输出到这里

输出目录

output_dir

文本

空

保存文件的位置

文件保存路径

留空会保存到临时目录

14.2 Character In Text(文本中的字符)

这个节点就像文字侦探,能检查文本中是否包含特定字符。

参数名 (UI显示)

参数名 (代码里)

参数值

建议值

通俗解释

专业解释

怎么用/举个例子

文本

text

文本

空

要检查的文本

输入的文本内容

输入"hello world"

字符

character

文本

空

要查找的字符

搜索的目标字符

输入"world"检查是否包含

起始索引

start_index

0-1024

1

找到时返回的基础数字

基础索引值

找到返回1+基础值,没找到返回基础值

14.3 Text Split By Delimiter(按分隔符分割文本)

这个节点就像文字切割器,能按照指定符号把长文本切成小段。

参数名 (UI显示)

参数名 (代码里)

参数值

建议值

通俗解释

专业解释

怎么用/举个例子

文本

text

文本

空

要分割的长文本

输入的文本内容

输入"苹果,香蕉,橘子"

分隔符

delimiter

文本

","

用什么符号分割

分割文本的标记

用","分割会得到三个水果名

起始索引

start_index

0-1000

0

从第几个开始取

开始提取的位置

设置1会跳过第一个结果

跳过间隔

skip_every

0-10

0

每隔几个取一个

提取的间隔数

设置1会隔一个取一个

最大数量

max_count

1-1000

10

最多取几个

提取结果的数量限制

设置5最多返回5个结果

15. JSON处理节点

15.1 Json Repair(JSON修复)

这个节点就像JSON医生,能修复格式错误的JSON数据。

参数名 (UI显示)

参数名 (代码里)

参数值

建议值

通俗解释

专业解释

怎么用/举个例子

JSON字符串

json_string

文本

必需

有问题的JSON数据

需要修复的JSON文本

输入格式错误的JSON

键名

key

文本

空

要提取的特定字段

JSON中的键名

输入"name"提取name字段的值

JSON字符串2

json_string2

文本

可选

要合并的第二个JSON

可选的额外JSON数据

用于合并两个JSON对象

16. 高级视频节点

16.1 VAE Encode For Inpaint Frames(视频帧修复编码)

这个节点专门处理视频修复,为每一帧准备修复数据。

参数名 (UI显示)

参数名 (代码里)

参数值

建议值

通俗解释

专业解释

怎么用/举个例子

VAE

vae

VAE

必需

编码器模型

VAE编码器

连接VAE模型

图片

images

IMAGE

必需

视频帧图片

输入的图像序列

连接视频帧数据

蒙版

masks

MASK

必需

每帧的修复蒙版

对应的遮罩序列

连接蒙版数据

蒙版扩展

grow_mask_by

0-64

6

蒙版边缘扩展像素

遮罩扩展的像素数

6表示向外扩展6像素

16.2 Generate Frames By Count(按数量生成帧)

这个节点能根据指定数量生成视频帧,支持往返循环。

参数名 (UI显示)

参数名 (代码里)

参数值

建议值

通俗解释

专业解释

怎么用/举个例子

帧序列

frames

IMAGE

必需

原始帧序列

输入的图像序列

连接图片序列

帧数量

frame_count

1以上

72

要生成多少帧

目标帧数

设置100生成100帧

往返模式

revert

True/False

True

是否往返循环播放

是否启用往返效果

True会正向+反向播放

17. 3D和特效节点

17.1 Load TripoSR Model(加载TripoSR模型)

这个节点加载3D重建模型,能把2D图片变成3D模型。

参数名 (UI显示)

参数名 (代码里)

参数值

建议值

通俗解释

专业解释

怎么用/举个例子

模型路径

model_path

文本

默认路径

3D模型文件位置

TripoSR模型的路径

使用默认路径或指定自定义路径

17.2 TripoSR Sampler(TripoSR采样器)

这个节点执行3D重建,把平面图片转换成立体模型。

参数名 (UI显示)

参数名 (代码里)

参数值

建议值

通俗解释

专业解释

怎么用/举个例子

模型

model

TRIPOSR_MODEL

必需

3D重建模型

TripoSR模型实例

连接加载的模型

图片

image

IMAGE

必需

要转3D的图片

输入的2D图像

连接任何图片

采样步数

steps

1以上

50

3D重建的精度

采样迭代次数

步数越多质量越好但越慢

18. 语音处理节点

18.1 Load Whisper Model(加载Whisper模型)

这个节点加载语音识别模型,为语音转文字做准备。

参数名 (UI显示)

参数名 (代码里)

参数值

建议值

通俗解释

专业解释

怎么用/举个例子

模型大小

model_size

tiny/base/small/medium/large

base

模型的大小级别

Whisper模型规格

base平衡速度和准确度

设备

device

auto/cpu/cuda

auto

运行设备

计算设备选择

auto自动选择最佳设备

18.2 Whisper Transcribe(Whisper转录)

这个节点执行语音转文字,把音频内容转换成文本。

参数名 (UI显示)

参数名 (代码里)

参数值

建议值

通俗解释

专业解释

怎么用/举个例子

模型

model

WHISPER_MODEL

必需

语音识别模型

Whisper模型实例

连接加载的模型

音频

audio

AUDIO

必需

要转录的音频

输入的音频数据

连接音频文件

语言

language

语言代码

auto

音频的语言

识别的目标语言

zh表示中文,en表示英文

19. 在线视频生成节点

19.1 Kling Video Generation(可灵视频生成)

这个节点连接可灵AI,能根据文字或图片生成视频。

参数名 (UI显示)

参数名 (代码里)

参数值

建议值

通俗解释

专业解释

怎么用/举个例子

API密钥

api_key

文本

必需

可灵服务的访问密钥

Kling API密钥

在可灵官网申请

提示词

prompt

文本

空

视频内容描述

视频生成的文本描述

"一只猫在花园里玩耍"

参考图片

image

IMAGE

可选

视频的参考图片

可选的参考图像

连接图片作为视频起始帧

时长

duration

5/10

5

视频长度(秒)

生成视频的时长

5秒或10秒

19.2 Runway Gen3 Image-to-Video(Runway图片转视频)

这个节点使用Runway AI把静态图片变成动态视频。

参数名 (UI显示)

参数名 (代码里)

参数值

建议值

通俗解释

专业解释

怎么用/举个例子

API密钥

api_key

文本

必需

Runway服务密钥

Runway API密钥

在Runway官网申请

图片

image

IMAGE

必需

要动画化的图片

输入的静态图像

连接任何图片

提示词

prompt

文本

空

动画效果描述

动画的文本描述

"轻柔的风吹动树叶"

时长

duration

5/10

10

视频时长

生成视频的长度

通常选择10秒

20. 实验性节点

20.1 Create Seed Node(创建种子节点)

这个节点专门用来设置和管理随机种子。

参数名 (UI显示)

参数名 (代码里)

参数值

建议值

通俗解释

专业解释

怎么用/举个例子

种子

seed

0以上

0

随机数种子

控制随机性的数值

相同种子产生相同结果

20.2 Create Ckpt Names(创建检查点名称)

这个节点管理和选择AI模型检查点。

参数名 (UI显示)

参数名 (代码里)

参数值

建议值

通俗解释

专业解释

怎么用/举个例子

检查点名称

ckpt_names

文本列表

默认列表

可用的模型列表

系统中的检查点文件

每行一个模型名称

20.3 Create Lora Names(创建Lora名称)

这个节点管理Lora模型列表和对应的提示词。

参数名 (UI显示)

参数名 (代码里)

参数值

建议值

通俗解释

专业解释

怎么用/举个例子

Lora名称

lora_names

文本列表

默认列表

可用的Lora列表

系统中的Lora文件

每行一个Lora名称

21. 风格对齐节点

21.1 StyleAligned Reference Sampler(风格对齐参考采样器)

这个节点能让生成的图片保持一致的风格。

参数名 (UI显示)

参数名 (代码里)

参数值

建议值

通俗解释

专业解释

怎么用/举个例子

参考潜变量

ref_latents

STEP_LATENTS

必需

参考风格数据

参考的潜在空间数据

连接风格参考

参考图片文本

reference_image_text

文本

空

参考图片的描述

参考图像的文本描述

描述参考图片的内容

模型

model

MODEL

必需

生成模型

扩散模型

连接主要的生成模型

批次大小

batch_size

1-8

2

一次生成几张图

批处理大小

2表示一次生成2张图

21.2 StyleAligned Batch Align(风格对齐批次对齐)

这个节点确保批量生成的图片风格一致。

参数名 (UI显示)

参数名 (代码里)

参数值

建议值

通俗解释

专业解释

怎么用/举个例子

模型

model

MODEL

必需

要修改的模型

输入的扩散模型

连接生成模型

共享规范化

share_norm

both/group/layer/disabled

both

共享哪些规范化层

规范化层的共享方式

both共享所有层

共享注意力

share_attn

q+k+v/q+k/disabled

q+k

共享哪些注意力

注意力机制的共享方式

q+k+v共享所有注意力

缩放比例

scale

0-1

1

风格影响强度

风格对齐的强度

1表示完全对齐

22. 视频场景检测节点

22.1 Video Scene Detect(视频场景检测)

这个节点能自动检测视频中的场景切换,并分割成不同的片段。

参数名 (UI显示)

参数名 (代码里)

参数值

建议值

通俗解释

专业解释

怎么用/举个例子

视频

video

文件列表

选择文件

要分析的视频文件

输入的视频文件

选择MP4或其他视频格式

最小场景长度

min_scene_len

1以上

10

每个场景最少多少秒

场景的最小持续时间

10表示每个场景至少10秒

自适应阈值

adaptive_threshold

0以上

2.5

场景切换的敏感度

场景检测的阈值

数值越小越敏感

采样帧数

number_of_sample_frames

1以上

1

每个场景提取多少帧

从每个场景提取的关键帧数

1表示只提取中间帧

22.2 Scene Info(场景信息)

这个节点用来获取场景检测结果的详细信息。

参数名 (UI显示)

参数名 (代码里)

参数值

建议值

通俗解释

专业解释

怎么用/举个例子

场景数据

scenes

SCENE_

必需

场景检测的结果

场景检测输出的数据

连接场景检测节点的输出

索引

index

-1以上

0

选择第几个场景

场景的索引号

-1表示全部场景,0表示第一个场景

23. 高级语音处理节点

23.1 Sense Voice(智能语音识别)

这个节点使用阿里的SenseVoice模型进行多语言语音识别。

参数名 (UI显示)

参数名 (代码里)

参数值

建议值

通俗解释

专业解释

怎么用/举个例子

音频

audio

AUDIO

必需

要识别的音频

输入的音频数据

连接音频文件

设备

device

auto/cpu

auto

运行设备

计算设备选择

auto自动选择最佳设备

语言

language

语言列表

auto

音频语言

识别的目标语言

auto自动检测,zh中文,en英文

线程数

num_threads

1-32

4

处理线程数量

并行处理的线程数

4表示使用4个线程

使用INT8

use_int8

True/False

True

是否使用INT8量化

是否启用模型量化

True可以加速但略微降低精度

使用ITN

use_itn

True/False

True

是否使用逆文本规范化

是否启用文本后处理

True会将数字转换为阿拉伯数字

24. 在线AI视频生成节点

24.1 Kling Video Generation(可灵视频生成)

这个节点连接可灵AI服务生成视频。

参数名 (UI显示)

参数名 (代码里)

参数值

建议值

通俗解释

专业解释

怎么用/举个例子

提示词

prompt

文本

空

视频内容描述

视频生成的文本提示

"一只猫在花园里玩耍"

时长

duration

5/10

5

视频长度(秒)

生成视频的时长

5秒或10秒

宽高比

aspect_ratio

16:9/9:16/1:1

16:9

视频的宽高比例

视频画面比例

16:9适合横屏,9:16适合竖屏

模式

mode

standard/pro

standard

生成质量模式

视频生成的质量级别

pro质量更高但更慢

API密钥

fal_key

文本

必需

FAL服务密钥

访问API的认证密钥

在FAL官网申请

参考图片

image

IMAGE

可选

视频参考图片

可选的参考图像

连接图片作为视频起始帧

24.2 Runway Gen3 Image-to-Video(Runway图片转视频)

这个节点使用Runway AI将静态图片转换为动态视频。

参数名 (UI显示)

参数名 (代码里)

参数值

建议值

通俗解释

专业解释

怎么用/举个例子

提示词

prompt

文本

空

动画效果描述

动画的文本描述

"轻柔的风吹动树叶"

图片

image

IMAGE

必需

要动画化的图片

输入的静态图像

连接任何图片

时长

duration

5/10

5

视频时长

生成视频的长度

通常选择10秒

宽高比

aspect_ratio

16:9/9:16

16:9

视频宽高比

视频画面比例

16:9横屏,9:16竖屏

API密钥

fal_key

文本

必需

FAL服务密钥

访问API的认证密钥

在FAL官网申请

24.3 Luma Dream Machine(Luma梦境机器)

这个节点使用Luma AI生成高质量视频。

参数名 (UI显示)

参数名 (代码里)

参数值

建议值

通俗解释

专业解释

怎么用/举个例子

提示词

prompt

文本

空

视频内容描述

视频生成的文本提示

"海浪拍打岩石"

宽高比

aspect_ratio

多种比例

16:9

视频宽高比

视频画面比例

支持多种比例选择

API密钥

fal_key

文本

必需

FAL服务密钥

访问API的认证密钥

在FAL官网申请

参考图片

image

IMAGE

可选

视频参考图片

可选的参考图像

连接图片作为视频起始帧

循环

loop

True/False

True

是否循环播放

视频是否无缝循环

True生成可循环的视频

24.4 Load Video from URL(从URL加载视频)

这个节点可以从网络地址直接加载视频文件。

参数名 (UI显示)

参数名 (代码里)

参数值

建议值

通俗解释

专业解释

怎么用/举个例子

网址

url

文本

示例网址

视频文件的网络地址

视频文件的URL

输入完整的视频文件链接

强制帧率

force_rate

0-60

0

强制设置帧率

覆盖原始帧率

0表示使用原始帧率

强制尺寸

force_size

尺寸选项

Disabled

强制调整尺寸

视频尺寸调整选项

Disabled保持原始尺寸

自定义宽度

custom_width

0-8192

512

自定义宽度像素

自定义的视频宽度

设置目标宽度

自定义高度

custom_height

0-8192

512

自定义高度像素

自定义的视频高度

设置目标高度

帧数限制

frame_load_cap

0-1000000

0

最多加载多少帧

加载帧数的上限

0表示加载全部帧

跳过开头帧

skip_first_frames

0-1000000

0

跳过开头多少帧

从第几帧开始加载

10表示跳过前10帧

每N帧选1帧

select_every_nth

1-1000000

1

采样间隔

帧采样的间隔

2表示每2帧取1帧

25. 高级功能节点

25.1 Edit Mask(编辑蒙版)

这个节点提供了一个可视化的蒙版编辑器。

参数名 (UI显示)

参数名 (代码里)

参数值

建议值

通俗解释

专业解释

怎么用/举个例子

图片

image

IMAGE

必需

要编辑蒙版的图片

输入的图像数据

连接任何图片

蒙版

mask

MASK

可选

初始蒙版

可选的初始蒙版

连接现有蒙版进行编辑

25.2 LaMa Inpainting(LaMa修复)

这个节点使用LaMa模型进行图像修复和内容填充。

参数名 (UI显示)

参数名 (代码里)

参数值

建议值

通俗解释

专业解释

怎么用/举个例子

图片

image

IMAGE

必需

要修复的图片

输入的图像数据

连接需要修复的图片

蒙版

mask

MASK

必需

标记需要修复的区域

修复区域的蒙版

白色区域会被修复

25.3 MiniCPM VQA Simple(轻量VQA问答)

这个节点使用MiniCPM模型进行视觉问答。

参数名 (UI显示)

参数名 (代码里)

参数值

建议值

通俗解释

专业解释

怎么用/举个例子

图片

image

IMAGE

必需

要分析的图片

输入的图像数据

连接任何图片

问题

question

文本

空

关于图片的问题

针对图像的问题

"这张图里有什么?"

26. FishSpeech语音合成节点

26.1 Load VQGAN(加载VQGAN模型)

这个节点加载FishSpeech的VQGAN模型。

参数名 (UI显示)

参数名 (代码里)

参数值

建议值

通俗解释

专业解释

怎么用/举个例子

模型路径

model_path

文本

默认路径

VQGAN模型文件位置

模型文件的路径

使用默认路径或指定自定义路径

26.2 Audio To Prompt(音频转提示)

这个节点将音频转换为文本提示。

参数名 (UI显示)

参数名 (代码里)

参数值

建议值

通俗解释

专业解释

怎么用/举个例子

音频

audio

AUDIO

必需

要转换的音频

输入的音频数据

连接音频文件

VQGAN模型

vqgan_model

VQGAN_MODEL

必需

加载的VQGAN模型

VQGAN模型实例

连接加载的模型

26.3 Prompt To Semantic(提示转语义)

这个节点将文本提示转换为语义表示。

参数名 (UI显示)

参数名 (代码里)

参数值

建议值

通俗解释

专业解释

怎么用/举个例子

文本

text

文本

空

要转换的文本

输入的文本内容

输入任何中文或英文文本

参考音频

reference_audio

AUDIO

可选

参考语音风格

参考的音频样本

连接音频作为声音参考

26.4 Semantic To Audio(语义转音频)

这个节点将语义表示转换为音频。

参数名 (UI显示)

参数名 (代码里)

参数值

建议值

通俗解释

专业解释

怎么用/举个例子

语义数据

semantic

SEMANTIC

必需

语义表示数据

从提示转换的语义数据

连接提示转语义节点的输出

VQGAN模型

vqgan_model

VQGAN_MODEL

必需

加载的VQGAN模型

VQGAN模型实例

连接加载的模型

27. 特殊功能节点

27.1 P5 Input(P5代码输入)

这个节点用于输入和执行P5.js代码。

参数名 (UI显示)

参数名 (代码里)

参数值

建议值

通俗解释

专业解释

怎么用/举个例子

P5代码

code

文本

空

P5.js代码内容

输入的P5.js程序代码

输入完整的P5.js绘图代码

27.2 Simulate Dev Design Discussions(模拟开发设计讨论)

这个节点用于模拟开发团队的设计讨论。

参数名 (UI显示)

参数名 (代码里)

参数值

建议值

通俗解释

专业解释

怎么用/举个例子

讨论主题

topic

文本

空

讨论的主题

设计讨论的主题

"如何设计一个用户友好的界面"

参与者

participants

文本

默认角色

讨论参与者

参与讨论的角色列表

"产品经理,设计师,开发者"

使用技巧和建议

1. 节点组合使用

  • 图像处理流水线:LoadImagesFromPath → ResizeImage → EnhanceImage → SaveImageToLocal

  • AI对话流程:KeyInput → ChatGPTNode → ShowTextForGPT

  • 视频制作流程:LoadVideoAndSegment → ImageListReplace → VideoCombine

2. 参数调节技巧

  • 权重参数:通常1.0是标准值,大于1.0增强效果,小于1.0减弱效果

  • 尺寸参数:建议使用8的倍数,如512、768、1024等

  • 颜色参数:使用十六进制颜色代码,如#FF0000(红色)、#00FF00(绿色)

3. 性能优化建议

  • 大批量处理时适当降低图片分辨率

  • 使用合适的压缩级别平衡质量和文件大小

  • 定期清理临时文件释放存储空间

常见问题解答

Q1:为什么有些节点显示红色错误?

A1: 通常是因为缺少依赖包。运行 pip install -r requirements.txt 安装所有依赖。

Q2:API密钥在哪里获取?

A2:

  • OpenAI:在 https://platform.openai.com 注册获取

  • 硅基流动:在 https://siliconflow.cn 注册获取免费额度

Q3:生成的图片质量不好怎么办?

A3:

  • 检查输入图片的分辨率和质量

  • 调整相关参数如对比度、平滑度等

  • 尝试不同的缩放选项

Q4:视频处理很慢怎么办?

A4:

  • 降低视频分辨率

  • 减少处理的帧数

  • 使用更快的视频格式如MP4

Q5:如何备份我的工作流?

A5: ComfyUI会自动保存工作流为JSON文件,建议定期备份这些文件。

总结

ComfyUI Mixlab 插件是一个功能全面的工具集,包含了120+个实用节点,覆盖了图像、音频、视频、AI对话等多个领域。通过合理组合这些节点,你可以创建出强大的自动化工作流,大大提高工作效率。

记住,熟练使用这个插件的关键是多实践、多尝试不同的参数组合。每个节点都有其独特的用途,理解它们的功能和参数含义,就能发挥出最大的潜力。

标签: #插件 2338
相关文章

ComfyUI错误修复插件详解:轻松解决常见问题 2025-07-10 18:25

ComfyUI-CustomMenu插件使用教程:高效自定义工作流指南 2025-07-10 17:50

ComfyUI图像合并插件comfyui-merge使用教程 2025-07-03 22:44

ComfyUI 图像合并插件教程 (comfyui-merge) 1. 插件简介 这是一个专门用来合并图片的 ComfyUI 插件,就像用 PS 把多张图片叠在一起那样。它的特别之处在于你精确控制每张图片的混合方式。 GitHub 地址:https://github.com/LingSss9/com

ComfyUI WAN 2.2视频插件教程:万相AI提示词全攻略 2025-07-31 11:47

ComfyUI WAN 2.2视频插件教程:万相AI提示词实战指南 2025-07-29 20:10

ComfyUI HeyGem数字人插件教程:零基础快速精通指南 2025-07-22 14:10

目录

从节点基础到高阶工作流,我们为你绘制最清晰的 ComfyUI 学习路径。告别困惑,让每一次连接都充满创造的魔力,轻松驾驭 AI 艺术的无限可能。

  • 微信
  • B站
  • GitHub
Copyright © 2025 AIX All Rights Reserved. Powered by AIX.
隐私政策
津ICP备2024019312号