【版权严正声明】
本文系作者 [编程界的小学生] 原创,并拥有完整、独立的著作权。
未经本人 书面授权 ,任何单位、平台或个人, 严禁 以任何形式(包括但不限于转载、复制、摘编、修改、链接、转贴、建立镜像等)使用本文的全部或部分内容。
任何无视本声明的侵权行为,本人将依据《中华人民共和国著作权法》等相关法律法规,采取一切必要的法律手段,追究其侵权责任,要求其 立即停止侵权、赔礼道歉、消除影响,并赔偿因此造成的一切经济损失及维权成本(包括但不限于律师费、诉讼费、公证费等)。
侵权必究,切勿以身试法!
插件简介
ComfyUI Mixlab 插件是一个功能强大的 ComfyUI 扩展包,提供了超过 100 个实用节点,涵盖图像处理、音频处理、视频处理、AI 对话、3D 处理等多个领域。
GitHub 地址: https://github.com/MixLabPro/comfyui-mixlab-nodes
这个插件就像一个超级工具箱,里面装满了各种好用的小工具。无论你是想做图片美化、音频处理,还是想玩转 AI 对话,这个插件都能帮到你。
如何安装
方法一:通过 ComfyUI Manager 安装(推荐)
打开 ComfyUI Manager
搜索 "mixlab"
找到 "comfyui-mixlab-nodes" 点击安装
重启 ComfyUI
方法二:手动安装
进入 ComfyUI 的 custom_nodes 目录
运行命令:git clone https://github.com/MixLabPro/comfyui-mixlab-nodes.git
进入插件目录:cd comfyui-mixlab-nodes
安装依赖:pip install -r requirements.txt
重启 ComfyUI
节点详细解析
当前插件包含节点总数:约 120+ 个节点
1. 提示词相关节点
1.1 Random Prompt(随机提示词)
这个节点就像一个提示词生成器,能帮你快速生成各种组合的提示词。
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
最大数量 | max_count | 1-1000 | 9 | 最多生成多少个提示词 | 控制输出提示词的数量上限 | 设置为10,就会生成10个不同的提示词组合 |
可变提示词 | mutable_prompt | 文本 | 默认游乐场设备列表 | 会变化的部分,每行一个 | 用于替换的可变内容列表 | 输入"红色\n蓝色\n绿色",每行一个颜色 |
固定提示词 | immutable_prompt | 文本 | "sticker, Cartoon, " | 不变的部分,用标记替换位置 | 固定的提示词模板 | "一个的苹果",会被可变内容替换 | |
随机采样 | random_sample | enable/disable | enable | 是否随机选择组合 | 控制是否随机选择生成的组合 | 开启后会随机选择,关闭后按顺序选择 |
1.2 Embedding Prompt(嵌入提示词)
这个节点帮你使用训练好的嵌入文件来增强提示词效果。
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
嵌入文件 | embedding | 文件列表 | 选择已有文件 | 选择你要用的嵌入文件 | 选择预训练的embedding文件 | 选择"badhandv4"来改善手部生成 |
权重 | weight | -2到2 | 1 | 这个嵌入的影响强度 | 控制embedding的影响程度 | 设置1.2会增强效果,0.8会减弱效果 |
1.3 Prompt Slide(提示词滑块)
这个节点让你可以调节单个关键词的权重,就像调音量一样简单。
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
提示词关键词 | prompt_keyword | 文本 | 空 | 你要调节的关键词 | 需要调整权重的提示词 | 输入"beautiful"来调节美丽程度 |
权重 | weight | -3到3 | 1 | 这个词的重要程度 | 关键词的权重值 | 1.5表示加强,0.5表示减弱 |
1.4 Prompt Simplification(提示词简化)
这个节点帮你把复杂的提示词简化成不同长度的版本。
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
提示词 | prompt | 文本 | 空 | 你要简化的长提示词 | 输入的原始提示词 | 输入一长串用逗号分隔的提示词 |
长度 | length | 1-100 | 5 | 简化后保留多少个词 | 简化后的提示词长度 | 设置5就保留前5个最重要的词 |
2. 输入相关节点
这个节点让你可以在图片上画框框,标记不同的区域。
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
网格数据 | grids | JSON文本 | 空 | 包含框框位置信息的数据 | 网格区域的坐标数据 | 从其他节点传入的区域坐标信息 |
边距 | padding | -500到5000 | 24 | 框框周围的空白距离 | 网格区域的内边距 | 设置24会在框框周围留24像素的空白 |
这个节点让你直接输入base64格式的图片数据。
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
图片base64 | image_base64 | 文本 | 空 | 图片的编码数据 | base64编码的图片数据 | 粘贴从网页复制的图片数据 |
文本 | text | 文本 | 空 | 配合图片的描述文字 | 与图片相关的文本信息 | 输入对图片的描述或标签 |
这个节点专门用来输入各种API的密钥,保护你的隐私信息。
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
密钥 | key | 文本 | 空 | 你的API访问密钥 | API服务的认证密钥 | 输入OpenAI的API密钥来使用GPT |
这个节点提供一个可调节的滑块,用来输入小数。
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
数值 | number | 浮点数 | 0 | 当前的数值 | 滑块的当前值 | 调节到0.75表示75%的强度 |
最小值 | min_value | 浮点数 | 0 | 滑块的最小值 | 允许的最小数值 | 设置0表示最小不能低于0 |
最大值 | max_value | 浮点数 | 1 | 滑块的最大值 | 允许的最大数值 | 设置2表示最大不能超过2 |
步长 | step | 浮点数 | 0.001 | 每次调节的最小单位 | 滑块调节的精度 | 0.01表示每次调节0.01 |
这个节点用来输入整数,比如图片尺寸、步数等。
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
数值 | number | 整数 | 0 | 当前的整数值 | 输入的整数数值 | 输入512表示512像素 |
最小值 | min_value | 整数 | 0 | 允许的最小整数 | 数值的下限 | 设置1表示最小为1 |
最大值 | max_value | 整数 | 1 | 允许的最大整数 | 数值的上限 | 设置2048表示最大2048 |
步长 | step | 整数 | 1 | 每次增减的数量 | 调节的步进值 | 设置8表示每次调节8的倍数 |
3. 图像处理节点
3.1 Mirrored Image(镜像图片)
这个节点就像照镜子一样,把图片左右翻转。
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
图片 | image | IMAGE | 必需 | 要翻转的图片 | 输入的图像数据 | 连接任何图片输出到这里 |
3.2 Noise Image(噪声图片)
这个节点创建带有随机噪点的图片,就像老电视的雪花屏。
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
宽度 | width | 1-8192 | 512 | 图片的宽度 | 生成图像的宽度像素 | 设置1024生成1024像素宽的图 |
高度 | height | 1-8192 | 512 | 图片的高度 | 生成图像的高度像素 | 设置768生成768像素高的图 |
噪声强度 | noise_level | 0-8192 | 128 | 噪点的强烈程度 | 噪声的强度级别 | 128是中等噪声,255是最强噪声 |
背景颜色 | color_hex | 颜色代码 | #FFFFFF | 图片的底色 | 背景颜色的十六进制值 | #FF0000是红色,#00FF00是绿色 |
3.3 Gradient Image(渐变图片)
这个节点创建颜色渐变的图片,就像彩虹一样从一种颜色慢慢变成另一种颜色。
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
宽度 | width | 1-8192 | 512 | 图片宽度 | 渐变图像的宽度 | 设置800创建800像素宽的渐变 |
高度 | height | 1-8192 | 512 | 图片高度 | 渐变图像的高度 | 设置600创建600像素高的渐变 |
起始颜色 | start_color_hex | 颜色代码 | #FFFFFF | 渐变开始的颜色 | 渐变起点的颜色值 | #FF0000表示从红色开始 |
结束颜色 | end_color_hex | 颜色代码 | #000000 | 渐变结束的颜色 | 渐变终点的颜色值 | #0000FF表示到蓝色结束 |
3.4 Transparent Image(透明图片)
这个节点根据蒙版把图片的某些部分变透明,就像用橡皮擦擦掉一样。
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
图片 | images | IMAGE | 必需 | 要处理的图片 | 输入的图像数据 | 连接任何图片到这里 |
蒙版 | masks | MASK | 必需 | 决定哪里透明的蒙版 | 控制透明度的遮罩 | 白色区域保留,黑色区域变透明 |
反转 | invert | yes/no | yes | 是否反转蒙版效果 | 是否反转遮罩的作用 | yes表示黑色变透明,no表示白色变透明 |
保存 | save | yes/no | yes | 是否保存到文件 | 是否将结果保存为文件 | yes会保存到输出文件夹 |
3.5 Resize Image(调整图片大小)
这个节点就像拉伸或缩小图片,可以改变图片的尺寸。
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
宽度 | width | 1-8192 | 512 | 目标宽度 | 调整后的图像宽度 | 设置1024把图片宽度改为1024 |
高度 | height | 1-8192 | 512 | 目标高度 | 调整后的图像高度 | 设置768把图片高度改为768 |
缩放选项 | scale_option | width/height/overall/center | width | 按什么方式缩放 | 图像缩放的方式 | width按宽度比例,height按高度比例 |
平均颜色 | average_color | on/off | on | 是否使用图片平均色填充 | 是否用平均色填充空白区域 | on会用图片主色调填充空白 |
填充颜色 | fill_color | 颜色代码 | #FFFFFF | 空白区域的填充色 | 填充区域的颜色 | #000000用黑色填充空白区域 |
4. 音频处理节点
4.1 Speech Recognition(语音识别)
这个节点就像一个听写员,能把语音转换成文字。
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
音频上传 | upload | AUDIOINPUTMIX | 必需 | 要识别的音频文件 | 输入的音频数据 | 上传一段录音或音频文件 |
开始时间 | start_by | 0-2048 | 0 | 从第几秒开始识别 | 音频识别的起始时间点 | 设置10表示从第10秒开始识别 |
4.2 Speech Synthesis(语音合成)
这个节点就像一个播音员,能把文字转换成语音。
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
文本 | text | STRING | 必需 | 要转换成语音的文字 | 需要合成语音的文本 | 输入"你好世界"生成对应语音 |
4.3 Preview Audio(音频预览)
这个节点让你可以直接在ComfyUI里播放音频,就像音乐播放器。
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
音频 | audio | AUDIO | 必需 | 要播放的音频数据 | 输入的音频流数据 | 连接任何音频输出到这里播放 |
5. 视频处理节点
5.1 Load Video And Segment(加载并分割视频)
这个节点就像视频剪辑师,能把长视频切成小段。
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
视频 | video | 文件列表 | 选择文件 | 要处理的视频文件 | 输入的视频文件 | 选择一个MP4或其他视频文件 |
视频段帧数 | video_segment_frames | -1以上 | 10 | 每段包含多少帧 | 每个视频片段的帧数 | 设置30表示每段30帧(约1秒) |
过渡帧数 | transition_frames | 0以上 | 0 | 段与段之间重叠的帧数 | 片段间的过渡帧数量 | 设置5表示段间有5帧重叠 |
5.2 Video Combine(视频合成)
这个节点就像视频制作软件,能把图片序列合成为视频。
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
图片批次 | image_batch | IMAGE | 必需 | 要合成的图片序列 | 输入的图像批次数据 | 连接一系列图片到这里 |
帧率 | frame_rate | 1以上 | 8 | 每秒播放多少张图片 | 视频的帧率设置 | 设置24表示每秒24帧,更流畅 |
循环次数 | loop_count | 0-100 | 0 | 视频重复播放次数 | 视频循环播放的次数 | 0表示无限循环,1表示播放一次 |
文件名前缀 | filename_prefix | 文本 | Comfyui | 输出文件的名字开头 | 生成文件的命名前缀 | 设置"MyVideo"生成MyVideo_xxx.mp4 |
格式 | format | 格式列表 | image/gif | 输出什么格式的文件 | 输出视频的文件格式 | 选择video/mp4生成MP4视频 |
6. AI对话节点
6.1 ChatGPT & Local LLM(ChatGPT和本地大语言模型)
这个节点就像一个聊天机器人,能和AI进行对话。
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
提示词 | prompt | 文本 | 空 | 你想问AI的问题 | 发送给AI的提示内容 | 输入"请帮我写一首诗" |
系统内容 | system_content | 文本 | 默认系统提示 | 告诉AI它的角色定位 | AI的系统角色设定 | "你是一个专业的翻译助手" |
模型 | model | 模型列表 | gpt-3.5-turbo | 选择使用哪个AI模型 | 选择的语言模型 | gpt-4更聪明但更贵 |
种子 | seed | 0以上 | 0 | 控制回答的随机性 | 随机种子值 | 相同种子会得到相似回答 |
上下文大小 | context_size | 0-30 | 1 | 记住多少轮对话 | 保持的对话历史长度 | 设置5会记住最近5轮对话 |
API地址 | api_url | 地址列表 | openai | 选择API服务商 | API服务的地址 | 选择不同的服务商 |
6.2 LLM Siliconflow(硅基流动大语言模型)
这个节点专门连接硅基流动的免费AI服务。
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
API密钥 | api_key | 文本 | 必需 | 硅基流动的访问密钥 | SiliconFlow的API密钥 | 在硅基流动官网申请免费密钥 |
提示词 | prompt | 文本 | 空 | 你的问题或指令 | 发送给模型的提示 | "帮我总结这段文字的要点" |
系统内容 | system_content | 文本 | 默认 | AI的角色设定 | 系统级别的角色提示 | "你是一个代码助手" |
模型 | model | 模型列表 | Qwen2.5-7B | 选择使用的模型 | 具体的语言模型 | Qwen2.5更新更强大 |
最大令牌数 | max_tokens | 512-200000 | 512 | 回答的最大长度 | 生成文本的最大长度 | 1000表示最多生成1000个字符 |
7. 蒙版处理节点
7.1 Smooth Mask(平滑蒙版)
这个节点就像给蒙版边缘磨砂,让边缘更柔和。
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
蒙版 | mask | MASK | 必需 | 要平滑的蒙版 | 输入的遮罩数据 | 连接任何蒙版到这里 |
平滑度 | smoothness | 0-150 | 1 | 边缘模糊的程度 | 高斯模糊的强度 | 数值越大边缘越模糊 |
7.2 Feathered Mask(羽化蒙版)
这个节点给蒙版添加羽化效果,让边缘有渐变过渡。
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
蒙版 | mask | MASK | 必需 | 要羽化的蒙版 | 输入的遮罩数据 | 连接蒙版到这里处理 |
起始偏移 | start_offset | -150到150 | 1 | 羽化开始的位置 | 羽化效果的起始偏移 | 正数向外羽化,负数向内羽化 |
羽化权重 | feathering_weight | 0-1 | 0.1 | 羽化效果的强度 | 羽化混合的权重 | 0.5表示50%的羽化强度 |
7.3 Face To Mask(人脸转蒙版)
这个节点能自动识别图片中的人脸,并创建对应的蒙版。
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
图片 | image | IMAGE | 必需 | 包含人脸的图片 | 输入的图像数据 | 连接一张有人脸的照片 |
8. 工具类节点
8.1 Math Operation(数学运算)
这个节点就像计算器,能对数字进行加减乘除运算。
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
数字A | numberA | 任意类型 | 必需 | 要计算的第一个数 | 输入的数值A | 可以是整数或小数 |
乘以 | multiply_by | 浮点数 | 1 | 乘法运算的数 | 乘数值 | 设置2表示乘以2 |
加上 | add_by | 浮点数 | 0 | 加法运算的数 | 加数值 | 设置10表示加上10 |
8.2 Text To Number(文本转数字)
这个节点能从文本中提取数字,就像从句子里找数字。
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
文本 | text | 文本 | "1" | 包含数字的文本 | 输入的文本字符串 | "我有5个苹果"会提取出5 |
随机数字 | random_number | enable/disable | disable | 是否生成随机数 | 是否启用随机数生成 | 开启后会生成随机数而不是提取 |
最大数 | max_num | 2以上 | 10 | 随机数的最大值 | 随机数生成的上限 | 设置100会生成1-100的随机数 |
8.3 Dynamic Delay By Text(文本动态延迟)
这个节点根据文本长度来控制延迟时间,文字越多延迟越长。
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
延迟秒数 | delay_seconds | 0-1000000 | 1 | 基础延迟时间 | 固定的延迟时间 | 设置3表示至少延迟3秒 |
延迟文本 | delay_by_text | 文本 | 空 | 用来计算延迟的文本 | 根据长度计算延迟的文本 | 输入长文本会增加延迟时间 |
每秒字数 | words_per_seconds | 0-1000 | 1.5 | 每秒处理多少字 | 文本处理的速度 | 1.5表示每秒处理1.5个字 |
9. 3D处理节点
9.1 3D Image(3D图像)
这个节点处理3D模型和相关的图像数据。
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
3D上传 | upload | THREED | 必需 | 3D模型文件 | 3D模型数据 | 上传GLB或其他3D格式文件 |
材质 | material | IMAGE | 可选 | 3D模型的贴图材质 | 3D对象的纹理贴图 | 连接一张纹理图片 |
9.2 Depth Viewer(深度查看器)
这个节点用来可视化深度图,就像看3D电影的深度效果。
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
图片 | image | IMAGE | 必需 | 原始图片 | 参考图像 | 连接彩色图片 |
深度图 | depth_map | IMAGE | 必需 | 对应的深度信息 | 深度图数据 | 连接深度图或法线图 |
10. 屏幕分享节点
10.1 Screen Share(屏幕分享)
这个节点能捕获屏幕内容,就像录屏软件。
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
图片base64 | image_base64 | CHEESE | 必需 | 屏幕截图数据 | 屏幕捕获的图像数据 | 自动捕获当前屏幕内容 |
刷新率 | refresh_rate | 0以上 | 500 | 多久更新一次屏幕 | 屏幕刷新的间隔时间 | 500表示每500毫秒更新一次 |
11. 背景移除节点
11.1 Remove Background(背景移除)
这个节点就像魔术橡皮擦,能自动识别并移除图片背景。
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
图片 | image | IMAGE | 必需 | 要去背景的图片 | 输入的图像数据 | 连接任何图片到这里 |
模型名称 | model_name | 模型列表 | u2net | 选择去背景的AI模型 | 背景移除使用的模型 | u2net适合一般图片,isnet适合复杂背景 |
12. 提示词生成节点
12.1 Prompt Generate(提示词生成)
这个节点就像一个创意助手,能根据简单的词语生成丰富的提示词。
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
文本 | text | 文本 | 空 | 简单的关键词 | 用于生成的种子文本 | 输入"cat"生成关于猫的详细描述 |
多条输出 | multiple | on/off | off | 是否输出多个版本 | 是否生成多个变体 | on会生成多个不同的提示词 |
种子 | seed | 100以上 | 100 | 控制生成的随机性 | 随机种子值 | 相同种子生成相同结果 |
12.2 Chinese Prompt(中文提示词)
这个节点专门处理中文提示词,能把中文转换成英文并优化。
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
文本 | text | 文本 | 空 | 中文提示词 | 输入的中文文本 | 输入"一只可爱的小猫" |
生成模式 | generation | on/off | off | 是否扩展生成更多内容 | 是否启用文本生成 | on会基于翻译结果生成更多描述 |
种子 | seed | 100以上 | 100 | 控制翻译和生成的随机性 | 随机种子值 | 固定种子确保结果一致 |
13. 图像分析节点
13.1 Clip Interrogator(图像反推提示词)
这个节点就像一个图片解说员,能看图说话,分析图片内容并生成对应的提示词。
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
图片 | image | IMAGE | 必需 | 要分析的图片 | 输入的图像数据 | 连接任何图片进行分析 |
提示词模式 | prompt_mode | fast/classic/best/negative | fast | 分析的详细程度 | 不同的分析算法 | fast速度快,best质量高但慢 |
图像分析 | image_analysis | on/off | off | 是否进行深度分析 | 是否分析艺术风格等 | on会分析艺术家风格、流派等 |
14. 文本处理节点
14.1 Show Text(显示文本)
这个节点就像一个文本显示器,能把文字内容保存到文件并显示。
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
文本 | text | 文本 | 必需 | 要显示的文字内容 | 输入的文本数据 | 连接任何文本输出到这里 |
输出目录 | output_dir | 文本 | 空 | 保存文件的位置 | 文件保存路径 | 留空会保存到临时目录 |
14.2 Character In Text(文本中的字符)
这个节点就像文字侦探,能检查文本中是否包含特定字符。
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
文本 | text | 文本 | 空 | 要检查的文本 | 输入的文本内容 | 输入"hello world" |
字符 | character | 文本 | 空 | 要查找的字符 | 搜索的目标字符 | 输入"world"检查是否包含 |
起始索引 | start_index | 0-1024 | 1 | 找到时返回的基础数字 | 基础索引值 | 找到返回1+基础值,没找到返回基础值 |
14.3 Text Split By Delimiter(按分隔符分割文本)
这个节点就像文字切割器,能按照指定符号把长文本切成小段。
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
文本 | text | 文本 | 空 | 要分割的长文本 | 输入的文本内容 | 输入"苹果,香蕉,橘子" |
分隔符 | delimiter | 文本 | "," | 用什么符号分割 | 分割文本的标记 | 用","分割会得到三个水果名 |
起始索引 | start_index | 0-1000 | 0 | 从第几个开始取 | 开始提取的位置 | 设置1会跳过第一个结果 |
跳过间隔 | skip_every | 0-10 | 0 | 每隔几个取一个 | 提取的间隔数 | 设置1会隔一个取一个 |
最大数量 | max_count | 1-1000 | 10 | 最多取几个 | 提取结果的数量限制 | 设置5最多返回5个结果 |
15. JSON处理节点
15.1 Json Repair(JSON修复)
这个节点就像JSON医生,能修复格式错误的JSON数据。
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
JSON字符串 | json_string | 文本 | 必需 | 有问题的JSON数据 | 需要修复的JSON文本 | 输入格式错误的JSON |
键名 | key | 文本 | 空 | 要提取的特定字段 | JSON中的键名 | 输入"name"提取name字段的值 |
JSON字符串2 | json_string2 | 文本 | 可选 | 要合并的第二个JSON | 可选的额外JSON数据 | 用于合并两个JSON对象 |
16. 高级视频节点
16.1 VAE Encode For Inpaint Frames(视频帧修复编码)
这个节点专门处理视频修复,为每一帧准备修复数据。
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
VAE | vae | VAE | 必需 | 编码器模型 | VAE编码器 | 连接VAE模型 |
图片 | images | IMAGE | 必需 | 视频帧图片 | 输入的图像序列 | 连接视频帧数据 |
蒙版 | masks | MASK | 必需 | 每帧的修复蒙版 | 对应的遮罩序列 | 连接蒙版数据 |
蒙版扩展 | grow_mask_by | 0-64 | 6 | 蒙版边缘扩展像素 | 遮罩扩展的像素数 | 6表示向外扩展6像素 |
16.2 Generate Frames By Count(按数量生成帧)
这个节点能根据指定数量生成视频帧,支持往返循环。
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
帧序列 | frames | IMAGE | 必需 | 原始帧序列 | 输入的图像序列 | 连接图片序列 |
帧数量 | frame_count | 1以上 | 72 | 要生成多少帧 | 目标帧数 | 设置100生成100帧 |
往返模式 | revert | True/False | True | 是否往返循环播放 | 是否启用往返效果 | True会正向+反向播放 |
17. 3D和特效节点
17.1 Load TripoSR Model(加载TripoSR模型)
这个节点加载3D重建模型,能把2D图片变成3D模型。
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
模型路径 | model_path | 文本 | 默认路径 | 3D模型文件位置 | TripoSR模型的路径 | 使用默认路径或指定自定义路径 |
17.2 TripoSR Sampler(TripoSR采样器)
这个节点执行3D重建,把平面图片转换成立体模型。
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
模型 | model | TRIPOSR_MODEL | 必需 | 3D重建模型 | TripoSR模型实例 | 连接加载的模型 |
图片 | image | IMAGE | 必需 | 要转3D的图片 | 输入的2D图像 | 连接任何图片 |
采样步数 | steps | 1以上 | 50 | 3D重建的精度 | 采样迭代次数 | 步数越多质量越好但越慢 |
18. 语音处理节点
18.1 Load Whisper Model(加载Whisper模型)
这个节点加载语音识别模型,为语音转文字做准备。
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
模型大小 | model_size | tiny/base/small/medium/large | base | 模型的大小级别 | Whisper模型规格 | base平衡速度和准确度 |
设备 | device | auto/cpu/cuda | auto | 运行设备 | 计算设备选择 | auto自动选择最佳设备 |
18.2 Whisper Transcribe(Whisper转录)
这个节点执行语音转文字,把音频内容转换成文本。
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
模型 | model | WHISPER_MODEL | 必需 | 语音识别模型 | Whisper模型实例 | 连接加载的模型 |
音频 | audio | AUDIO | 必需 | 要转录的音频 | 输入的音频数据 | 连接音频文件 |
语言 | language | 语言代码 | auto | 音频的语言 | 识别的目标语言 | zh表示中文,en表示英文 |
19. 在线视频生成节点
19.1 Kling Video Generation(可灵视频生成)
这个节点连接可灵AI,能根据文字或图片生成视频。
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
API密钥 | api_key | 文本 | 必需 | 可灵服务的访问密钥 | Kling API密钥 | 在可灵官网申请 |
提示词 | prompt | 文本 | 空 | 视频内容描述 | 视频生成的文本描述 | "一只猫在花园里玩耍" |
参考图片 | image | IMAGE | 可选 | 视频的参考图片 | 可选的参考图像 | 连接图片作为视频起始帧 |
时长 | duration | 5/10 | 5 | 视频长度(秒) | 生成视频的时长 | 5秒或10秒 |
19.2 Runway Gen3 Image-to-Video(Runway图片转视频)
这个节点使用Runway AI把静态图片变成动态视频。
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
API密钥 | api_key | 文本 | 必需 | Runway服务密钥 | Runway API密钥 | 在Runway官网申请 |
图片 | image | IMAGE | 必需 | 要动画化的图片 | 输入的静态图像 | 连接任何图片 |
提示词 | prompt | 文本 | 空 | 动画效果描述 | 动画的文本描述 | "轻柔的风吹动树叶" |
时长 | duration | 5/10 | 10 | 视频时长 | 生成视频的长度 | 通常选择10秒 |
20. 实验性节点
20.1 Create Seed Node(创建种子节点)
这个节点专门用来设置和管理随机种子。
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
种子 | seed | 0以上 | 0 | 随机数种子 | 控制随机性的数值 | 相同种子产生相同结果 |
20.2 Create Ckpt Names(创建检查点名称)
这个节点管理和选择AI模型检查点。
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
检查点名称 | ckpt_names | 文本列表 | 默认列表 | 可用的模型列表 | 系统中的检查点文件 | 每行一个模型名称 |
20.3 Create Lora Names(创建Lora名称)
这个节点管理Lora模型列表和对应的提示词。
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
Lora名称 | lora_names | 文本列表 | 默认列表 | 可用的Lora列表 | 系统中的Lora文件 | 每行一个Lora名称 |
21. 风格对齐节点
21.1 StyleAligned Reference Sampler(风格对齐参考采样器)
这个节点能让生成的图片保持一致的风格。
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
参考潜变量 | ref_latents | STEP_LATENTS | 必需 | 参考风格数据 | 参考的潜在空间数据 | 连接风格参考 |
参考图片文本 | reference_image_text | 文本 | 空 | 参考图片的描述 | 参考图像的文本描述 | 描述参考图片的内容 |
模型 | model | MODEL | 必需 | 生成模型 | 扩散模型 | 连接主要的生成模型 |
批次大小 | batch_size | 1-8 | 2 | 一次生成几张图 | 批处理大小 | 2表示一次生成2张图 |
21.2 StyleAligned Batch Align(风格对齐批次对齐)
这个节点确保批量生成的图片风格一致。
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
模型 | model | MODEL | 必需 | 要修改的模型 | 输入的扩散模型 | 连接生成模型 |
共享规范化 | share_norm | both/group/layer/disabled | both | 共享哪些规范化层 | 规范化层的共享方式 | both共享所有层 |
共享注意力 | share_attn | q+k+v/q+k/disabled | q+k | 共享哪些注意力 | 注意力机制的共享方式 | q+k+v共享所有注意力 |
缩放比例 | scale | 0-1 | 1 | 风格影响强度 | 风格对齐的强度 | 1表示完全对齐 |
22. 视频场景检测节点
22.1 Video Scene Detect(视频场景检测)
这个节点能自动检测视频中的场景切换,并分割成不同的片段。
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
视频 | video | 文件列表 | 选择文件 | 要分析的视频文件 | 输入的视频文件 | 选择MP4或其他视频格式 |
最小场景长度 | min_scene_len | 1以上 | 10 | 每个场景最少多少秒 | 场景的最小持续时间 | 10表示每个场景至少10秒 |
自适应阈值 | adaptive_threshold | 0以上 | 2.5 | 场景切换的敏感度 | 场景检测的阈值 | 数值越小越敏感 |
采样帧数 | number_of_sample_frames | 1以上 | 1 | 每个场景提取多少帧 | 从每个场景提取的关键帧数 | 1表示只提取中间帧 |
22.2 Scene Info(场景信息)
这个节点用来获取场景检测结果的详细信息。
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
场景数据 | scenes | SCENE_ | 必需 | 场景检测的结果 | 场景检测输出的数据 | 连接场景检测节点的输出 |
索引 | index | -1以上 | 0 | 选择第几个场景 | 场景的索引号 | -1表示全部场景,0表示第一个场景 |
23. 高级语音处理节点
23.1 Sense Voice(智能语音识别)
这个节点使用阿里的SenseVoice模型进行多语言语音识别。
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
音频 | audio | AUDIO | 必需 | 要识别的音频 | 输入的音频数据 | 连接音频文件 |
设备 | device | auto/cpu | auto | 运行设备 | 计算设备选择 | auto自动选择最佳设备 |
语言 | language | 语言列表 | auto | 音频语言 | 识别的目标语言 | auto自动检测,zh中文,en英文 |
线程数 | num_threads | 1-32 | 4 | 处理线程数量 | 并行处理的线程数 | 4表示使用4个线程 |
使用INT8 | use_int8 | True/False | True | 是否使用INT8量化 | 是否启用模型量化 | True可以加速但略微降低精度 |
使用ITN | use_itn | True/False | True | 是否使用逆文本规范化 | 是否启用文本后处理 | True会将数字转换为阿拉伯数字 |
24. 在线AI视频生成节点
24.1 Kling Video Generation(可灵视频生成)
这个节点连接可灵AI服务生成视频。
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
提示词 | prompt | 文本 | 空 | 视频内容描述 | 视频生成的文本提示 | "一只猫在花园里玩耍" |
时长 | duration | 5/10 | 5 | 视频长度(秒) | 生成视频的时长 | 5秒或10秒 |
宽高比 | aspect_ratio | 16:9/9:16/1:1 | 16:9 | 视频的宽高比例 | 视频画面比例 | 16:9适合横屏,9:16适合竖屏 |
模式 | mode | standard/pro | standard | 生成质量模式 | 视频生成的质量级别 | pro质量更高但更慢 |
API密钥 | fal_key | 文本 | 必需 | FAL服务密钥 | 访问API的认证密钥 | 在FAL官网申请 |
参考图片 | image | IMAGE | 可选 | 视频参考图片 | 可选的参考图像 | 连接图片作为视频起始帧 |
24.2 Runway Gen3 Image-to-Video(Runway图片转视频)
这个节点使用Runway AI将静态图片转换为动态视频。
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
提示词 | prompt | 文本 | 空 | 动画效果描述 | 动画的文本描述 | "轻柔的风吹动树叶" |
图片 | image | IMAGE | 必需 | 要动画化的图片 | 输入的静态图像 | 连接任何图片 |
时长 | duration | 5/10 | 5 | 视频时长 | 生成视频的长度 | 通常选择10秒 |
宽高比 | aspect_ratio | 16:9/9:16 | 16:9 | 视频宽高比 | 视频画面比例 | 16:9横屏,9:16竖屏 |
API密钥 | fal_key | 文本 | 必需 | FAL服务密钥 | 访问API的认证密钥 | 在FAL官网申请 |
24.3 Luma Dream Machine(Luma梦境机器)
这个节点使用Luma AI生成高质量视频。
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
提示词 | prompt | 文本 | 空 | 视频内容描述 | 视频生成的文本提示 | "海浪拍打岩石" |
宽高比 | aspect_ratio | 多种比例 | 16:9 | 视频宽高比 | 视频画面比例 | 支持多种比例选择 |
API密钥 | fal_key | 文本 | 必需 | FAL服务密钥 | 访问API的认证密钥 | 在FAL官网申请 |
参考图片 | image | IMAGE | 可选 | 视频参考图片 | 可选的参考图像 | 连接图片作为视频起始帧 |
循环 | loop | True/False | True | 是否循环播放 | 视频是否无缝循环 | True生成可循环的视频 |
24.4 Load Video from URL(从URL加载视频)
这个节点可以从网络地址直接加载视频文件。
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
网址 | url | 文本 | 示例网址 | 视频文件的网络地址 | 视频文件的URL | 输入完整的视频文件链接 |
强制帧率 | force_rate | 0-60 | 0 | 强制设置帧率 | 覆盖原始帧率 | 0表示使用原始帧率 |
强制尺寸 | force_size | 尺寸选项 | Disabled | 强制调整尺寸 | 视频尺寸调整选项 | Disabled保持原始尺寸 |
自定义宽度 | custom_width | 0-8192 | 512 | 自定义宽度像素 | 自定义的视频宽度 | 设置目标宽度 |
自定义高度 | custom_height | 0-8192 | 512 | 自定义高度像素 | 自定义的视频高度 | 设置目标高度 |
帧数限制 | frame_load_cap | 0-1000000 | 0 | 最多加载多少帧 | 加载帧数的上限 | 0表示加载全部帧 |
跳过开头帧 | skip_first_frames | 0-1000000 | 0 | 跳过开头多少帧 | 从第几帧开始加载 | 10表示跳过前10帧 |
每N帧选1帧 | select_every_nth | 1-1000000 | 1 | 采样间隔 | 帧采样的间隔 | 2表示每2帧取1帧 |
25. 高级功能节点
25.1 Edit Mask(编辑蒙版)
这个节点提供了一个可视化的蒙版编辑器。
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
图片 | image | IMAGE | 必需 | 要编辑蒙版的图片 | 输入的图像数据 | 连接任何图片 |
蒙版 | mask | MASK | 可选 | 初始蒙版 | 可选的初始蒙版 | 连接现有蒙版进行编辑 |
25.2 LaMa Inpainting(LaMa修复)
这个节点使用LaMa模型进行图像修复和内容填充。
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
图片 | image | IMAGE | 必需 | 要修复的图片 | 输入的图像数据 | 连接需要修复的图片 |
蒙版 | mask | MASK | 必需 | 标记需要修复的区域 | 修复区域的蒙版 | 白色区域会被修复 |
25.3 MiniCPM VQA Simple(轻量VQA问答)
这个节点使用MiniCPM模型进行视觉问答。
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
图片 | image | IMAGE | 必需 | 要分析的图片 | 输入的图像数据 | 连接任何图片 |
问题 | question | 文本 | 空 | 关于图片的问题 | 针对图像的问题 | "这张图里有什么?" |
26. FishSpeech语音合成节点
26.1 Load VQGAN(加载VQGAN模型)
这个节点加载FishSpeech的VQGAN模型。
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
模型路径 | model_path | 文本 | 默认路径 | VQGAN模型文件位置 | 模型文件的路径 | 使用默认路径或指定自定义路径 |
26.2 Audio To Prompt(音频转提示)
这个节点将音频转换为文本提示。
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
音频 | audio | AUDIO | 必需 | 要转换的音频 | 输入的音频数据 | 连接音频文件 |
VQGAN模型 | vqgan_model | VQGAN_MODEL | 必需 | 加载的VQGAN模型 | VQGAN模型实例 | 连接加载的模型 |
26.3 Prompt To Semantic(提示转语义)
这个节点将文本提示转换为语义表示。
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
文本 | text | 文本 | 空 | 要转换的文本 | 输入的文本内容 | 输入任何中文或英文文本 |
参考音频 | reference_audio | AUDIO | 可选 | 参考语音风格 | 参考的音频样本 | 连接音频作为声音参考 |
26.4 Semantic To Audio(语义转音频)
这个节点将语义表示转换为音频。
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
语义数据 | semantic | SEMANTIC | 必需 | 语义表示数据 | 从提示转换的语义数据 | 连接提示转语义节点的输出 |
VQGAN模型 | vqgan_model | VQGAN_MODEL | 必需 | 加载的VQGAN模型 | VQGAN模型实例 | 连接加载的模型 |
27. 特殊功能节点
这个节点用于输入和执行P5.js代码。
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
P5代码 | code | 文本 | 空 | P5.js代码内容 | 输入的P5.js程序代码 | 输入完整的P5.js绘图代码 |
27.2 Simulate Dev Design Discussions(模拟开发设计讨论)
这个节点用于模拟开发团队的设计讨论。
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
讨论主题 | topic | 文本 | 空 | 讨论的主题 | 设计讨论的主题 | "如何设计一个用户友好的界面" |
参与者 | participants | 文本 | 默认角色 | 讨论参与者 | 参与讨论的角色列表 | "产品经理,设计师,开发者" |
使用技巧和建议
1. 节点组合使用
图像处理流水线:LoadImagesFromPath → ResizeImage → EnhanceImage → SaveImageToLocal
AI对话流程:KeyInput → ChatGPTNode → ShowTextForGPT
视频制作流程:LoadVideoAndSegment → ImageListReplace → VideoCombine
2. 参数调节技巧
权重参数:通常1.0是标准值,大于1.0增强效果,小于1.0减弱效果
尺寸参数:建议使用8的倍数,如512、768、1024等
颜色参数:使用十六进制颜色代码,如#FF0000(红色)、#00FF00(绿色)
3. 性能优化建议
大批量处理时适当降低图片分辨率
使用合适的压缩级别平衡质量和文件大小
定期清理临时文件释放存储空间
常见问题解答
Q1:为什么有些节点显示红色错误?
A1: 通常是因为缺少依赖包。运行 pip install -r requirements.txt 安装所有依赖。
Q2:API密钥在哪里获取?
A2:
Q3:生成的图片质量不好怎么办?
A3:
检查输入图片的分辨率和质量
调整相关参数如对比度、平滑度等
尝试不同的缩放选项
Q4:视频处理很慢怎么办?
A4:
降低视频分辨率
减少处理的帧数
使用更快的视频格式如MP4
Q5:如何备份我的工作流?
A5: ComfyUI会自动保存工作流为JSON文件,建议定期备份这些文件。
总结
ComfyUI Mixlab 插件是一个功能全面的工具集,包含了120+个实用节点,覆盖了图像、音频、视频、AI对话等多个领域。通过合理组合这些节点,你可以创建出强大的自动化工作流,大大提高工作效率。
记住,熟练使用这个插件的关键是多实践、多尝试不同的参数组合。每个节点都有其独特的用途,理解它们的功能和参数含义,就能发挥出最大的潜力。