【版权严正声明】
本文系作者 [编程界的小学生] 原创,并拥有完整、独立的著作权。
未经本人 书面授权 ,任何单位、平台或个人, 严禁 以任何形式(包括但不限于转载、复制、摘编、修改、链接、转贴、建立镜像等)使用本文的全部或部分内容。
任何无视本声明的侵权行为,本人将依据《中华人民共和国著作权法》等相关法律法规,采取一切必要的法律手段,追究其侵权责任,要求其 立即停止侵权、赔礼道歉、消除影响,并赔偿因此造成的一切经济损失及维权成本(包括但不限于律师费、诉讼费、公证费等)。
侵权必究,切勿以身试法!
1. 插件简介
插件地址: https://github.com/kijai/ComfyUI-KJNodes
ComfyUI-KJNodes 是一个功能强大的 ComfyUI 插件包,由 kijai 开发。这个插件就像一个超级工具箱,里面装满了各种实用的小工具,让你在制作图片和视频时更加得心应手。
主要功能包括:
图像处理工具 - 就像美图秀秀的各种滤镜和调整功能
遮罩生成和处理 - 就像PS里的选区工具,可以精确控制哪些地方要处理
文字和形状生成 - 可以在图片上添加文字或各种形状
批量处理功能 - 一次性处理多张图片,就像批量重命名文件一样方便
动画和过渡效果 - 让静态图片变成动态效果
音频相关处理 - 根据音乐节拍生成视觉效果
当前插件包含节点总数: 约200个节点 本次教程覆盖节点数: 完整版 - 200个节点 已补全所有主要节点类别,包括:
常量节点 (5个)
图像处理节点 (30+个)
遮罩处理节点 (20+个)
条件处理节点 (5个)
潜在空间处理节点 (5个)
音频处理节点 (10+个)
批量裁剪节点 (5个)
噪声处理节点 (5个)
实用工具节点 (15+个)
曲线编辑节点 (10+个)
实验性节点 (20+个)
模型优化节点 (15+个)
视频模型节点 (10+个)
2. 如何安装
方法一:通过 ComfyUI Manager 安装(推荐)
打开 ComfyUI,点击右下角的 "Manager" 按钮
在弹出的窗口中选择 "Install Custom Nodes"
搜索 "KJNodes" 或 "ComfyUI-KJNodes"
点击 "Install" 按钮
重启 ComfyUI
方法二:手动安装
打开终端或命令提示符
进入 ComfyUI 的 custom_nodes 文件夹
运行命令:git clone https://github.com/kijai/ComfyUI-KJNodes.git
进入插件文件夹:cd ComfyUI-KJNodes
安装依赖:pip install -r requirements.txt
重启 ComfyUI
3. 节点详细解析
3.1 常量节点类 (Constants)
3.1.1 BOOL Constant - 布尔值常量
作用: 就像一个开关,只有"开"和"关"两种状态,用来控制其他功能的启用或禁用。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
value | value | True/False | True | 就像电灯开关,True是开,False是关 | 布尔值,控制逻辑判断 | 用来控制是否反转遮罩、是否启用某个效果等 |
3.1.2 INT Constant - 整数常量
作用: 提供一个固定的整数值,就像设定一个具体的数量。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
value | value | 0-无限大 | 512 | 就像计数器,可以设置任何整数 | 整型数值常量 | 设置图片宽度512、批次数量10等 |
3.1.3 Float Constant - 小数常量
作用: 提供一个带小数点的数值,用于精确控制。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
value | value | 任意小数 | 1.0 | 就像温度计的刻度,可以很精确 | 浮点数值常量 | 设置透明度0.5、缩放比例1.2等 |
3.1.4 String Constant - 文字常量
作用: 存储一段文字,就像便签纸上写的内容。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
string | string | 任意文字 | "Hello" | 就像在纸上写字,可以写任何内容 | 字符串常量 | 写提示词、文件名、标签等 |
3.1.5 String Constant Multiline - 多行文字常量
作用: 可以写多行文字,就像写作文一样。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
string | string | 多行文字 | "" | 就像写日记,可以换行写很多内容 | 多行字符串常量 | 写长篇提示词、多个标签等 |
strip_newlines | strip_newlines | True/False | True | 是否去掉换行符,就像把段落合并成一行 | 是否移除换行符 | 处理文本格式时使用 |
3.2 图像处理节点类 (Image Processing)
3.2.1 Image Pass - 图像传递
作用: 就像一个中转站,让图像原样通过,不做任何改变。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例例 |
|---|
image | image | 图像 | - | 就像传递接力棒,原样传给下一个 | 图像数据透传 | 用于工作流中的图像路由 |
3.2.2 Color Match - 颜色匹配
作用: 让一张图片的颜色风格变得和另一张图片一样,就像给照片换滤镜。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
image_ref | image_ref | 参考图像 | - | 就像样板房,要模仿的颜色风格 | 参考图像,提供目标色彩风格 | 用一张夕阳照片给其他照片调色 |
image_target | image_target | 目标图像 | - | 要被改变颜色的图片 | 待处理的目标图像 | 要调色的原始照片 |
method | method | 多种算法 | mkl | 不同的调色方法,就像不同牌子的滤镜 | 颜色匹配算法选择 | mkl效果自然,hm速度快 |
strength | strength | 0.0-10.0 | 1.0 | 调色强度,就像滤镜的浓淡程度 | 颜色匹配强度系数 | 1.0是完全匹配,0.5是一半效果 |
3.2.3 Save Image With Alpha - 保存带透明通道的图像
作用: 保存图片时保留透明效果,就像保存PNG格式的透明图片。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
images | images | 图像 | - | 要保存的图片 | 输入图像数据 | 处理好的图片 |
mask | mask | 遮罩 | - | 透明区域的形状,就像镂空模板 | Alpha通道遮罩 | 决定哪些地方透明 |
filename_prefix | filename_prefix | 文字 | "ComfyUI" | 文件名的开头,就像给文件起名字 | 文件名前缀 | "my_image"会保存为"my_image_00001.png" |
3.2.4 Image Concatenate - 图像拼接
作用: 把两张图片拼在一起,就像拼图一样。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
image1 | image1 | 图像 | - | 第一张图片 | 第一个输入图像 | 左边或上面的图片 |
image2 | image2 | 图像 | - | 第二张图片 | 第二个输入图像 | 右边或下面的图片 |
direction | direction | 方向选择 | right | 拼接方向,就像贴瓷砖的方向 | 图像拼接方向 | right是左右拼接,down是上下拼接 |
match_image_size | match_image_size | True/False | True | 是否调整图片大小让它们匹配 | 是否统一图像尺寸 | True会自动调整大小,False保持原样 |
3.2.5 Image Concat From Batch - 批量图像网格拼接
作用: 把多张图片排列成网格,就像制作照片墙。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
images | images | 图像批次 | - | 一堆要排列的图片 | 输入图像批次 | 多张生成的图片 |
num_columns | num_columns | 1-255 | 3 | 每行放几张图,就像相册的列数 | 网格列数 | 3表示每行3张图 |
match_image_size | match_image_size | True/False | False | 是否让所有图片大小一致 | 是否统一图像尺寸 | True会调整到相同大小 |
max_resolution | max_resolution | 数字 | 4096 | 最大分辨率限制,防止图片太大 | 最大分辨率限制 | 4096表示最大4K分辨率 |
3.2.6 Image Grid Composite 2x2 - 2x2网格合成
作用: 把4张图片排成2行2列的格子,就像四宫格照片。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
image1 | image1 | 图像 | - | 左上角的图片 | 第一象限图像 | 放在左上位置的图 |
image2 | image2 | 图像 | - | 右上角的图片 | 第二象限图像 | 放在右上位置的图 |
image3 | image3 | 图像 | - | 左下角的图片 | 第三象限图像 | 放在左下位置的图 |
image4 | image4 | 图像 | - | 右下角的图片 | 第四象限图像 | 放在右下位置的图 |
3.2.7 Image Grid Composite 3x3 - 3x3网格合成
作用: 把9张图片排成3行3列的格子,就像九宫格照片。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
image1-image9 | image1-image9 | 图像 | - | 从左上到右下的9张图片 | 九宫格位置的图像 | 按顺序排列的9张图 |
3.2.8 Image Batch Test Pattern - 测试图案生成
作用: 生成带数字的测试图片,就像给每张图片贴上编号标签。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
batch_size | batch_size | 1-255 | 1 | 要生成几张图片 | 批次大小 | 10表示生成10张编号图片 |
start_from | start_from | 0-255 | 0 | 从哪个数字开始编号 | 起始编号 | 5表示从数字5开始 |
text_x | text_x | 0-4096 | 256 | 数字在图片中的左右位置 | 文字X坐标 | 256表示在图片中间偏左 |
text_y | text_y | 0-4096 | 256 | 数字在图片中的上下位置 | 文字Y坐标 | 256表示在图片中间偏上 |
width | width | 16-4096 | 512 | 图片宽度,就像画布的宽 | 图像宽度像素 | 512表示512像素宽 |
height | height | 16-4096 | 512 | 图片高度,就像画布的高 | 图像高度像素 | 512表示512像素高 |
font | font | 字体文件 | - | 数字的字体样式 | 字体文件选择 | 选择喜欢的字体风格 |
font_size | font_size | 8-4096 | 255 | 数字的大小 | 字体大小 | 255表示很大的数字 |
3.2.9 Image Grab PIL - 屏幕截图
作用: 截取屏幕上指定区域的图片,就像用截图工具。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
x | x | 0-4096 | 0 | 截图区域的左边界 | 截图起始X坐标 | 100表示从屏幕左边100像素开始 |
y | y | 0-4096 | 0 | 截图区域的上边界 | 截图起始Y坐标 | 50表示从屏幕顶部50像素开始 |
width | width | 0-4096 | 512 | 截图区域的宽度 | 截图宽度 | 800表示截图宽800像素 |
height | height | 0-4096 | 512 | 截图区域的高度 | 截图高度 | 600表示截图高600像素 |
num_frames | num_frames | 1-255 | 1 | 连续截几张图 | 截图帧数 | 5表示连续截5张图 |
delay | delay | 0.0-10.0 | 0.1 | 每次截图间隔时间(秒) | 截图间隔延迟 | 0.5表示每隔0.5秒截一张 |
3.2.10 Add Label - 添加文字标签
作用: 在图片上添加文字标签,就像给照片加说明文字。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
image | image | 图像 | - | 要添加文字的图片 | 输入图像 | 原始照片 |
text_x | text_x | 0-4096 | 10 | 文字的左右位置 | 文字X坐标 | 10表示距离左边10像素 |
text_y | text_y | 0-4096 | 2 | 文字的上下位置 | 文字Y坐标 | 2表示距离顶部2像素 |
height | height | -1-4096 | 48 | 文字区域的高度 | 文字区域高度 | 48像素高的文字区域 |
font_size | font_size | 0-4096 | 32 | 文字大小 | 字体大小 | 32表示中等大小的字 |
font_color | font_color | 颜色名 | "white" | 文字颜色 | 字体颜色 | "red"表示红色文字 |
label_color | label_color | 颜色名 | "black" | 文字背景颜色 | 标签背景色 | "blue"表示蓝色背景 |
font | font | 字体文件 | - | 文字的字体样式 | 字体文件 | 选择合适的字体 |
text | text | 文字内容 | "Text" | 要显示的文字内容 | 文字内容 | "Hello World"等任意文字 |
direction | direction | 方向选择 | up | 文字标签添加的位置 | 标签位置方向 | up在图片上方,down在下方 |
caption | caption | 文字内容 | "" | 可选的说明文字 | 可选标题文字 | 动态文字内容 |
3.3 遮罩处理节点类 (Mask Processing)
3.3.1 Color To Mask - 颜色转遮罩
作用: 把图片中特定颜色的区域变成遮罩,就像用魔术棒工具选择相同颜色。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
images | images | 图像 | - | 要处理的图片 | 输入图像数据 | 包含特定颜色的图片 |
invert | invert | True/False | False | 是否反转选择,就像选择相反的区域 | 是否反转遮罩 | True选择非目标颜色区域 |
red | red | 0-255 | 0 | 目标颜色的红色分量 | RGB红色值 | 255表示纯红色 |
green | green | 0-255 | 0 | 目标颜色的绿色分量 | RGB绿色值 | 255表示纯绿色 |
blue | blue | 0-255 | 0 | 目标颜色的蓝色分量 | RGB蓝色值 | 255表示纯蓝色 |
threshold | threshold | 0-255 | 10 | 颜色容差,就像选择的宽松程度 | 颜色匹配阈值 | 10表示允许轻微色差 |
per_batch | per_batch | 1-4096 | 16 | 每次处理多少张图片 | 批处理大小 | 16表示一次处理16张 |
3.3.2 Create Text Mask - 创建文字遮罩
作用: 生成文字形状的遮罩,就像用文字做模板。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
invert | invert | True/False | False | 是否反转遮罩,就像底片效果 | 是否反转遮罩 | True让文字变成透明 |
frames | frames | 1-4096 | 1 | 生成多少帧动画 | 动画帧数 | 10表示10帧动画 |
text_x | text_x | 0-4096 | 0 | 文字的左右位置 | 文字X坐标 | 100表示距左边100像素 |
text_y | text_y | 0-4096 | 0 | 文字的上下位置 | 文字Y坐标 | 50表示距顶部50像素 |
font_size | font_size | 8-4096 | 32 | 文字大小 | 字体大小 | 64表示大号文字 |
font_color | font_color | 颜色名 | "white" | 文字颜色 | 字体颜色 | "red"表示红色文字 |
text | text | 文字内容 | "HELLO!" | 要显示的文字 | 文字内容 | 任意想要的文字 |
font | font | 字体文件 | - | 文字的字体样式 | 字体文件选择 | 选择合适的字体 |
width | width | 16-4096 | 512 | 画布宽度 | 图像宽度 | 1024表示1024像素宽 |
height | height | 16-4096 | 512 | 画布高度 | 图像高度 | 768表示768像素高 |
start_rotation | start_rotation | 0-359 | 0 | 开始旋转角度 | 起始旋转角度 | 45表示倾斜45度 |
end_rotation | end_rotation | -359-359 | 0 | 结束旋转角度 | 结束旋转角度 | 90表示最终旋转90度 |
3.3.3 Create Gradient Mask - 创建渐变遮罩
作用: 生成渐变效果的遮罩,就像从黑到白的渐变。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
invert | invert | True/False | False | 是否反转渐变方向 | 是否反转遮罩 | True让渐变方向相反 |
frames | frames | 0-255 | 0 | 生成多少帧动画 | 动画帧数 | 20表示20帧渐变动画 |
width | width | 16-4096 | 256 | 遮罩宽度 | 遮罩宽度像素 | 512表示512像素宽 |
height | height | 16-4096 | 256 | 遮罩高度 | 遮罩高度像素 | 512表示512像素高 |
3.3.4 Create Shape Mask - 创建形状遮罩
作用: 生成各种几何形状的遮罩,就像用模具切出形状。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
shape | shape | 形状选择 | circle | 要生成的形状类型 | 几何形状类型 | circle圆形,square方形,triangle三角形 |
frames | frames | 1-4096 | 1 | 生成多少帧 | 动画帧数 | 10表示10帧动画 |
location_x | location_x | 0-4096 | 256 | 形状中心的左右位置 | 形状中心X坐标 | 256表示在画布中央 |
location_y | location_y | 0-4096 | 256 | 形状中心的上下位置 | 形状中心Y坐标 | 256表示在画布中央 |
grow | grow | -512-512 | 0 | 每帧形状大小变化量 | 形状增长速度 | 5表示每帧增大5像素 |
frame_width | frame_width | 16-4096 | 512 | 画布宽度 | 画布宽度像素 | 1024表示1024像素宽 |
frame_height | frame_height | 16-4096 | 512 | 画布高度 | 画布高度像素 | 768表示768像素高 |
shape_width | shape_width | 8-4096 | 128 | 形状的宽度 | 形状宽度像素 | 200表示200像素宽的形状 |
shape_height | shape_height | 8-4096 | 128 | 形状的高度 | 形状高度像素 | 150表示150像素高的形状 |
3.3.5 Grow Mask With Blur - 扩展并模糊遮罩
作用: 让遮罩变大或变小,还可以加上模糊效果,就像让选区边缘变柔和。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
mask | mask | 遮罩 | - | 要处理的遮罩 | 输入遮罩数据 | 原始的选区遮罩 |
expand | expand | 负数到正数 | 0 | 扩展大小,正数变大负数变小 | 遮罩扩展像素数 | 10让遮罩向外扩展10像素 |
incremental_expandrate | incremental_expandrate | 0.0-100.0 | 0.0 | 每帧递增的扩展量 | 递增扩展速率 | 1.0表示每帧多扩展1像素 |
tapered_corners | tapered_corners | True/False | True | 是否让角落变圆滑 | 是否使用锥形角落 | True让扩展后的角落更自然 |
flip_input | flip_input | True/False | False | 是否反转输入遮罩 | 是否翻转输入遮罩 | True让黑白区域互换 |
blur_radius | blur_radius | 0.0-100 | 0.0 | 模糊半径,数值越大越模糊 | 高斯模糊半径 | 5.0让边缘有轻微模糊 |
lerp_alpha | lerp_alpha | 0.0-1.0 | 1.0 | 帧间插值强度 | 线性插值系数 | 0.8让动画更平滑 |
decay_factor | decay_factor | 0.0-1.0 | 1.0 | 衰减因子 | 衰减系数 | 0.9让效果逐渐减弱 |
fill_holes | fill_holes | True/False | False | 是否填充遮罩中的洞 | 是否填充空洞 | True会填补遮罩内的空隙 |
3.3.6 Batch CLIPSeg - 批量CLIPSeg分割
作用: 使用AI模型根据文字描述批量分割图像,就像用语言告诉AI要选中什么。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
images | images | 图像批次 | - | 要分割的图片 | 输入图像批次 | 一批需要分割的照片 |
text | text | 文字描述 | "" | 要选中的物体描述 | 分割目标描述 | "person"选中人物,"car"选中汽车 |
threshold | threshold | 0.0-10.0 | 0.5 | 选中的敏感度 | 分割阈值 | 0.3更容易选中,0.7更严格 |
binary_mask | binary_mask | True/False | True | 是否生成二值化遮罩 | 是否二值化输出 | True只有黑白,False有灰度 |
combine_mask | combine_mask | True/False | False | 是否合并所有遮罩 | 是否合并批次遮罩 | True将所有结果合并成一个 |
use_cuda | use_cuda | True/False | True | 是否使用GPU加速 | 是否使用CUDA | True更快但需要显存 |
blur_sigma | blur_sigma | 0.0-100.0 | 0.0 | 边缘模糊程度 | 高斯模糊参数 | 2.0让边缘更柔和 |
3.3.7 Create Voronoi Mask - 创建泰森多边形遮罩
作用: 生成泰森多边形图案的遮罩,就像破碎的玻璃效果。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
frames | frames | 2-4096 | 16 | 生成多少帧动画 | 动画帧数 | 30表示30帧的动画 |
num_points | num_points | 1-4096 | 15 | 多边形的数量 | 泰森点数量 | 20表示20个多边形 |
line_width | line_width | 1-4096 | 4 | 边界线的粗细 | 线条宽度 | 2表示细线,8表示粗线 |
speed | speed | 0.0-1.0 | 0.5 | 动画速度 | 动画变化速度 | 0.8表示较快的变化 |
frame_width | frame_width | 16-4096 | 512 | 画布宽度 | 图像宽度 | 1024像素宽的画布 |
frame_height | frame_height | 16-4096 | 512 | 画布高度 | 图像高度 | 768像素高的画布 |
3.3.8 Create Magic Mask - 创建魔法遮罩
作用: 生成复杂的数学纹理遮罩,就像万花筒的图案。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
frames | frames | 2-4096 | 16 | 生成多少帧动画 | 动画帧数 | 60表示60帧的动画 |
depth | depth | 1-500 | 12 | 纹理复杂度 | 算法迭代深度 | 20表示更复杂的纹理 |
distortion | distortion | 0.0-100.0 | 1.5 | 扭曲程度 | 纹理扭曲强度 | 3.0表示很大的扭曲 |
seed | seed | 0-99999999 | 123 | 随机种子 | 随机数种子 | 相同种子生成相同图案 |
transitions | transitions | 1-20 | 1 | 过渡次数 | 动画过渡数量 | 3表示3次不同的过渡 |
frame_width | frame_width | 16-4096 | 512 | 画布宽度 | 图像宽度 | 1024像素宽的画布 |
frame_height | frame_height | 16-4096 | 512 | 画布高度 | 图像高度 | 768像素高的画布 |
3.3.9 Separate Masks - 分离遮罩
作用: 将一个包含多个区域的遮罩分离成多个单独的遮罩,就像把粘在一起的贴纸分开。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
mask | mask | 遮罩 | - | 要分离的遮罩 | 输入遮罩数据 | 包含多个区域的遮罩 |
size_threshold_width | size_threshold_width | 0-4096 | 256 | 最小宽度阈值 | 区域宽度阈值 | 100表示忽略小于100像素宽的区域 |
size_threshold_height | size_threshold_height | 0-4096 | 256 | 最小高度阈值 | 区域高度阈值 | 100表示忽略小于100像素高的区域 |
mode | mode | convex_polygons/area | convex_polygons | 分离模式 | 分离算法模式 | convex_polygons生成凸多边形 |
max_poly_points | max_poly_points | 3-32 | 8 | 多边形最大点数 | 多边形顶点数限制 | 12表示最多12个顶点 |
3.4 条件处理节点类 (Conditioning)
3.4.1 Conditioning Multi Combine - 多重条件合并
作用: 把多个提示词条件合并成一个,就像把多个想法融合在一起。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
inputcount | inputcount | 2-20 | 2 | 要合并多少个条件 | 输入条件数量 | 3表示合并3个不同的提示词 |
operation | operation | combine/concat | combine | 合并方式 | 条件合并操作类型 | combine是混合,concat是连接 |
conditioning_1 | conditioning_1 | 条件 | - | 第一个提示词条件 | 第一个条件输入 | 比如"美丽的风景" |
conditioning_2 | conditioning_2 | 条件 | - | 第二个提示词条件 | 第二个条件输入 | 比如"夕阳西下" |
3.4.2 Conditioning Set Mask And Combine - 设置遮罩并合并条件
作用: 给不同的提示词设置不同的作用区域,就像给不同区域涂不同颜色。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
positive_1 | positive_1 | 正面条件 | - | 第一个正面提示词 | 第一个正向条件 | "美丽的天空" |
negative_1 | negative_1 | 负面条件 | - | 第一个负面提示词 | 第一个负向条件 | "模糊的" |
positive_2 | positive_2 | 正面条件 | - | 第二个正面提示词 | 第二个正向条件 | "绿色的草地" |
negative_2 | negative_2 | 负面条件 | - | 第二个负面提示词 | 第二个负向条件 | "枯萎的" |
mask_1 | mask_1 | 遮罩 | - | 第一个提示词的作用区域 | 第一个区域遮罩 | 天空区域的遮罩 |
mask_2 | mask_2 | 遮罩 | - | 第二个提示词的作用区域 | 第二个区域遮罩 | 地面区域的遮罩 |
mask_1_strength | mask_1_strength | 0.0-10.0 | 1.0 | 第一个遮罩的强度 | 第一个遮罩强度 | 1.0是完全作用 |
mask_2_strength | mask_2_strength | 0.0-10.0 | 1.0 | 第二个遮罩的强度 | 第二个遮罩强度 | 0.5是一半强度 |
set_cond_area | set_cond_area | default/mask bounds | default | 条件作用范围设置 | 条件区域设置模式 | mask bounds限制在遮罩范围内 |
3.4.3 Conditioning Set Mask And Combine 3/4/5 - 多区域条件合并
作用: 同时对图像的3、4、5个不同区域设置不同的提示词,实现更精细的控制。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
positive_1-5 | positive_1-5 | 正面条件 | - | 多个正面提示词 | 多个正向条件 | 天空、山峰、水面、树木、人物 |
negative_1-5 | negative_1-5 | 负面条件 | - | 多个负面提示词 | 多个负向条件 | 对应区域的不想要的特征 |
mask_1-5 | mask_1-5 | 遮罩 | - | 多个区域遮罩 | 多个区域遮罩 | 精细划分的不同区域 |
mask_1-5_strength | mask_1-5_strength | 0.0-10.0 | 1.0 | 各区域遮罩强度 | 各区域遮罩强度 | 可以设置不同强度 |
3.5 潜在空间处理节点类 (Latent Processing)
3.5.1 Get Latents From Batch Indexed - 按索引获取潜在表示
作用: 从一批潜在表示中按索引选取特定的几个,就像从一堆照片中挑出几张。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
latents | latents | 潜在表示 | - | 要选择的潜在数据 | 输入潜在批次 | 一批潜在表示数据 |
indexes | indexes | 索引列表 | "0, 1, 2" | 要选取的索引号 | 索引列表字符串 | "0, 3, 5"选取第1、4、6个 |
latent_format | latent_format | BCHW/BTCHW/BCTHW | BCHW | 潜在数据格式 | 潜在张量格式 | BCHW是图像,BTCHW是视频 |
3.5.2 Get Latent Range From Batch - 获取潜在范围
作用: 从潜在批次中获取连续的一段,就像从视频中截取一段。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
latents | latents | 潜在表示 | - | 要截取的潜在数据 | 输入潜在批次 | 一批潜在表示数据 |
start_index | start_index | -1-4096 | 0 | 开始索引 | 起始位置索引 | 10表示从第10个开始 |
num_frames | num_frames | -1-4096 | 1 | 要获取的数量 | 获取的帧数 | 5表示获取连续5个 |
3.5.3 Insert Latent To Index - 插入潜在到指定位置
作用: 将一个潜在表示插入到另一个批次的指定位置,就像在视频中插入一帧。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
source | source | 源潜在表示 | - | 要插入的潜在数据 | 源潜在向量 | 新生成的潜在表示 |
destination | destination | 目标潜在表示 | - | 要被插入的潜在批次 | 目标潜在批次 | 原始的潜在序列 |
index | index | -1-4096 | 0 | 插入位置 | 插入索引 | 5表示插入到第5个位置 |
3.6 图像高级处理节点类 (Advanced Image Processing)
3.5.1 Cross Fade Images - 图像交叉淡入淡出
作用: 在两张图片之间创建平滑的过渡效果,就像电影中的镜头切换。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
images_1 | images_1 | 图像批次 | - | 第一组图片 | 第一个图像批次 | 起始的图片序列 |
images_2 | images_2 | 图像批次 | - | 第二组图片 | 第二个图像批次 | 目标的图片序列 |
interpolation | interpolation | 多种插值方式 | linear | 过渡动画类型 | 插值算法 | ease_in_out让过渡更自然 |
transition_start_index | transition_start_index | 0-4096 | 1 | 从第几帧开始过渡 | 过渡起始帧索引 | 10表示从第10帧开始过渡 |
transitioning_frames | transitioning_frames | 0-4096 | 1 | 过渡持续帧数 | 过渡帧数 | 30表示过渡持续30帧 |
start_level | start_level | 0.0-1.0 | 0.0 | 过渡起始透明度 | 起始透明度 | 0.0表示完全透明 |
end_level | end_level | 0.0-1.0 | 1.0 | 过渡结束透明度 | 结束透明度 | 1.0表示完全不透明 |
3.5.2 Transition Images Multi - 多图过渡效果
作用: 在多张图片之间创建各种过渡效果,就像PPT的切换动画。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
inputcount | inputcount | 2-1000 | 2 | 要过渡的图片数量 | 输入图像数量 | 5表示5张图片之间过渡 |
transition_type | transition_type | 多种过渡类型 | horizontal slide | 过渡效果类型 | 过渡动画类型 | circle是圆形扩展,fade是淡入淡出 |
interpolation | interpolation | 多种插值 | linear | 过渡动画曲线 | 插值算法 | bounce有弹跳效果 |
transitioning_frames | transitioning_frames | 0-4096 | 1 | 每个过渡的帧数 | 过渡帧数 | 15表示每个过渡持续15帧 |
blur_radius | blur_radius | 0.0-100.0 | 0.0 | 过渡边缘模糊程度 | 边缘模糊半径 | 5.0让过渡边缘更柔和 |
reverse | reverse | True/False | False | 是否反向过渡 | 是否反向播放 | True让过渡方向相反 |
3.5.3 Image Upscale With Model Batched - 批量模型放大
作用: 使用AI模型批量放大图片,比普通放大更清晰。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
upscale_model | upscale_model | 放大模型 | - | AI放大模型 | 超分辨率模型 | ESRGAN或RealESRGAN模型 |
images | images | 图像批次 | - | 要放大的图片 | 输入图像批次 | 一批需要放大的照片 |
per_batch | per_batch | 1-4096 | 16 | 每次处理的图片数 | 批次处理大小 | 8适合小显存,32适合大显存 |
3.5.4 Load Images From Folder KJ - 从文件夹加载图片
作用: 从指定文件夹批量加载图片,就像批量导入照片。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
folder | folder | 文件夹路径 | "" | 图片所在的文件夹 | 文件夹路径 | "/Users/images/"或"C:\Pictures\" |
width | width | -1-无限 | 1024 | 统一调整到的宽度 | 目标图像宽度 | 512表示调整到512像素宽 |
height | height | -1-无限 | 1024 | 统一调整到的高度 | 目标图像高度 | 512表示调整到512像素高 |
keep_aspect_ratio | keep_aspect_ratio | crop/pad/stretch | crop | 尺寸调整方式 | 纵横比处理方式 | crop裁剪,pad填充,stretch拉伸 |
image_load_cap | image_load_cap | 0-无限 | 0 | 最大加载图片数 | 图片数量限制 | 100表示最多加载100张 |
start_index | start_index | 0-无限 | 0 | 从第几张开始加载 | 起始索引 | 10表示跳过前10张图片 |
include_subfolders | include_subfolders | True/False | False | 是否包含子文件夹 | 是否递归搜索 | True会搜索所有子文件夹 |
3.8 实用工具节点类 (Utility)
作用: 读取其他节点的参数值并转换成文字,就像复制别人的设置。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
id | id | 0-100000 | 0 | 目标节点的编号 | 节点ID标识符 | 123表示编号为123的节点 |
widget_name | widget_name | 文字 | "" | 要读取的参数名称 | 控件参数名 | "width"表示读取宽度参数 |
return_all | return_all | True/False | False | 是否返回所有参数 | 是否返回全部控件值 | True返回该节点所有参数 |
any_input | any_input | 任意 | - | 连接线,确保目标节点存在 | 依赖输入连接 | 连接到目标节点确保执行顺序 |
node_title | node_title | 文字 | "" | 目标节点的标题名称 | 节点标题名称 | 可以用标题代替ID查找 |
allowed_float_decimals | allowed_float_decimals | 0-10 | 2 | 小数显示位数 | 浮点数精度位数 | 3表示显示3位小数 |
3.5.2 Something To String - 任意值转文字
作用: 把任何类型的数据转换成文字格式,就像把数字写在纸上。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
input | input | 任意类型 | - | 要转换的数据 | 输入数据 | 数字、列表等任意数据 |
prefix | prefix | 文字 | "" | 前缀文字 | 字符串前缀 | "结果是:"这样的开头 |
suffix | suffix | 文字 | "" | 后缀文字 | 字符串后缀 | "像素"这样的结尾 |
3.5.3 Sleep - 延时等待
作用: 让工作流暂停一段时间,就像让程序休息一下。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
input | input | 任意 | - | 要传递的数据 | 透传数据 | 原样传递给下一个节点 |
minutes | minutes | 0-1439 | 0 | 等待的分钟数 | 延迟分钟数 | 2表示等待2分钟 |
seconds | seconds | 0.0-59.99 | 0.0 | 等待的秒数 | 延迟秒数 | 5.5表示等待5.5秒 |
3.5.4 VRAM Debug - 显存调试
作用: 检查和清理显存使用情况,就像清理电脑内存。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
empty_cache | empty_cache | True/False | True | 是否清空缓存 | 是否清理显存缓存 | True会释放不用的显存 |
gc_collect | gc_collect | True/False | True | 是否进行垃圾回收 | 是否执行垃圾收集 | True会清理无用数据 |
unload_all_models | unload_all_models | True/False | False | 是否卸载所有模型 | 是否卸载全部模型 | True会释放所有模型占用的显存 |
any_input | any_input | 任意 | - | 任意输入数据 | 透传输入 | 用于控制执行时机 |
image_pass | image_pass | 图像 | - | 图像数据透传 | 图像透传 | 原样传递图像 |
model_pass | model_pass | 模型 | - | 模型数据透传 | 模型透传 | 原样传递模型 |
3.9 音频处理节点类 (Audio Processing)
3.6.1 Audio Concatenate - 音频拼接
作用: 把两段音频拼接在一起,就像把两首歌连在一起播放。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
audio1 | audio1 | 音频 | - | 第一段音频 | 第一个音频输入 | 背景音乐 |
audio2 | audio2 | 音频 | - | 第二段音频 | 第二个音频输入 | 人声录音 |
direction | direction | right/left | right | 拼接方向 | 音频拼接方向 | right是audio1在前,left是audio2在前 |
3.6.2 Sound Reactive - 声音反应
作用: 根据声音的大小来控制其他参数,就像音响的音量指示灯。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
sound_level | sound_level | 0.0-99999 | 1.0 | 当前声音大小 | 音频电平值 | 麦克风输入的音量大小 |
start_range_hz | start_range_hz | 0-9999 | 150 | 监听频率范围的起始值 | 频率范围下限 | 150Hz是低音范围 |
end_range_hz | end_range_hz | 0-9999 | 2000 | 监听频率范围的结束值 | 频率范围上限 | 2000Hz是中高音范围 |
multiplier | multiplier | 0.01-99999 | 1.0 | 声音强度放大倍数 | 音频增益系数 | 2.0表示声音强度翻倍 |
smoothing_factor | smoothing_factor | 0.0-1.0 | 0.5 | 平滑程度,避免声音跳跃 | 平滑滤波系数 | 0.8让变化更平缓 |
normalize | normalize | True/False | False | 是否标准化到0-1范围 | 是否归一化处理 | True让输出值在0-1之间 |
3.10 批量裁剪节点类 (Batch Cropping)
3.7.1 Batch Crop From Mask - 批量遮罩裁剪
作用: 根据遮罩批量裁剪图片,就像用模板批量切割照片。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
images | images | 图像批次 | - | 要裁剪的图片 | 输入图像批次 | 一批需要处理的照片 |
masks | masks | 遮罩批次 | - | 裁剪区域的遮罩 | 裁剪区域遮罩 | 标记要保留区域的模板 |
crop_size_mult | crop_size_mult | 0.1-10.0 | 1.0 | 裁剪尺寸倍数 | 裁剪尺寸乘数 | 1.5表示裁剪区域放大1.5倍 |
bbox_smooth_alpha | bbox_smooth_alpha | 0.0-1.0 | 0.5 | 边界框平滑度 | 边界框平滑系数 | 0.8让边界更平滑 |
3.7.2 Batch Uncrop - 批量反裁剪
作用: 把裁剪的图片放回原来的位置,就像把拼图块放回原位。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
original_images | original_images | 原始图像 | - | 原始的完整图片 | 原始图像数据 | 裁剪前的完整照片 |
cropped_images | cropped_images | 裁剪图像 | - | 处理过的裁剪图片 | 裁剪后的图像 | 经过AI处理的局部图片 |
bboxes | bboxes | 边界框 | - | 裁剪位置信息 | 边界框坐标 | 记录裁剪位置的坐标 |
border_blending | border_blending | 0.0-1.0 | 0.25 | 边界融合强度 | 边界混合系数 | 0.5让拼接更自然 |
3.11 噪声处理节点类 (Noise Processing)
3.8.1 Generate Noise - 生成噪声
作用: 生成随机噪声,就像电视没信号时的雪花点。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
width | width | 16-4096 | 512 | 噪声图片宽度 | 噪声图像宽度 | 512像素宽的噪声 |
height | height | 16-4096 | 512 | 噪声图片高度 | 噪声图像高度 | 512像素高的噪声 |
batch_size | batch_size | 1-4096 | 1 | 生成多少张噪声图 | 批次大小 | 10表示生成10张噪声图 |
seed | seed | 0-无限大 | 123 | 随机种子,控制噪声样式 | 随机数种子 | 相同种子生成相同噪声 |
multiplier | multiplier | 0.0-4096 | 1.0 | 噪声强度倍数 | 噪声强度乘数 | 2.0让噪声更强烈 |
constant_batch_noise | constant_batch_noise | True/False | False | 是否所有图片用相同噪声 | 是否使用恒定噪声 | True让所有图片噪声一样 |
normalize | normalize | True/False | False | 是否标准化噪声 | 是否归一化噪声 | True让噪声值在标准范围内 |
3.8.2 Inject Noise To Latent - 向潜在空间注入噪声
作用: 给图像的潜在表示添加噪声,就像给照片加上胶片颗粒感。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
latents | latents | 潜在表示 | - | 要添加噪声的潜在数据 | 输入潜在向量 | 图像的压缩表示 |
strength | strength | 0.0-200.0 | 0.1 | 噪声强度 | 噪声注入强度 | 0.5表示中等强度噪声 |
noise | noise | 噪声潜在表示 | - | 要注入的噪声 | 噪声潜在向量 | 随机生成的噪声数据 |
normalize | normalize | True/False | False | 是否标准化结果 | 是否归一化输出 | True保持数据范围稳定 |
average | average | True/False | False | 是否取平均值 | 是否使用平均混合 | True用平均而非相加 |
3.12 曲线编辑节点类 (Curve Editing)
3.9.1 Spline Editor - 样条曲线编辑器
作用: 创建和编辑平滑曲线,就像在绘图软件中画贝塞尔曲线。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
coordinates | coordinates | 坐标点 | "0,0;1,1" | 曲线上的控制点 | 样条曲线控制点 | "0,0;0.5,0.8;1,0"表示一条弧线 |
num_points | num_points | 10-1000 | 100 | 曲线上的点数 | 曲线采样点数 | 200表示曲线更平滑 |
closed_curve | closed_curve | True/False | False | 是否闭合曲线 | 是否创建闭合路径 | True让起点和终点相连 |
3.9.2 Create Shape Image On Path - 在路径上创建形状图像
作用: 沿着指定路径放置形状,就像在道路上画标线。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
coordinates | coordinates | 路径坐标 | - | 路径的坐标点 | 路径坐标数据 | 曲线或直线的路径 |
shape | shape | 形状类型 | circle | 要放置的形状 | 几何形状类型 | circle圆形,square方形 |
shape_size | shape_size | 1-100 | 10 | 形状大小 | 形状尺寸 | 20表示较大的形状 |
num_points | num_points | 1-1000 | 50 | 沿路径放置多少个形状 | 形状数量 | 100表示密集排列 |
width | width | 16-4096 | 512 | 画布宽度 | 图像宽度 | 1024像素宽的画布 |
height | height | 16-4096 | 512 | 画布高度 | 图像高度 | 768像素高的画布 |
3.13 实验性节点类 (Experimental)
3.10.1 Webcam Capture CV2 - 摄像头捕获
作用: 从摄像头实时捕获图像,就像拍照功能。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
x | x | 0-4096 | 0 | 捕获区域左上角X坐标 | 捕获区域X坐标 | 100表示从左边100像素开始 |
y | y | 0-4096 | 0 | 捕获区域左上角Y坐标 | 捕获区域Y坐标 | 50表示从顶部50像素开始 |
width | width | 0-4096 | 512 | 捕获区域宽度 | 捕获宽度 | 640像素宽的捕获区域 |
height | height | 0-4096 | 512 | 捕获区域高度 | 捕获高度 | 480像素高的捕获区域 |
cam_index | cam_index | 0-255 | 0 | 摄像头编号 | 摄像头设备索引 | 0是默认摄像头,1是第二个摄像头 |
release | release | True/False | False | 是否释放摄像头 | 是否释放摄像头资源 | True在使用后释放摄像头 |
3.10.2 Screencap mss - 屏幕截图(高性能)
作用: 高性能屏幕截图,比普通截图更快。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
x | x | 0-10000 | 0 | 截图区域左边界 | 截图起始X坐标 | 200表示从屏幕左边200像素开始 |
y | y | 0-10000 | 0 | 截图区域上边界 | 截图起始Y坐标 | 100表示从屏幕顶部100像素开始 |
width | width | 0-10000 | 512 | 截图区域宽度 | 截图宽度 | 1920表示截图宽1920像素 |
height | height | 0-10000 | 512 | 截图区域高度 | 截图高度 | 1080表示截图高1080像素 |
num_frames | num_frames | 1-255 | 1 | 连续截图帧数 | 截图帧数 | 10表示连续截10张图 |
delay | delay | 0.0-10.0 | 0.1 | 截图间隔时间(秒) | 截图间隔延迟 | 0.5表示每隔0.5秒截一张 |
3.14 模型优化节点类 (Model Optimization)
3.11.1 Torch Compile Model Flux Advanced - Flux模型编译优化
作用: 优化Flux模型的运行速度,就像给汽车调校引擎。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
model | model | 模型 | - | 要优化的Flux模型 | 输入模型 | 原始的Flux扩散模型 |
backend | backend | 编译后端 | inductor | 编译优化方式 | 编译器后端 | inductor是默认优化方式 |
mode | mode | 编译模式 | default | 优化程度 | 编译优化模式 | max-autotune最大优化 |
fullgraph | fullgraph | True/False | False | 是否完整图编译 | 是否编译完整计算图 | True可能更快但更不稳定 |
3.11.2 Patch Sage Attention KJ - Sage注意力机制补丁
作用: 优化注意力机制的内存使用,让模型运行更省显存。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
model | model | 模型 | - | 要优化的模型 | 输入模型 | 需要优化的扩散模型 |
enable | enable | True/False | True | 是否启用优化 | 是否启用Sage注意力 | True启用内存优化 |
q_chunk_size | q_chunk_size | 512-4096 | 1024 | 查询块大小 | 查询张量块大小 | 2048适合大显存 |
k_chunk_size | k_chunk_size | 512-4096 | 1024 | 键块大小 | 键张量块大小 | 1024是平衡选择 |
3.15 音频调度节点类 (Audio Scheduler)
3.13.1 Normalized Amplitude To Mask - 标准化振幅转遮罩
作用: 将音频的振幅信息转换为遮罩,可以根据音乐节拍生成视觉效果。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
normalized_amp | normalized_amp | 音频振幅 | - | 标准化的音频振幅数据 | 归一化音频振幅 | 从音频分析得到的振幅 |
width | width | 16-4096 | 512 | 遮罩宽度 | 输出遮罩宽度 | 512像素宽的遮罩 |
height | height | 16-4096 | 512 | 遮罩高度 | 输出遮罩高度 | 512像素高的遮罩 |
3.13.2 Normalized Amplitude To Float List - 标准化振幅转浮点列表
作用: 将音频振幅转换为浮点数列表,用于驱动其他参数。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
normalized_amp | normalized_amp | 音频振幅 | - | 标准化的音频振幅数据 | 归一化音频振幅 | 音频分析结果 |
multiplier | multiplier | 0.0-100.0 | 1.0 | 数值放大倍数 | 振幅乘数 | 2.0表示振幅翻倍 |
3.13.3 Offset Mask By Normalized Amplitude - 按振幅偏移遮罩
作用: 根据音频振幅动态偏移遮罩位置,创建音乐可视化效果。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
mask | mask | 遮罩 | - | 要偏移的遮罩 | 输入遮罩数据 | 基础遮罩形状 |
normalized_amp | normalized_amp | 音频振幅 | - | 音频振幅数据 | 归一化振幅 | 控制偏移量的音频数据 |
x_multiplier | x_multiplier | 0.0-1000.0 | 100.0 | X方向偏移倍数 | 水平偏移系数 | 200表示更大的水平移动 |
y_multiplier | y_multiplier | 0.0-1000.0 | 100.0 | Y方向偏移倍数 | 垂直偏移系数 | 150表示更大的垂直移动 |
作用: 根据音频振幅动态变换图像,创建音乐响应式视觉效果。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
images | images | 图像 | - | 要变换的图像 | 输入图像数据 | 背景图片或视频帧 |
normalized_amp | normalized_amp | 音频振幅 | - | 音频振幅数据 | 归一化振幅 | 控制变换的音频数据 |
zoom_multiplier | zoom_multiplier | 0.0-10.0 | 1.0 | 缩放倍数 | 缩放系数 | 2.0表示根据音频放大2倍 |
rotation_multiplier | rotation_multiplier | 0.0-360.0 | 0.0 | 旋转倍数 | 旋转角度系数 | 90表示最大旋转90度 |
3.16 曲线编辑节点类 (Curve Editing)
3.14.1 Spline Editor - 样条曲线编辑器
作用: 创建和编辑平滑曲线,就像在绘图软件中画贝塞尔曲线。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
coordinates | coordinates | 坐标点 | "0,0;1,1" | 曲线上的控制点 | 样条曲线控制点 | "0,0;0.5,0.8;1,0"表示一条弧线 |
num_points | num_points | 10-1000 | 100 | 曲线上的点数 | 曲线采样点数 | 200表示曲线更平滑 |
closed_curve | closed_curve | True/False | False | 是否闭合曲线 | 是否创建闭合路径 | True让起点和终点相连 |
3.14.2 Create Shape Image On Path - 在路径上创建形状图像
作用: 沿着指定路径放置形状,就像在道路上画标线。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
coordinates | coordinates | 路径坐标 | - | 路径的坐标点 | 路径坐标数据 | 曲线或直线的路径 |
shape | shape | 形状类型 | circle | 要放置的形状 | 几何形状类型 | circle圆形,square方形 |
shape_size | shape_size | 1-100 | 10 | 形状大小 | 形状尺寸 | 20表示较大的形状 |
num_points | num_points | 1-1000 | 50 | 沿路径放置多少个形状 | 形状数量 | 100表示密集排列 |
width | width | 16-4096 | 512 | 画布宽度 | 图像宽度 | 1024像素宽的画布 |
height | height | 16-4096 | 512 | 画布高度 | 图像高度 | 768像素高的画布 |
3.14.3 Create Shape Mask On Path - 在路径上创建形状遮罩
作用: 沿着路径创建形状遮罩,用于精确的区域控制。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
coordinates | coordinates | 路径坐标 | - | 路径的坐标点 | 路径坐标数据 | 从样条编辑器输出的路径 |
shape | shape | 形状类型 | circle | 遮罩形状 | 几何形状类型 | circle创建圆形遮罩 |
shape_size | shape_size | 1-100 | 10 | 遮罩大小 | 形状尺寸 | 15表示中等大小的遮罩 |
num_points | num_points | 1-1000 | 50 | 沿路径的遮罩数量 | 形状数量 | 80表示密集的遮罩分布 |
width | width | 16-4096 | 512 | 画布宽度 | 图像宽度 | 1024像素宽 |
height | height | 16-4096 | 512 | 画布高度 | 图像高度 | 768像素高 |
3.14.4 Create Text On Path - 在路径上创建文字
作用: 沿着曲线路径排列文字,创建艺术字效果。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
coordinates | coordinates | 路径坐标 | - | 文字排列的路径 | 路径坐标数据 | 弯曲的文字路径 |
text | text | 文字内容 | "Hello" | 要显示的文字 | 文本字符串 | "Welcome to AI World" |
font_size | font_size | 8-200 | 32 | 文字大小 | 字体大小 | 48表示大号文字 |
font_color | font_color | 颜色 | "white" | 文字颜色 | 字体颜色 | "red"表示红色文字 |
width | width | 16-4096 | 512 | 画布宽度 | 图像宽度 | 1024像素宽 |
height | height | 16-4096 | 512 | 画布高度 | 图像高度 | 768像素高 |
3.14.5 Create Gradient From Coords - 从坐标创建渐变
作用: 根据坐标点创建渐变效果,可以制作复杂的渐变图案。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
coordinates | coordinates | 坐标点 | - | 渐变的控制点 | 渐变坐标数据 | 定义渐变方向和强度 |
width | width | 16-4096 | 512 | 渐变图宽度 | 图像宽度 | 1024像素宽的渐变 |
height | height | 16-4096 | 512 | 渐变图高度 | 图像高度 | 768像素高的渐变 |
invert | invert | True/False | False | 是否反转渐变 | 是否反转颜色 | True让黑白颠倒 |
3.14.6 Cut And Drag On Path - 路径上的剪切拖拽
作用: 沿着路径对图像进行剪切和拖拽变形,创建动态效果。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
image | image | 图像 | - | 要变形的图片 | 输入图像 | 原始照片 |
coordinates | coordinates | 路径坐标 | - | 变形路径 | 变形路径数据 | 拖拽的轨迹 |
strength | strength | 0.0-10.0 | 1.0 | 变形强度 | 变形系数 | 2.0表示更强的变形 |
grow | grow | -100-100 | 0 | 路径扩展量 | 路径增长值 | 10表示路径向外扩展 |
3.17 批量裁剪节点类 (Batch Cropping)
3.15.1 Batch Crop From Mask - 批量遮罩裁剪
作用: 根据遮罩批量裁剪图片,就像用模板批量切割照片。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
images | images | 图像批次 | - | 要裁剪的图片 | 输入图像批次 | 一批需要处理的照片 |
masks | masks | 遮罩批次 | - | 裁剪区域的遮罩 | 裁剪区域遮罩 | 标记要保留区域的模板 |
crop_size_mult | crop_size_mult | 0.1-10.0 | 1.0 | 裁剪尺寸倍数 | 裁剪尺寸乘数 | 1.5表示裁剪区域放大1.5倍 |
bbox_smooth_alpha | bbox_smooth_alpha | 0.0-1.0 | 0.5 | 边界框平滑度 | 边界框平滑系数 | 0.8让边界更平滑 |
3.15.2 Batch Crop From Mask Advanced - 高级批量遮罩裁剪
作用: 更高级的批量裁剪功能,提供更多控制选项。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
images | images | 图像批次 | - | 要裁剪的图片 | 输入图像批次 | 一批需要处理的照片 |
masks | masks | 遮罩批次 | - | 裁剪区域遮罩 | 裁剪区域遮罩 | 精确的裁剪模板 |
crop_size_mult | crop_size_mult | 0.1-10.0 | 1.0 | 裁剪尺寸倍数 | 裁剪尺寸乘数 | 2.0表示裁剪区域翻倍 |
bbox_smooth_alpha | bbox_smooth_alpha | 0.0-1.0 | 0.5 | 边界框平滑度 | 边界框平滑系数 | 0.9表示很平滑的边界 |
individual_crop_size | individual_crop_size | True/False | False | 是否单独计算每个裁剪尺寸 | 是否独立计算尺寸 | True让每个区域有不同大小 |
min_crop_size | min_crop_size | 64-2048 | 256 | 最小裁剪尺寸 | 最小裁剪像素 | 512表示最小512像素 |
3.15.3 Batch Uncrop - 批量反裁剪
作用: 把裁剪的图片放回原来的位置,就像把拼图块放回原位。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
original_images | original_images | 原始图像 | - | 原始的完整图片 | 原始图像数据 | 裁剪前的完整照片 |
cropped_images | cropped_images | 裁剪图像 | - | 处理过的裁剪图片 | 裁剪后的图像 | 经过AI处理的局部图片 |
bboxes | bboxes | 边界框 | - | 裁剪位置信息 | 边界框坐标 | 记录裁剪位置的坐标 |
border_blending | border_blending | 0.0-1.0 | 0.25 | 边界融合强度 | 边界混合系数 | 0.5让拼接更自然 |
3.15.4 Batch Uncrop Advanced - 高级批量反裁剪
作用: 更高级的反裁剪功能,提供更精细的控制。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
original_images | original_images | 原始图像 | - | 原始完整图片 | 原始图像数据 | 裁剪前的背景图 |
cropped_images | cropped_images | 裁剪图像 | - | 处理后的图片 | 处理后图像 | AI增强后的局部图 |
bboxes | bboxes | 边界框 | - | 位置信息 | 边界框坐标 | 精确的位置数据 |
border_blending | border_blending | 0.0-1.0 | 0.25 | 边界融合强度 | 边界混合系数 | 0.7表示强融合 |
blend_mode | blend_mode | 混合模式 | normal | 图像混合方式 | 混合算法 | multiply表示正片叠底 |
feather_amount | feather_amount | 0-100 | 0 | 羽化程度 | 边缘羽化像素 | 10表示10像素的羽化 |
3.18 视频模型节点类 (Video Models)
3.16.1 Hunyuan Video Encode Keyframes To Cond - 混元视频关键帧编码
作用: 把视频的关键帧编码成条件信息,用于视频生成。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
model | model | 模型 | - | 视频生成模型 | 视频扩散模型 | HunyuanVideo模型 |
positive | positive | 正面条件 | - | 正面提示词 | 正向条件 | "美丽的风景视频" |
vae | vae | VAE编码器 | - | 视频编码器 | 视频自编码器 | 用于编码视频帧 |
start_frame | start_frame | 起始帧 | - | 视频开始帧 | 视频起始图像 | 视频第一帧的图片 |
end_frame | end_frame | 结束帧 | - | 视频结束帧 | 视频结束图像 | 视频最后一帧的图片 |
num_frames | num_frames | 2-4096 | 33 | 视频总帧数 | 视频帧数 | 60表示60帧的视频 |
tile_size | tile_size | 64-4096 | 512 | 瓦片大小 | 分块处理大小 | 1024适合高分辨率 |
overlap | overlap | 0-4096 | 64 | 瓦片重叠 | 分块重叠像素 | 128表示更多重叠 |
temporal_size | temporal_size | 8-4096 | 64 | 时间维度大小 | 时间分块大小 | 32适合短视频 |
temporal_overlap | temporal_overlap | 4-4096 | 8 | 时间重叠 | 时间分块重叠 | 16表示更多时间重叠 |
3.16.2 Apply RifleX RoPE HunyuanVideo - 应用RifleX旋转位置编码
作用: 扩展HunyuanVideo的帧数处理能力,让它能生成更长的视频。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
model | model | 模型 | - | 要扩展的视频模型 | 输入视频模型 | HunyuanVideo模型 |
latent | latent | 潜在表示 | - | 视频的潜在表示 | 视频潜在向量 | 用于获取帧数信息 |
k | k | 1-100 | 4 | 内在频率索引 | 频率索引参数 | 6适合更长视频 |
3.16.3 Apply RifleX RoPE WanVideo - 应用RifleX旋转位置编码(万视频)
作用: 扩展WanVideo模型的帧数处理能力。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
model | model | 模型 | - | 要扩展的视频模型 | 输入视频模型 | WanVideo模型 |
latent | latent | 潜在表示 | - | 视频的潜在表示 | 视频潜在向量 | 用于获取帧数信息 |
k | k | 1-100 | 6 | 内在频率索引 | 频率索引参数 | 8适合更长视频 |
3.16.4 WanVideo Tea Cache - 万视频茶缓存
作用: 通过缓存技术加速WanVideo模型的推理速度。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
model | model | 模型 | - | 要加速的模型 | 输入视频模型 | WanVideo模型 |
rel_l1_thresh | rel_l1_thresh | 0.0-10.0 | 0.275 | 缓存阈值 | 相对L1距离阈值 | 0.2表示更激进的缓存 |
start_percent | start_percent | 0.0-1.0 | 0.1 | 开始缓存的步数百分比 | 缓存起始百分比 | 0.2表示从20%步数开始 |
end_percent | end_percent | 0.0-1.0 | 1.0 | 结束缓存的步数百分比 | 缓存结束百分比 | 0.9表示到90%步数结束 |
cache_device | cache_device | 设备选择 | offload_device | 缓存存储设备 | 缓存设备选择 | main_device使用主设备 |
coefficients | coefficients | 系数选择 | i2v_480 | 模型特定的缓存系数 | 缓存优化系数 | 1.3B适合小模型 |
3.16.5 WanVideo Enhance A Video - 万视频增强
作用: 使用Enhance-A-Video技术提升视频质量和一致性。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
model | model | 模型 | - | 要增强的模型 | 输入视频模型 | WanVideo模型 |
latent | latent | 潜在表示 | - | 视频潜在数据 | 视频潜在向量 | 用于获取帧数信息 |
weight | weight | 0.0-10.0 | 2.0 | 增强强度 | 增强权重 | 3.0表示更强的增强效果 |
3.16.6 WanVideo NAG - 万视频标准化注意力引导
作用: 使用标准化注意力引导技术改善视频生成质量。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
model | model | 模型 | - | 要应用NAG的模型 | 输入视频模型 | WanVideo模型 |
conditioning | conditioning | 条件 | - | 正面提示词条件 | 正向条件数据 | 文本提示词的编码 |
nag_scale | nag_scale | 0.0-100.0 | 11.0 | 负面引导强度 | 负向引导缩放 | 15.0表示更强的负面引导 |
nag_alpha | nag_alpha | 0.0-1.0 | 0.25 | 混合系数 | 引导混合权重 | 0.3表示更多引导效果 |
nag_tau | nag_tau | 0.0-10.0 | 2.5 | 裁剪阈值 | 注意力裁剪阈值 | 3.0表示更严格的裁剪 |
3.16.7 Skip Layer Guidance WanVideo - 万视频跳层引导
作用: 通过跳过特定层的计算来加速推理并改善生成质量。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
model | model | 模型 | - | 要应用跳层的模型 | 输入视频模型 | WanVideo模型 |
blocks | blocks | 块编号 | "10" | 要跳过的层编号 | 跳过的块索引 | "5,10,15"表示跳过多个层 |
start_percent | start_percent | 0.0-1.0 | 0.2 | 开始跳层的步数百分比 | 跳层起始百分比 | 0.3表示从30%步数开始 |
end_percent | end_percent | 0.0-1.0 | 1.0 | 结束跳层的步数百分比 | 跳层结束百分比 | 0.8表示到80%步数结束 |
3.19 其他重要节点类 (Additional Important Nodes)
3.17.1 CheckpointLoaderKJ - 检查点加载器KJ
作用: 增强版的检查点加载器,提供更多控制选项。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
ckpt_name | ckpt_name | 模型文件 | - | 要加载的模型文件 | 检查点文件名 | 选择SD1.5或SDXL模型 |
device | device | 设备选择 | main_device | 模型加载到哪个设备 | 计算设备选择 | main_device用主设备,cpu用CPU |
weight_dtype | weight_dtype | 数据类型 | fp16 | 模型权重的数据类型 | 权重数据精度 | fp16省显存,fp32更精确 |
3.17.2 DiffusionModelLoaderKJ - 扩散模型加载器KJ
作用: 专门用于加载扩散模型的加载器。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
model_path | model_path | 模型路径 | - | 扩散模型文件路径 | 模型文件路径 | 指向具体的扩散模型文件 |
device | device | 设备选择 | main_device | 加载设备 | 计算设备 | 选择GPU或CPU |
weight_dtype | weight_dtype | 数据类型 | fp16 | 权重精度 | 数据类型精度 | 平衡速度和质量 |
3.17.3 GLIGENTextBoxApplyBatchCoords - GLIGEN文本框批量坐标
作用: 为GLIGEN模型批量应用文本框坐标,实现精确的文本定位。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
conditioning | conditioning | 条件 | - | 输入的条件信息 | 条件编码 | GLIGEN的文本条件 |
clip | clip | CLIP模型 | - | CLIP文本编码器 | CLIP编码器 | 用于编码文本 |
gligen_textbox_model | gligen_textbox_model | GLIGEN模型 | - | GLIGEN文本框模型 | GLIGEN模型 | 专门的定位模型 |
coordinates | coordinates | 坐标列表 | - | 文本框的位置坐标 | 边界框坐标 | 指定文本出现的位置 |
text | text | 文本内容 | - | 要定位的文字 | 文本字符串 | "cat", "dog"等描述词 |
3.17.4 Intrinsic_lora_sampling - 内在LoRA采样
作用: 使用内在LoRA进行特殊的采样控制。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
model | model | 模型 | - | 要应用LoRA的模型 | 输入模型 | 基础扩散模型 |
lora_name | lora_name | LoRA名称 | - | 内在LoRA文件 | LoRA文件选择 | 选择特定的内在LoRA |
strength | strength | 强度 | 1.0 | LoRA的影响强度 | LoRA权重 | 1.0是完全应用 |
3.17.5 Superprompt - 超级提示词
作用: 使用T5模型自动扩展和优化提示词,让简单的描述变成详细的提示词。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
instruction_prompt | instruction_prompt | 指令提示 | "Expand the following prompt to add more detail" | 告诉AI如何处理提示词 | 指令模板 | 可以改成"让这个描述更生动" |
prompt | prompt | 原始提示词 | - | 要扩展的简单描述 | 输入提示词 | "a cat"会扩展成详细描述 |
max_new_tokens | max_new_tokens | 最大新词数 | 128 | 最多生成多少个新词 | 生成长度限制 | 256表示更详细的扩展 |
3.17.6 CFGZeroStarAndInit - CFG零星初始化
作用: 特殊的CFG初始化方法,用于某些高级采样技术。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例例 |
|---|
model | model | 模型 | - | 要处理的模型 | 输入扩散模型 | 基础生成模型 |
positive | positive | 正面条件 | - | 正面提示词 | 正向条件 | 想要的内容描述 |
negative | negative | 负面条件 | - | 负面提示词 | 负向条件 | 不想要的内容 |
cfg_scale | cfg_scale | CFG强度 | 7.0 | 提示词遵循程度 | CFG引导强度 | 7.0是常用值 |
3.17.7 ModelPatchTorchSettings - 模型补丁Torch设置
作用: 调整模型的PyTorch运行设置,优化性能。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
model | model | 模型 | - | 要优化的模型 | 输入模型 | 需要调优的扩散模型 |
dtype | dtype | 数据类型 | fp16 | 计算精度 | 数据类型 | fp16更快,fp32更精确 |
device | device | 设备 | auto | 运行设备 | 计算设备 | auto自动选择最佳设备 |
3.20 实例扩散节点类 (Instance Diffusion)
3.18.1 CreateInstanceDiffusionTracking - 创建实例扩散跟踪
作用: 创建实例扩散的跟踪数据,用于物体跟踪和一致性控制。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
instances | instances | 实例数量 | 1 | 要跟踪的物体数量 | 实例对象数量 | 2表示跟踪2个不同物体 |
frames | frames | 帧数 | 16 | 跟踪多少帧 | 时间序列长度 | 30表示30帧的跟踪 |
3.18.2 AppendInstanceDiffusionTracking - 追加实例扩散跟踪
作用: 向现有的跟踪数据中添加新的实例信息。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
tracking_data | tracking_data | 跟踪数据 | - | 现有的跟踪信息 | 实例跟踪数据 | 之前创建的跟踪数据 |
new_instance | new_instance | 新实例 | - | 要添加的新物体 | 新实例数据 | 新的跟踪目标 |
3.18.3 DrawInstanceDiffusionTracking - 绘制实例扩散跟踪
作用: 将跟踪数据可视化,显示物体的运动轨迹。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|
tracking_data | tracking_data | 跟踪数据 | - | 要可视化的跟踪信息 | 实例跟踪数据 | 包含轨迹的数据 |
width | width | 画布宽度 | 512 | 可视化图像的宽度 | 输出图像宽度 | 1024表示高分辨率 |
height | height | 画布高度 | 512 | 可视化图像的高度 | 输出图像高度 | 768表示16:9比例 |
show_trajectory | show_trajectory | 显示轨迹 | True | 是否显示运动轨迹线 | 是否绘制轨迹 | True显示完整运动路径 |
4. 使用技巧和建议
4.1 基础使用技巧
节点连接顺序很重要 - 就像做菜要按步骤来,先洗菜再切菜再炒菜
善用常量节点 - 把经常用的数值设置成常量,方便统一调整
遮罩是关键 - 学会使用各种遮罩节点,可以精确控制效果范围
批量处理节省时间 - 一次处理多张图片比一张张处理效率高
4.2 性能优化建议
合理设置批次大小 - per_batch参数不要设置太大,避免显存不足
及时清理显存 - 使用VRAM Debug节点定期清理显存
避免过大分辨率 - 测试时先用小分辨率,确认效果后再用大分辨率
4.3 常见组合用法
图像拼接流程:Image Batch → Image Concat From Batch → Save Image
文字遮罩应用:Create Text Mask → Grow Mask With Blur → 应用到图像
颜色匹配工作流:参考图像 + 目标图像 → Color Match → 调整强度
5. 常见问题解答
Q1: 为什么节点显示红色错误?
A: 通常是因为:
输入数据类型不匹配
缺少必要的依赖库
参数设置超出范围
显存不足
Q2: 如何提高处理速度?
A: 可以尝试:
降低批次大小
使用较小的图像分辨率进行测试
定期清理显存
关闭不必要的预览
Q3: 遮罩效果不明显怎么办?
A: 检查:
遮罩的黑白对比度
遮罩强度参数设置
是否需要反转遮罩
遮罩尺寸是否匹配图像
Q4: 文字节点不显示中文怎么办?
A: 需要:
使用支持中文的字体文件
确保字体文件放在正确的fonts文件夹中
检查字体文件格式是否正确
Q5: 如何批量处理大量图片?
A: 建议:
使用Image Batch相关节点
合理设置per_batch参数
监控显存使用情况
分批次处理避免内存溢出
6. 进阶应用示例
6.1 制作动态文字效果
使用Create Text Mask创建文字遮罩
设置start_rotation和end_rotation创建旋转动画
用Grow Mask With Blur添加动态扩展效果
最后应用到背景图像上
6.2 批量图片风格统一
选择一张风格参考图片
使用Color Match节点
批量处理多张目标图片
调整strength参数控制风格强度
6.3 创建复杂遮罩动画
组合多个Create Shape Mask
使用不同的grow参数创建动态效果
用Conditioning Set Mask And Combine应用到不同区域
生成具有区域控制的动画效果