【版权严正声明】
本文系作者 [编程界的小学生] 原创,并拥有完整、独立的著作权。
未经本人 书面授权 ,任何单位、平台或个人, 严禁 以任何形式(包括但不限于转载、复制、摘编、修改、链接、转贴、建立镜像等)使用本文的全部或部分内容。
任何无视本声明的侵权行为,本人将依据《中华人民共和国著作权法》等相关法律法规,采取一切必要的法律手段,追究其侵权责任,要求其 立即停止侵权、赔礼道歉、消除影响,并赔偿因此造成的一切经济损失及维权成本(包括但不限于律师费、诉讼费、公证费等)。
侵权必究,切勿以身试法!
1. 插件简介
插件地址: https://github.com/kijai/ComfyUI-CogVideoXWrapper
这个插件是专门为 ComfyUI 设计的 CogVideoX 视频生成工具包。它就像给你的 ComfyUI 装上了一个专业的视频制作工厂,让你能够:
文字生成视频(T2V):就像对着魔法师说话,AI 根据你的描述创造出动态视频
图片生成视频(I2V):把静态图片变成会动的视频,就像哈利波特里的魔法照片
视频转视频(V2V):改变现有视频的风格和内容
轨迹控制(Tora):精确控制视频中物体的运动路径
姿态控制:让视频中的人物按照指定动作表演
风格迁移(LoRA):给视频换上不同的艺术风格
2. 如何安装
通用安装方法:
找到 ComfyUI 文件夹
打开你的 ComfyUI 安装目录
进入 custom_nodes 文件夹
下载插件
安装依赖
重启 ComfyUI
3. 节点详细解析
本插件总共包含 25 个节点,现在逐一详细解析:
3.1 CogVideo Sampler(CogVideo 采样器)
这个节点就像一个"视频制作机",是整个视频生成的核心引擎。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|
model | model | COGVIDEOMODEL类型 | 必填 | 这是你的"视频制作机器",不同机器有不同能力 | CogVideo模型实例 | 连接模型加载器的输出 |
positive | positive | CONDITIONING类型 | 必填 | 告诉AI你想要什么样的视频内容 | 正面提示词编码 | 连接文字编码器,描述想要的内容 |
negative | negative | CONDITIONING类型 | 必填 | 告诉AI你不想要什么内容 | 负面提示词编码 | 连接负面文字编码器,避免不想要的内容 |
num_frames | num_frames | 整数 | 49 | 视频有多少帧,就像翻页动画有多少页 | 生成视频的帧数 | 49帧约6秒,97帧约12秒 |
steps | steps | 整数 | 50 | AI"思考"多少次,次数越多质量越好但越慢 | 采样步数 | 20步够用,50步质量更好 |
cfg | cfg | 浮点数 | 6.0 | 控制AI有多"听话",数值越大越按你说的做 | 分类器自由引导强度 | 6.0是平衡值,太高可能过度拟合 |
seed | seed | 整数 | 0 | 随机数种子,相同种子产生相同结果 | 控制随机性的种子值 | 固定种子可重现结果 |
scheduler | scheduler | 下拉选择 | CogVideoXDDIM | 选择"制作工艺",不同工艺有不同效果 | 采样调度器类型 | DDIM适合大多数情况 |
3.2 CogVideo Decode(CogVideo 解码器)
这个节点就像"胶卷冲洗机",把AI生成的数据变成你能看到的视频。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|
vae | vae | VAE类型 | 必填 | 这是"冲洗设备",把数据变成图像 | 变分自编码器 | 连接VAE加载器 |
samples | samples | LATENT类型 | 必填 | 这是要"冲洗"的原始数据 | 潜在空间样本 | 连接采样器输出 |
enable_vae_tiling | enable_vae_tiling | 布尔值 | True | 开启后省显存但可能有接缝 | 启用VAE分块处理 | 显存不够时开启 |
tile_sample_min_height | tile_sample_min_height | 整数 | 240 | 分块的最小高度 | 分块最小高度像素 | 默认值通常够用 |
tile_sample_min_width | tile_sample_min_width | 整数 | 360 | 分块的最小宽度 | 分块最小宽度像素 | 默认值通常够用 |
tile_overlap_factor_height | tile_overlap_factor_height | 浮点数 | 0.2 | 分块间重叠程度,减少接缝 | 高度方向重叠因子 | 0.2是好的平衡值 |
tile_overlap_factor_width | tile_overlap_factor_width | 浮点数 | 0.2 | 分块间重叠程度,减少接缝 | 宽度方向重叠因子 | 0.2是好的平衡值 |
auto_tile_size | auto_tile_size | 布尔值 | True | 自动计算最佳分块大小 | 自动分块大小计算 | 建议保持开启 |
3.3 CogVideo TextEncode(CogVideo 文字编码器)
这个节点就像"翻译官",把你的文字描述翻译成AI能理解的语言。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|
clip | clip | CLIP类型 | 必填 | 这是"翻译设备",理解文字含义 | CLIP文本编码器 | 连接CLIP加载器 |
prompt | prompt | 字符串 | 空 | 你想要的视频内容描述 | 提示词文本 | "一只猫在花园里玩耍" |
strength | strength | 浮点数 | 1.0 | 控制描述的"影响力"强度 | 编码强度系数 | 1.0是标准强度 |
force_offload | force_offload | 布尔值 | True | 编码完成后释放显存 | 强制卸载到CPU | 显存紧张时开启 |
3.4 CogVideo ImageEncode(CogVideo 图片编码器)
这个节点就像"图片分析仪",把图片转换成AI能处理的格式,用于图生视频。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|
vae | vae | VAE类型 | 必填 | 图片处理设备 | 变分自编码器 | 连接VAE加载器 |
start_image | start_image | IMAGE类型 | 必填 | 视频的起始画面 | 起始帧图像 | 上传你想要动起来的图片 |
end_image | end_image | IMAGE类型 | 可选 | 视频的结束画面,可以做插值动画 | 结束帧图像 | 上传结束状态的图片 |
enable_tiling | enable_tiling | 布尔值 | False | 开启分块处理省显存 | 启用分块编码 | 大图片时开启 |
noise_aug_strength | noise_aug_strength | 浮点数 | 0.0 | 给图片加点"噪音"增加变化 | 噪声增强强度 | 0.1-0.3适合增加变化 |
strength | strength | 浮点数 | 1.0 | 控制图片对视频的影响程度 | 编码强度 | 1.0是完全按图片生成 |
start_percent | start_percent | 浮点数 | 0.0 | 从什么时候开始受图片影响 | 起始影响百分比 | 0.0表示从头开始 |
end_percent | end_percent | 浮点数 | 1.0 | 到什么时候停止受图片影响 | 结束影响百分比 | 1.0表示影响到最后 |
3.5 (Down)load CogVideo Model(下载加载 CogVideo 模型)
这个节点就像"模型商店",自动下载并加载各种CogVideo模型。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|
model | model | 下拉选择 | 根据需要 | 选择要使用的AI模型版本 | 预训练模型选择 | 2b模型快但质量一般,5b质量好但慢 |
precision | precision | 下拉选择 | bf16 | 选择计算精度,影响质量和速度 | 数值精度类型 | bf16平衡质量和速度 |
quantization | quantization | 下拉选择 | disabled | 模型压缩方式,省显存但可能降质量 | 量化方法 | fp8节省显存,disabled最高质量 |
enable_sequential_cpu_offload | enable_sequential_cpu_offload | 布尔值 | False | 把部分计算转到CPU,省显存但变慢 | 启用CPU卸载 | 显存不够时开启 |
attention_mode | attention_mode | 下拉选择 | sdpa | 选择注意力计算方式 | 注意力机制类型 | sdpa适合大多数情况 |
load_device | load_device | 下拉选择 | main_device | 选择模型加载到哪个设备 | 设备选择 | 有独显选main_device |
3.6 CogVideo TextEncode Combine(CogVideo 文字编码合并器)
这个节点就像"调色板",把两个不同的文字描述混合成一个。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|
conditioning_1 | conditioning_1 | CONDITIONING类型 | 必填 | 第一个文字描述 | 第一个条件编码 | 连接第一个文字编码器 |
conditioning_2 | conditioning_2 | CONDITIONING类型 | 必填 | 第二个文字描述 | 第二个条件编码 | 连接第二个文字编码器 |
combination_mode | combination_mode | 下拉选择 | weighted_average | 选择混合方式 | 组合模式 | weighted_average可调节比例 |
weighted_average_ratio | weighted_average_ratio | 浮点数 | 0.5 | 控制两个描述的混合比例 | 加权平均比例 | 0.3表示第一个占70%,第二个占30% |
这个节点就像"模型改装师",可以移除模型的某些部分来节省资源。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|
remove_blocks | remove_blocks | 字符串 | "15, 25, 37" | 要移除的模型块编号,用逗号分隔 | 要移除的Transformer块索引 | "15,25,37"移除这三个块 |
3.8 CogVideo Context Options(CogVideo 上下文选项)
这个节点就像"记忆管理器",控制AI在生成长视频时如何处理前后关联。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|
context_schedule | context_schedule | 下拉选择 | uniform_standard | 选择上下文调度策略 | 上下文调度方法 | uniform_standard适合大多数情况 |
context_frames | context_frames | 整数 | 48 | 上下文窗口大小(像素帧) | 上下文帧数 | 48帧是好的平衡值 |
context_stride | context_stride | 整数 | 4 | 上下文步长(像素帧) | 上下文步进 | 4是标准步长 |
context_overlap | context_overlap | 整数 | 4 | 上下文重叠(像素帧) | 上下文重叠帧数 | 4帧重叠保证连续性 |
freenoise | freenoise | 布尔值 | True | 是否打乱噪声分布 | 自由噪声开关 | True增加随机性 |
3.9 Tora Encode Trajectory(Tora 轨迹编码器)
这个节点就像"运动规划师",让你精确控制视频中物体的运动路径。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|
tora_model | tora_model | TORAMODEL类型 | 必填 | Tora运动控制模型 | Tora轨迹模型 | 连接Tora模型加载器 |
vae | vae | VAE类型 | 必填 | 图像编码器 | 变分自编码器 | 连接VAE加载器 |
coordinates | coordinates | 字符串 | 必填 | 运动轨迹坐标点 | 轨迹坐标数据 | JSON格式的坐标序列 |
width | width | 整数 | 720 | 视频宽度 | 视频宽度像素 | 720是标准宽度 |
height | height | 整数 | 480 | 视频高度 | 视频高度像素 | 480是标准高度 |
num_frames | num_frames | 整数 | 49 | 视频帧数 | 总帧数 | 49帧约6秒视频 |
strength | strength | 浮点数 | 1.0 | 轨迹控制强度 | 轨迹影响强度 | 1.0是完全按轨迹运动 |
start_percent | start_percent | 浮点数 | 0.0 | 轨迹开始生效的时间点 | 起始百分比 | 0.0从头开始 |
end_percent | end_percent | 浮点数 | 1.0 | 轨迹结束生效的时间点 | 结束百分比 | 1.0到最后结束 |
3.10 CogVideoX FasterCache(CogVideoX 快速缓存)
这个节点就像"记忆加速器",通过缓存计算结果来提高生成速度。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|
start_step | start_step | 整数 | 15 | 从第几步开始使用缓存 | 缓存开始步数 | 15步后开始缓存 |
hf_step | hf_step | 整数 | 30 | 高频缓存步数 | 高频缓存阈值 | 30步是平衡值 |
lf_step | lf_step | 整数 | 40 | 低频缓存步数 | 低频缓存阈值 | 40步是平衡值 |
cache_device | cache_device | 下拉选择 | main_device | 缓存存储设备 | 缓存设备选择 | main_device速度快但占显存 |
num_blocks_to_cache | num_blocks_to_cache | 整数 | 42 | 要缓存的模型块数量 | 缓存块数量 | 42是5b模型的全部块数 |
3.11 CogVideo ControlNet(CogVideo 控制网络)
这个节点就像"导演助手",让你用图片序列来控制视频的生成过程。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|
controlnet | controlnet | COGVIDECONTROLNETMODEL类型 | 必填 | 控制网络模型 | ControlNet模型实例 | 连接ControlNet加载器 |
images | images | IMAGE类型 | 必填 | 控制图片序列 | 控制帧序列 | 上传边缘图或深度图序列 |
control_strength | control_strength | 浮点数 | 1.0 | 控制强度 | 控制影响强度 | 1.0是完全按控制图生成 |
control_start_percent | control_start_percent | 浮点数 | 0.0 | 控制开始时间点 | 控制起始百分比 | 0.0从头开始控制 |
control_end_percent | control_end_percent | 浮点数 | 1.0 | 控制结束时间点 | 控制结束百分比 | 1.0控制到最后 |
3.12 CogVideo LatentPreview(CogVideo 潜在预览)
这个节点就像"草图预览器",让你在正式解码前先看看大概效果。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|
samples | samples | LATENT类型 | 必填 | 要预览的潜在数据 | 潜在空间样本 | 连接采样器输出 |
seed | seed | 整数 | 0 | 预览随机种子 | 随机种子 | 固定种子保证一致性 |
min_val | min_val | 浮点数 | -0.15 | 颜色映射最小值 | 最小映射值 | -0.15是合适的下限 |
max_val | max_val | 浮点数 | 0.15 | 颜色映射最大值 | 最大映射值 | 0.15是合适的上限 |
r_bias | r_bias | 浮点数 | 0.0 | 红色通道偏移 | 红色偏置 | 调节红色强度 |
g_bias | g_bias | 浮点数 | 0.0 | 绿色通道偏移 | 绿色偏置 | 调节绿色强度 |
b_bias | b_bias | 浮点数 | 0.0 | 蓝色通道偏移 | 蓝色偏置 | 调节蓝色强度 |
3.13 CogVideoXFun ResizeToClosestBucket(CogVideoXFun 最近分辨率调整)
这个节点就像"画布调整器",把图片调整到最适合的训练分辨率。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|
images | images | IMAGE类型 | 必填 | 要调整的图片 | 输入图像 | 上传需要调整的图片 |
base_resolution | base_resolution | 整数 | 512 | 基础分辨率 | 基准分辨率 | 512是标准基准 |
upscale_method | upscale_method | 下拉选择 | lanczos | 缩放算法 | 插值方法 | lanczos质量最好 |
crop | crop | 下拉选择 | disabled | 是否裁剪 | 裁剪模式 | center居中裁剪 |
3.14 CogVideo TorchCompileSettings(CogVideo 编译设置)
这个节点就像"性能优化器",通过编译优化来提高运行速度。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|
backend | backend | 下拉选择 | inductor | 编译后端 | 编译器后端 | inductor适合大多数情况 |
fullgraph | fullgraph | 布尔值 | False | 是否编译整个计算图 | 全图编译模式 | False更稳定 |
mode | mode | 下拉选择 | default | 编译优化模式 | 优化模式 | max-autotune最快但可能不稳定 |
dynamic | dynamic | 布尔值 | False | 是否启用动态模式 | 动态编译模式 | False更稳定 |
dynamo_cache_size_limit | dynamo_cache_size_limit | 整数 | 64 | 缓存大小限制 | 动态缓存限制 | 64是合适的大小 |
3.15 CogVideo ImageEncode FunInP(CogVideo 图片编码 Fun修复版)
这个节点是专门为Fun模型设计的图片编码器,支持图片修复功能。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|
vae | vae | VAE类型 | 必填 | 图片编码器 | 变分自编码器 | 连接VAE加载器 |
start_image | start_image | IMAGE类型 | 必填 | 起始图片 | 起始帧图像 | 上传要处理的图片 |
num_frames | num_frames | 整数 | 49 | 视频总帧数 | 目标帧数 | 49帧约6秒 |
end_image | end_image | IMAGE类型 | 可选 | 结束图片 | 结束帧图像 | 可选的结束状态 |
enable_tiling | enable_tiling | 布尔值 | False | 启用分块处理 | 分块编码开关 | 大图片时开启 |
noise_aug_strength | noise_aug_strength | 浮点数 | 0.0 | 噪声增强强度 | 噪声增强系数 | 0.1增加变化性 |
3.16 CogVideo Enhance-A-Video(CogVideo 视频增强)
这个节点就像"视频美颜师",能够增强视频的质量和细节。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|
weight | weight | 浮点数 | 1.0 | 增强效果的强度 | 增强权重 | 1.0是标准强度 |
start_percent | start_percent | 浮点数 | 0.0 | 开始增强的时间点 | 起始百分比 | 0.0从头开始 |
end_percent | end_percent | 浮点数 | 1.0 | 结束增强的时间点 | 结束百分比 | 1.0增强到最后 |
3.17 CogVideoX TeaCache(CogVideoX 茶缓存)
这个节点就像"智能缓存管家",通过智能缓存策略来加速生成。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|
rel_l1_thresh | rel_l1_thresh | 浮点数 | 0.3 | 缓存阈值,越高越快但质量可能下降 | 相对L1阈值 | 0.3是质量和速度的平衡点 |
3.18 Tora Encode OpticalFlow(Tora 光流编码器)
这个节点就像"运动分析师",分析现有视频的运动模式来指导新视频生成。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|
vae | vae | VAE类型 | 必填 | 图像编码器 | 变分自编码器 | 连接VAE加载器 |
tora_model | tora_model | TORAMODEL类型 | 必填 | Tora模型 | Tora轨迹模型 | 连接Tora模型加载器 |
optical_flow | optical_flow | IMAGE类型 | 必填 | 光流图像序列 | 光流数据 | 上传光流可视化图像 |
strength | strength | 浮点数 | 1.0 | 光流影响强度 | 光流权重 | 1.0完全按光流运动 |
start_percent | start_percent | 浮点数 | 0.0 | 开始应用时间点 | 起始百分比 | 0.0从头开始 |
end_percent | end_percent | 浮点数 | 1.0 | 结束应用时间点 | 结束百分比 | 1.0应用到最后 |
3.19 CogVideo LoraSelect(CogVideo LoRA选择器)
这个节点就像"风格选择器",让你选择和应用不同的艺术风格。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|
lora | lora | 下拉选择 | 根据需要 | 选择LoRA风格文件 | LoRA模型选择 | 选择动漫风格或写实风格 |
strength | strength | 浮点数 | 1.0 | 风格影响强度 | LoRA权重强度 | 1.0是完全应用风格 |
prev_lora | prev_lora | COGLORA类型 | 可选 | 之前的LoRA设置,用于叠加多个风格 | 前置LoRA链 | 可以叠加多种风格 |
fuse_lora | fuse_lora | 布尔值 | False | 是否融合LoRA到模型中 | LoRA融合开关 | True可能提高速度 |
3.20 CogVideoX VAE Loader(CogVideoX VAE加载器)
这个节点就像"图像处理器加载器",专门加载视频编解码器。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|
model_name | model_name | 下拉选择 | 根据需要 | 选择VAE模型文件 | VAE模型选择 | 选择对应的VAE文件 |
precision | precision | 下拉选择 | bf16 | 计算精度选择 | 数值精度 | bf16平衡质量和速度 |
compile_args | compile_args | COMPILEARGS类型 | 可选 | 编译优化参数 | 编译参数 | 连接编译设置节点 |
3.21 CogVideoX Model Loader(CogVideoX 模型加载器)
这个节点就像"本地模型管理器",加载你已经下载好的模型文件。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|
model | model | 下拉选择 | 根据需要 | 选择本地模型文件 | 本地模型选择 | 从diffusion_models文件夹选择 |
base_precision | base_precision | 下拉选择 | bf16 | 基础计算精度 | 基础精度类型 | bf16是推荐精度 |
quantization | quantization | 下拉选择 | disabled | 量化压缩方式 | 量化方法 | fp8节省显存 |
load_device | load_device | 下拉选择 | main_device | 加载设备选择 | 设备选择 | main_device加载到GPU |
enable_sequential_cpu_offload | enable_sequential_cpu_offload | 布尔值 | False | CPU卸载开关 | CPU卸载模式 | 显存不够时开启 |
attention_mode | attention_mode | 下拉选择 | sdpa | 注意力计算模式 | 注意力机制 | sdpa是标准模式 |
3.22 (Down)load CogVideo GGUF Model(下载加载 CogVideo GGUF模型)
这个节点就像"压缩模型专家",加载高度压缩的GGUF格式模型。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|
model | model | 下拉选择 | 根据需要 | 选择GGUF压缩模型 | GGUF模型选择 | Q4_0是4位量化版本 |
vae_precision | vae_precision | 下拉选择 | bf16 | VAE计算精度 | VAE精度类型 | bf16平衡质量速度 |
fp8_fastmode | fp8_fastmode | 布尔值 | False | FP8快速模式 | FP8优化模式 | 新显卡可以开启 |
load_device | load_device | 下拉选择 | main_device | 加载设备 | 设备选择 | main_device加载到GPU |
enable_sequential_cpu_offload | enable_sequential_cpu_offload | 布尔值 | False | CPU卸载 | CPU卸载开关 | 显存不够开启 |
attention_mode | attention_mode | 下拉选择 | sdpa | 注意力模式 | 注意力机制 | sdpa是标准选择 |
3.23 (Down)load CogVideo ControlNet(下载加载 CogVideo控制网络)
这个节点就像"控制器商店",下载各种控制网络模型。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|
model | model | 下拉选择 | 根据需要 | 选择控制网络类型 | ControlNet模型选择 | canny用于边缘控制,hed用于软边缘 |
3.24 (Down)load Tora Model(下载加载 Tora模型)
这个节点就像"运动控制专家",下载Tora轨迹控制模型。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|
model | model | 下拉选择 | 根据需要 | 选择Tora模型版本 | Tora模型选择 | I2V版本支持图生视频轨迹控制 |
3.25 CogVideo LoraSelect Comfy(CogVideo LoRA选择器 Comfy版)
这个节点是标准ComfyUI LoRA文件夹的LoRA选择器。
参数详解:
参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|
lora | lora | 下拉选择 | 根据需要 | 从ComfyUI标准LoRA文件夹选择 | 标准LoRA选择 | 使用ComfyUI/models/loras中的文件 |
strength | strength | 浮点数 | 1.0 | LoRA影响强度 | LoRA权重 | 1.0是完全应用 |
prev_lora | prev_lora | COGLORA类型 | 可选 | 前置LoRA链接 | LoRA链 | 可叠加多个LoRA |
fuse_lora | fuse_lora | 布尔值 | False | 是否融合LoRA | 融合开关 | True可能提高性能 |
4. 使用技巧和建议
4.1 新手入门建议
从文字生视频开始:先用简单的T2V工作流熟悉基本操作
选择合适的模型:2b模型速度快适合测试,5b模型质量好适合正式创作
控制视频长度:初学者建议从49帧(6秒)开始,熟练后再尝试更长视频
4.2 性能优化技巧
4.3 质量提升建议
提示词优化:详细描述想要的内容,使用专业的视频制作术语
参数调节:CFG值6-8通常效果最好,步数50以上质量更佳
后处理增强:使用Enhance-A-Video节点可以进一步提升视频质量
5. 常见问题解答
Q1: 为什么生成的视频很模糊?
A: 检查是否使用了过度量化,尝试提高采样步数,或使用质量更好的模型。
Q2: 显存不够怎么办?
A: 开启CPU卸载,使用GGUF模型,启用VAE分块,或选择较小的模型。
Q3: 如何控制视频中物体的运动?
A: 使用Tora节点可以精确控制运动轨迹,或使用ControlNet进行结构控制。
Q4: 生成速度太慢怎么办?
A: 使用FasterCache或TeaCache,启用torch编译优化,或选择较小的模型。
Q5: 如何生成更长的视频?
A: 使用Context Options节点配置上下文窗口,或使用视频插值技术。
6. 总结
ComfyUI-CogVideoXWrapper插件是一个功能强大的视频生成工具包,通过25个专业节点,你可以:
多种生成模式:文字生视频、图片生视频、视频转视频
精确控制:轨迹控制、姿态控制、边缘控制
风格定制:LoRA风格迁移、多风格混合
性能优化:多种量化方案、缓存加速、编译优化
质量增强:视频增强、高精度采样
无论你是视频创作新手还是专业用户,这个插件都能帮你创造出令人惊艳的AI视频作品。记住,掌握这些工具需要时间和实践,建议从简单的工作流开始,逐步探索更高级的功能!