ComfyUI-KLingAI-API 插件保姆级教程
1. 插件简介
插件地址: https://github.com/KwaiVGI/ComfyUI-KLingAI-API
ComfyUI-KLingAI-API 是一个超级强大的视频和图片生成插件!你可以把它想象成一个"魔法工厂",能够:
这个插件能给我们带来什么效果?
-
文字变视频:只要输入一段描述,就能生成对应的视频!就像对着魔法师说"我想要一只会飞的猫",然后真的出现了这样的视频!
-
图片变视频:把静态图片变成动态视频!就像哈利波特里的魔法照片一样会动!
-
智能图片生成:根据文字描述生成高质量图片,比传统的图片生成更智能!
-
虚拟试衣:可以让人物图片"穿上"不同的衣服,就像虚拟换装游戏!
-
视频延长:把短视频变成长视频,让故事继续下去!
-
口型同步:让人物说话时嘴巴动作和声音完全同步!
-
特效视频:给视频添加各种酷炫特效,比如爱心、拥抱等!
2. 如何安装
方法一:使用 ComfyUI Manager(推荐新手)
- 打开 ComfyUI
- 点击右下角的 "Manager" 按钮
- 搜索 "KLingAI"
- 找到 "ComfyUI-KLingAI-API" 点击安装
- 重启 ComfyUI
方法二:手动安装
- 打开终端或命令提示符
- 进入你的 ComfyUI 安装目录下的
custom_nodes文件夹 - 运行命令:
git clone https://github.com/KwaiVGI/ComfyUI-KLingAI-API.git - 安装依赖:
pip install -r ComfyUI-KLingAI-API/requirements.txt - 重启 ComfyUI
重要提醒
使用这个插件需要 KLingAI 的账号和密钥,就像需要会员卡才能进入会员商店一样!
3. 节点逐一解析
3.1 Client 节点是干嘛的?
这个节点就像一把"万能钥匙"!它的作用是:
- 连接到 KLingAI 的服务器
- 验证你的身份(就像刷门禁卡)
- 为其他所有节点提供"通行证"
- 没有这个节点,其他节点都用不了!
3.2 Client 节点参数详解
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| access_key | access_key | 文本字符串 | 你的访问密钥 | 这是你的"用户名",告诉服务器你是谁 | KLingAI API的访问密钥 | 从KLingAI官网获取后填入 |
| secret_key | secret_key | 文本字符串 | 你的秘密密钥 | 这是你的"密码",证明你有权限使用 | KLingAI API的秘密密钥 | 从KLingAI官网获取后填入 |
| poll_interval | poll_interval | 整数 | 1 | 这是"查询间隔",控制多久检查一次任务完成 | 轮询间隔时间(秒) | 通常用1秒,网络慢可以改成2-3秒 |
3.3 Image Generator 节点是干嘛的?
这个节点就像一个"画家机器人"!它的作用是:
- 根据你的文字描述画出图片
- 可以参考已有图片来画新图片
- 支持不同的画风和尺寸
- 就像对画家说"画一只蓝色的猫"然后真的画出来!
3.4 Image Generator 节点参数详解
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| client | client | 客户端连接 | 来自Client节点 | 这是"通行证",连接到服务器用的 | API客户端实例 | 连接Client节点的输出 |
| model | model | 模型选择 | kling-v2 | 这是选择"画家的风格",不同模型画风不同 | 图像生成模型版本 | v2是最新最好的,推荐使用 |
| prompt | prompt | 文本描述 | 详细描述 | 这是告诉画家"你想要什么"的描述 | 正向提示词 | 写"一只可爱的小猫在花园里玩耍" |
| negative_prompt | negative_prompt | 文本描述 | 不想要的内容 | 这是告诉画家"你不想要什么" | 负向提示词 | 写"模糊,低质量,变形" |
| image | image | 图片输入 | 可选 | 这是给画家看的"参考图片" | 参考图像 | 连接一张图片作为参考 |
| image_reference | image_reference | 参考类型 | None | 这是告诉画家"参考图片的哪个部分" | 图像参考类型 | subject参考主体,face参考脸部 |
| image_fidelity | image_fidelity | 0.0-1.0 | 0.5 | 这是"参考图片的相似度",越高越像参考图 | 图像保真度 | 0.5是平衡,0.8更像参考图 |
| human_fidelity | human_fidelity | 0.0-1.0 | 0.45 | 这是"人物相似度",控制人脸像不像参考 | 人物保真度 | 生成人物时调高到0.7-0.8 |
| image_num | image_num | 1-9 | 1 | 这是"要画几张图",就像点菜数量 | 生成图像数量 | 1张够用,多张会消耗更多积分 |
| aspect_ratio | aspect_ratio | 比例选择 | 16:9 | 这是"画布形状",横屏还是竖屏 | 图像宽高比 | 16:9适合横屏,9:16适合手机 |
3.5 Text2Video 节点是干嘛的?
这个节点就像一个"电影导演机器人"!它的作用是:
- 根据你的文字描述拍出视频
- 可以控制镜头运动(推拉摇移)
- 支持不同时长和画质
- 就像对导演说"拍一个猫咪在草地上奔跑的视频"!
3.6 Text2Video 节点参数详解
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| client | client | 客户端连接 | 来自Client节点 | 这是"通行证",连接到服务器用的 | API客户端实例 | 连接Client节点的输出 |
| model | model | 模型选择 | kling-v2-master | 这是选择"导演的风格",不同模型效果不同 | 视频生成模型版本 | v2-master是最新最好的 |
| prompt | prompt | 文本描述 | 详细描述 | 这是告诉导演"你想拍什么视频" | 正向提示词 | 写"一只小猫在阳光下追蝴蝶" |
| negative_prompt | negative_prompt | 文本描述 | 不想要的内容 | 这是告诉导演"你不想要什么效果" | 负向提示词 | 写"模糊,抖动,低质量" |
| cfg_scale | cfg_scale | 0.0-1.0 | 0.5 | 这是"创意程度",越高越按你的描述来 | 引导强度 | 0.5是平衡,0.8更严格按描述 |
| mode | mode | std/pro | pro | 这是"画质档位",pro更清晰但更贵 | 生成模式 | pro质量更好,std更便宜 |
| aspect_ratio | aspect_ratio | 比例选择 | 16:9 | 这是"视频画面比例",横屏还是竖屏 | 视频宽高比 | 16:9适合电脑,9:16适合手机 |
| duration | duration | 5/10 | 5 | 这是"视频长度",5秒或10秒 | 视频时长(秒) | 5秒够用且便宜,10秒更完整 |
| camera_control_type | camera_control_type | 镜头类型 | None | 这是"镜头运动方式",比如推进、后退 | 镜头控制类型 | simple可自定义,其他是预设 |
| camera_control_config | camera_control_config | 运动方向 | horizontal | 这是"镜头运动方向",水平还是垂直 | 镜头控制配置 | horizontal左右移动,vertical上下移动 |
| camera_control_value | camera_control_value | -10.0到10.0 | 0.5 | 这是"镜头运动幅度",正数向前负数向后 | 镜头控制数值 | 2.0是轻微移动,5.0是明显移动 |
3.7 Image2Video 节点是干嘛的?
这个节点就像一个"照片复活师"!它的作用是:
- 把静态图片变成动态视频
- 可以控制图片中的元素如何动起来
- 支持首尾帧控制(开始和结束的样子)
- 就像让蒙娜丽莎的画像动起来眨眼睛!
3.8 Image2Video 节点参数详解
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| client | client | 客户端连接 | 来自Client节点 | 这是"通行证",连接到服务器用的 | API客户端实例 | 连接Client节点的输出 |
| model | model | 模型选择 | kling-v2-master | 这是选择"复活师的技能",不同模型效果不同 | 视频生成模型版本 | v2-master效果最好 |
| image | image | 图片输入 | 必需 | 这是要"复活"的静态图片 | 输入图像 | 连接一张清晰的图片 |
| image_tail | image_tail | 结束图片 | 可选 | 这是视频"结束时的样子",控制动画终点 | 尾帧图像 | 可以让动画有明确的结束状态 |
| prompt | prompt | 文本描述 | 动作描述 | 这是告诉复活师"图片要怎么动" | 动作提示词 | 写"轻轻摇摆,微风吹动" |
| negative_prompt | negative_prompt | 文本描述 | 不想要的动作 | 这是告诉复活师"不要这样动" | 负向提示词 | 写"剧烈摇晃,变形扭曲" |
| cfg_scale | cfg_scale | 0.0-1.0 | 0.5 | 这是"动作强度",越高动作越明显 | 引导强度 | 0.3轻微动作,0.7明显动作 |
| mode | mode | std/pro | pro | 这是"画质档位",pro更清晰但更贵 | 生成模式 | pro质量更好,适合重要作品 |
| duration | duration | 5/10 | 5 | 这是"动画长度",5秒或10秒 | 视频时长(秒) | 5秒适合简单动作 |
| camera_control_type | camera_control_type | 镜头类型 | None | 这是"镜头运动方式",比如推进、后退 | 镜头控制类型 | 可以让镜头也动起来 |
| camera_control_config | camera_control_config | 运动方向 | horizontal | 这是"镜头运动方向",水平还是垂直 | 镜头控制配置 | 配合镜头类型使用 |
| camera_control_value | camera_control_value | -10.0到10.0 | 0.5 | 这是"镜头运动幅度",控制移动距离 | 镜头控制数值 | 数值越大移动越明显 |
3.9 Virtual Try On 节点是干嘛的?
这个节点就像一个"虚拟试衣间"!它的作用是:
- 让人物图片"穿上"不同的衣服
- 自动识别人体和衣服的形状
- 生成逼真的试穿效果
- 就像网购时的虚拟试衣功能!
3.10 Virtual Try On 节点参数详解
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| client | client | 客户端连接 | 来自Client节点 | 这是"通行证",连接到服务器用的 | API客户端实例 | 连接Client节点的输出 |
| model_name | model_name | 模型选择 | kolors-virtual-try-on-v1-5 | 这是选择"试衣师的技能",v1-5更准确 | 虚拟试衣模型版本 | v1-5是最新版本,效果更好 |
| human_image | human_image | 人物图片 | 必需 | 这是要"试衣服的人"的照片 | 人物图像输入 | 需要清晰的人物正面照 |
| cloth_image | cloth_image | 衣服图片 | 必需 | 这是要"试穿的衣服"的照片 | 服装图像输入 | 需要平铺的衣服照片 |
3.11 KLingAI Preview Video 节点是干嘛的?
这个节点就像一个"视频播放器"!它的作用是:
- 预览生成的视频效果
- 可以选择是否保存到本地
- 自动下载视频文件
- 就像视频网站的播放窗口!
3.12 KLingAI Preview Video 节点参数详解
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| video_url | video_url | 视频链接 | 来自其他节点 | 这是"视频的网址",告诉播放器去哪找视频 | 视频URL地址 | 连接视频生成节点的url输出 |
| filename_prefix | filename_prefix | 文件名前缀 | KLingAI | 这是"保存文件的名字开头",方便整理 | 文件名前缀 | 可以改成"我的视频"等 |
| save_output | save_output | 是否保存 | True | 这是"要不要把视频下载到电脑"的开关 | 是否保存到本地 | True保存,False只预览 |
3.13 Video Extend 节点是干嘛的?
这个节点就像一个"续集导演"!它的作用是:
- 把短视频延长成长视频
- 根据原视频内容继续创作
- 保持风格和内容的连贯性
- 就像给电影拍续集!
3.14 Video Extend 节点参数详解
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| client | client | 客户端连接 | 来自Client节点 | 这是"通行证",连接到服务器用的 | API客户端实例 | 连接Client节点的输出 |
| video_id | video_id | 视频ID | 来自其他节点 | 这是"原视频的身份证号",告诉系统延长哪个视频 | 原视频的唯一标识 | 连接视频生成节点的video_id输出 |
| prompt | prompt | 文本描述 | 续集描述 | 这是告诉导演"续集要拍什么内容" | 延长内容提示词 | 写"继续奔跑,跳过小溪" |
3.15 Lip Sync Text Input 节点是干嘛的?
这个节点就像一个"配音演员"!它的作用是:
- 把文字转换成语音
- 提供各种不同的声音选择
- 控制说话的速度和语言
- 就像给动画片配音!
3.16 Lip Sync Text Input 节点参数详解
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| text | text | 文本内容 | 要说的话 | 这是"要说的台词",就像剧本 | 语音合成文本 | 写"你好,欢迎来到我的世界" |
| voice_id | voice_id | 声音选择 | 阳光少年 | 这是"选择配音演员",不同声音有不同特色 | 语音合成音色ID | 阳光少年适合男性角色 |
| voice_language | voice_language | 语言选择 | zh | 这是"说什么语言",中文还是英文 | 语音合成语言 | zh是中文,en是英文 |
| voice_speed | voice_speed | 0.8-2.0 | 1.0 | 这是"说话速度",1.0是正常速度 | 语音合成速度 | 0.8慢一点,1.5快一点 |
3.17 Lip Sync Audio Input 节点是干嘛的?
这个节点就像一个"录音机"!它的作用是:
- 使用现有的音频文件
- 支持本地文件或网络链接
- 为口型同步提供音频源
- 就像播放录音带!
3.18 Lip Sync Audio Input 节点参数详解
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| audio_file | audio_file | 音频文件路径 | 可选 | 这是"录音文件的位置",告诉系统去哪找音频 | 本地音频文件路径 | 填入"C:/音乐/我的录音.mp3" |
| audio_url | audio_url | 音频网址 | 可选 | 这是"网上音频的地址",从网络获取音频 | 网络音频URL | 填入音频文件的网络链接 |
3.19 Lip Sync 节点是干嘛的?
这个节点就像一个"口型同步师"!它的作用是:
- 让视频中的人物嘴巴和声音同步
- 自动分析音频和视频
- 生成自然的说话动画
- 就像给哑剧演员配上声音!
3.20 Lip Sync 节点参数详解
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| client | client | 客户端连接 | 来自Client节点 | 这是"通行证",连接到服务器用的 | API客户端实例 | 连接Client节点的输出 |
| input | input | 音频输入 | 来自音频节点 | 这是"要同步的声音",来自音频输入节点 | 音频输入数据 | 连接音频输入节点的输出 |
| video_id | video_id | 视频ID | 可选 | 这是"要同步的视频身份证",指定哪个视频 | 目标视频ID | 连接视频生成节点的video_id |
| video_url | video_url | 视频链接 | 可选 | 这是"要同步的视频地址",网络视频链接 | 目标视频URL | 可以用网络视频链接 |
3.21 Effects 节点是干嘛的?
这个节点就像一个"特效师"!它的作用是:
- 给图片或视频添加特殊效果
- 支持多种预设特效(爱心、拥抱等)
- 可以处理单张或多张图片
- 就像电影后期制作的特效!
3.22 Effects 节点参数详解
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| client | client | 客户端连接 | 来自Client节点 | 这是"通行证",连接到服务器用的 | API客户端实例 | 连接Client节点的输出 |
| effect_scene | effect_scene | 特效类型 | heart_gesture | 这是"选择什么特效",比如爱心手势、拥抱等 | 特效场景类型 | heart_gesture做爱心手势 |
| model_name | model_name | 模型选择 | kling-v1-6 | 这是"特效师的技能版本",不同版本效果不同 | 特效生成模型 | v1-6是推荐版本 |
| mode | mode | 质量模式 | pro | 这是"特效质量档位",pro更清晰 | 生成质量模式 | pro质量好,std便宜 |
| duration | duration | 时长 | 5 | 这是"特效视频的长度",5秒或10秒 | 视频时长(秒) | 5秒适合大部分特效 |
| image0 | image0 | 主图片 | 必需 | 这是"要加特效的主要图片" | 主要输入图像 | 连接清晰的人物图片 |
| image1 | image1 | 副图片 | 可选 | 这是"第二张图片",某些特效需要两张图 | 辅助输入图像 | 拥抱特效需要两个人的图片 |
4. 使用技巧和建议
4.1 新手入门建议
- 先申请账号:去 KLingAI 官网注册账号,获取密钥
- 从简单开始:先试试图片生成,再尝试视频功能
- 描述要详细:提示词越详细,效果越好
- 注意积分消耗:每个功能都会消耗积分,合理使用
4.2 高效使用技巧
- 图片生成技巧:使用高质量参考图,调整保真度参数
- 视频生成技巧:先用5秒测试效果,满意后再用10秒
- 镜头控制技巧:轻微的镜头移动比剧烈移动效果更好
- 特效使用技巧:选择合适的人物姿势,特效效果更自然
4.3 参数调优建议
- cfg_scale:0.3-0.5适合自然效果,0.7-0.8适合精确控制
- 保真度参数:人物生成用0.6-0.8,风景生成用0.3-0.5
- 模型选择:优先使用最新版本(v2、v2-master)
- 质量模式:测试用std,最终作品用pro
4.4 工作流程建议
- Client节点 → 设置密钥连接服务器
- 生成节点 → 选择合适的生成类型
- Preview节点 → 预览和保存结果
- 后处理 → 使用其他ComfyUI节点进一步处理
5. 常见问题解答
Q1:提示"ACCESS_KEY is empty"怎么办?
A: 这是因为没有设置密钥:
- 去 KLingAI 官网注册账号
- 在开发者页面获取 access_key 和 secret_key
- 在Client节点中填入这两个密钥
Q2:视频生成很慢怎么办?
A: 这是正常现象:
- 视频生成需要较长时间,通常1-5分钟
- 可以调低poll_interval减少查询频率
- 选择std模式会比pro模式快一些
Q3:生成的视频质量不好怎么办?
A: 可以尝试以下方法:
- 使用更详细的提示词描述
- 选择pro模式提高质量
- 使用最新的模型版本
- 调整cfg_scale参数
Q4:口型同步效果不自然怎么办?
A: 检查以下几点:
- 确保输入视频中人物面部清晰
- 音频质量要好,没有杂音
- 选择合适的语音音色
- 语速不要太快
Q5:特效节点报错怎么办?
A: 可能的原因:
- 某些特效需要两张图片,检查image1是否连接
- 图片分辨率太低,使用高质量图片
- 人物姿势不适合该特效,换个特效试试
6. 高级应用技巧
6.1 创意视频制作流程
- 文字转视频 → 生成基础视频素材
- 视频延长 → 扩展视频长度
- 口型同步 → 添加对话内容
- 特效处理 → 增加视觉效果
6.2 虚拟人物创建
- 图片生成 → 创建人物形象
- 图片转视频 → 让人物动起来
- 口型同步 → 让人物说话
- 特效增强 → 添加表情动作
6.3 商业应用场景
- 广告制作:快速生成产品展示视频
- 教育内容:制作生动的教学视频
- 社交媒体:创建吸引人的短视频内容
- 虚拟主播:制作虚拟人物视频
7. 成本控制建议
7.1 积分消耗参考
- 图片生成:消耗较少,适合大量测试
- 5秒视频:中等消耗,适合预览效果
- 10秒视频:消耗较多,用于最终作品
- Pro模式:比std模式消耗更多积分
7.2 省钱技巧
- 先用图片测试:确定效果后再生成视频
- 使用5秒模式:测试满意后再用10秒
- 批量处理:一次性处理多个任务
- 合理使用特效:不是每个视频都需要特效
8. 总结
ComfyUI-KLingAI-API 就像给你的 ComfyUI 装了一个"魔法工厂",让视频和图片创作变得简单有趣!记住这几个要点:
- Client节点是基础,所有功能都需要它
- 提示词很重要,描述越详细效果越好
- 参数需要调优,不同场景用不同设置
- 注意成本控制,合理使用积分
- 多尝试组合,不同节点可以串联使用
现在就去试试吧!让你的创意通过AI变成现实!🎬✨