# ComfyUI_ModelScopeT2V插件完全教程 ## 1. 插件简介 ComfyUI_ModelScopeT2V是一个专门用来生成视频的插件,它就像是给ComfyUI装上了一个"文字变视频"的魔法机器。你只需要输入一段文字描述,比如"一只猫在花园里跑步",这个插件就能帮你生成一段真实的视频。 **插件原地址:** https://github.com/ExponentialML/ComfyUI_ModelScopeT2V 这个插件的特别之处在于它使用了阿里巴巴ModelScope团队开发的视频生成技术,可以说是目前最强大的文字转视频工具之一。就像你有了一个专业的视频制作师,只要告诉他你想要什么场景,他就能帮你拍出来。 ## 2. 如何安装 安装这个插件就像下载一个手机应用一样简单,按照以下步骤操作: 1. **打开命令行窗口**(就是那个黑色的文字输入框) 2. **进入ComfyUI的插件文件夹**,输入: ``` cd /你的ComfyUI路径/custom_nodes ``` 3. **下载插件**,输入: ``` git clone https://github.com/ExponentialML/ComfyUI_ModelScopeT2V.git ``` 4. **创建模型存放文件夹**: - 在ComfyUI的models文件夹里创建一个名为"text2video"的新文件夹 - 这就像给你的视频生成器准备一个专门的工具箱 5. **下载必要的模型文件**: - 需要下载`text2video_pytorch_model.pth`文件放到text2video文件夹 - 需要下载`open_clip_pytorch_model.bin`文件放到clip文件夹 - 这些文件就像是视频生成器的"大脑",没有它们就无法工作 ## 3. 节点详细解析 ### 3.1 ModelScopeT2V 节点 - 主要的视频生成器 这是插件的核心节点,就像一台专业的视频制作机器。你把文字描述、各种设置参数输入进去,它就会输出一段视频。 ### 3.2 参数详解 | 参数名 (UI显示) | 参数名 (代码里) | 参数类型 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 | | :--- | :--- | :--- | :--- | :--- | :--- | :--- | | 模型路径 | model_path | 文件选择 | 自动检测 | 告诉机器去哪里找视频生成的"大脑"文件 | 指定ModelScope模型的文件路径 | 选择你下载的text2video_pytorch_model.pth文件 | | 启用时间注意力 | enable_attn | 开关 | True | 让视频里的物体动作更连贯,就像让演员演戏时注意前后动作的连接 | 启用ModelScope的时间注意力机制 | 生成人物行走视频时开启,让步伐更自然 | | 启用时间卷积 | enable_conv | 开关 | True | 让视频画面之间的过渡更平滑,就像电影里的平稳镜头切换 | 启用时间卷积模块 | 生成风景变化视频时开启,让场景转换更流畅 | | 时间注意力强度 | temporal_attn_strength | 数值滑杆 | 1.0 | 控制动作连贯程度的强弱,像调节电视音量一样 | 控制时间注意力的影响强度 | 设置0.8让动作稍微随意一些,设置1.2让动作更规整 | | 时间卷积强度 | temporal_conv_strength | 数值滑杆 | 1.0 | 控制画面过渡的平滑程度,像调节相机防抖强度 | 控制时间卷积的影响强度 | 拍摄运动场景时设置1.2,静态场景设置0.8 | | SD 1.5模型 | sd_15_model | 模型选择 | 可选 | 选择一个额外的图像生成助手,让视频质量更好 | 可选的Stable Diffusion 1.5模型 | 选择你常用的SD1.5模型来提升画质 | | 正面提示词 | positive_prompt | 文本框 | 必填 | 告诉机器你想要什么样的视频内容 | 正向文本提示 | 输入"一只可爱的小猫在阳光下玩耍" | | 负面提示词 | negative_prompt | 文本框 | 推荐填写 | 告诉机器你不想要什么,就像告诉厨师不要放辣椒 | 负向文本提示 | 输入"模糊,低质量,扭曲" | | 帧数 | frames | 数值输入 | 24 | 决定视频有多长,就像决定拍几张连续照片 | 生成视频的帧数 | 短视频用16帧,长一点的用32帧 | | 宽度 | width | 数值输入 | 512 | 视频画面的宽度,就像调节电视屏幕的宽度 | 生成视频的宽度像素 | 标准用512,高清用1024 | | 高度 | height | 数值输入 | 512 | 视频画面的高度,就像调节电视屏幕的高度 | 生成视频的高度像素 | 标准用512,高清用1024 | | 引导强度 | cfg_scale | 数值滑杆 | 15.0 | 控制机器有多听你的话,数值越高越听话 | 分类器自由引导强度 | 想要精确效果用15-20,想要随意效果用7-10 | | 采样步数 | steps | 数值输入 | 50 | 决定机器思考多少次才给你结果,步数越多质量越好但速度越慢 | 去噪采样步数 | 快速预览用20步,高质量用50步 | | 随机种子 | seed | 数值输入 | 随机 | 就像抽奖的号码,同样的号码会得到同样的结果 | 随机数生成种子 | 固定种子可以重现相同效果 | ### 3.3 ModelScopeT2V Loader 节点 - 模型加载器 这个节点就像是给视频生成器安装"大脑"的工具,专门负责加载和准备模型文件。 | 参数名 (UI显示) | 参数名 (代码里) | 参数类型 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 | | :--- | :--- | :--- | :--- | :--- | :--- | :--- | | 模型名称 | model_name | 下拉选择 | 自动检测 | 选择你要用的视频生成"大脑",就像选择不同的专业摄影师 | 选择可用的ModelScope模型 | 选择"text2video_pytorch_model.pth" | | 设备类型 | device | 下拉选择 | auto | 选择用显卡还是处理器来工作,就像选择用跑车还是普通车 | 指定运行设备 | 有好显卡选"cuda",没有选"cpu" | | 精度类型 | dtype | 下拉选择 | fp16 | 选择计算精度,就像选择照片是高清还是标清 | 模型运行精度 | 显存够用选"fp16",不够选"fp32" | ## 4. 使用技巧和建议 ### 4.1 获得更好视频质量的小窍门 **就像拍照一样,以下技巧能让你的视频更棒:** - **提示词要具体**:不要只写"一只猫",而要写"一只橘色的波斯猫在绿色草地上慢慢行走" - **使用合适的帧数**:短视频用16-24帧,长视频用32帧以上 - **调整引导强度**:想要精确效果用15-20,想要更有创意用7-12 - **分辨率要合理**:开始时用512x512,熟练后再尝试更高分辨率 ### 4.2 组合使用的建议 **就像做菜需要配菜一样,这个插件也可以和其他插件搭配:** - **配合AnimateDiff**:可以让动作更自然流畅 - **配合ControlNet**:可以更精确地控制视频内容 - **配合Upscaler**:可以提升视频清晰度 ### 4.3 性能优化小贴士 **让你的电脑跑得更快更稳:** - **显存不足时**:降低分辨率或减少帧数 - **速度太慢时**:减少采样步数或使用较小的模型 - **内存不够时**:关闭其他占用内存的程序 ## 5. 常见问题解答 ### Q1: 安装后在ComfyUI里找不到节点怎么办? **A:** 就像手机安装新应用后需要重启一样,你需要重启ComfyUI。如果还是找不到,检查是否把插件放在了正确的custom_nodes文件夹里。 ### Q2: 生成的视频质量不好怎么办? **A:** 这就像拍照技巧一样,试试这些方法: - 提高采样步数(比如从20改到50) - 增加引导强度(比如从7改到15) - 写更详细的提示词 - 使用更好的基础模型 ### Q3: 生成视频时出现错误怎么办? **A:** 检查以下几个方面: - 模型文件是否下载完整 - 显存是否足够(至少需要6GB) - 参数设置是否合理(分辨率不要太高) ### Q4: 可以生成多长的视频? **A:** 就像拍照片有张数限制一样,这个插件也有限制。一般建议: - 新手:16-24帧(约1-2秒) - 进阶:32-48帧(约2-3秒) - 专业:64帧以上(需要强大硬件) ### Q5: 为什么我的视频和别人的不一样? **A:** 这是正常的!就像每个人画画都有自己的风格,每次生成都会有细微差别。如果想要完全一样的结果,需要使用相同的随机种子。 ## 6. 进阶玩法 ### 6.1 批量生成视频 你可以设置不同的随机种子,一次生成多个相似但不完全相同的视频,就像拍照时连拍几张选最好的一张。 ### 6.2 风格化视频制作 通过搭配不同的SD1.5模型,可以生成不同艺术风格的视频,比如动漫风格、写实风格、油画风格等。 ### 6.3 长视频制作 虽然单次生成有限制,但可以生成多个短视频片段,然后用视频编辑软件拼接成长视频。 --- **小贴士:** 刚开始使用时,建议先用默认参数生成几个简单的视频,熟悉了基本操作后再尝试调整各种参数。就像学开车一样,先在空旷地方练习,再上复杂路段! 记住,生成好的视频需要耐心和多次尝试,每个参数的调整都会影响最终效果。多试几次,你就能找到最适合你需求的设置组合啦!
ComfyUI图像合并插件comfyui-merge使用教程 2025-07-03 22:44 ComfyUI 图像合并插件教程 (comfyui-merge) 1. 插件简介 这是一个专门用来合并图片的 ComfyUI 插件,就像用 PS 把多张图片叠在一起那样。它的特别之处在于你精确控制每张图片的混合方式。 GitHub 地址:https://github.com/LingSss9/com