# ComfyUI_StepFun 插件完整使用教程 ## 1. 插件简介 ComfyUI_StepFun 是一个专门为 ComfyUI 设计的多模态插件,原项目地址:https://github.com/chenbaiyujason/ComfyUI_StepFun 这个插件就像是给你的 ComfyUI 安装了一个智能助手,能够: - 看懂图片内容并描述出来(就像有个朋友帮你看图说话) - 分析视频内容并生成文字说明(相当于给视频配字幕) - 根据你的想法自动生成更好的提示词(就像有个文案高手帮你润色) - 不需要你的电脑有强大的显卡,全部在云端处理 简单来说,这个插件让你的 ComfyUI 变得更聪明,能够理解图片和视频的内容,并帮你生成各种创意内容。 ## 2. 如何安装 ### 方法一:使用 ComfyUI Manager(推荐新手) 1. 打开 ComfyUI,点击右下角的"Manager"按钮 2. 选择"Install Custom Nodes" 3. 搜索"StepFun" 4. 找到后点击"Install"按钮 5. 重启 ComfyUI ### 方法二:手动安装 1. 找到你的 ComfyUI 安装文件夹 2. 进入 `custom_nodes` 文件夹 3. 在这里打开命令行窗口 4. 输入以下命令: ```bash git clone https://github.com/chenbaiyujason/ComfyUI_StepFun.git ``` 5. 进入插件文件夹: ```bash cd ComfyUI_StepFun ``` 6. 安装依赖: ```bash pip install -r requirements.txt ``` 7. 重启 ComfyUI ### 获取密钥 1. 访问 [StepFun 平台](https://platform.stepfun.com/account-overview) 2. 注册账号并登录 3. 在账户总览页面找到你的密钥 4. 把密钥添加到插件配置文件中 ## 3. 节点详细解析 ### 3.1 StepFun Image Chat 节点 这个节点就像是一个能看图说话的智能助手,你给它一张图片,它就能告诉你图片里有什么内容。 #### 参数详解 | 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 | |:---|:---|:---|:---|:---|:---|:---| | 图片输入 | image | 图片文件 | 任意图片 | 就像给朋友看照片一样,把你想分析的图片放这里 | 输入待分析的图像数据 | 连接一个"加载图片"节点的输出 | | 提示词 | prompt | 文本 | "描述这张图片" | 告诉助手你想知道什么,比如"这张图片里有什么?" | 用户指令,指定分析任务 | 输入"详细描述这张图片的内容" | | 密钥 | api_key | 字符串 | 你的密钥 | 就像门票一样,让你能使用这个服务 | API访问凭证 | 从StepFun平台获取的密钥 | | 温度 | temperature | 0.0-1.0 | 0.7 | 控制回答的创意程度,越高越有创意但可能不准确 | 控制生成结果的随机性 | 0.3适合需要准确描述,0.8适合创意描述 | | 最大长度 | max_tokens | 数字 | 1000 | 限制回答的长度,就像限制作文字数 | 限制生成文本的最大长度 | 简单描述用500,详细分析用2000 | ### 3.2 StepFun Video Chat 节点 这个节点就像是一个能看视频并解说的专家,能理解视频内容并生成文字描述。 #### 参数详解 | 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 | |:---|:---|:---|:---|:---|:---|:---| | 视频网址 | video_url | 网址链接 | 视频链接 | 告诉节点你要分析哪个视频,就像发链接给朋友 | 视频资源的URL地址 | 输入"https://example.com/video.mp4" | | 提示词 | prompt | 文本 | "分析这个视频" | 告诉助手你想了解视频的什么内容 | 用户指令,指定分析任务 | 输入"这个视频讲了什么故事?" | | 密钥 | api_key | 字符串 | 你的密钥 | 就像门票一样,让你能使用这个服务 | API访问凭证 | 从StepFun平台获取的密钥 | | 温度 | temperature | 0.0-1.0 | 0.7 | 控制回答的创意程度,数值越高越有创意 | 控制生成结果的随机性 | 0.3适合客观分析,0.8适合创意解读 | | 最大长度 | max_tokens | 数字 | 1500 | 限制回答的长度,防止回答太长 | 限制生成文本的最大长度 | 简单概括用800,详细分析用3000 | ### 3.3 StepFun Video File Uploader 节点 这个节点就像是一个文件搬运工,能把你电脑里的视频文件上传到云端,让其他节点能够处理。 #### 参数详解 | 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 | |:---|:---|:---|:---|:---|:---|:---| | 文件路径 | file_path | 文件路径 | 完整路径 | 告诉节点你的视频文件在电脑的哪个位置 | 本地视频文件的绝对路径 | 输入"C:\Videos\my_video.mp4" | | 密钥 | api_key | 字符串 | 你的密钥 | 用来验证身份的通行证 | API访问凭证 | 从StepFun平台获取的密钥 | ### 3.4 StepFun Prompt Generator 节点 这个节点就像是一个文案高手,能根据你的想法生成更好的提示词。 #### 参数详解 | 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 | |:---|:---|:---|:---|:---|:---|:---| | 输入描述 | input_description | 文本 | 你的想法 | 告诉节点你想要什么样的内容 | 用户的创意描述或需求 | 输入"一个科幻城市的场景" | | 风格类型 | style_type | 选择项 | realistic | 选择你想要的风格,就像选择绘画风格 | 指定生成内容的艺术风格 | 选择"anime"、"realistic"、"cartoon"等 | | 详细程度 | detail_level | 选择项 | medium | 控制生成提示词的详细程度 | 控制输出描述的详细程度 | "simple"简单,"detailed"详细 | | 密钥 | api_key | 字符串 | 你的密钥 | 使用服务的凭证 | API访问凭证 | 从StepFun平台获取的密钥 | | 温度 | temperature | 0.0-1.0 | 0.8 | 控制创意程度,越高越有创意 | 控制生成结果的创造性 | 0.6适合平衡,0.9适合高创意 | ## 4. 使用技巧和建议 ### 图片分析技巧 - **提示词要具体**:不要只说"分析图片",要说"描述图片中人物的表情和动作" - **分步骤询问**:先问整体内容,再问细节,这样能得到更准确的结果 - **注意图片质量**:清晰的图片能得到更好的分析结果 ### 视频处理建议 - **文件大小控制**:视频文件超过128MB时,建议先压缩 - **格式转换**:建议使用MP4格式,兼容性最好 - **分段处理**:长视频可以分段上传,每段2分钟左右效果更好 ### 提示词优化 - **使用具体的形容词**:比如"温暖的阳光"比"光线"更好 - **结合风格词汇**:在描述后加上"卡通风格"、"写实风格"等 - **参考成功案例**:多看看别人的优秀提示词 ## 5. 常见问题解答 ### Q1:为什么我的密钥不起作用? A1:检查以下几点: - 确保密钥是从官方平台获取的 - 检查密钥是否复制完整(没有多余的空格) - 确认账户是否有足够的额度 ### Q2:视频上传失败怎么办? A2:尝试以下解决方案: - 检查文件路径是否正确(使用完整路径) - 确认视频文件没有损坏 - 文件过大时先压缩再上传 ### Q3:生成的文本不符合预期怎么办? A3:调整这些参数: - 降低温度值(0.3-0.5)让结果更稳定 - 修改提示词,让指令更清晰 - 增加最大长度限制 ### Q4:处理速度很慢怎么办? A4:这是正常现象,因为: - 处理是在云端进行的 - 复杂的任务需要更多时间 - 网络状况会影响速度 ## 6. 工作流程示例 ### 示例1:图片内容分析工作流 1. 使用"加载图片"节点载入图片 2. 连接到"StepFun Image Chat"节点 3. 设置提示词为"详细描述这张图片的内容、色彩和氛围" 4. 连接到"显示文本"节点查看结果 ### 示例2:视频字幕生成工作流 1. 使用"StepFun Video File Uploader"上传视频 2. 将输出连接到"StepFun Video Chat"节点 3. 设置提示词为"为这个视频生成字幕" 4. 连接到"保存文本"节点保存结果 ### 示例3:创意提示词生成工作流 1. 使用"StepFun Prompt Generator"节点 2. 输入简单的创意描述 3. 选择合适的风格和详细程度 4. 将生成的提示词用于其他生成任务 ## 7. 注意事项 ### 使用限制 - 需要稳定的网络连接 - 需要有效的StepFun账户和充足额度 - 遵守平台的使用条款和限制 ### 最佳实践 - 合理设置参数,避免浪费额度 - 备份重要的工作流程 - 定期检查账户额度使用情况 ### 安全提醒 - 不要分享你的密钥给他人 - 注意保护个人隐私内容 - 遵守相关法律法规 这个插件让ComfyUI具备了强大的多模态理解能力,无论是图片分析、视频处理还是创意生成,都能为你的创作工作提供强大的支持。记住,熟练使用需要多练习,不断尝试不同的参数组合来找到最适合你需求的设置。
ComfyUI图像合并插件comfyui-merge使用教程 2025-07-03 22:44 ComfyUI 图像合并插件教程 (comfyui-merge) 1. 插件简介 这是一个专门用来合并图片的 ComfyUI 插件,就像用 PS 把多张图片叠在一起那样。它的特别之处在于你精确控制每张图片的混合方式。 GitHub 地址:https://github.com/LingSss9/com