1. 插件简介
ComfyUI Step1X-Edit 是一个强大的图像编辑插件,它把 Step1X-Edit 这个顶级图像编辑模型搬到了 ComfyUI 里。简单来说,这个插件就像是一个超级厉害的 AI 修图师,你只需要给它一张图片和一句话描述你想要的修改,它就能帮你自动完成编辑。
GitHub原地址: https://github.com/raykindle/ComfyUI_Step1X-Edit
这个插件能做什么:
- 根据你的文字描述来修改图片(比如"给这个女孩戴上红宝石项链")
- 改变人物表情(比如"让她哭")
- 添加或移除物体
- 改变场景风格
- 速度还特别快(比普通方法快2倍)
2. 如何安装
方法一:通过 ComfyUI Manager 安装(推荐)
- 打开 ComfyUI
- 点击 Manager 按钮
- 搜索 "Step1X-Edit"
- 点击安装
方法二:手动安装
- 打开终端/命令行
- 进入 ComfyUI 的 custom_nodes 文件夹
- 执行命令:
git clone https://github.com/raykindle/ComfyUI_Step1X-Edit.git
安装依赖文件
- 进入插件文件夹:
cd ComfyUI_Step1X-Edit
- 安装依赖:
pip install -r requirements.txt
下载模型文件
你需要下载三个模型文件:
- 主模型:step1x-edit-i1258-FP8.safetensors(放在 models/diffusion_models 文件夹)
- VAE模型:vae.safetensors(放在 models/vae 文件夹)
- 文本编码器:Qwen2.5-VL-7B-Instruct(放在 models/text_encoders 文件夹)
3. 节点详解
3.1 Step1X-Edit Model Loader(模型加载器)
这个节点就像是一个仓库管理员,负责把所有需要的模型文件都准备好,让后面的节点可以顺利工作。
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| Diffusion Model | diffusion_model | 下拉菜单选择 | step1x-edit-i1258-FP8.safetensors | 选择主要的AI绘图大脑,就像选择画笔的类型 | 指定用于图像生成的扩散模型文件 | 从列表中选择你下载的模型文件 |
| VAE | vae | 下拉菜单选择 | vae.safetensors | 选择图像编码解码器,就像选择图片格式转换器 | 指定变分自编码器模型,用于图像编码和解码 | 选择对应的VAE文件 |
| Text Encoder | text_encoder | 文本输入 | Qwen2.5-VL-7B-Instruct | 选择文字理解大脑,就像选择翻译官 | 指定文本编码器模型,用于理解文本指令 | 输入文本编码器文件夹名称 |
| Data Type | dtype | 下拉菜单 | bfloat16 | 选择计算精度,就像选择计算器的精确度 | 指定模型运算时使用的数据类型精度 | 内存小选bfloat16,质量要求高选float32 |
| Quantized | quantized | 开关 | True | 开启压缩模式,让模型跑得更快占用更少内存 | 是否使用量化权重来减少内存使用 | 内存不够时开启,质量要求极高时关闭 |
| Offload | offload | 开关 | False | 开启卸载模式,把不用的部分放到内存里 | 是否将模型组件卸载到CPU以节省显存 | 显存不够时开启 |
3.2 Step1X-Edit TeaCache Model Loader(快速模型加载器)
这个节点是普通加载器的升级版,就像是给汽车装了涡轮增压器,能让处理速度提高2倍。
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| Diffusion Model | diffusion_model | 下拉菜单选择 | step1x-edit-i1258-FP8.safetensors | 选择主要的AI绘图大脑,就像选择画笔的类型 | 指定用于图像生成的扩散模型文件 | 从列表中选择你下载的模型文件 |
| VAE | vae | 下拉菜单选择 | vae.safetensors | 选择图像编码解码器,就像选择图片格式转换器 | 指定变分自编码器模型,用于图像编码和解码 | 选择对应的VAE文件 |
| Text Encoder | text_encoder | 文本输入 | Qwen2.5-VL-7B-Instruct | 选择文字理解大脑,就像选择翻译官 | 指定文本编码器模型,用于理解文本指令 | 输入文本编码器文件夹名称 |
| Data Type | dtype | 下拉菜单 | bfloat16 | 选择计算精度,就像选择计算器的精确度 | 指定模型运算时使用的数据类型精度 | 内存小选bfloat16,质量要求高选float32 |
| Quantized | quantized | 开关 | True | 开启压缩模式,让模型跑得更快占用更少内存 | 是否使用量化权重来减少内存使用 | 内存不够时开启,质量要求极高时关闭 |
| Offload | offload | 开关 | False | 开启卸载模式,把不用的部分放到内存里 | 是否将模型组件卸载到CPU以节省显存 | 显存不够时开启 |
| TeaCache Threshold | teacache_threshold | 数值滑块 | 0.6 | 控制速度和质量的平衡,就像调节空调温度 | 控制缓存策略的阈值,影响速度和质量平衡 | 0.25轻微加速,0.6推荐值2倍速度 |
| Verbose | verbose | 开关 | False | 是否显示调试信息,就像开启详细日志 | 是否输出TeaCache的详细调试信息 | 想了解运行细节时开启 |
3.3 Step1X-Edit Generate(图像生成器)
这个节点是真正的画师,接收你的图片和描述,然后创造出修改后的新图片。
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| Model | model | 连接线 | - | 接收模型加载器的输出,就像接收画笔和颜料 | 连接Step1X-Edit模型实例 | 从模型加载器节点连线过来 |
| Image | image | 图片输入 | - | 输入要修改的原始图片,就像给画师看参考图 | 输入待编辑的原始图像 | 连接图片加载节点或其他图片 |
| Prompt | prompt | 文本输入 | - | 描述你想要的修改,就像给画师下指令 | 描述期望编辑效果的文本指令 | 例如:"给她戴上红色帽子" |
| Negative Prompt | negative_prompt | 文本输入 | - | 描述你不想要的效果,就像告诉画师别画什么 | 描述不希望出现的内容或效果 | 例如:"不要模糊,不要变形" |
| Steps | steps | 数值滑块 | 20 | 控制绘制的精细程度,就像调节画笔精度 | 扩散过程的迭代步数,影响生成质量 | 步数越多质量越好但速度越慢 |
| CFG Scale | cfg_scale | 数值滑块 | 7.5 | 控制听话程度,就像调节学生对老师的服从度 | 分类器自由引导强度,控制对提示词的遵循程度 | 值越大越听话,但太大会失真 |
| Image Size | image_size | 数值输入 | 512 | 设置输出图片的尺寸,就像选择画布大小 | 指定生成图像的分辨率大小 | 512推荐,更大需要更多内存 |
| Seed | seed | 数值输入 | -1 | 随机种子,就像掷骰子的初始状态 | 控制随机性的种子值,用于复现结果 | -1表示随机,固定数字可重复结果 |
3.4 Step1X-Edit TeaCache Generate(快速图像生成器)
这个节点是普通生成器的加速版本,功能完全一样但速度更快。
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| Model | model | 连接线 | - | 接收快速模型加载器的输出,就像接收涡轮增压画笔 | 连接Step1X-Edit TeaCache模型实例 | 从TeaCache模型加载器连线过来 |
| Image | image | 图片输入 | - | 输入要修改的原始图片,就像给画师看参考图 | 输入待编辑的原始图像 | 连接图片加载节点或其他图片 |
| Prompt | prompt | 文本输入 | - | 描述你想要的修改,就像给画师下指令 | 描述期望编辑效果的文本指令 | 例如:"给她戴上红色帽子" |
| Negative Prompt | negative_prompt | 文本输入 | - | 描述你不想要的效果,就像告诉画师别画什么 | 描述不希望出现的内容或效果 | 例如:"不要模糊,不要变形" |
| Steps | steps | 数值滑块 | 20 | 控制绘制的精细程度,就像调节画笔精度 | 扩散过程的迭代步数,影响生成质量 | 步数越多质量越好但速度越慢 |
| CFG Scale | cfg_scale | 数值滑块 | 7.5 | 控制听话程度,就像调节学生对老师的服从度 | 分类器自由引导强度,控制对提示词的遵循程度 | 值越大越听话,但太大会失真 |
| Image Size | image_size | 数值输入 | 512 | 设置输出图片的尺寸,就像选择画布大小 | 指定生成图像的分辨率大小 | 512推荐,更大需要更多内存 |
| Seed | seed | 数值输入 | -1 | 随机种子,就像掷骰子的初始状态 | 控制随机性的种子值,用于复现结果 | -1表示随机,固定数字可重复结果 |
4. 使用技巧和建议
4.1 速度优化技巧
- 使用 TeaCache 版本:选择带 TeaCache 的节点可以获得 2 倍速度提升
- 合理设置阈值:TeaCache 阈值 0.6 是最佳平衡点
- 开启量化:将 quantized 设为 True 可以节省内存并提高速度
4.2 质量提升技巧
- 合理设置步数:steps 在 15-25 之间通常效果最好
- 调节 CFG 值:CFG Scale 在 7-10 之间比较合适
- 精确描述:prompt 要具体清楚,避免模糊描述
4.3 内存管理技巧
- 开启卸载:内存不够时将 offload 设为 True
- 降低精度:使用 bfloat16 或 float16 减少内存占用
- 控制图片大小:512 像素是推荐尺寸
5. 常见问题解答
Q1:提示"显存不足"怎么办?
A1:
- 开启 offload 选项
- 使用 FP8 量化模型
- 减小图片尺寸到 512 或更小
- 关闭其他占用显存的程序
Q2:生成速度太慢怎么办?
A2:
- 使用 TeaCache 版本的节点
- 减少步数到 15-20
- 开启 quantized 选项
- 使用较小的图片尺寸
Q3:生成效果不理想怎么办?
A3:
- 检查 prompt 是否足够具体
- 调整 CFG Scale 值
- 增加步数到 25-30
- 尝试不同的 seed 值
Q4:模型加载失败怎么办?
A4:
- 确认模型文件路径正确
- 检查文件是否完整下载
- 确认文件夹权限设置
- 重启 ComfyUI 重新加载
Q5:TeaCache 效果异常怎么办?
A5:
- 尝试不同的阈值设置
- 开启 verbose 查看详细信息
- 确认使用的是 TeaCache 版本的模型加载器
- 检查模型文件是否支持 TeaCache
6. 实际应用案例
案例1:人物装饰添加
- 原始图片:一张女孩的照片
- 编辑指令:「给这个女孩戴上红宝石项链」
- 参数设置:steps=20, cfg_scale=7.5, 使用 TeaCache 版本
- 效果:成功添加了红宝石项链,保持了原有的自然感
案例2:表情修改
- 原始图片:一张人物微笑的照片
- 编辑指令:「让她哭」
- 参数设置:steps=25, cfg_scale=8.0
- 效果:成功改变了表情,其他部分保持不变
案例3:场景元素添加
- 原始图片:室内场景
- 编辑指令:「在桌子上放一盆花」
- 参数设置:steps=30, cfg_scale=7.0
- 效果:自然地添加了花盆,与环境融合良好
7. 总结
ComfyUI Step1X-Edit 插件是一个功能强大的图像编辑工具,它把复杂的 AI 图像编辑变得简单易用。通过合理设置参数和使用 TeaCache 加速功能,你可以快速获得高质量的图像编辑结果。
记住几个关键点:
- 新手建议从 TeaCache 版本开始使用
- 合理设置内存相关参数避免显存不足
- 详细具体的文字描述能获得更好的效果
- 多尝试不同参数组合找到最适合的设置
希望这个教程能帮助你快速上手这个强大的图像编辑插件!