ComfyUI_InvSR 插件完全教程
1. 插件简介
ComfyUI_InvSR 是一个专门用于图片超分辨率放大的 ComfyUI 插件,基于最新的 InvSR(Arbitrary-steps Image Super-resolution via Diffusion Inversion)技术。这个插件就像一个超级智能的放大镜,可以把小图片变成大图片,而且画质还能保持得非常清晰!
GitHub 原地址: https://github.com/yuvraj108c/ComfyUI_InvSR
这个插件能给我们带来什么效果?
- 图片超分辨率放大:就像用魔法放大镜一样,可以把小图片放大4倍,而且不会变模糊
- 智能细节增强:不仅仅是简单放大,还能智能地添加细节,让图片看起来更清晰
- 灵活的处理步数:可以选择1-5步处理,步数越多质量越好但速度越慢
- 大图片分块处理:对于超大图片,可以分成小块处理,避免显存不够的问题
- 颜色校正功能:处理后的图片如果颜色有偏差,可以自动修正
2. 如何安装
方法一:使用 Git 克隆(推荐)
- 打开终端或命令提示符
- 进入你的 ComfyUI 安装目录下的
custom_nodes文件夹 - 运行以下命令:
git clone https://github.com/yuvraj108c/ComfyUI_InvSR.git
cd ComfyUI_InvSR
pip install -r requirements.txt
方法二:手动下载
- 访问 https://github.com/yuvraj108c/ComfyUI_InvSR
- 点击绿色的 "Code" 按钮,选择 "Download ZIP"
- 解压到 ComfyUI 的
custom_nodes文件夹中 - 安装依赖:
pip install -r requirements.txt
安装后步骤
- 重启 ComfyUI
- 插件会自动下载所需的模型文件:
- Diffusers 模型(stabilityai/sd-turbo)会下载到
ComfyUI/models/diffusers - InvSR 模型(noise_predictor_sd_turbo_v5.pth)会下载到
ComfyUI/models/invsr
- Diffusers 模型(stabilityai/sd-turbo)会下载到
3. 节点详细解析
3.1 LoadInvSRModels 节点 - InvSR 模型加载器
这个节点就像一个智能的工具箱管理员,负责加载和准备所有需要的模型文件,为后续的图片放大工作做准备。
参数详解
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| sd_model | sd_model | stabilityai/sd-turbo | stabilityai/sd-turbo | 选择基础的AI模型 | Stable Diffusion模型选择 | 目前只有一个选项,直接用默认的就行 |
| invsr_model | invsr_model | 下拉选择 | noise_predictor_sd_turbo_v5.pth | 选择超分辨率专用模型 | InvSR噪声预测模型 | 有两个版本可选,v5是标准版,v5_diftune是调优版 |
| dtype | dtype | fp16/fp32/bf16 | fp16 | 选择计算精度 | 数据类型精度 | fp16=省显存,fp32=最高精度,bf16=平衡选择 |
| tiled_vae | tiled_vae | 开关选择 | True | 是否使用分块处理 | VAE分块编码 | True=省显存,False=速度快但占显存 |
3.2 InvSRSampler 节点 - InvSR 超分辨率处理器
这个节点是整个插件的核心,就像一个超级智能的图片放大师,可以把小图片变成高清大图片。
参数详解
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| invsr_pipe | invsr_pipe | 模型管道 | 连接加载器输出 | 连接模型加载器 | InvSR处理管道 | 连接LoadInvSRModels节点的输出 |
| images | images | 图片输入 | 连接图片 | 要放大的原始图片 | 输入图像张量 | 连接LoadImage节点或其他图片输出 |
| num_steps | num_steps | 1-5整数 | 1 | 处理的精细程度 | 推理步数 | 1=最快,5=最好质量但最慢 |
| cfg | cfg | 浮点数 | 1.0 | 控制生成的引导强度 | 分类器自由引导比例 | 1.0=标准,数值越大引导越强 |
| batch_size | batch_size | 整数 | 1 | 同时处理多少张完整图片 | 批处理大小 | 1=逐张处理,数值大=同时处理多张 |
| chopping_batch_size | chopping_batch_size | 整数 | 8 | 同时处理多少个图片块 | 分块批处理大小 | 8=标准,显存小可调低到1 |
| chopping_size | chopping_size | 128/256/512 | 128 | 大图片分块的尺寸 | 分块处理尺寸 | 128=小块省显存,512=大块速度快 |
| color_fix | color_fix | none/wavelet/ycbcr | none | 颜色校正方法 | 颜色修正算法 | none=不校正,wavelet/ycbcr=不同校正方法 |
| seed | seed | 0-最大整数 | 123 | 随机种子值 | 随机数种子 | 固定数值可重现结果,0=随机 |
4. 使用技巧和建议
基础使用流程
-
标准放大流程:
- LoadImage → LoadInvSRModels → InvSRSampler → SaveImage
- 这是最基本的4倍放大流程
-
高质量放大流程:
- 设置 num_steps 为 3-5
- 根据显存情况调整 chopping_batch_size
- 启用适当的 color_fix 方法
参数调优建议
-
显存优化设置:
- dtype 选择 fp16 节省显存
- tiled_vae 设为 True
- chopping_batch_size 设为 1
- chopping_size 选择 128
-
质量优先设置:
- num_steps 设为 3-5
- dtype 选择 fp32
- chopping_size 选择 256 或 512
- 启用合适的 color_fix
-
速度优先设置:
- num_steps 设为 1
- batch_size 可以适当增加
- chopping_size 选择较大值
不同场景的使用建议
-
小图片放大(512x512以下):
- chopping_size 设为 128
- chopping_batch_size 可以设高一些
-
大图片放大(1K-4K):
- chopping_size 设为 256
- chopping_batch_size 根据显存调整
-
超大图片放大(4K以上):
- chopping_size 设为 512
- chopping_batch_size 设为 1
- 启用 tiled_vae
5. 常见问题解答
Q1: 安装后提示缺少依赖怎么办?
A:
- 确保已安装 requirements.txt 中的所有依赖
- 特别注意 diffusers 版本需要在 0.30.0-0.32.2 之间
- 如果还有问题,尝试:
pip install diffusers==0.31.0
Q2: 显存不足怎么办?
A:
- 设置 dtype 为 fp16
- 启用 tiled_vae
- 降低 chopping_batch_size 到 1
- 选择较小的 chopping_size(128)
- 减少 batch_size
Q3: 处理速度很慢怎么办?
A:
- 设置 num_steps 为 1
- 增加 chopping_batch_size(如果显存允许)
- 选择较大的 chopping_size
- 关闭 tiled_vae(如果显存足够)
Q4: 放大后的图片颜色有偏差怎么办?
A:
- 尝试设置 color_fix 为 "wavelet" 或 "ycbcr"
- 不同的图片可能适合不同的校正方法
- 可以都试试看哪个效果最好
Q5: 模型下载失败怎么办?
A:
- 检查网络连接是否正常
- 确保有足够的磁盘空间
- 可以手动下载模型文件到对应目录
- 检查防火墙是否阻止了下载
Q6: 处理大图片时出现错误怎么办?
A:
- 确保图片尺寸能被16整除(插件会自动调整)
- 增加 chopping_size 的值
- 降低 chopping_batch_size
- 确保有足够的系统内存
6. 实际应用场景
场景1:老照片修复放大
- 用途:把老旧的小尺寸照片放大并增强细节
- 设置:num_steps=3-5,启用color_fix
- 技巧:可以配合其他修复插件使用
场景2:游戏截图放大
- 用途:把游戏截图放大用作壁纸
- 设置:chopping_size=256,num_steps=2-3
- 技巧:游戏截图通常细节丰富,适合中等质量设置
场景3:艺术作品放大
- 用途:把小尺寸的艺术作品放大用于打印
- 设置:num_steps=5,color_fix=wavelet
- 技巧:艺术作品对颜色要求高,建议启用颜色校正
场景4:网络图片放大
- 用途:把从网上下载的小图片放大
- 设置:标准设置即可,根据图片质量调整
- 技巧:网络图片质量参差不齐,建议先测试效果
7. 技术特点和优势
核心技术优势
- 基于扩散模型:使用最新的扩散反演技术
- 任意步数推理:可以选择1-5步,平衡质量和速度
- 智能分块处理:支持超大图片的分块处理
- 颜色校正:内置多种颜色校正算法
与传统放大方法的区别
- 传统插值放大:简单粗暴,容易产生模糊
- InvSR放大:智能添加细节,保持清晰度
- 质量提升:不仅放大尺寸,还增强细节
- 灵活控制:可以根据需求调整质量和速度
8. 更新和维护
如何更新插件
- 进入插件目录:
cd custom_nodes/ComfyUI_InvSR - 拉取最新代码:
git pull - 更新依赖:
pip install -r requirements.txt --upgrade - 重启 ComfyUI
如何卸载插件
- 删除
custom_nodes/ComfyUI_InvSR文件夹 - 清理下载的模型文件(可选)
- 重启 ComfyUI
9. 总结
ComfyUI_InvSR 是一个功能强大的图片超分辨率插件,为用户提供了高质量的图片放大解决方案。它的主要优势包括:
- 先进的技术:基于最新的扩散反演技术
- 灵活的控制:可以根据需求调整质量和速度
- 智能优化:支持大图片分块处理和显存优化
- 易于使用:简单的两个节点就能完成复杂的超分辨率处理
- 高质量输出:不仅放大尺寸,还能智能增强细节
无论你是需要放大老照片、游戏截图,还是艺术作品,这个插件都能为你提供出色的效果。记住,合理的参数设置是获得最佳效果的关键!
希望这个教程能帮助你更好地使用 ComfyUI_InvSR 插件,创造出令人惊艳的高清图片!