ComfyUI-PhotoMaker-ZHO 插件保姆级教程
1. 插件简介
插件地址: https://github.com/ZHO-ZHO-ZHO/ComfyUI-PhotoMaker-ZHO
ComfyUI-PhotoMaker-ZHO 是一个超级神奇的人脸定制插件!它就像一个"人脸魔法师",能够把你提供的真人照片融合到各种风格的图片中。
这个插件能干啥?
- 把你的照片变成各种风格:电影风、迪士尼风、科幻风等等
- 支持多张参考照片,让生成的人物更像你
- 可以配合 LoRA 模型使用,效果更丰富
- 支持 10 种预设风格,从写实到卡通应有尽有
- 生成速度很快,A100 显卡 50 步只需要 7 秒
工作原理(大白话版):
想象你有一个超级厉害的化妆师和摄影师。你给他们看你的照片,告诉他们想要什么风格(比如"我想变成钢铁侠"),他们就能根据你的脸部特征,创造出一张你穿着钢铁侠战衣的照片。PhotoMaker 就是这样一个 AI 化妆师!
2. 如何安装
手动安装方法
- 找到你的 ComfyUI 文件夹,进入
custom_nodes目录 - 在这里打开命令行(终端)
- 输入命令:
git clone https://github.com/ZHO-ZHO-ZHO/ComfyUI-PhotoMaker-ZHO.git - 进入插件文件夹:
cd ComfyUI-PhotoMaker-ZHO - 安装依赖:
pip install -r requirements.txt - 重启 ComfyUI
3. 节点详细解析
3.1 BaseModel_Loader_fromhub 节点 - 在线基础模型加载器
这个节点是干嘛的?
这个节点就像一个"网络下载器",它能自动从网上下载你需要的 AI 模型。你只需要告诉它模型的名字,它就会自动帮你下载并加载好。
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| base_model_path | base_model_path | 字符串 | SG161222/RealVisXL_V3.0 | 这是模型的网络地址,就像网购时的商品链接 | HuggingFace Hub上的模型标识符 | 输入"SG161222/RealVisXL_V3.0"会下载一个写实风格的模型 |
3.2 BaseModel_Loader_local 节点 - 本地基础模型加载器
这个节点是干嘛的?
这个节点就像一个"本地文件管理器",它会从你电脑里已经下载好的模型文件中选择一个来使用。适合网络不好或者已经有模型文件的用户。
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| ckpt_name | ckpt_name | 下拉选择 | - | 从你电脑里的模型文件中选一个,就像从衣柜里选衣服 | 本地checkpoints文件夹中的模型文件名 | 选择你下载好的SDXL模型文件 |
3.3 PhotoMakerAdapter_Loader_fromhub 节点 - 在线PhotoMaker适配器加载器
这个节点是干嘛的?
这个节点是专门下载 PhotoMaker 的"魔法组件"的。如果说基础模型是汽车发动机,那这个适配器就是让汽车能识别人脸的特殊装置。
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| repo_id | repo_id | 字符串 | TencentARC/PhotoMaker | 这是PhotoMaker官方仓库地址,就像官方商店地址 | HuggingFace仓库标识符 | 保持默认值即可,这是官方推荐的 |
| filename | filename | 字符串 | photomaker-v1.bin | 要下载的具体文件名,就像商品的具体型号 | PhotoMaker模型文件名 | 保持默认值,这是标准的PhotoMaker文件 |
| pipe | pipe | MODEL类型 | - | 这是从基础模型加载器传来的模型,就像流水线上的半成品 | 输入的管道模型对象 | 连接基础模型加载器的输出 |
3.4 PhotoMakerAdapter_Loader_local 节点 - 本地PhotoMaker适配器加载器
这个节点是干嘛的?
这个节点是从你电脑本地加载 PhotoMaker 组件的。如果你已经下载了 PhotoMaker 文件,用这个节点会更快。
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| pm_model_path | pm_model_path | 字符串 | enter your photomaker model path | 这是你电脑里PhotoMaker文件的存放位置,就像告诉别人你家地址 | PhotoMaker模型文件的本地路径 | 输入类似"D:/models/photomaker/"这样的路径 |
| filename | filename | 字符串 | photomaker-v1.bin | PhotoMaker文件的具体名字 | PhotoMaker模型文件名 | 保持默认值photomaker-v1.bin |
| pipe | pipe | MODEL类型 | - | 从基础模型加载器传来的模型 | 输入的管道模型对象 | 连接基础模型加载器的输出 |
3.5 LoRALoader 节点 - LoRA模型加载器
这个节点是干嘛的?
这个节点就像给你的 AI 模型装上"特殊滤镜"。LoRA 是一种小巧的模型增强包,能让你的图片有特定的风格或效果,比如让人物更漂亮、背景更梦幻等。
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| lora_name | lora_name | 下拉选择 | - | 从你的LoRA收藏中选一个,就像选择相机滤镜 | 本地loras文件夹中的LoRA文件名 | 选择你想要的风格LoRA,比如"anime_style.safetensors" |
| lora_weight | lora_weight | 0.0-1.0 | 0.5 | 控制LoRA效果强度的旋钮,就像调节滤镜浓度 | LoRA权重强度控制 | 0.3是轻微效果,0.7是强烈效果 |
| pipe | pipe | MODEL类型 | - | 从PhotoMaker适配器传来的模型 | 输入的管道模型对象 | 连接PhotoMaker适配器的输出 |
3.6 Ref_Image_Preprocessing 节点 - 参考图片预处理器
这个节点是干嘛的?
这个节点就像一个"照片整理员",它负责处理你提供的参考照片。你可以直接上传照片,也可以告诉它一个文件夹位置,它会自动读取里面的所有照片。
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| ref_images_path | ref_images_path | 字符串 | path/to/images | 存放参考照片的文件夹位置,就像告诉别人相册在哪里 | 参考图像文件夹的路径 | 输入"D:/photos/my_face/"这样的路径 |
| mode | mode | 下拉选择 | direct_Input | 选择照片输入方式:直接上传还是从文件夹读取 | 图像输入模式选择 | direct_Input直接上传,path_Input从文件夹读取 |
| ref_image | ref_image | IMAGE类型 | - | 直接上传的参考照片,就像直接给别人看照片 | 可选的直接输入图像 | 连接图片加载节点或直接上传照片 |
3.7 Prompt_Styler 节点 - 提示词风格化器
这个节点是干嘛的?
这个节点就像一个"文案包装师",它会根据你选择的风格,自动给你的描述词加上专业的修饰语。比如你说"一个男人",它能包装成"电影级别的一个男人,专业摄影,高质量"。
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| prompt | prompt | 字符串 | sci-fi, closeup portrait photo of a man img wearing the sunglasses in Iron man suit, face, slim body, high quality, film grain | 你想要的画面描述,就像给画家下订单 | 正向提示词,描述想要生成的内容 | "一个穿钢铁侠战衣的男人img"(注意要包含img关键词) |
| negative_prompt | negative_prompt | 字符串 | asymmetry, worst quality, low quality, illustration, 3d, 2d, painting, cartoons, sketch), open mouth | 你不想要的效果,就像告诉画家别画什么 | 负向提示词,描述不想要的内容 | "低质量,卡通,草图"等不想要的效果 |
| style_name | style_name | 下拉选择 | Photographic (Default) | 选择画面风格,就像选择拍照滤镜 | 预设风格模板选择 | 有写实、电影、迪士尼、科幻等10种风格可选 |
3.8 NEW_PhotoMaker_Generation 节点 - 新版PhotoMaker生成器
这个节点是干嘛的?
这是整个流程的"最终制作车间",它把前面所有准备好的材料(模型、照片、描述词)组合起来,最终生成你想要的图片。就像把所有食材放进锅里炒成一道菜。
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| positive | positive | 字符串 | - | 经过风格化的正面描述词,就像详细的制作说明书 | 处理后的正向提示词 | 连接Prompt_Styler的positive输出 |
| negative | negative | 字符串 | - | 经过风格化的负面描述词,告诉AI不要做什么 | 处理后的负向提示词 | 连接Prompt_Styler的negative输出 |
| batch_size | batch_size | 1-4 | 1 | 一次生成几张图片,就像一次洗几张照片 | 批次生成数量 | 1张速度快,4张可以多选择 |
| style_strength_ratio | style_strength_ratio | 1-50 | 20 | 人脸融合的强度,数值越高越像参考照片 | 风格强度比例控制 | 20是平衡值,30以上按30计算 |
| steps | steps | 1-100 | 50 | AI绘画的精细程度,就像画家画画的遍数 | 推理步数 | 30步够用,50步更精细 |
| guidance_scale | guidance_scale | 0-10 | 5 | AI对你描述的遵循程度,就像听话程度 | 引导缩放系数 | 5是标准值,太高可能过度拟合 |
| width | width | 512-2048 | 1024 | 生成图片的宽度,单位是像素点 | 图像宽度 | 1024是标准尺寸,需要是32的倍数 |
| height | height | 512-2048 | 1024 | 生成图片的高度,单位是像素点 | 图像高度 | 1024是标准尺寸,需要是32的倍数 |
| seed | seed | 0-很大的数 | 0 | 随机种子,相同种子会生成相似图片 | 随机数种子 | 0是随机,固定数字可以复现结果 |
| pipe | pipe | MODEL类型 | - | 处理好的完整模型,包含所有功能 | 完整的管道模型 | 连接LoRALoader或PhotoMaker适配器的输出 |
| pil_image | pil_image | IMAGE类型 | - | 处理好的参考照片 | 预处理后的参考图像 | 连接Ref_Image_Preprocessing的输出 |
4. 使用技巧和建议
4.1 参考照片选择技巧
- 照片质量要好: 选择清晰、光线充足的照片
- 正脸效果最佳: 避免侧脸或遮挡严重的照片
- 多张照片更好: 2-3张不同角度的照片能让效果更稳定
- 表情自然: 避免夸张表情或闭眼照片
4.2 提示词编写技巧
- 必须包含"img": 这是触发词,告诉AI在哪里放人脸
- 描述要具体: "一个穿红色衣服的男人img"比"一个人img"效果好
- 风格词汇: 加上"高质量、专业摄影、电影级"等词汇提升效果
- 避免冲突: 不要在描述中包含其他人的名字
4.3 参数调节建议
-
新手推荐设置:
- steps: 30-50
- guidance_scale: 5-7
- style_strength_ratio: 15-25
- batch_size: 1-2
-
追求质量:
- steps: 50-80
- style_strength_ratio: 20-30
- 使用高质量的基础模型
-
追求速度:
- steps: 20-30
- batch_size: 1
- 降低图片尺寸
4.4 风格选择指南
- Photographic (Default): 写实照片风格,最接近真实照片
- Cinematic: 电影风格,有电影质感和氛围
- Disney Character: 迪士尼动画风格,卡通可爱
- Digital Art: 数字艺术风格,插画感强
- Fantasy art: 奇幻艺术风格,梦幻神秘
- Neonpunk: 赛博朋克风格,霓虹灯效果
- Comic book: 漫画风格,色彩鲜艳
- Line art: 线条艺术风格,简洁现代
5. 常见问题解答
Q1:为什么生成的人脸不像我?
A: 可能的原因和解决方法:
- 参考照片质量不好 → 换用清晰正脸照片
- style_strength_ratio 设置太低 → 调高到25-30
- 提示词中没有包含"img" → 确保描述中有"img"关键词
- 照片角度问题 → 使用多张不同角度的照片
Q2:生成速度很慢怎么办?
A: 优化建议:
- 降低steps数值(30步通常够用)
- 减少batch_size(一次生成1张)
- 降低图片尺寸(768x768也有不错效果)
- 使用本地模型加载器而不是在线下载
Q3:生成的图片质量不好?
A: 提升质量的方法:
- 增加steps到50-80
- 调整guidance_scale到6-8
- 使用高质量的基础模型
- 在提示词中加入"high quality, professional"等词汇
- 检查负面提示词是否包含了不想要的效果
Q4:LoRA效果不明显?
A: 调节建议:
- 增加lora_weight到0.7-0.8
- 确保LoRA模型与基础模型兼容
- 在提示词中加入LoRA相关的触发词
- 尝试不同的LoRA模型
Q5:内存不够用怎么办?
A: 节省内存的方法:
- 降低图片尺寸到768x768或512x512
- 减少batch_size到1
- 关闭其他占用内存的程序
- 使用CPU模式(虽然会很慢)
6. 工作流连接顺序
基础工作流:
- BaseModel_Loader_fromhub → PhotoMakerAdapter_Loader_fromhub
- Ref_Image_Preprocessing → NEW_PhotoMaker_Generation
- Prompt_Styler → NEW_PhotoMaker_Generation
完整工作流(包含LoRA):
- BaseModel_Loader_fromhub → PhotoMakerAdapter_Loader_fromhub → LoRALoader
- Ref_Image_Preprocessing → NEW_PhotoMaker_Generation
- Prompt_Styler → NEW_PhotoMaker_Generation
- LoRALoader → NEW_PhotoMaker_Generation
本地模型工作流:
- BaseModel_Loader_local → PhotoMakerAdapter_Loader_local
- 其余连接同基础工作流
7. 高级技巧
7.1 多人物生成
- 在一个提示词中使用多个"img"
- 为每个人物准备单独的参考照片
- 调整style_strength_ratio平衡不同人物的相似度
7.2 风格混合
- 使用多个LoRA模型叠加
- 调节不同LoRA的权重实现风格平衡
- 在提示词中混合不同风格的描述
7.3 批量生成优化
- 使用相同的seed可以生成一致的构图
- 通过调整batch_size一次生成多个变体
- 保存满意的参数设置供后续使用
8. 总结
ComfyUI-PhotoMaker-ZHO 是一个功能强大且易于使用的人脸定制插件。它通过简单的节点连接,就能实现复杂的人脸风格转换效果。无论你是想制作个人头像、创作艺术作品,还是进行商业设计,这个插件都能为你提供强大的支持。
记住这几个要点:
- 参考照片质量很重要
- 提示词必须包含"img"关键词
- 合理调节各项参数找到最佳效果
- 多尝试不同的风格和LoRA组合
- 保存好用的参数设置
希望这个教程能帮助你更好地使用 PhotoMaker 插件,创造出令人惊艳的人脸艺术作品!🎨✨