ComfyUI-Cloud-APIs 插件完全新手教程
1. 插件简介
插件地址:https://github.com/BetaDoggo/ComfyUI-Cloud-APIs
ComfyUI-Cloud-APIs 是一个专门为那些显卡不够强大的朋友们设计的插件。简单来说,这个插件就像是一个"云端显卡租赁服务",让你可以在自己的电脑上使用那些超级强大但需要昂贵显卡才能运行的AI模型。
想象一下,你想用最新最强的Flux模型来生成图片,但你的显卡只能跑个扫雷游戏。这个插件就像是给你开了一个"云端工作室",你把工作交给云端的超级电脑来完成,然后把结果传回给你。
这个插件能给你带来什么?
- 使用最新的Flux模型生成高质量图片(文字转图片、图片转图片)
- 使用强大的图像理解模型(LLaVA)让AI看图说话
- 使用其他高级模型如Auraflow、SoteDiffusion等
- 不需要购买昂贵的显卡就能体验最新AI技术
2. 如何安装
方法一:使用ComfyUI管理器(推荐)
- 打开ComfyUI,点击"Manager"按钮
- 选择"Install via Git URL"(通过网址安装)
- 输入:
https://github.com/BetaDoggo/ComfyUI-Cloud-APIs - 点击安装并重启ComfyUI
方法二:手动安装
- 进入ComfyUI的custom_nodes文件夹
- 使用git命令:
git clone https://github.com/BetaDoggo/ComfyUI-Cloud-APIs - 重启ComfyUI
3. 节点逐一解析
3.1 Flux文字转图片节点(fal平台)
这个节点就像是一个"云端画家",你用文字描述你想要的图片,它就帮你画出来。
参数详解:
| 参数名 (界面显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| 文字描述 | prompt | 文本 | 详细描述 | 告诉AI你想要什么样的图片 | 输入提示词来指导图像生成 | "一只穿着西装的猫在办公室里工作" |
| 图片尺寸 | image_size | 选择项 | 1024x1024 | 决定生成图片的大小 | 设置输出图像的分辨率 | 选择方形、横向或竖向 |
| 推理步数 | num_inference_steps | 数字 | 28 | 控制生成质量,越高越精细但越慢 | 扩散模型的迭代步数 | 快速预览用15,高质量用50 |
| 引导强度 | guidance_scale | 数字 | 7.5 | 控制AI听话程度,越高越按你说的做 | 分类器自由引导的强度 | 创意发挥用3-5,精确控制用7-12 |
| 随机种子 | seed | 数字 | 随机 | 控制随机性,相同种子生成相同结果 | 伪随机数生成器的种子值 | 固定种子可重现相同结果 |
3.2 Flux图片转图片节点(fal平台)
这个节点就像是一个"图片改造师",你给它一张图片,告诉它你想改成什么样,它就帮你改造。
参数详解:
| 参数名 (界面显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| 输入图片 | image | 图片 | 必须 | 你要改造的原始图片 | 作为参考的输入图像 | 上传一张照片或连接前面的节点 |
| 文字描述 | prompt | 文本 | 详细描述 | 告诉AI你想把图片改成什么样 | 描述期望的图像变化 | "把这张白天的照片改成夜晚" |
| 强度 | strength | 数字 | 0.8 | 控制改变程度,0是不变,1是完全重画 | 图像到图像转换的强度 | 微调用0.3,大改用0.8 |
| 图片尺寸 | image_size | 选择项 | 原图尺寸 | 决定输出图片的大小 | 设置输出图像的分辨率 | 通常保持原图尺寸 |
| 推理步数 | num_inference_steps | 数字 | 28 | 控制生成质量,越高越精细但越慢 | 扩散模型的迭代步数 | 快速预览用15,高质量用50 |
| 引导强度 | guidance_scale | 数字 | 7.5 | 控制AI听话程度,越高越按你说的做 | 分类器自由引导的强度 | 创意发挥用3-5,精确控制用7-12 |
| 随机种子 | seed | 数字 | 随机 | 控制随机性,相同种子生成相同结果 | 伪随机数生成器的种子值 | 固定种子可重现相同结果 |
3.3 Flux文字转图片节点(Replicate平台)
这个节点功能和fal平台的类似,但使用的是Replicate的服务,就像是换了一个云端画家。
参数详解:
| 参数名 (界面显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| 文字描述 | prompt | 文本 | 详细描述 | 告诉AI你想要什么样的图片 | 输入提示词来指导图像生成 | "一朵盛开的玫瑰花在阳光下" |
| 负面描述 | negative_prompt | 文本 | 可选 | 告诉AI你不想要什么 | 负面提示词,避免不需要的元素 | "模糊,低质量,变形" |
| 宽度 | width | 数字 | 1024 | 设置图片宽度 | 输出图像的宽度像素 | 常用尺寸:512、768、1024 |
| 高度 | height | 数字 | 1024 | 设置图片高度 | 输出图像的高度像素 | 常用尺寸:512、768、1024 |
| 推理步数 | num_inference_steps | 数字 | 28 | 控制生成质量,越高越精细但越慢 | 扩散模型的迭代步数 | 快速预览用15,高质量用50 |
| 引导强度 | guidance_scale | 数字 | 7.5 | 控制AI听话程度,越高越按你说的做 | 分类器自由引导的强度 | 创意发挥用3-5,精确控制用7-12 |
| 随机种子 | seed | 数字 | 随机 | 控制随机性,相同种子生成相同结果 | 伪随机数生成器的种子值 | 固定种子可重现相同结果 |
3.4 Flux带风格模型节点(fal平台)
这个节点就像是一个"专业摄影师",不仅会画画,还会使用各种特殊的拍摄风格和技巧。
参数详解:
| 参数名 (界面显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| 文字描述 | prompt | 文本 | 详细描述 | 告诉AI你想要什么样的图片 | 输入提示词来指导图像生成 | "一个现代化的客厅设计" |
| 风格模型 | loras | 选择项 | 根据需要 | 选择特定的绘画风格或效果 | 加载特定的LoRA模型 | 选择"动漫风格"、"写实风格"等 |
| 输入图片 | image | 图片 | 可选 | 参考图片,可以不提供 | 作为参考的输入图像 | 上传参考图或连接前面的节点 |
| 图片尺寸 | image_size | 选择项 | 1024x1024 | 决定生成图片的大小 | 设置输出图像的分辨率 | 选择方形、横向或竖向 |
| 推理步数 | num_inference_steps | 数字 | 28 | 控制生成质量,越高越精细但越慢 | 扩散模型的迭代步数 | 快速预览用15,高质量用50 |
| 引导强度 | guidance_scale | 数字 | 7.5 | 控制AI听话程度,越高越按你说的做 | 分类器自由引导的强度 | 创意发挥用3-5,精确控制用7-12 |
| 随机种子 | seed | 数字 | 随机 | 控制随机性,相同种子生成相同结果 | 伪随机数生成器的种子值 | 固定种子可重现相同结果 |
3.5 Auraflow文字转图片节点(fal平台)
这个节点使用的是Auraflow模型,就像是另一个风格的云端画家,擅长创造不同风格的图片。
参数详解:
| 参数名 (界面显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| 文字描述 | prompt | 文本 | 详细描述 | 告诉AI你想要什么样的图片 | 输入提示词来指导图像生成 | "一幅抽象艺术作品,充满活力的色彩" |
| 图片尺寸 | image_size | 选择项 | 1024x1024 | 决定生成图片的大小 | 设置输出图像的分辨率 | 选择方形、横向或竖向 |
| 推理步数 | num_inference_steps | 数字 | 20 | 控制生成质量,越高越精细但越慢 | 扩散模型的迭代步数 | Auraflow推荐用20-30 |
| 引导强度 | guidance_scale | 数字 | 7.0 | 控制AI听话程度,越高越按你说的做 | 分类器自由引导的强度 | Auraflow推荐用5-9 |
| 随机种子 | seed | 数字 | 随机 | 控制随机性,相同种子生成相同结果 | 伪随机数生成器的种子值 | 固定种子可重现相同结果 |
3.6 SoteDiffusion文字转图片节点(fal平台)
这个节点使用SoteDiffusion模型,就像是一个专门的艺术家,有自己独特的绘画风格。
参数详解:
| 参数名 (界面显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| 文字描述 | prompt | 文本 | 详细描述 | 告诉AI你想要什么样的图片 | 输入提示词来指导图像生成 | "一个神秘的森林场景" |
| 负面描述 | negative_prompt | 文本 | 可选 | 告诉AI你不想要什么 | 负面提示词,避免不需要的元素 | "模糊,低质量,噪点" |
| 图片尺寸 | image_size | 选择项 | 1024x1024 | 决定生成图片的大小 | 设置输出图像的分辨率 | 选择方形、横向或竖向 |
| 推理步数 | num_inference_steps | 数字 | 25 | 控制生成质量,越高越精细但越慢 | 扩散模型的迭代步数 | 快速预览用15,高质量用40 |
| 引导强度 | guidance_scale | 数字 | 7.5 | 控制AI听话程度,越高越按你说的做 | 分类器自由引导的强度 | 创意发挥用3-5,精确控制用7-12 |
| 随机种子 | seed | 数字 | 随机 | 控制随机性,相同种子生成相同结果 | 伪随机数生成器的种子值 | 固定种子可重现相同结果 |
3.7 StableCascade文字转图片节点(fal平台)
这个节点使用StableCascade模型,就像是一个"分层绘画师",会先画个草图,再慢慢细化。
参数详解:
| 参数名 (界面显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| 文字描述 | prompt | 文本 | 详细描述 | 告诉AI你想要什么样的图片 | 输入提示词来指导图像生成 | "一座现代化的摩天大楼" |
| 负面描述 | negative_prompt | 文本 | 可选 | 告诉AI你不想要什么 | 负面提示词,避免不需要的元素 | "模糊,变形,低质量" |
| 宽度 | width | 数字 | 1024 | 设置图片宽度 | 输出图像的宽度像素 | 常用尺寸:768、1024、1536 |
| 高度 | height | 数字 | 1024 | 设置图片高度 | 输出图像的高度像素 | 常用尺寸:768、1024、1536 |
| 先期步数 | prior_num_inference_steps | 数字 | 20 | 控制第一阶段生成的步数 | 级联模型第一阶段的迭代步数 | 快速用15,高质量用25 |
| 解码步数 | decoder_num_inference_steps | 数字 | 10 | 控制第二阶段细化的步数 | 级联模型第二阶段的迭代步数 | 快速用8,高质量用15 |
| 引导强度 | guidance_scale | 数字 | 4.0 | 控制AI听话程度,越高越按你说的做 | 分类器自由引导的强度 | StableCascade推荐用3-6 |
| 随机种子 | seed | 数字 | 随机 | 控制随机性,相同种子生成相同结果 | 伪随机数生成器的种子值 | 固定种子可重现相同结果 |
3.8 LLaVA 1.5 13B 图像理解节点(fal平台)
这个节点就像是一个"AI眼睛",能够看图片并用文字描述看到的内容。
参数详解:
| 参数名 (界面显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| 输入图片 | image | 图片 | 必须 | 你想让AI看的图片 | 输入图像进行视觉理解 | 上传照片或连接前面的节点 |
| 问题 | prompt | 文本 | 具体问题 | 你想问AI关于图片的什么问题 | 关于图像的具体询问 | "这张图片里有什么?" |
| 最大长度 | max_length | 数字 | 100 | 控制AI回答的长度 | 生成回答的最大字符数 | 简短回答用50,详细用200 |
| 温度 | temperature | 数字 | 0.7 | 控制AI回答的创造性 | 控制输出的随机性 | 准确回答用0.3,创意回答用0.9 |
3.9 LLaVA 1.6 34B 图像理解节点(fal平台)
这个节点是LLaVA 1.5的升级版,就像是一个"更聪明的AI眼睛",能更准确地理解图片内容。
参数详解:
| 参数名 (界面显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| 输入图片 | image | 图片 | 必须 | 你想让AI看的图片 | 输入图像进行视觉理解 | 上传照片或连接前面的节点 |
| 问题 | prompt | 文本 | 具体问题 | 你想问AI关于图片的什么问题 | 关于图像的具体询问 | "分析这张图片的构图特点" |
| 最大长度 | max_length | 数字 | 150 | 控制AI回答的长度 | 生成回答的最大字符数 | 简短回答用80,详细用300 |
| 温度 | temperature | 数字 | 0.7 | 控制AI回答的创造性 | 控制输出的随机性 | 准确回答用0.3,创意回答用0.9 |
3.10 Runware SD1.5 文字转图片节点(带风格)
这个节点使用Runware平台的SD1.5模型,就像是一个"经典风格画家",支持各种风格模型。
参数详解:
| 参数名 (界面显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| 文字描述 | prompt | 文本 | 详细描述 | 告诉AI你想要什么样的图片 | 输入提示词来指导图像生成 | "一个卡通风格的小女孩" |
| 负面描述 | negative_prompt | 文本 | 可选 | 告诉AI你不想要什么 | 负面提示词,避免不需要的元素 | "模糊,低质量,变形" |
| 风格模型 | lora | 选择项 | 根据需要 | 选择特定的绘画风格或效果 | 加载特定的LoRA模型 | 选择"动漫风格"、"油画风格"等 |
| 宽度 | width | 数字 | 512 | 设置图片宽度 | 输出图像的宽度像素 | SD1.5推荐512或768 |
| 高度 | height | 数字 | 512 | 设置图片高度 | 输出图像的高度像素 | SD1.5推荐512或768 |
| 推理步数 | steps | 数字 | 20 | 控制生成质量,越高越精细但越慢 | 扩散模型的迭代步数 | 快速用15,高质量用30 |
| 引导强度 | guidance_scale | 数字 | 7.5 | 控制AI听话程度,越高越按你说的做 | 分类器自由引导的强度 | 创意发挥用3-5,精确控制用7-12 |
| 随机种子 | seed | 数字 | 随机 | 控制随机性,相同种子生成相同结果 | 伪随机数生成器的种子值 | 固定种子可重现相同结果 |
3.11 Runware SDXL 文字转图片节点(带风格)
这个节点使用Runware平台的SDXL模型,就像是一个"高清画家",能生成更高质量的图片。
参数详解:
| 参数名 (界面显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| 文字描述 | prompt | 文本 | 详细描述 | 告诉AI你想要什么样的图片 | 输入提示词来指导图像生成 | "一个超现实主义的艺术作品" |
| 负面描述 | negative_prompt | 文本 | 可选 | 告诉AI你不想要什么 | 负面提示词,避免不需要的元素 | "模糊,低质量,变形" |
| 风格模型 | lora | 选择项 | 根据需要 | 选择特定的绘画风格或效果 | 加载特定的LoRA模型 | 选择"写实风格"、"未来科技风格"等 |
| 宽度 | width | 数字 | 1024 | 设置图片宽度 | 输出图像的宽度像素 | SDXL推荐1024或1536 |
| 高度 | height | 数字 | 1024 | 设置图片高度 | 输出图像的高度像素 | SDXL推荐1024或1536 |
| 推理步数 | steps | 数字 | 25 | 控制生成质量,越高越精细但越慢 | 扩散模型的迭代步数 | 快速用20,高质量用40 |
| 引导强度 | guidance_scale | 数字 | 7.5 | 控制AI听话程度,越高越按你说的做 | 分类器自由引导的强度 | 创意发挥用3-5,精确控制用7-12 |
| 随机种子 | seed | 数字 | 随机 | 控制随机性,相同种子生成相同结果 | 伪随机数生成器的种子值 | 固定种子可重现相同结果 |
4. 使用技巧和建议
4.1 平台选择技巧
- fal.ai:速度快,支持的模型多,适合快速测试
- Replicate:价格透明,计费精确,适合正式项目
- Runware:支持风格模型多,适合特定风格创作
4.2 参数调节建议
- 新手起步:先用默认参数,熟悉后再调节
- 快速预览:降低推理步数到15-20,节省时间和费用
- 高质量输出:增加推理步数到30-50,但费用会增加
- 创意探索:降低引导强度到3-5,让AI更有创造性
- 精确控制:增加引导强度到8-12,让AI更听话
4.3 费用控制技巧
- 先在本地ComfyUI测试工作流,确认无误后再使用云端节点
- 使用较小的图片尺寸进行测试,满意后再用大尺寸
- 合理设置推理步数,不要盲目追求高数值
- 定期检查账户余额,避免意外超支
4.4 提示词优化
- 使用具体、详细的描述
- 避免使用过于复杂的句子
- 英文提示词通常效果更好
- 可以参考其他AI绘画平台的优质提示词
5. 常见问题解答
Q1:为什么我的节点无法连接?
A1: 检查以下几点:
- 确保在
ComfyUI-Cloud-APIs/keys文件夹中放置了正确的密钥文件 - 检查网络连接是否正常
- 确认账户余额充足
- 重启ComfyUI后再尝试