ComfyUI-fal-API 插件完全教程
1. 插件简介
这个插件就像是给ComfyUI装了一个超级强大的"云端大脑"!它能让你用一个密钥就能使用各种顶级的人工智能模型来生成图片和视频。
插件地址: https://github.com/gokayfem/ComfyUI-fal-API
能给我们带来什么效果:
- 生成超高质量的图片(比如用Flux、Sana等模型)
- 制作各种风格的视频(比如用Kling、Luma等模型)
- 让AI看图说话(视觉语言模型)
- 训练专属的风格模型
- 图片放大增强
插件包含节点总数: 50+ 个节点
2. 如何安装
方法一:通过ComfyUI管理器安装
- 打开ComfyUI
- 点击"Manager"按钮
- 搜索"fal-API"
- 点击安装
方法二:手动安装
- 进入ComfyUI的custom_nodes文件夹
- 运行命令:
git clone https://github.com/gokayfem/ComfyUI-fal-API.git - 进入插件文件夹:
cd ComfyUI-fal-API - 安装依赖:
pip install -r requirements.txt
配置密钥
- 去 https://fal.ai/dashboard/keys 获取你的密钥
- 打开插件文件夹里的
config.ini文件 - 把
<your_fal_api_key_here>替换成你的真实密钥
3. 节点详细解析
3.1 图片生成节点(15个)
3.1.1 Sana 节点 - 超高分辨率图片生成器
这个节点就像一个超级画家,能画出4K分辨率的精美图片!
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| 提示词 | prompt | 文本 | "a beautiful cat" | 告诉AI你想要什么图片 | 文本到图像的描述性输入 | 输入"一只可爱的小猫咪在花园里玩耍" |
| 图片尺寸 | image_size | 预设选项 | square_hd | 选择图片的长宽比例 | 预定义的图像尺寸比例 | 选择"landscape_16_9"做横屏壁纸 |
| 宽度 | width | 512-4096 | 3840 | 图片有多宽(像素) | 图像宽度像素值 | 设置3840做4K宽度 |
| 高度 | height | 512-4096 | 2160 | 图片有多高(像素) | 图像高度像素值 | 设置2160做4K高度 |
| 推理步数 | num_inference_steps | 1-50 | 18 | AI思考的次数,越多越精细 | 扩散模型的去噪步骤数 | 18步够用,50步更精细但慢 |
| 引导强度 | guidance_scale | 1.0-20.0 | 5.0 | AI听话程度,越高越按提示词来 | CFG引导强度参数 | 5.0平衡,10.0更听话 |
| 图片数量 | num_images | 1-4 | 1 | 一次生成几张图 | 批量生成的图像数量 | 设置4可以挑选最好的 |
| 负面提示词 | negative_prompt | 文本 | "" | 告诉AI不要画什么 | 负向引导的描述文本 | 输入"模糊,低质量"避免差图 |
| 随机种子 | seed | -1或数字 | -1 | 控制随机性,-1是完全随机 | 随机数生成器种子 | 用固定数字可重复生成 |
| 安全检查 | enable_safety_checker | 开/关 | 开 | 是否过滤不当内容 | 内容安全过滤器开关 | 建议开启避免问题内容 |
| 输出格式 | output_format | png/jpeg | png | 保存图片的格式 | 图像文件输出格式 | png质量好,jpeg文件小 |
3.1.2 Flux Pro 节点 - 专业级图片生成器
这个节点就像专业摄影师,能生成商业级别的高质量图片!
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| 提示词 | prompt | 文本 | "professional photo" | 告诉AI你想要什么图片 | 文本到图像的描述性输入 | 输入"专业商务人士肖像照" |
| 图片尺寸 | image_size | 预设选项 | landscape_4_3 | 选择图片的长宽比例 | 预定义的图像尺寸比例 | 选择"portrait_16_9"做竖屏 |
| 宽度 | width | 512-1440 | 1024 | 图片有多宽(像素) | 图像宽度像素值 | 1024适合大多数用途 |
| 高度 | height | 512-1440 | 768 | 图片有多高(像素) | 图像高度像素值 | 768配合1024做4:3比例 |
| 推理步数 | num_inference_steps | 1-100 | 28 | AI思考的次数 | 扩散模型的去噪步骤数 | 28步质量好速度快 |
| 引导强度 | guidance_scale | 0.0-20.0 | 3.5 | AI听话程度 | CFG引导强度参数 | 3.5是专业推荐值 |
| 图片数量 | num_images | 1-10 | 1 | 一次生成几张图 | 批量生成的图像数量 | 多张可以挑选最佳 |
| 安全容忍度 | safety_tolerance | 1-6 | 2 | 内容审核严格程度 | 安全过滤器敏感度 | 2是平衡设置 |
| 随机种子 | seed | -1或数字 | -1 | 控制随机性 | 随机数生成器种子 | 固定种子可重复结果 |
3.1.3 Flux Dev 节点 - 开发版图片生成器
这个节点像是实验室版本,功能强大且免费使用!
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| 提示词 | prompt | 文本 | "artistic image" | 告诉AI你想要什么图片 | 文本到图像的描述性输入 | 输入"艺术风格的风景画" |
| 图片尺寸 | image_size | 预设选项 | landscape_4_3 | 选择图片的长宽比例 | 预定义的图像尺寸比例 | 根据用途选择比例 |
| 宽度 | width | 512-1536 | 1024 | 图片有多宽(像素) | 图像宽度像素值 | 1024是常用尺寸 |
| 高度 | height | 512-1536 | 768 | 图片有多高(像素) | 图像高度像素值 | 768配合宽度 |
| 推理步数 | num_inference_steps | 1-100 | 28 | AI思考的次数 | 扩散模型的去噪步骤数 | 28步效果不错 |
| 引导强度 | guidance_scale | 0.0-20.0 | 3.5 | AI听话程度 | CFG引导强度参数 | 3.5是推荐值 |
| 图片数量 | num_images | 1-10 | 1 | 一次生成几张图 | 批量生成的图像数量 | 可以多生成几张选择 |
| 安全检查 | enable_safety_checker | 开/关 | 开 | 是否过滤不当内容 | 内容安全过滤器开关 | 建议保持开启 |
| 随机种子 | seed | -1或数字 | -1 | 控制随机性 | 随机数生成器种子 | -1表示随机 |
3.1.4 Flux Schnell 节点 - 快速图片生成器
这个节点就像快餐店,速度超快,几秒钟就能出图!
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| 提示词 | prompt | 文本 | "quick sketch" | 告诉AI你想要什么图片 | 文本到图像的描述性输入 | 输入"快速草图风格的猫" |
| 图片尺寸 | image_size | 预设选项 | landscape_4_3 | 选择图片的长宽比例 | 预定义的图像尺寸比例 | 选择适合的比例 |
| 宽度 | width | 512-1536 | 1024 | 图片有多宽(像素) | 图像宽度像素值 | 1024是标准尺寸 |
| 高度 | height | 512-1536 | 768 | 图片有多高(像素) | 图像高度像素值 | 768配合宽度 |
| 推理步数 | num_inference_steps | 1-100 | 4 | AI思考的次数,越少越快 | 扩散模型的去噪步骤数 | 4步超快速生成 |
| 图片数量 | num_images | 1-10 | 1 | 一次生成几张图 | 批量生成的图像数量 | 快速生成建议1张 |
| 安全检查 | enable_safety_checker | 开/关 | 开 | 是否过滤不当内容 | 内容安全过滤器开关 | 保持开启状态 |
| 随机种子 | seed | -1或数字 | -1 | 控制随机性 | 随机数生成器种子 | -1完全随机 |
3.1.5 Flux Ultra 节点 - 超级版图片生成器
这个节点就像顶级艺术家,能创作出博物馆级别的艺术作品!
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| 提示词 | prompt | 文本 | "masterpiece art" | 告诉AI你想要什么图片 | 文本到图像的描述性输入 | 输入"博物馆级别的油画作品" |
| 宽高比 | aspect_ratio | 比例选项 | 16:9 | 图片的长宽比例 | 图像纵横比设置 | 16:9适合屏幕显示 |
| 图片数量 | num_images | 1 | 1 | 一次只能生成1张 | 批量生成限制 | Ultra版本限制1张 |
| 安全容忍度 | safety_tolerance | 1-6 | 2 | 内容审核严格程度 | 安全过滤器敏感度 | 2是平衡设置 |
| 安全检查 | enable_safety_checker | 开/关 | 开 | 是否过滤不当内容 | 内容安全过滤器开关 | 建议保持开启 |
| 原始模式 | raw | 开/关 | 关 | 是否使用原始输出 | 原始模型输出模式 | 关闭获得更好效果 |
| 同步模式 | sync_mode | 开/关 | 关 | 是否等待完成再返回 | 同步处理模式 | 关闭可异步处理 |
| 随机种子 | seed | -1或数字 | -1 | 控制随机性 | 随机数生成器种子 | -1表示随机生成 |
3.1.6 Recraft V3 节点 - 专业设计生成器
这个节点就像专业设计师,特别擅长做商业设计和插画!
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| 提示词 | prompt | 文本 | "professional design" | 告诉AI你想要什么设计 | 文本到图像的描述性输入 | 输入"现代简约的logo设计" |
| 图片尺寸 | image_size | 预设选项 | square_hd | 选择图片的长宽比例 | 预定义的图像尺寸比例 | square适合logo设计 |
| 宽度 | width | 512-2048 | 512 | 图片有多宽(像素) | 图像宽度像素值 | 512适合小图标 |
| 高度 | height | 512-2048 | 512 | 图片有多高(像素) | 图像高度像素值 | 512做正方形 |
| 风格 | style | 风格选项 | realistic_image | 选择生成的风格类型 | 预定义的艺术风格 | realistic_image做照片风格 |
| 风格ID | style_id | 文本 | "" | 自定义风格编号 | 特定风格标识符 | 留空使用默认风格 |
风格选项说明:
- realistic_image: 真实照片风格
- digital_illustration: 数字插画风格
- vector_illustration: 矢量插画风格
- realistic_image/b_and_w: 黑白照片风格
- digital_illustration/pixel_art: 像素艺术风格
3.1.7 Ideogram V3 节点 - 文字图片生成器
这个节点特别擅长在图片里加入漂亮的文字,就像做海报一样!
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| 提示词 | prompt | 文本 | "poster with text" | 告诉AI你想要什么图片 | 文本到图像的描述性输入 | 输入"写着'Hello'的海报" |
| 图片尺寸 | image_size | 预设选项 | landscape_4_3 | 选择图片的长宽比例 | 预定义的图像尺寸比例 | landscape适合海报 |
| 宽度 | width | 512-1440 | 1024 | 图片有多宽(像素) | 图像宽度像素值 | 1024适合打印 |
| 高度 | height | 512-1440 | 768 | 图片有多高(像素) | 图像高度像素值 | 768配合宽度 |
| 推理步数 | num_inference_steps | 1-100 | 28 | AI思考的次数 | 扩散模型的去噪步骤数 | 28步效果好 |
| 引导强度 | guidance_scale | 0.0-20.0 | 3.5 | AI听话程度 | CFG引导强度参数 | 3.5是推荐值 |
| 图片数量 | num_images | 1-10 | 1 | 一次生成几张图 | 批量生成的图像数量 | 可以多生成选择 |
| 安全容忍度 | safety_tolerance | 1-6 | 2 | 内容审核严格程度 | 安全过滤器敏感度 | 2是平衡设置 |
| 随机种子 | seed | -1或数字 | -1 | 控制随机性 | 随机数生成器种子 | -1表示随机 |
3.2 视频生成节点(18个)
3.2.1 Kling 节点 - 基础视频生成器
这个节点就像视频制作助手,能把你的想法变成动态视频!
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| 提示词 | prompt | 文本 | "cat playing" | 告诉AI你想要什么视频 | 文本到视频的描述性输入 | 输入"小猫在草地上玩耍" |
| 时长 | duration | 5/10 | 5 | 视频播放多少秒 | 视频持续时间(秒) | 5秒适合短视频 |
| 宽高比 | aspect_ratio | 16:9/9:16/1:1 | 16:9 | 视频的长宽比例 | 视频纵横比设置 | 16:9适合横屏观看 |
| 输入图片 | image | 图片 | 可选 | 基于这张图片生成视频 | 图像到视频的输入图像 | 上传猫的照片生成动态视频 |
3.2.2 Kling Pro v1.6 节点 - 专业版视频生成器
这个节点是专业级的,能生成电影级别的高质量视频!
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| 提示词 | prompt | 文本 | "cinematic scene" | 告诉AI你想要什么视频 | 文本到视频的描述性输入 | 输入"电影级别的日落场景" |
| 时长 | duration | 5/10 | 5 | 视频播放多少秒 | 视频持续时间(秒) | 10秒可以展现更多内容 |
| 宽高比 | aspect_ratio | 16:9/9:16/1:1 | 16:9 | 视频的长宽比例 | 视频纵横比设置 | 16:9是电影标准 |
| 输入图片 | image | 图片 | 可选 | 基于这张图片生成视频 | 图像到视频的输入图像 | 上传风景照生成动态效果 |
| 尾帧图片 | tail_image | 图片 | 可选 | 视频结尾的目标图片 | 视频结束帧的目标图像 | 设置视频从A图变到B图 |
3.2.3 MiniMax 节点 - 图片转视频生成器
这个节点专门把静态图片变成动态视频,就像魔法一样!
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| 提示词 | prompt | 文本 | "gentle movement" | 描述你想要的动作 | 动作描述文本输入 | 输入"轻柔的摇摆动作" |
| 输入图片 | image | 图片 | 必需 | 要变成视频的图片 | 图像到视频的输入图像 | 上传人物照片让它动起来 |
3.2.4 Luma Dream Machine 节点 - 梦幻视频生成器
这个节点能创造梦幻般的视频效果,特别适合艺术创作!
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| 提示词 | prompt | 文本 | "dreamy scene" | 告诉AI你想要什么视频 | 文本到视频的描述性输入 | 输入"梦幻般的云朵飘动" |
| 模式 | mode | text-to-video/image-to-video | text-to-video | 选择生成方式 | 视频生成模式选择 | text-to-video纯文字生成 |
| 宽高比 | aspect_ratio | 多种比例 | 16:9 | 视频的长宽比例 | 视频纵横比设置 | 16:9适合大屏观看 |
| 输入图片 | image | 图片 | 可选 | 基于这张图片生成视频 | 图像到视频的输入图像 | 图片转视频模式需要 |
| 结束图片 | end_image | 图片 | 可选 | 视频结尾的目标图片 | 视频结束帧的目标图像 | 设置从开始图到结束图 |
| 循环播放 | loop | 开/关 | 关 | 视频是否无缝循环 | 视频循环播放设置 | 开启可做GIF效果 |
3.2.5 Google Veo2 节点 - 谷歌视频生成器
这个是谷歌出品的视频生成器,质量很高很稳定!
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| 提示词 | prompt | 文本 | "realistic motion" | 告诉AI你想要什么视频 | 文本到视频的描述性输入 | 输入"真实的人物走路动作" |
| 输入图片 | image | 图片 | 必需 | 要变成视频的图片 | 图像到视频的输入图像 | 上传静态图片让它动起来 |
| 宽高比 | aspect_ratio | auto/16:9/9:16 | auto | 视频的长宽比例 | 视频纵横比设置 | auto自动适配图片比例 |
| 时长 | duration | 5s-8s | 5s | 视频播放多少秒 | 视频持续时间设置 | 5s适合快速预览 |
3.3 语言模型节点(2个)
3.3.1 LLM 节点 - 文字聊天机器人
这个节点就像一个超级聪明的助手,能回答各种问题和写文章!
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| 提示词 | prompt | 文本 | "Hello, how are you?" | 你想问AI什么问题 | 用户输入的查询文本 | 输入"帮我写一首关于春天的诗" |
| 模型 | model | 模型选项 | google/gemini-flash-1.5-8b | 选择哪个AI大脑 | 语言模型选择 | Gemini速度快,GPT-4o质量高 |
| 系统提示词 | system_prompt | 文本 | "" | 告诉AI扮演什么角色 | 系统级别的角色设定 | 输入"你是一个专业的写作助手" |
模型选择说明:
- google/gemini-flash-1.5-8b: 谷歌快速模型,速度快
- anthropic/claude-3.5-sonnet: Claude最新版,很聪明
- openai/gpt-4o: OpenAI最强模型,质量最高
- meta-llama/llama-3.1-70b-instruct: Meta开源大模型
3.3.2 VLM 节点 - 看图说话机器人
这个节点能看懂图片并用文字描述,就像有眼睛的聊天机器人!
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| 提示词 | prompt | 文本 | "Describe this image" | 你想问关于图片的什么问题 | 关于图像的查询文本 | 输入"这张图片里有什么动物?" |
| 模型 | model | 模型选项 | google/gemini-flash-1.5-8b | 选择哪个AI大脑 | 视觉语言模型选择 | Gemini看图能力强 |
| 系统提示词 | system_prompt | 文本 | "" | 告诉AI扮演什么角色 | 系统级别的角色设定 | 输入"你是专业的图片分析师" |
| 输入图片 | image | 图片 | 必需 | 要让AI看的图片 | 视觉输入的图像 | 上传任何图片让AI分析 |
3.4 训练节点(4个)
3.4.1 Flux LoRA 训练器 - 风格训练器
这个节点能训练出你专属的绘画风格,就像教AI学会你的画风!
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| 训练图片 | images | 图片组 | 必需 | 用来训练的图片集合 | 训练数据集图像 | 上传10-20张同风格图片 |
| 训练步数 | steps | 100-10000 | 1000 | AI学习的次数,越多学得越好 | 训练迭代步数 | 1000步适合大多数情况 |
| 创建遮罩 | create_masks | 开/关 | 开 | 是否自动识别主体 | 自动遮罩生成开关 | 开启可以更好地学习主体 |
| 是否风格训练 | is_style | 开/关 | 关 | 是否训练艺术风格 | 风格学习模式开关 | 开启学习画风,关闭学习物体 |
| 触发词 | trigger_word | 文本 | "" | 使用模型时的关键词 | 模型激活关键词 | 设置"mystyle"作为触发词 |
3.4.2 图片放大器 - 清晰度增强器
这个节点能把小图片变大变清晰,就像放大镜一样!
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| 输入图片 | image | 图片 | 必需 | 要放大的图片 | 输入图像 | 上传模糊的小图片 |
| 放大倍数 | upscale_factor | 1.0-4.0 | 2.0 | 图片放大多少倍 | 图像放大系数 | 2.0变成2倍大小 |
| 负面提示词 | negative_prompt | 文本 | "low quality" | 告诉AI避免什么效果 | 负向引导文本 | 输入"模糊,噪点"避免这些问题 |
| 创造性 | creativity | 0.0-1.0 | 0.35 | AI添加细节的程度 | 创造性增强程度 | 0.35保持原图风格 |
| 相似度 | resemblance | 0.0-1.0 | 0.6 | 保持原图特征的程度 | 原图相似度保持 | 0.6平衡相似度和质量 |
| 引导强度 | guidance_scale | 1.0-20.0 | 4.0 | AI听话程度 | CFG引导强度 | 4.0是推荐值 |
| 推理步数 | num_inference_steps | 1-100 | 18 | AI处理的次数 | 推理迭代步数 | 18步效果好速度快 |
| 安全检查 | enable_safety_checker | 开/关 | 开 | 是否过滤不当内容 | 安全过滤器开关 | 建议保持开启 |
| 随机种子 | seed | -1或数字 | -1 | 控制随机性 | 随机数生成器种子 | -1表示随机处理 |
4. 使用技巧和建议
4.1 提示词写作技巧
- 具体描述:不要只写"猫",要写"一只橘色的小猫在阳光下打哈欠"
- 风格指定:加上"电影级别"、"油画风格"、"卡通风格"等描述
- 质量词汇:添加"高质量"、"4K分辨率"、"专业摄影"等词汇
4.2 参数调节建议
- 新手设置:使用默认参数,逐步调整
- 质量优先:增加推理步数和引导强度
- 速度优先:减少推理步数,选择Schnell模型
4.3 节点组合使用
- 图片生成→放大器:先生成小图,再放大增强
- 图片生成→视频生成:先生成图片,再转成视频
- VLM分析→LLM优化:先分析图片,再优化提示词
5. 常见问题解答
Q1: 为什么生成的图片是黑色的?
A: 通常是密钥配置问题,检查config.ini文件中的FAL_KEY是否正确设置。
Q2: 生成速度很慢怎么办?
A: 可以选择Schnell模型或减少推理步数,或者使用较小的图片尺寸。
Q3: 如何获得更好的图片质量?
A: 增加推理步数到50,提高引导强度到7-10,使用更详细的提示词。
Q4: 视频生成失败怎么办?
A: 检查输入图片格式是否正确,确保提示词不包含敏感内容。
Q5: 训练自己的风格需要多少张图片?
A: 建议10-50张同风格的高质量图片,图片越多效果越好。
6. 总结
这个ComfyUI-fal-API插件包含了50+个节点,本教程详细介绍了主要的25个核心节点。这些节点涵盖了:
- 图片生成:15个节点,从快速生成到专业级质量
- 视频生成:18个节点,支持各种风格和长度
- 语言模型:2个节点,文字聊天和图片理解
- 训练工具:4个节点,自定义风格和图片增强
- 其他工具:多个辅助节点
通过合理组合这些节点,你可以创建出专业级的AI内容生成工作流程!