ComfyUI 魔法书 Logo
🏠 首页
👥 加群
😎 大帅比
❤️‍🔥 Monster 社区
登录 →
ComfyUI 魔法书 Logo
🏠 首页 👥 加群 😎 大帅比 ❤️‍🔥 Monster 社区
登录
  1. 首页
  2. 🧩 插件工坊 (Plugin Workshop)
  3. ComfyUI DagThomas插件使用教程 从入门到精通

ComfyUI DagThomas插件使用教程 从入门到精通

0
  • 🧩 插件工坊 (Plugin Workshop)
  • 发布于 2025-06-30
  • 265 次阅读
编程界的小学生
编程界的小学生

ComfyUI DagThomas 插件完全教程

1. 插件简介

插件地址: https://github.com/dagthomas/comfyui_dagthomas

这个插件就像是给 ComfyUI 装了一个超级智能的文字助手!它能帮你:

  • 自动写画面描述:就像有个专业摄影师在旁边告诉你怎么拍照
  • 分析图片内容:把图片"看懂"然后用文字描述出来
  • 随机生成创意:像抽盲盒一样给你惊喜的画面想法
  • 连接各种AI大脑:可以用GPT、谷歌的AI、本地AI等等

简单说,这个插件让你不用绞尽脑汁想怎么描述画面,AI帮你搞定!

2. 如何安装

方法一:ComfyUI管理器安装(推荐)

  1. 打开ComfyUI
  2. 点击"Manager"按钮
  3. 搜索"dagthomas"
  4. 点击安装

方法二:手动安装

  1. 打开ComfyUI的安装文件夹
  2. 进入custom_nodes文件夹
  3. 用git下载:git clone https://github.com/dagthomas/comfyui_dagthomas.git
  4. 重启ComfyUI

环境变量设置(重要!)

如果要用GPT功能,需要设置:

OPENAI_API_KEY=你的OpenAI密钥

如果要用谷歌AI功能,需要设置:

GEMINI_API_KEY=你的Gemini密钥

3. 节点详细解析

3.1 PromptGenerator(自动画面描述生成器)

这个节点就像一个会写作文的机器人,你告诉它几个关键词,它就能给你写出完整的画面描述。

参数详解

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释 (能干嘛的)专业解释怎么用/举个例子
种子seed0-1125899906842624随机数就像抽奖的号码,同样的号码会得到同样的结果随机数种子,控制生成的随机性设置123,每次都会生成相同的描述
自定义内容custom文本空或特定风格在描述前面加上你想要的特殊内容自定义前缀文本输入"赛博朋克风格"会在所有描述前加上这个
主体对象subject文本空或具体人物画面的主角是谁或什么主要描述对象输入"美丽的女孩"替换默认的人物描述
艺术形式artform列表选择photography选择是拍照还是画画等艺术类型艺术表现形式选"photography"生成摄影描述,选"painting"生成绘画描述
照片类型photo_type列表选择random什么样的照片风格,比如肖像、风景等摄影类型分类选"portrait"专门生成人像照片描述
身材类型body_types列表选择random人物的身材特征人物体型描述选"athletic"生成运动员身材的描述
默认标签default_tags列表选择random基础的人物描述,比如男人、女人等基础人物标签选"woman"会生成女性相关描述
角色职业roles列表选择random人物的职业或身份人物角色设定选"doctor"会生成医生形象的描述
发型hairstyles列表选择random头发的样式发型描述选"long hair"生成长发造型描述
额外细节additional_details列表选择random一些特殊的细节描述补充细节信息会添加一些有趣的小细节让画面更生动
摄影风格photography_styles列表选择random摄影的技术风格摄影技法风格选"macro photography"生成微距摄影描述
设备器材device列表选择random用什么相机或设备拍摄拍摄设备选"Canon EOS R5"会在描述中提到用这个相机拍摄
摄影师photographer列表选择random模仿哪个著名摄影师的风格摄影师风格选"Annie Leibovitz"会模仿她的拍摄风格
艺术家artist列表选择random模仿哪个艺术家的绘画风格艺术家风格选"Van Gogh"会生成梵高风格的描述
数字艺术形式digital_artform列表选择random数字艺术的类型数字艺术分类选"3D render"生成三维渲染图描述
地点场所place列表选择random画面发生的地点场景位置选"beach"会生成海滩场景
灯光效果lighting列表选择random光线的效果和氛围照明设置选"golden hour"生成黄金时段的光线效果
服装穿着clothing列表选择random人物穿什么衣服服装描述选"elegant dress"生成优雅裙装描述
构图方式composition列表选择random画面的构图和角度构图技法选"rule of thirds"使用三分法构图
姿势动作pose列表选择random人物的姿势和动作人物姿态选"sitting"生成坐着的姿势
背景环境background列表选择random画面的背景是什么样的背景设置选"blurred background"生成虚化背景效果

3.2 GPT4VisionNode(GPT-4图片分析器)

这个节点就像给你请了个专业的艺术评论家,它能"看懂"图片然后用文字详细描述出来。

参数详解

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释 (能干嘛的)专业解释怎么用/举个例子
图片输入imagesIMAGE类型必填要分析的图片,就像给评论家看照片输入图像数据连接任何图片节点
详细描述happy_talkTrue/FalseTrue开启后会写很详细的描述,关闭后只写简单的控制描述详细程度True=写作文,False=写要点
压缩输出compressTrue/FalseFalse让描述变短一些,节省字数压缩输出长度开启后描述会更简洁
压缩程度compression_levelsoft/medium/hardsoft压缩的强度,hard最短压缩级别hard=最简洁,soft=稍微简化
电影海报模式posterTrue/FalseFalse生成电影海报风格的描述海报风格输出开启后会生成像电影海报的描述格式
自定义提示词custom_base_prompt文本空告诉AI你想要什么样的描述风格自定义基础提示输入"用诗歌的方式描述"会得到诗意的描述
自定义标题custom_title文本空在海报模式下给作品起个标题海报标题设置输入"神秘森林"作为海报标题
覆盖指令override文本空完全替换默认的分析指令覆盖默认提示输入完全自定义的分析要求

3.3 GPT4MiniNode(GPT-4文本增强器)

这个节点就像一个文字魔法师,你给它一段简单的描述,它能帮你扩展成丰富详细的画面描述。

参数详解

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释 (能干嘛的)专业解释怎么用/举个例子
输入文本input_text文本必填你想要扩展的简单描述输入文本内容输入"一个女孩在花园里"会扩展成详细场景
详细描述happy_talkTrue/FalseTrue是否生成详细丰富的描述控制输出详细度True生成电影级描述,False生成简洁描述
压缩输出compressTrue/FalseFalse让输出变短一些压缩输出长度开启后会限制字数
压缩程度compression_levelsoft/medium/hardsoft压缩的强度级别压缩级别设置hard=最简洁,soft=适度简化
海报模式posterTrue/FalseFalse生成电影海报风格的描述海报格式输出开启后按海报格式组织描述
自定义基础提示custom_base_prompt文本空自定义AI的工作方式自定义提示词输入"用科幻风格描述"改变输出风格
自定义标题custom_title文本空海报模式下的标题海报标题输入"未来世界"作为海报标题
覆盖指令override文本空完全自定义AI指令覆盖默认指令输入完全自定义的处理要求

3.4 OllamaNode(本地AI文本处理器)

这个节点让你用自己电脑上的AI来处理文本,不需要联网,就像在家里养了个AI助手。

参数详解

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释 (能干嘛的)专业解释怎么用/举个例子
输入文本input_text文本必填要处理的文本内容输入文本数据输入任何想要AI处理的文字
详细描述happy_talkTrue/FalseTrue是否生成详细描述控制输出详细度True=详细,False=简洁
压缩输出compressTrue/FalseFalse压缩输出长度输出长度控制开启后会限制输出字数
压缩程度compression_levelsoft/medium/hardsoft压缩强度压缩级别hard最短,soft适中
海报模式posterTrue/FalseFalse海报风格输出海报格式化生成电影海报式描述
自定义基础提示custom_base_prompt文本空自定义AI工作方式自定义提示词告诉AI用什么风格处理
自定义模型custom_model文本llama3.1:8b使用哪个本地AI模型本地模型选择可以换成其他已安装的模型
Ollama地址ollama_urlURLlocalhost:11434本地AI服务的地址服务端点地址通常不需要改动
自定义标题custom_title文本空海报模式标题海报标题设置海报模式下的标题文字
覆盖指令override文本空覆盖默认指令自定义指令覆盖完全自定义处理指令

3.5 Gpt4VisionCloner(GPT-4图片克隆分析器)

这个节点像个专业的图片分析师,能把图片内容分解成详细的JSON格式数据,还能把多张图片融合在一起。

参数详解

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释 (能干嘛的)专业解释怎么用/举个例子
图片输入imagesIMAGE类型必填要分析的图片输入图像数据连接图片节点
淡化百分比fade_percentage0.1-50.015.0多张图片融合时的过渡效果强度图像融合过渡度15.0表示15%的区域用于过渡融合
自定义提示custom_prompt文本空自定义分析指令自定义分析提示告诉AI用什么方式分析图片

3.6 PGSD3LatentGenerator(SD3潜在空间生成器)

这个节点就像一个画布准备器,为Stable Diffusion 3创建合适尺寸的"空白画布"。

参数详解

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释 (能干嘛的)专业解释怎么用/举个例子
宽度width0-最大分辨率1024图片的宽度像素图像宽度设置1024表示1024像素宽
高度height0-最大分辨率1024图片的高度像素图像高度设置1024表示1024像素高
批次大小batch_size1-40961一次生成几张图批处理数量设置4会一次准备4张画布

3.7 APNLatent(高级潜在空间生成器)

这个节点是PGSD3的升级版,能自动调整尺寸比例,就像一个智能的画布助手。

参数详解

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释 (能干嘛的)专业解释怎么用/举个例子
宽度width0-最大分辨率1024图片宽度图像宽度设置图片的宽度像素
高度height0-最大分辨率1024图片高度图像高度设置图片的高度像素
批次大小batch_size1-40961一次生成数量批处理大小同时生成的图片数量
百万像素缩放megapixel_scale0.1-2.01.0控制图片的总像素数像素密度控制1.0=标准,2.0=双倍像素
宽高比aspect_ratio1:1/3:2/4:3/16:9/21:91:1图片的长宽比例纵横比设置16:9适合宽屏,1:1适合方形
竖屏模式is_portraitTrue/FalseFalse是否生成竖屏图片方向设置True=竖屏,False=横屏

3.8 RandomIntegerNode(随机数生成器)

这个节点就像一个数字抽奖机,能在指定范围内随机选择数字。

参数详解

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释 (能干嘛的)专业解释怎么用/举个例子
最小值min_value-10亿到10亿0随机数的最小值随机范围下限设置0表示最小不能小于0
最大值max_value-10亿到10亿10随机数的最大值随机范围上限设置100表示最大不超过100
种子seed-1到2^32-1-1控制随机结果的种子随机种子-1=真随机,固定数字=固定结果

3.9 StringMergerNode(文本合并器)

这个节点像个文字拼接工具,能把两段文字智能地合并在一起。

参数详解

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释 (能干嘛的)专业解释怎么用/举个例子
文本1string1文本必填第一段要合并的文字第一个输入字符串输入"美丽的女孩"
文本2string2文本必填第二段要合并的文字第二个输入字符串输入"在花园里"
使用AND连接use_andTrue/FalseFalse用"AND"还是逗号连接连接符选择True="美丽的女孩 AND 在花园里"

3.10 FlexibleStringMergerNode(灵活文本合并器)

这个节点是StringMerger的升级版,能同时合并最多4段文字。

参数详解

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释 (能干嘛的)专业解释怎么用/举个例子
文本1string1文本必填第一段文字主要输入文本输入主要描述内容
文本2string2文本可选第二段文字可选输入文本输入补充描述
文本3string3文本可选第三段文字可选输入文本输入更多细节
文本4string4文本可选第四段文字可选输入文本输入最后的补充

3.11 SentenceMixerNode(句子混合器)

这个节点就像一个文字搅拌机,能把多段文字打散重新组合,创造出新的表达方式。

参数详解

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释 (能干嘛的)专业解释怎么用/举个例子
输入1input1文本必填第一段要混合的文字主要输入文本输入一段完整的描述
输入2input2文本可选第二段要混合的文字可选输入文本输入另一段描述
输入3input3文本可选第三段要混合的文字可选输入文本输入第三段描述
输入4input4文本可选第四段要混合的文字可选输入文本输入第四段描述

3.12 DynamicStringCombinerNode(动态文本组合器)

这个节点像个智能文字管家,能根据你的需要组合不同数量的文本。

参数详解

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释 (能干嘛的)专业解释怎么用/举个例子
输入数量num_inputs1-52要组合几段文字输入数量控制选3表示组合3段文字
用户文本user_text文本必填你自己写的文字内容用户自定义文本输入你想要的描述
文本1-5string1-5文本可选要组合的各段文字可选输入文本根据num_inputs决定用几个

3.13 CustomPromptLoader(自定义提示词加载器)

这个节点就像一个文件管理器,能读取你保存的提示词文件。

参数详解

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释 (能干嘛的)专业解释怎么用/举个例子
提示词文件prompt_file文件列表选择文件选择要加载的提示词文件文件选择器从下拉列表选择.txt文件

3.14 FileReaderNode(文件读取器)

这个节点像个随机抽取器,能从JSON文件中随机选择内容。

参数详解

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释 (能干嘛的)专业解释怎么用/举个例子
文件路径file_path文件路径默认路径JSON文件的位置文件路径设置指向包含提示词的JSON文件
数量amount1-10010随机选择几个内容随机选择数量10表示随机选10个提示词
自定义标签custom_tag文本空在选择的内容前加上标签自定义前缀标签输入"风景:"会在每个内容前加上
种子seed0-最大值0控制随机选择的种子随机种子控制0=真随机,固定值=固定结果

3.15 GeminiTextOnly(谷歌AI文本处理器)

这个节点让你使用谷歌的Gemini AI来处理文本,功能强大且支持多种模型。

参数详解

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释 (能干嘛的)专业解释怎么用/举个例子
自定义提示custom_prompt文本必填告诉AI要做什么自定义提示词输入"把这段话改写成诗歌"
附加提示additive_prompt文本可选在主提示前加的内容附加提示内容输入额外的指令
动态提示dynamic_promptTrue/FalseFalse是否使用动态替换功能动态提示开关开启后可以用##TAG##等占位符
标签tag文本ohwx man动态替换的标签内容标签替换内容会替换提示中的##TAG##
性别sex文本male性别信息性别设置会替换提示中的##SEX##
字数words文本100期望的输出字数输出长度控制会替换提示中的##WORDS##
代词pronouns文本him, his使用的代词代词设置会替换提示中的##PRONOUNS##
Gemini模型gemini_model模型列表gemini-2.0-flash-exp使用哪个Gemini模型模型选择不同模型有不同能力

3.16 GeminiCustomVision(谷歌AI图片分析器)

这个节点使用谷歌的Gemini AI来分析图片,支持图片融合和自定义分析。

参数详解

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释 (能干嘛的)专业解释怎么用/举个例子
图片输入imagesIMAGE类型必填要分析的图片输入图像数据连接图片节点
自定义提示custom_prompt文本空自定义分析指令自定义分析提示告诉AI怎么分析图片
附加提示additive_prompt文本空附加的分析指令附加提示内容补充分析要求
动态提示dynamic_promptTrue/FalseFalse动态替换功能动态提示开关开启后支持占位符替换
标签tag文本ohwx man标签替换内容标签设置替换##TAG##占位符
性别sex文本male性别设置性别信息替换##SEX##占位符
字数words文本100输出字数控制长度控制替换##WORDS##占位符
代词pronouns文本him, his代词设置代词信息替换##PRONOUNS##占位符
淡化百分比fade_percentage0.1-50.015.0多图融合的过渡强度图像融合度控制图片融合的自然程度
Gemini模型gemini_model模型列表gemini-2.0-flash-exp使用的模型模型选择选择合适的Gemini模型

3.17 Gpt4CustomVision(GPT-4自定义图片分析器)

这个节点是GPT4VisionNode的自定义版本,提供更多的个性化分析选项。

参数详解

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释 (能干嘛的)专业解释怎么用/举个例子
图片输入imagesIMAGE类型必填要分析的图片输入图像数据连接任何图片节点
自定义提示custom_prompt文本空自定义分析方式自定义分析提示输入"用艺术评论的角度分析"
附加提示additive_prompt文本空附加分析要求附加提示内容补充特殊要求
动态提示dynamic_promptTrue/FalseFalse动态替换功能动态提示开关支持占位符自动替换
标签tag文本ohwx man标签内容标签替换替换##TAG##占位符
性别sex文本male性别信息性别设置替换##SEX##占位符
字数words文本100输出字数长度控制替换##WORDS##占位符
代词pronouns文本him, his代词设置代词信息替换##PRONOUNS##占位符
淡化百分比fade_percentage0.1-50.015.0图片融合强度融合过渡度多图融合时的自然过渡

3.18 OllamaVisionNode(本地AI图片分析器)

这个节点让你用本地的AI模型来分析图片,完全离线工作。

参数详解

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释 (能干嘛的)专业解释怎么用/举个例子
图片输入imagesIMAGE类型必填要分析的图片输入图像数据连接图片节点
自定义提示custom_prompt文本空分析指令自定义分析提示告诉AI怎么看图片
附加提示additive_prompt文本空附加指令附加提示内容补充分析要求
动态提示dynamic_promptTrue/FalseFalse动态替换动态提示开关支持占位符功能
标签tag文本ohwx man标签内容标签设置替换##TAG##
性别sex文本male性别信息性别设置替换##SEX##
字数words文本100字数控制长度控制替换##WORDS##
代词pronouns文本him, his代词信息代词设置替换##PRONOUNS##
淡化百分比fade_percentage0.1-50.015.0图片融合度融合强度多图融合过渡
自定义模型custom_model文本llava-llama3:latest本地模型名称模型选择使用的本地视觉模型
Ollama地址ollama_urlURLlocalhost:11434本地服务地址服务端点本地Ollama服务地址

4. 动态生成的分类节点(23个)

这些节点都是基于APNextNode自动生成的,每个都对应一个特定的创意分类。它们就像不同主题的创意宝库,能为你的画面描述添加各种元素。

4.1 ArchitecturePromptNode(建筑风格节点)

专门添加建筑相关的元素,比如建筑师风格、建筑类型、材料等。

4.2 ArtPromptNode(艺术风格节点)

添加各种艺术风格元素,包括绘画技法、调色板、图案等。

4.3 ArtistPromptNode(艺术家风格节点)

模仿著名艺术家的风格,包括概念艺术家、插画师、画家等。

4.4 BrandsPromptNode(品牌风格节点)

添加各种品牌相关的视觉元素和风格。

4.5 CharacterPromptNode(角色类型节点)

添加各种角色类型,包括动漫、奇幻、科幻、超级英雄等。

4.6 CinematicPromptNode(电影风格节点)

添加电影相关元素,包括导演风格、镜头类型、色彩分级等。

4.7 FashionPromptNode(时尚风格节点)

添加时尚元素,包括服装、配饰、发型、设计师风格等。

4.8 FeelingsPromptNode(情感氛围节点)

添加各种情感氛围,比如恐怖、浪漫、忧郁、不安等。

4.9 GeographyPromptNode(地理位置节点)

添加地理相关元素,包括国家、民族、地区等。

4.10 HumanPromptNode(人类活动节点)

添加人类相关活动,包括节庆、群体、爱好、职业等。

4.11 InteractionPromptNode(互动关系节点)

添加人物之间的互动关系,比如情侣互动、群体互动等。

4.12 KeywordsPromptNode(关键词节点)

添加各种修饰关键词,包括史诗、故障、流行趋势等。

4.13 PeoplePromptNode(人物特征节点)

添加人物特征,包括原型、身材、表情、眼色等。

4.14 PhotographyPromptNode(摄影技术节点)

添加摄影相关元素,包括相机、镜头、胶片、照明等。

4.15 PlotsPromptNode(情节主题节点)

添加各种故事情节主题,包括动作、恐怖、浪漫、科幻等。

4.16 PosesPromptNode(姿势动作节点)

添加各种人物姿势和动作描述。

4.17 ScenePromptNode(场景环境节点)

添加场景相关元素,包括植物、纹理、天气、场景修饰等。

4.18 SciencePromptNode(科学元素节点)

添加科学相关元素,包括天文、元素、数学、医学等。

4.19 StuffPromptNode(物品道具节点)

添加各种物品和道具,包括城市、日常用品、科幻道具等。

4.20 TimePromptNode(时间元素节点)

添加时间相关元素,包括世纪、年代、时代等。

4.21 TypographyPromptNode(字体排版节点)

添加字体和排版相关元素。

4.22 VehiclePromptNode(交通工具节点)

添加各种交通工具,包括汽车、经典车型等。

4.23 VideoGamePromptNode(游戏风格节点)

添加游戏相关元素,包括游戏设计师、引擎、游戏类型等。

所有分类节点的通用参数

参数名 (UI显示)参数名 (代码里)参数值建议值通俗解释 (能干嘛的)专业解释怎么用/举个例子
提示词prompt文本必填基础的画面描述基础提示文本输入"一个美丽的女孩"
分隔符separator文本,用什么符号连接添加的内容内容分隔符通常用逗号分隔
字符串输入string文本可选额外的文本输入可选文本输入可以连接其他节点的输出
种子seed0-最大值0控制随机选择的种子随机种子固定种子得到固定结果
属性开关attributesTrue/FalseFalse是否添加详细属性描述属性详细化开关开启后会添加更多细节描述
各分类字段动态生成None/Random/Multiple Random/具体选项None每个分类都有自己的选项分类特定选项None=不添加,Random=随机选一个

5. 使用技巧和建议

5.1 新手入门建议

  1. 从PromptGenerator开始:这是最容易上手的节点,就像一个智能的画面描述助手
  2. 先用默认设置:所有参数都有合理的默认值,不用一开始就全部调整
  3. 逐步添加元素:先生成基础描述,再用分类节点添加特殊元素
  4. 保存好的结果:遇到满意的描述记得保存,可以用CustomPromptLoader重复使用

5.2 高级使用技巧

  1. 节点链式组合:

    • PromptGenerator → 分类节点 → StringMerger → 最终输出
    • 这样能创造出层次丰富的描述
  2. 种子控制技巧:

    • 用相同种子可以得到一致的随机结果
    • 在RandomIntegerNode中生成种子,然后分发给其他节点
  3. 图片分析流程:

    • 先用GPT4VisionNode分析图片
    • 再用GPT4MiniNode优化描述
    • 最后用分类节点添加创意元素
  4. 本地AI使用:

    • OllamaNode适合不想花钱用API的用户
    • 需要先安装Ollama并下载模型
    • 速度较慢但完全免费

5.3 参数调优建议

  1. 压缩设置:

    • 生成长描述时用soft压缩
    • 需要简洁描述时用hard压缩
    • 不确定时选择medium
  2. 淡化百分比:

    • 多图融合时,15%通常效果最好
    • 想要更明显过渡用25-30%
    • 想要更自然融合用10%以下
  3. 批次大小:

    • 显存充足时可以设置较大批次
    • 显存不足时保持1-2的小批次

6. 常见问题解答

6.1 安装和配置问题

Q: 安装后找不到节点怎么办?
A: 重启ComfyUI,确保插件文件夹在custom_nodes目录下,检查是否有错误信息。

Q: GPT节点报错"API key not found"?
A: 需要设置环境变量OPENAI_API_KEY,或者在系统环境变量中添加你的OpenAI API密钥。

Q: Ollama节点无法连接?
A: 确保Ollama服务正在运行,在终端输入ollama serve启动服务。

6.2 使用问题

Q: 生成的描述太长了怎么办?
A: 开启compress选项,选择medium或hard压缩级别。

Q: 随机结果每次都不一样?
A: 设置固定的seed值,相同种子会产生相同结果。

Q: 图片分析不准确?
A: 尝试使用custom_base_prompt自定义分析指令,告诉AI你想要什么样的分析结果。

Q: 分类节点选项太多不知道选什么?
A: 选择"Random"让AI随机选择,或者选择"Multiple Random"获得更丰富的组合。

6.3 性能问题

Q: 节点运行很慢?
A:

  • GPT节点:检查网络连接,考虑使用GPT-4o-mini而不是GPT-4o
  • Ollama节点:确保有足够的显存,考虑使用较小的模型
  • 图片处理:减少批次大小,降低图片分辨率

Q: 显存不够用?
A: 减少batch_size,使用较小的图片尺寸,关闭不必要的节点。

7. 创意使用案例

7.1 电影海报生成流程

  1. 用GPT4VisionNode分析参考图片,开启poster模式
  2. 用ArchitecturePromptNode添加场景元素
  3. 用CharacterPromptNode添加角色特征
  4. 用CinematicPromptNode添加电影风格
  5. 最终合并生成完整海报描述

7.2 随机创意生成流程

  1. 用RandomIntegerNode生成随机种子
  2. 用PromptGenerator生成基础描述
  3. 随机选择2-3个分类节点添加元素
  4. 用StringMerger合并所有内容
  5. 得到完全随机的创意描述

7.3 风格迁移流程

  1. 用GPT4VisionNode分析源图片
  2. 用ArtistPromptNode选择目标艺术家风格
  3. 用GPT4MiniNode重新组织描述
  4. 生成风格迁移后的画面描述

8. 总结

ComfyUI DagThomas插件是一个功能强大的AI辅助创作工具集,包含41个节点,涵盖了从基础文本处理到高级AI分析的各个方面。

核心优势:

  • 🎯 零门槛使用:所有参数都有合理默认值
  • 🔄 高度可组合:节点可以自由连接组合
  • 🌍 多AI支持:支持GPT、Gemini、Ollama等多种AI
  • 🎨 创意丰富:23个分类节点提供海量创意元素
  • 💰 成本可控:既有付费API也有免费本地方案

适用人群:

  • ComfyUI新手:从PromptGenerator开始学习
  • 创意工作者:用分类节点激发灵感
  • 技术爱好者:用本地AI节点探索可能性
  • 专业用户:用高级节点构建复杂工作流

无论你是想要快速生成画面描述,还是想要深度定制AI工作流,这个插件都能满足你的需求。记住,最好的学习方式就是动手实践,从简单的节点开始,逐步探索更复杂的组合方式!

标签: #插件 2338
相关文章

ComfyUI错误修复插件详解:轻松解决常见问题 2025-07-10 18:25

ComfyUI-CustomMenu插件使用教程:高效自定义工作流指南 2025-07-10 17:50

ComfyUI图像合并插件comfyui-merge使用教程 2025-07-03 22:44

ComfyUI 图像合并插件教程 (comfyui-merge) 1. 插件简介 这是一个专门用来合并图片的 ComfyUI 插件,就像用 PS 把多张图片叠在一起那样。它的特别之处在于你精确控制每张图片的混合方式。 GitHub 地址:https://github.com/LingSss9/com

ComfyUI WAN 2.2视频插件教程:万相AI提示词全攻略 2025-07-31 11:47

ComfyUI WAN 2.2视频插件教程:万相AI提示词实战指南 2025-07-29 20:10

ComfyUI HeyGem数字人插件教程:零基础快速精通指南 2025-07-22 14:10

目录

从节点基础到高阶工作流,我们为你绘制最清晰的 ComfyUI 学习路径。告别困惑,让每一次连接都充满创造的魔力,轻松驾驭 AI 艺术的无限可能。

  • 微信
  • B站
  • GitHub
Copyright © 2025 AIX All Rights Reserved. Powered by AIX.
隐私政策
津ICP备2024019312号