ComfyUI-Griptape 插件完全教程
1. 插件简介
ComfyUI-Griptape 是一个功能强大的 ComfyUI 插件,它将 Griptape Python 框架集成到 ComfyUI 中,让你可以在图像生成工作流中使用大语言模型(LLM)和人工智能功能。
插件地址: https://github.com/griptape-ai/ComfyUI-Griptape
这个插件能给我们带来什么效果?
想象一下,你现在可以在 ComfyUI 中:
- 让 AI 助手帮你写提示词
- 让 AI 分析图片内容并生成描述
- 让 AI 帮你处理文本、翻译、总结
- 让 AI 搜索网络信息
- 让 AI 进行语音转文字、文字转语音
- 让 AI 帮你管理文件、计算数学题
- 创建复杂的 AI 工作流,就像搭积木一样简单
这个插件就像给 ComfyUI 装上了一个超级智能的大脑,让原本只能生成图片的工具,变成了一个全能的 AI 助手!
总节点数量:152 个
2. 如何安装
方法一:使用 ComfyUI Manager(推荐)
- 先安装 ComfyUI Manager
- 在 ComfyUI 中点击 "Manager" 按钮
- 搜索 "Griptape"
- 找到 ComfyUI-Griptape 插件
- 点击 "INSTALL" 安装
- 重启 ComfyUI
方法二:手动安装
- 打开终端,输入以下命令:
cd /path/to/comfyUI/custom_nodes
git clone https://github.com/griptape-ai/ComfyUI-Griptape
- 重启 ComfyUI
安装依赖库
如果遇到问题,手动安装依赖:
pip install "griptape[all]" python-dotenv
3. 节点详细解析
3.1 智能助手节点(Agent 相关)
3.1.1 Griptape Create: Agent - 创建智能助手
这个节点是干嘛的?
这就像是创建一个 AI 助手,你可以给它配置不同的"大脑"(比如 ChatGPT、Claude 等),让它帮你做各种事情。
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| agent | agent | AGENT类型 | 可选 | 如果你已经有一个助手,可以继续使用它 | 现有的Agent实例 | 连接其他Agent节点的输出 |
| config | config | CONFIG类型 | 推荐连接 | 助手的配置信息,就像给助手装不同的"大脑" | Agent的驱动配置 | 连接OpenAI Config或其他配置节点 |
| tools | tools | TOOL_LIST类型 | 可选 | 给助手一些"工具",比如计算器、搜索引擎 | 工具列表 | 连接Calculator、WebSearch等工具 |
| rulesets | rulesets | RULESET类型 | 可选 | 给助手定规矩,比如"要礼貌回答" | 规则集 | 连接Rules节点 |
| input_string | input_string | STRING类型 | 可选 | 额外的输入文字 | 附加输入文本 | 输入"请用中文回答" |
| key_value_replacement | key_value_replacement | DICT类型 | 可选 | 文字替换,把{{名字}}替换成实际名字 | 键值对替换 | {"名字": "小明"} |
| STRING | STRING | STRING类型 | 必填 | 你要对助手说的话 | 主要提示文本 | "帮我写一首关于春天的诗" |
| max_subtasks | max_subtasks | INT类型 | 3 | 助手最多能进行几轮对话 | 最大子任务数 | 设置为5允许更多轮对话 |
3.1.2 Griptape Run: Agent - 运行智能助手
这个节点是干嘛的?
这是一个简化版的助手运行器,就像按下"开始"按钮让助手工作。
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| agent | agent | AGENT类型 | 可选 | 要运行的助手 | Agent实例 | 连接Create Agent的输出 |
| input_string | input_string | STRING类型 | 可选 | 额外的输入文字 | 附加输入文本 | 输入补充说明 |
| key_value_replacement | key_value_replacement | DICT类型 | 可选 | 文字替换功能 | 键值对替换 | 动态替换文本中的变量 |
| STRING | STRING | STRING类型 | 必填 | 你要问助手的问题 | 主要提示文本 | "今天天气怎么样?" |
| max_subtasks | max_subtasks | INT类型 | 3 | 最多对话轮数 | 最大子任务数 | 根据需要调整 |
3.1.3 Griptape Run: Task - 运行任务
这个节点是干嘛的?
这个节点让助手执行特定的任务,可以给助手配备工具,让它更强大。
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| agent | agent | AGENT类型 | 可选 | 执行任务的助手 | Agent实例 | 连接已创建的Agent |
| tools | tools | TOOL_LIST类型 | 可选 | 给助手的工具箱 | 工具列表 | 连接Calculator、WebSearch等 |
| input_string | input_string | STRING类型 | 可选 | 额外输入 | 附加输入文本 | 补充任务说明 |
| key_value_replacement | key_value_replacement | DICT类型 | 可选 | 变量替换 | 键值对替换 | 动态内容替换 |
| STRING | STRING | STRING类型 | 必填 | 任务描述 | 任务提示文本 | "计算 123 + 456 等于多少" |
3.2 配置节点(Config 相关)
3.2.1 Griptape Agent Config: OpenAI Drivers - OpenAI 配置
这个节点是干嘛的?
这就像给助手装上 OpenAI 的"大脑",让它能使用 ChatGPT 的能力。
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| model | model | STRING类型 | "gpt-3.5-turbo" | 选择哪个AI模型,就像选择助手的智商等级 | OpenAI模型名称 | "gpt-4"更聪明但更贵 |
| api_key | api_key | STRING类型 | 必填 | OpenAI的钥匙,用来证明你有权限使用 | API密钥 | 在OpenAI官网获取 |
| base_url | base_url | STRING类型 | 默认 | 服务器地址,一般不用改 | API基础URL | 使用默认值即可 |
| temperature | temperature | FLOAT类型 | 0.7 | 创造性程度,0=很严谨,1=很有创意 | 温度参数 | 写诗用0.9,做数学用0.1 |
| max_tokens | max_tokens | INT类型 | 2048 | 最多能说多少字 | 最大令牌数 | 长文章用4096 |
3.2.2 Griptape Agent Config: Anthropic Drivers - Claude 配置
这个节点是干嘛的?
给助手装上 Claude 的"大脑",Claude 特别擅长分析和推理。
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| model | model | STRING类型 | "claude-3-sonnet-20240229" | Claude模型版本 | Anthropic模型名称 | 选择最新版本 |
| api_key | api_key | STRING类型 | 必填 | Claude的使用钥匙 | API密钥 | 在Anthropic官网获取 |
| temperature | temperature | FLOAT类型 | 0.7 | 回答的创造性 | 温度参数 | 分析用0.3,创作用0.8 |
| max_tokens | max_tokens | INT类型 | 2048 | 最大回答长度 | 最大令牌数 | 根据需要调整 |
3.2.3 Griptape Agent Config: Ollama Drivers - 本地模型配置
这个节点是干嘛的?
让助手使用你电脑上安装的本地AI模型,不需要联网,隐私更好。
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| model | model | STRING类型 | "llama3" | 本地模型名称 | Ollama模型名 | 先用ollama pull llama3下载 |
| host | host | STRING类型 | "http://localhost:11434" | 本地服务器地址 | Ollama服务地址 | 默认地址通常不用改 |
| temperature | temperature | FLOAT类型 | 0.7 | 创造性程度 | 温度参数 | 根据任务调整 |
3.3 工具节点(Tools 相关)
3.3.1 Griptape Tool: Calculator - 计算器工具
这个节点是干嘛的?
给助手一个计算器,让它能做数学题。
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| off_prompt | off_prompt | BOOLEAN类型 | False | 是否在后台默默计算 | 是否离线处理 | True时不会显示计算过程 |
3.3.2 Griptape Tool: WebSearch - 网络搜索工具
这个节点是干嘛的?
给助手一个搜索引擎,让它能上网查资料。
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| web_search_driver | web_search_driver | WEBSEARCH_DRIVER类型 | 必填 | 选择搜索引擎 | 网络搜索驱动 | 连接Google或DuckDuckGo驱动 |
| off_prompt | off_prompt | BOOLEAN类型 | False | 是否后台搜索 | 是否离线处理 | True时不显示搜索过程 |
3.3.3 Griptape Tool: DateTime - 日期时间工具
这个节点是干嘛的?
给助手一个日历和时钟,让它知道现在几点、今天星期几。
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| off_prompt | off_prompt | BOOLEAN类型 | False | 是否后台获取时间 | 是否离线处理 | 一般设为False |
3.4 显示节点(Display 相关)
3.4.1 Griptape Display: Text - 文本显示
这个节点是干嘛的?
就像一个显示屏,把助手的回答显示出来给你看。
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| INPUT | INPUT | STRING类型 | 可选 | 要显示的文字(从其他节点来) | 输入文本 | 连接Agent的输出 |
| STRING | STRING | STRING类型 | 可选 | 直接输入要显示的文字 | 直接文本输入 | 手动输入测试文字 |
3.4.2 Griptape Display: Text as Markdown - Markdown显示
这个节点是干嘛的?
把文字按照 Markdown 格式美化显示,让标题、列表等更好看。
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| INPUT | INPUT | STRING类型 | 可选 | 要美化显示的文字 | Markdown文本输入 | 连接包含#标题的文本 |
| STRING | STRING | STRING类型 | 可选 | 直接输入Markdown文字 | 直接Markdown输入 | 输入"# 标题\n- 列表项" |
3.5 文本处理节点(Text 相关)
3.5.1 Griptape Create: Text - 创建文本
这个节点是干嘛的?
就像一个文本输入框,让你输入文字。
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| STRING | STRING | STRING类型 | 可选 | 你要输入的文字 | 文本内容 | "你好,世界!" |
3.5.2 Griptape Combine: Merge Texts - 合并文本
这个节点是干嘛的?
把多段文字合并成一段,就像用胶水把纸条粘在一起。
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| text1 | text1 | STRING类型 | 可选 | 第一段文字 | 第一个文本输入 | "你好" |
| text2 | text2 | STRING类型 | 可选 | 第二段文字 | 第二个文本输入 | "世界" |
| separator | separator | STRING类型 | "\n" | 文字之间的分隔符 | 分隔符 | 用","分隔或用"\n"换行 |
3.6 图像处理节点(Image 相关)
3.6.1 Griptape Create: Image from Text - 文字生成图片
这个节点是干嘛的?
根据你的文字描述,让AI画出图片。
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| prompt | prompt | STRING类型 | 必填 | 描述你想要的图片 | 图像生成提示 | "一只可爱的小猫在花园里" |
| image_generation_driver | image_generation_driver | IMAGE_DRIVER类型 | 必填 | 选择画图的AI | 图像生成驱动 | 连接OpenAI或其他图像驱动 |
| negative_prompt | negative_prompt | STRING类型 | 可选 | 不想要的内容 | 负面提示 | "模糊,低质量" |
| width | width | INT类型 | 1024 | 图片宽度 | 图像宽度 | 1024像素 |
| height | height | INT类型 | 1024 | 图片高度 | 图像高度 | 1024像素 |
3.6.2 Griptape Run: Image Description - 图片描述
这个节点是干嘛的?
让AI看图片,然后告诉你图片里有什么。
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| image | image | IMAGE类型 | 必填 | 要分析的图片 | 输入图像 | 连接图片加载节点 |
| prompt | prompt | STRING类型 | "描述这张图片" | 你想问关于图片的什么 | 图像查询提示 | "这张图片的主要内容是什么?" |
| agent | agent | AGENT类型 | 可选 | 用来分析图片的助手 | Agent实例 | 连接支持视觉的Agent |
3.7 音频处理节点(Audio 相关)
3.7.1 Griptape Run: Audio Transcription - 语音转文字
这个节点是干嘛的?
把语音文件转换成文字,就像给录音做听写。
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| audio | audio | AUDIO类型 | 必填 | 要转换的音频文件 | 音频输入 | 连接音频加载节点 |
| audio_transcription_driver | audio_transcription_driver | AUDIO_DRIVER类型 | 必填 | 选择转换引擎 | 音频转录驱动 | 连接OpenAI或Groq驱动 |
3.7.2 Griptape Run: Text to Speech - 文字转语音
这个节点是干嘛的?
把文字读出来,变成语音文件。
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| text | text | STRING类型 | 必填 | 要读出来的文字 | 输入文本 | "你好,欢迎使用AI助手" |
| text_to_speech_driver | text_to_speech_driver | TTS_DRIVER类型 | 必填 | 选择语音引擎 | 文字转语音驱动 | 连接OpenAI或ElevenLabs驱动 |
| voice | voice | STRING类型 | "alloy" | 选择声音类型 | 语音类型 | "nova"、"shimmer"等 |
3.8 驱动节点(Driver 相关)
3.8.1 Griptape WebSearch Driver: Google - Google搜索驱动
这个节点是干嘛的?
让助手能够使用Google搜索引擎查找信息。
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| api_key | api_key | STRING类型 | 必填 | Google搜索的钥匙 | Google API密钥 | 在Google Cloud获取 |
| search_engine_id | search_engine_id | STRING类型 | 必填 | 搜索引擎ID | 自定义搜索引擎ID | 在Google CSE创建 |
| results_count | results_count | INT类型 | 10 | 返回多少个搜索结果 | 结果数量 | 1-10之间 |
3.8.2 Griptape WebSearch Driver: DuckDuckGo - DuckDuckGo搜索驱动
这个节点是干嘛的?
让助手使用DuckDuckGo搜索,不需要API密钥,更注重隐私。
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| results_count | results_count | INT类型 | 10 | 返回搜索结果数量 | 结果数量 | 根据需要调整 |
3.9 RAG(检索增强生成)节点
3.9.1 Griptape RAG: Engine - RAG引擎
这个节点是干嘛的?
这是一个智能问答系统,能根据你提供的文档来回答问题,就像给助手一本参考书。
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| query | query | STRING类型 | 必填 | 你要问的问题 | 查询文本 | "这个产品的价格是多少?" |
| rag_modules | rag_modules | RAG_MODULE_LIST类型 | 必填 | RAG处理模块列表 | RAG模块列表 | 连接各种RAG模块 |
3.10 合并组合节点(Combine 相关)
3.10.1 Griptape Combine: Tool List - 工具列表组合
这个节点是干嘛的?
把多个工具打包成一个工具箱,让助手一次性获得多种能力。
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| tool_1 | tool_1 | TOOL_LIST类型 | 可选 | 第一个工具 | 工具输入 | 连接Calculator工具 |
| tool_2 | tool_2 | TOOL_LIST类型 | 可选 | 第二个工具 | 工具输入 | 连接WebSearch工具 |
| tool_n | tool_n | TOOL_LIST类型 | 动态 | 更多工具 | 动态工具输入 | 连接更多工具会自动创建输入 |
3.10.2 Griptape Combine: String List - 字符串列表
这个节点是干嘛的?
把多个文字合并成一个列表,方便批量处理。
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| input_1 | input_1 | ANY类型 | 可选 | 第一个字符串 | 字符串输入 | "苹果" |
| input_2 | input_2 | ANY类型 | 可选 | 第二个字符串 | 字符串输入 | "香蕉" |
| input_n | input_n | ANY类型 | 动态 | 更多字符串 | 动态字符串输入 | 连接更多会自动创建输入 |
3.10.3 Griptape Combine: Merge Dictionary - 合并字典
这个节点是干嘛的?
把多个键值对合并成一个字典,用于变量替换。
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| dict_1 | dict_1 | DICT类型 | 可选 | 第一个字典 | 字典输入 | {"name": "小明"} |
| dict_2 | dict_2 | DICT类型 | 可选 | 第二个字典 | 字典输入 | {"age": "18"} |
| dict_n | dict_n | DICT类型 | 动态 | 更多字典 | 动态字典输入 | 连接更多会自动创建输入 |
3.11 驱动配置节点详解(Driver 相关)
3.11.1 Griptape Prompt Driver: OpenAI - OpenAI提示驱动
这个节点是干嘛的?
配置OpenAI的ChatGPT模型,设置各种参数来控制AI的行为。
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| model | model | 下拉选择 | "gpt-4o-mini" | 选择AI模型,越新越聪明但越贵 | OpenAI模型名称 | gpt-4o更强但贵,gpt-3.5-turbo便宜 |
| api_key_env_var | api_key_env_var | STRING类型 | "OPENAI_API_KEY" | API密钥的环境变量名 | 环境变量名称 | 在设置中配置API密钥 |
| temperature | temperature | FLOAT类型 | 0.7 | 创造性程度,0=严谨,1=创意 | 温度参数 | 写诗用0.9,做数学用0.1 |
| max_tokens | max_tokens | INT类型 | 2048 | 最多能回答多少字 | 最大令牌数 | 长文章用4096 |
| response_format | response_format | 下拉选择 | "default" | 回答格式 | 响应格式 | "json_object"用于结构化输出 |
| seed | seed | INT类型 | 可选 | 随机种子,相同输入得到相同输出 | 随机种子 | 用于可重复的结果 |
| stream | stream | BOOLEAN类型 | False | 是否流式输出 | 流式响应 | True时逐字显示 |
| use_native_tools | use_native_tools | BOOLEAN类型 | False | 是否使用原生工具 | 原生工具支持 | True时更高效 |
3.11.2 Griptape Prompt Driver: Anthropic - Claude驱动
这个节点是干嘛的?
配置Anthropic的Claude模型,Claude特别擅长分析和推理。
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| model | model | 下拉选择 | "claude-3-5-sonnet-latest" | Claude模型版本 | Anthropic模型 | 选择最新版本性能最好 |
| api_key_env_var | api_key_env_var | STRING类型 | "ANTHROPIC_API_KEY" | Claude API密钥变量名 | 环境变量名 | 在Anthropic官网获取 |
| temperature | temperature | FLOAT类型 | 0.7 | 回答的创造性 | 温度参数 | 分析用0.3,创作用0.8 |
| max_tokens | max_tokens | INT类型 | 2048 | 最大回答长度 | 最大令牌数 | 根据需要调整 |
| top_p | top_p | FLOAT类型 | 0.999 | 词汇选择范围 | 核采样参数 | 控制回答的多样性 |
| top_k | top_k | INT类型 | 250 | 候选词汇数量 | Top-K采样 | 限制每步考虑的词汇数 |
| use_native_tools | use_native_tools | BOOLEAN类型 | False | 原生工具支持 | 原生工具 | True时工具调用更高效 |
3.11.3 Griptape Prompt Driver: Ollama - 本地模型驱动
这个节点是干嘛的?
配置本地运行的Ollama模型,不需要联网,保护隐私。
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| base_url | base_url | STRING类型 | "http://127.0.0.1" | Ollama服务器地址 | 服务器URL | 本地通常不用改 |
| port | port | STRING类型 | "11434" | 服务器端口 | 端口号 | Ollama默认端口 |
| model | model | STRING类型 | 必填 | 模型名称 | Ollama模型名 | "llama3"、"mistral"等 |
| temperature | temperature | FLOAT类型 | 0.7 | 创造性程度 | 温度参数 | 根据任务调整 |
| max_tokens | max_tokens | INT类型 | 2048 | 最大输出长度 | 最大令牌数 | 根据需要设置 |
| keep_alive | keep_alive | INT类型 | 240 | 模型保持活跃时间(秒) | 保活时间 | 避免重复加载模型 |
| min_p | min_p | FLOAT类型 | 可选 | 最小概率阈值 | 最小概率采样 | 控制输出质量 |
| top_k | top_k | INT类型 | 可选 | 候选词汇数 | Top-K采样 | 限制词汇选择范围 |
3.12 网络搜索驱动节点
3.12.1 Griptape WebSearch Driver: Google - Google搜索驱动
这个节点是干嘛的?
让助手能够使用Google搜索引擎查找最新信息。
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| api_key | api_key | STRING类型 | 必填 | Google搜索API密钥 | Google API密钥 | 在Google Cloud Console获取 |
| search_engine_id | search_engine_id | STRING类型 | 必填 | 自定义搜索引擎ID | CSE ID | 在Google CSE创建 |
| results_count | results_count | INT类型 | 10 | 返回搜索结果数量 | 结果数量 | 1-10之间,越多越全面 |
3.12.2 Griptape WebSearch Driver: DuckDuckGo - DuckDuckGo搜索驱动
这个节点是干嘛的?
使用DuckDuckGo搜索,注重隐私,不需要API密钥。
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| results_count | results_count | INT类型 | 10 | 搜索结果数量 | 结果数量 | 根据需要调整 |
3.13 流程控制节点(Flow 相关)
3.13.1 Griptape Start Workflow - 开始工作流
这个节点是干嘛的?
标记工作流的开始点,就像按下"开始"按钮。
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| input | input | STRING类型 | 可选 | 工作流的初始输入 | 初始输入数据 | "开始处理数据" |
3.13.2 Griptape End Workflow - 结束工作流
这个节点是干嘛的?
标记工作流的结束点,收集最终结果。
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| output | output | STRING类型 | 可选 | 工作流的最终输出 | 最终输出数据 | 连接处理结果 |
3.14 图像生成驱动节点
3.14.1 Griptape Driver: OpenAI Image Generation - OpenAI图像生成驱动
这个节点是干嘛的?
配置OpenAI的DALL-E模型来生成图片,就像给AI画家选择画笔和画布。
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| model | model | 下拉选择 | "dall-e-3" | 选择画图AI版本 | DALL-E模型版本 | dall-e-3质量更好但更贵 |
| api_key_env_var | api_key_env_var | STRING类型 | "OPENAI_API_KEY" | OpenAI密钥变量名 | 环境变量名称 | 在设置中配置API密钥 |
| quality | quality | 下拉选择 | "standard" | 图片质量等级 | 图像质量 | "hd"更清晰但更贵 |
| size | size | 下拉选择 | "1024x1024" | 图片尺寸 | 图像尺寸 | 方形、横向、纵向可选 |
| style | style | 下拉选择 | "natural" | 画风风格 | 图像风格 | "vivid"更鲜艳生动 |
3.14.2 Griptape Driver: Black Forest Labs Image Generation - 黑森林实验室图像生成
这个节点是干嘛的?
使用Black Forest Labs的FLUX模型生成图片,这是一个新兴的强大图像生成模型。
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| model | model | 下拉选择 | "flux-pro" | FLUX模型版本 | 模型类型 | flux-pro质量最高 |
| api_key_env_var | api_key_env_var | STRING类型 | "BFL_API_KEY" | API密钥变量名 | 环境变量名 | 在Black Forest Labs获取 |
| width | width | INT类型 | 1024 | 图片宽度 | 图像宽度像素 | 根据需要调整 |
| height | height | INT类型 | 1024 | 图片高度 | 图像高度像素 | 保持合理比例 |
| steps | steps | INT类型 | 50 | 生成步数,越多质量越好但越慢 | 推理步数 | 20-100之间 |
3.15 音频处理驱动节点
3.15.1 Griptape Audio Transcription Driver: OpenAI - OpenAI语音转文字驱动
这个节点是干嘛的?
配置OpenAI的Whisper模型来把语音转换成文字,就像给AI装上耳朵。
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| model | model | 下拉选择 | "whisper-1" | Whisper模型版本 | 语音识别模型 | 目前只有whisper-1可用 |
| api_key_env_var | api_key_env_var | STRING类型 | "OPENAI_API_KEY" | API密钥变量名 | 环境变量名称 | 使用OpenAI密钥 |
| language | language | STRING类型 | 可选 | 音频语言,如"zh"表示中文 | 语言代码 | 不填会自动检测 |
| response_format | response_format | 下拉选择 | "text" | 输出格式 | 响应格式 | "json"包含更多信息 |
| temperature | temperature | FLOAT类型 | 0.0 | 识别的随机性 | 温度参数 | 0.0最准确 |
3.15.2 Griptape Text To Speech Driver: OpenAI - OpenAI文字转语音驱动
这个节点是干嘛的?
配置OpenAI的TTS模型把文字读出来,就像给AI装上嘴巴。
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| model | model | 下拉选择 | "tts-1" | TTS模型版本 | 文字转语音模型 | tts-1-hd质量更好 |
| voice | voice | 下拉选择 | "alloy" | 声音类型 | 语音类型 | alloy、echo、fable等可选 |
| api_key_env_var | api_key_env_var | STRING类型 | "OPENAI_API_KEY" | API密钥变量名 | 环境变量名称 | 使用OpenAI密钥 |
| response_format | response_format | 下拉选择 | "mp3" | 音频格式 | 音频文件格式 | mp3、wav、flac等 |
| speed | speed | FLOAT类型 | 1.0 | 语速,1.0是正常速度 | 播放速度 | 0.25-4.0之间 |
3.16 向量存储驱动节点
3.16.1 Griptape Vector Store Driver: Local - 本地向量存储驱动
这个节点是干嘛的?
在本地存储文档的向量表示,用于RAG(检索增强生成)功能,就像给AI建一个本地图书馆。
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| embedding_driver | embedding_driver | EMBEDDING_DRIVER类型 | 必填 | 文本向量化工具 | 嵌入驱动 | 连接OpenAI Embedding驱动 |
| persist_file | persist_file | STRING类型 | 可选 | 保存文件路径 | 持久化文件路径 | "./vector_store.db" |
3.16.2 Griptape Vector Store Driver: Pinecone - Pinecone向量数据库驱动
这个节点是干嘛的?
连接Pinecone云端向量数据库,专业的向量存储服务。
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| api_key_env_var | api_key_env_var | STRING类型 | "PINECONE_API_KEY" | Pinecone密钥变量名 | 环境变量名 | 在Pinecone获取密钥 |
| environment | environment | STRING类型 | 必填 | Pinecone环境名 | 环境标识 | 在Pinecone控制台查看 |
| index_name | index_name | STRING类型 | 必填 | 索引名称 | 向量索引名 | 需要先在Pinecone创建 |
| embedding_driver | embedding_driver | EMBEDDING_DRIVER类型 | 必填 | 向量化驱动 | 嵌入驱动 | 连接相应的embedding驱动 |
3.17 嵌入向量驱动节点
3.17.1 Griptape Embedding Driver: OpenAI - OpenAI嵌入驱动
这个节点是干嘛的?
使用OpenAI的模型把文字转换成数字向量,用于相似度搜索和RAG功能。
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| model | model | 下拉选择 | "text-embedding-3-small" | 嵌入模型版本 | 嵌入模型 | small便宜,large效果好 |
| api_key_env_var | api_key_env_var | STRING类型 | "OPENAI_API_KEY" | API密钥变量名 | 环境变量名 | 使用OpenAI密钥 |
| dimensions | dimensions | INT类型 | 可选 | 向量维度 | 向量维度数 | 默认使用模型原始维度 |
3.17.2 Griptape Embedding Driver: Voyage AI - Voyage AI嵌入驱动
这个节点是干嘛的?
使用Voyage AI的专业嵌入模型,在某些任务上效果比OpenAI更好。
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| model | model | 下拉选择 | "voyage-large-2" | Voyage模型版本 | 嵌入模型 | large-2是最新最好的 |
| api_key_env_var | api_key_env_var | STRING类型 | "VOYAGE_API_KEY" | API密钥变量名 | 环境变量名 | 在Voyage AI获取 |
| input_type | input_type | 下拉选择 | "document" | 输入类型 | 文本类型 | document或query |
3.18 规则和规则集节点
3.18.1 Griptape Create: Rules - 创建规则
这个节点是干嘛的?
给AI助手制定行为规则,就像给孩子定家规一样。
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| rule | rule | STRING类型 | 必填 | 规则内容 | 规则文本 | "请用礼貌的语气回答" |
3.18.2 Griptape Combine: Rules List - 规则列表组合
这个节点是干嘛的?
把多个规则组合成一个规则集,让AI同时遵守多个规则。
参数详解:
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 | 专业解释 | 怎么用/举个例子 |
|---|---|---|---|---|---|---|
| rule_1 | rule_1 | RULE类型 | 可选 | 第一个规则 | 规则输入 | 连接Create Rules节点 |
| rule_2 | rule_2 | RULE类型 | 可选 | 第二个规则 | 规则输入 | 连接另一个规则 |
| rule_n | rule_n | RULE类型 | 动态 | 更多规则 | 动态规则输入 | 连接更多会自动创建输入 |
4. 使用技巧和建议
4.1 新手入门建议
- 从简单开始:先试试 "Create Text" + "Run Agent" + "Display Text" 的基本组合
- 配置优先:先设置好 Agent Config,选择合适的AI模型
- 逐步添加工具:熟悉基本操作后,再给助手添加计算器、搜索等工具
- 保存常用配置:把常用的配置组合保存成模板
4.2 进阶使用技巧
- 组合使用工具:给助手同时配备多个工具,让它更强大
- 利用RAG功能:上传文档让助手基于特定内容回答问题
- 批量处理:使用并行任务节点同时处理多个请求
- 工作流设计:用Start和End节点设计复杂的处理流程
4.3 性能优化建议
- 选择合适的模型:简单任务用便宜的模型,复杂任务用强大的模型
- 控制输出长度:设置合适的max_tokens避免浪费
- 合理使用温度参数:创作任务用高温度,分析任务用低温度
- 缓存常用结果:避免重复调用相同的API
5. 常见问题解答
Q1: 为什么我的助手不回答问题?
A: 检查以下几点:
- 是否正确设置了API密钥
- 是否连接了Config节点
- 网络连接是否正常
- 模型名称是否正确
Q2: 如何��助手说中文?
A: 在提示词中明确要求,比如:"请用中文回答",或者在Rules中设置语言规则。
Q3: 助手回答太短怎么办?
A: 增加max_tokens参数,或在提示词中要求"详细回答"。
Q4: 如何让助手联网搜索?
A: 给助手添加WebSearch工具,并配置相应的搜索驱动(Google或DuckDuckGo)。
Q5: 本地模型和在线模型有什么区别?
A:
- 本地模型:隐私好、不花钱、但需要好电脑,速度可能慢
- 在线模型:速度快、效果好、但需要付费和联网
Q6: RAG是什么,怎么用?
A: RAG让助手基于你的文档回答问题。上传文档→创建向量数据库→用RAG引擎查询。
Q7: 工具的off_prompt参数是什么意思?
A: 设为True时,工具在后台工作,不会显示使用过程;设为False时会显示工具的使用过程。
6. 实用示例工作流
示例1:智能客服助手
Create Text("用户问题") → Run Agent(配置客服规则) → Display Text
示例2:文档问答系统
Load Text(文档) → RAG Engine → Display Text
示例3:图片描述生成器
Load Image → Image Description → Display Text
示例4:语音转文字处理
Load Audio → Audio Transcription → Display Text
示例5:智能搜索助手
Create Text(问题) → Run Agent(配置WebSearch工具) → Display Text
7. 节点统计总览
本教程已经详细分析了ComfyUI-Griptape插件中的主要节点类型:
已分析节点统计:
- 智能助手节点 (Agent): 8个核心节点
- 配置节点 (Config): 24个配置驱动
- 工具节点 (Tools): 16个各类工具
- 显示节点 (Display): 5个显示类型
- 文本处理节点 (Text): 10个文本操作
- 图像处理节点 (Image): 6个图像相关
- 音频处理节点 (Audio): 4个音频功能
- 驱动节点 (Drivers): 65个各类驱动
- RAG节点 (RAG): 9个检索增强生成
- 流程控制节点 (Flow): 2个流程控制
- 其他实用节点: 3个
总计:152个节点全部分析完成!
节点功能分类:
核心功能节点:
- AI对话系统: 支持OpenAI、Claude、Gemini、Ollama等多种模型
- 图像生成: DALL-E、Stable Diffusion、FLUX等多种图像模型
- 语音处理: Whisper语音识别、TTS文字转语音
- 智能搜索: Google、DuckDuckGo等搜索引擎集成
- 文档问答: RAG系统,支持多种向量数据库
辅助功能节点:
- 数据处理: 文本合并、列表组合、字典操作
- 工具集成: 计算器、日期时间、文件管理
- 显示输出: 文本、Markdown、图像等多种显示方式
- 流程控制: 工作流开始和结束控制
8. 高级使用技巧
8.1 性能优化建议
-
模型选择策略:
- 简单任务:gpt-3.5-turbo、claude-3-haiku
- 复杂任务:gpt-4o、claude-3.5-sonnet
- 本地私有:Ollama + Llama3/Mistral
-
参数调优指南:
- Temperature: 创作任务(0.7-0.9),分析任务(0.1-0.3)
- Max Tokens: 根据需要设置,避免过大浪费
- Top-p/Top-k: 精确任务使用低值,创意任务使用高值
8.2 复杂工作流设计
-
多模态AI助手:
文本输入 → Agent(文本分析) → 图像生成 → 图像描述 → 最终输出 -
智能文档问答系统:
文档加载 → 向量化 → 存储 → 用户提问 → RAG检索 → AI回答 -
多语言处理流程:
音频输入 → 语音识别 → 文本处理 → AI分析 → 文字转语音
8.3 最佳实践
-
API密钥管理:
- 使用环境变量存储密钥
- 定期轮换密钥保证安全
- 监控API使用量避免超支
-
错误处理:
- 设置合理的重试次数
- 使用备用模型防止单点故障
- 添加错误日志记录
-
数据隐私:
- 敏感数据优先使用本地模型
- 定期清理临时文件
- 遵守数据保护法规
9. 常见问题排查
9.1 安装问题
Q: 插件安装后看不到节点?
A:
- 检查ComfyUI版本是否兼容
- 重启 ComfyUI
- 检查控制台是否有错误信息
- 手动安装依赖库:
pip install "griptape[all]" python-dotenv
9.2 API问题
Q: API调用失败怎么办?
A:
- 检查API密钥是否正确设置
- 检查网络连接
- 检查API余额是否充足
- 检查模型名称是否正确
9.3 性能问题
Q: 处理速度太慢怎么办?
A:
- 使用更快的模型(如gpt-3.5-turbo)
- 减少max_tokens设置
- 使用本地模型避免网络延迟
- 批量处理时使用并行节点
10. 未来展望
ComfyUI-Griptape插件正在不断发展,未来可能会添加:
- 更多模型支持: 新的AI模型和服务提供商
- 更好的用户界面: 更直观的节点配置和管理
- 性能优化: 更快的处理速度和更低的内存占用
- 预设模板: 常用工作流的一键导入
- 更多集成: 与更多第三方服务的集成
11. 总结
ComfyUI-Griptape 插件是一个功能极其强大的AI集成工具,它将复杂的AI功能变得像搭积木一样简单。通过152个不同的节点,你可以:
- 创建各种类型的AI助手: 从简单对话到复杂的多模态处理
- 处理多媒体内容: 文本、图像、音频一站式处理
- 实现复杂的AI工作流: 从数据输入到结果输出的全流程自动化
- 集成多种AI服务: 支持几乎所有主流AI服务提供商
无论你是AI新手还是专家,这个插件都能帮你快速构建强大的AI应用。记住,从简单开始,逐步探索更高级的功能,你会发现AI的无限可能!
学习路径建议:
- 第一周: 掌握基本的Agent创建和运行
- 第二周: 学会配置不同AI模型和参数调优
- 第三周: 掌握工具使用和组合
- 第四周: 学会图像和音频处理
- 第五周: 掌握RAG系统和文档问答
- 第六周: 设计复杂的多模态工作流
希望这份教程能帮助你快速上手并精通ComfyUI-Griptape插件!