# ComfyUI_GLM4_Wrapper 插件完整保姆级教程 ## 1. 插件简介 **插件地址:** https://github.com/Nojahhh/ComfyUI_GLM4_Wrapper 这个插件就像是给ComfyUI装了一个"超级文案助手",它能帮你把简单的描述变成详细生动的画面描述。想象一下,你只是说"一个美丽的日出",这个插件就能帮你扩展成"金色的阳光透过薄雾洒在连绵的山峦上,天空呈现出温暖的橙红色渐变,远处的云朵被染成粉色..."这样的详细描述。 **主要功能:** - 把简单的描述变成超详细的画面描述 - 可以分析图片并生成对应的文字描述 - 支持对话式的文字生成 - 占用空间比较大(18GB-26GB),但效果很好 ## 2. 如何安装 ### 方法一:通过ComfyUI管理器安装(推荐) 1. 打开ComfyUI管理器 2. 搜索"GLM-4" 3. 点击安装即可 ### 方法二:手动安装 1. 打开ComfyUI的custom_nodes文件夹 2. 在地址栏输入以下命令: ``` git clone https://github.com/Nojahhh/ComfyUI_GLM4_Wrapper.git ``` 3. 进入刚下载的文件夹 4. 运行安装命令: ``` ../../python_embeded python -m pip install -r requirements.txt ``` **注意:** 如果你想用更省空间的版本,需要额外安装: ``` pip install auto-gptq ``` ## 3. 节点逐一解析 ### 3.1 GLM-4 Model Loader(模型加载器)节点是干嘛的? 这个节点就像是一个"智能助手启动器"。你需要先用这个节点把GLM-4这个超级聪明的人工智能助手"叫醒",然后其他节点才能使用它。就像你要先打开微信,才能和朋友聊天一样。 ### 3.2 GLM-4 Model Loader 参数详解 | 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 | | :— | :— | :— | :— | :— | :— | :— | | model | model | 多个模型选择 | THUDM/glm-4-9b | 选择不同的智能助手版本,有些能看图,有些只能处理文字 | 选择不同功能的GLM-4模型变体 | 如果要处理图片就选glm-4v-9b,只处理文字就选glm-4-9b | | precision | precision | fp16/fp32/bf16 | bf16 | 决定助手思考的精细程度,就像调节画笔的精细度 | 设置模型运算的数值精度 | 一般用bf16就够了,既快又准确 | | quantization | quantization | 4/8/16 | 4 | 压缩助手的体积,数字越小占用空间越少但可能稍微笨一点 | 设置模型量化的位数 | 显存不够用选4,显存够用选8或16 | ### 3.3 GLM-4 Prompt Enhancer(提示词增强器)节点是干嘛的? 这个节点就像是一个"文案扩写大师"。你给它一个简单的描述,它就能帮你写出超级详细、生动的长描述。比如你说"猫咪",它能给你写出"一只毛茸茸的橘色小猫咪,正懒洋洋地趴在阳光透过百叶窗洒下的温暖地板上..." ### 3.4 GLM-4 Prompt Enhancer 参数详解 | 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 | | :— | :— | :— | :— | :— | :— | :— | | GLMPipeline | GLMPipeline | 连线输入 | 来自模型加载器 | 连接刚才启动的智能助手 | 接收GLM-4模型管道 | 从GLM-4 Model Loader节点拖线过来 | | prompt | prompt | 文本输入 | 你的简单描述 | 输入你想要扩写的简单描述 | 输入基础提示词 | 输入"美丽的夕阳",它会扩写成详细描述 | | max_tokens | max_tokens | 数字 | 200 | 控制生成文字的最大长度,就像限制作文字数 | 设置最大输出token数量 | 200够用了,太多会很啰嗦 | | temperature | temperature | 0.0-2.0 | 0.1 | 控制创意程度,数字越大越有创意但也越不稳定 | 控制生成文本的随机性 | 0.1比较稳定,0.7比较有创意 | | top_k | top_k | 数字 | 40 | 限制选词范围,就像限制从多少个词里选 | 限制每步选择的词汇数量 | 40是个好平衡,不要改太多 | | top_p | top_p | 0.0-1.0 | 0.7 | 另一种控制选词的方法,和top_k配合使用 | 累积概率阈值 | 0.7比较合适,配合top_k使用 | | repetition_penalty | repetition_penalty | 数字 | 1.1 | 防止重复说话,数字越大越不重复 | 重复惩罚因子 | 1.1刚好,太高会说话奇怪 | | image | image | 图片输入 | 可选 | 如果你想让它看图说话,就连接图片 | 输入图像用于视觉理解 | 只有带v的模型才能用,比如glm-4v-9b | | unload_model | unload_model | True/False | True | 用完后是否清理显存,就像用完电脑要不要关机 | 使用后是否卸载模型 | 一般选True,省显存 | | seed | seed | 数字 | 可选 | 随机种子,相同种子产生相同结果 | 随机种子值 | 想要重现相同结果时使用 | ### 3.5 GLM-4 Inferencing(推理对话)节点是干嘛的? 这个节点就像是一个"聊天机器人"。你可以和它进行对话,问它问题,让它帮你写东西,或者分析图片。它比提示词增强器更灵活,可以进行复杂的对话和分析。 ### 3.6 GLM-4 Inferencing 参数详解 | 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 | | :— | :— | :— | :— | :— | :— | :— | | GLMPipeline | GLMPipeline | 连线输入 | 来自模型加载器 | 连接刚才启动的智能助手 | 接收GLM-4模型管道 | 从GLM-4 Model Loader节点拖线过来 | | system_prompt | system_prompt | 文本输入 | 角色设定 | 告诉助手它应该扮演什么角色 | 系统提示词,定义AI角色 | "你是一个专业的摄影师,请详细描述照片" | | user_prompt | user_prompt | 文本输入 | 你的问题 | 你想问助手的具体问题或要求 | 用户输入的具体问题 | "请分析这张图片的构图和光线" | | max_tokens | max_tokens | 数字 | 250 | 控制回答的最大长度,就像限制回答字数 | 设置最大输出token数量 | 250够用了,复杂问题可以设更高 | | temperature | temperature | 0.0-2.0 | 0.7 | 控制创意程度,数字越大回答越有创意 | 控制生成文本的随机性 | 0.7比较有创意,0.1比较严谨 | | top_k | top_k | 数字 | 50 | 限制选词范围,就像限制从多少个词里选 | 限制每步选择的词汇数量 | 50是个好平衡,对话用这个合适 | | top_p | top_p | 0.0-1.0 | 1.0 | 另一种控制选词的方法,和top_k配合使用 | 累积概率阈值 | 1.0给最大自由度,适合对话 | | repetition_penalty | repetition_penalty | 数字 | 1.0 | 防止重复说话,数字越大越不重复 | 重复惩罚因子 | 1.0正常,对话不需要太多惩罚 | | image | image | 图片输入 | 可选 | 如果你想让它看图回答,就连接图片 | 输入图像用于视觉理解 | 只有带v的模型才能用,比如glm-4v-9b | | unload_model | unload_model | True/False | True | 用完后是否清理显存,就像用完电脑要不要关机 | 使用后是否卸载模型 | 一般选True,省显存 | | seed | seed | 数字 | 可选 | 随机种子,相同种子产生相同结果 | 随机种子值 | 想要重现相同对话结果时使用 | ## 4. 使用技巧和建议 ### 4.1 选择合适的模型 - **只处理文字**:选择`THUDM/glm-4-9b`或`THUDM/glm-4-9b-chat` - **需要看图功能**:选择`THUDM/glm-4v-9b`或压缩版本 - **显存不够**:选择`alexwww94/glm-4v-9b-gptq-4bit`(只要8.5GB空间) ### 4.2 参数调节小窍门 - **要稳定结果**:temperature设低(0.1-0.3) - **要有创意**:temperature设高(0.7-1.0) - **防止重复**:repetition_penalty设1.1-1.2 - **显存不够**:quantization设4,unload_model设True ### 4.3 提示词写作技巧 - **简单明了**:不要写太复杂的初始提示词 - **具体细节**:提到你想要的具体元素,比如"红色的花"而不是"花" - **情感色彩**:可以加入情感词汇,比如"温暖的"、"神秘的" ## 5. 常见问题解答 ### Q1:为什么下载模型这么慢? A1:因为模型文件很大(18-26GB),建议使用稳定的网络环境,或者选择压缩版本的模型。 ### Q2:显存不够怎么办? A2:可以选择压缩版本的模型(gptq-4bit只要8.5GB),或者把quantization设为4,unload_model设为True。 ### Q3:生成的文字总是重复怎么办? A3:把repetition_penalty调高到1.1-1.2,或者降低temperature到0.1-0.3。 ### Q4:想要更有创意的结果怎么办? A4:把temperature调高到0.7-1.0,top_p调高到0.8-1.0。 ### Q5:为什么我的模型不能处理图片? A5:只有带"v"的模型才能处理图片,比如glm-4v-9b。如果你用的是glm-4-9b,就不能连接图片。 ## 6. 实际应用场景 ### 6.1 提示词增强场景 - **原始提示词**:一只猫 - **增强后**:一只优雅的长毛波斯猫,有着如丝绸般光滑的白色毛发,湛蓝色的眼睛如宝石般闪烁,正优雅地坐在铺着天鹅绒坐垫的古董椅子上... ### 6.2 图片分析场景 - **上传一张风景照** - **系统提示词**:你是一个专业的摄影师 - **用户提示词**:请分析这张照片的构图和光线 - **AI回答**:这张照片采用了经典的三分法构图,主体位于画面的左三分线上,天空占据了上三分之一的空间... ### 6.3 创意写作场景 - **系统提示词**:你是一个创意写作助手 - **用户提示词**:帮我写一个关于太空探险的开头 - **AI回答**:在距离地球三万光年的银河系边缘,一艘名为"希望号"的探险飞船正静静地漂浮在星际尘埃中... 这个插件非常适合那些想要让AI图片生成更精准、更有创意的朋友使用。虽然模型比较大,但生成的效果确实很棒!
ComfyUI图像合并插件comfyui-merge使用教程 2025-07-03 22:44 ComfyUI 图像合并插件教程 (comfyui-merge) 1. 插件简介 这是一个专门用来合并图片的 ComfyUI 插件,就像用 PS 把多张图片叠在一起那样。它的特别之处在于你精确控制每张图片的混合方式。 GitHub 地址:https://github.com/LingSss9/com