ComfyUI-JaRue 插件完全使用指南
1. 插件简介
ComfyUI-JaRue 是一个专门为 ComfyUI 设计的插件包,主要功能就像一个"YouTube 字幕提取神器"。想象一下,你有一个很棒的YouTube视频,里面有字幕,你想把这些字幕一句一句地提取出来,然后用来制作动画或者生成图片。这个插件就是干这个活的!
GitHub原地址: https://github.com/jtrue/ComfyUI-JaRue
主要功能: - 从YouTube视频中提取字幕文本 - 把字幕按照时间轴分割成小段 - 将文本转换成图像(还在完善中) - 支持批量动画制作
2. 如何安装
方法一:使用 ComfyUI Manager(推荐)
- 打开 ComfyUI Manager
- 搜索 "JaRue"
- 点击安装
方法二:手动安装
- 打开你的 ComfyUI 安装目录
- 进入
custom_nodes文件夹 - 在这里打开命令行(Windows用户可以在文件夹里按住Shift+右键,选择"在此处打开命令窗口")
- 输入命令:
git clone https://github.com/jtrue/ComfyUI-JaRue.git - 重启 ComfyUI
重要提醒:
安装后你还需要额外安装一个YouTube的工具包:
1. 打开命令行
2. 输入:pip install youtube-transcript-api
3. 如果ComfyUI还是提示找不到,需要手动把这个工具包复制到ComfyUI的custom_nodes目录下
3. 节点逐一解析
3.1 JRU YouTube Transcript 节点(YouTube字幕提取器)
这个节点就像一个"YouTube字幕搬运工",它能够从YouTube视频中把字幕全部提取出来,并且按照你想要的时间间隔来分割。
3.2 参数详解
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 |
| :— | :— | :— | :— | :— | :— | :— |
| Video ID | video_id | 文本输入 | 无 | 就像给视频的"身份证号码",告诉插件你要提取哪个视频的字幕 | YouTube视频的唯一标识符 | 在YouTube视频网址中找到,比如https://youtu.be/abc123中的abc123 |
| FPS | fps | 数字 | 10 | 就像调节"字幕切片的密度",数字越大切得越细 | 每秒帧数,控制字幕时间轴的精度 | 设置为10意味着每秒会有10个时间点可以放字幕 |
| Begin Frame | begin | 数字 | 0 | 就像告诉插件"从视频的第几秒开始提取字幕" | 开始提取字幕的起始帧位置 | 如果想从视频30秒开始,可以设置为300(30秒×10帧) |
| Cache Enable | cache | 布尔值 | True | 就像"保存上次下载的字幕",避免重复下载同一个视频 | 缓存机制,避免重复请求YouTube服务器 | 开启后第二次处理同一视频会更快 |
3.3 JRU Text2Image 节点(文字转图片生成器)
这个节点就像一个"文字变图片的魔法师",能够把文字转换成图片。目前这个功能还在完善中,作者还在努力让它更好用。
3.4 参数详解
| 参数名 (UI显示) | 参数名 (代码里) | 参数值 | 建议值 | 通俗解释 (能干嘛的) | 专业解释 | 怎么用/举个例子 | | :— | :— | :— | :— | :— | :— | :— | | Text Input | text_input | 文本输入 | 无 | 就像告诉插件"请把这些文字变成图片" | 输入要转换为图像的文本内容 | 输入"Hello World"就会生成包含这些文字的图片 | | Font Size | font_size | 数字 | 24 | 就像调节"字体大小",数字越大字越大 | 控制生成图像中文字的字体大小 | 设置为48会让文字变得很大很醒目 | | Image Width | width | 数字 | 512 | 就像设置"图片有多宽",数字越大图片越宽 | 生成图像的宽度像素值 | 设置为1024会得到更宽的图片 | | Image Height | height | 数字 | 512 | 就像设置"图片有多高",数字越大图片越高 | 生成图像的高度像素值 | 设置为768会得到更高的图片 | | Background Color | bg_color | 颜色选择器 | 黑色 | 就像选择"图片背景是什么颜色" | 设置图像背景的颜色值 | 选择白色会得到白底黑字的图片 | | Text Color | text_color | 颜色选择器 | 白色 | 就像选择"文字是什么颜色" | 设置文字的颜色值 | 选择红色会得到红色的文字 |
4. 使用技巧和建议
获取YouTube视频ID的小技巧
- 打开任意YouTube视频
- 看网址栏,找到类似这样的地址:
https://www.youtube.com/watch?v=dQw4w9WgXcQ - 其中
dQw4w9WgXcQ就是视频ID - 或者短网址:
https://youtu.be/dQw4w9WgXcQ,后面的dQw4w9WgXcQ就是ID
设置合理的FPS值
- 如果你要做动画,推荐用10-24的FPS
- 如果只是提取字幕文本,可以用更低的FPS,比如5
- FPS越高,提取的字幕时间点越精确,但处理时间会更长
缓存使用建议
- 第一次提取某个视频的字幕时,建议开启缓存
- 如果YouTube视频更新了字幕,需要关闭缓存重新提取
- 缓存文件会占用一些硬盘空间,定期清理
5. 常见问题解答
Q: 为什么提示找不到youtube-transcript-api?
A: 这是因为Python库没有正确安装。解决方法:
1. 用命令行安装:pip install youtube-transcript-api
2. 如果还不行,需要手动复制库文件到ComfyUI的custom_nodes目录
Q: 某些YouTube视频无法提取字幕? A: 不是所有YouTube视频都有字幕。如果视频没有字幕或者字幕被禁用,插件会报错提示你。
Q: 提取的字幕格式是什么样的? A: 插件会按照时间轴把字幕分割成小段,每一段都有对应的时间戳,方便你用于动画制作。
Q: Text2Image功能为什么不完整? A: 作者还在开发这个功能,目前可以生成简单的文字图片,但还不能完美配合YouTube字幕使用。
6. 实际应用场景
制作字幕动画
- 用YouTube Transcript节点提取视频字幕
- 连接到AnimatedDiff或其他动画节点
- 每一句字幕对应一帧动画
- 生成有文字说明的动画视频
批量内容生成
- 从教学视频中提取字幕
- 把每句话转换成对应的图片
- 制作图文并茂的教程内容
多语言内容处理
- 提取英文YouTube视频的字幕
- 配合翻译工具处理文本
- 生成本地化的内容
7. 注意事项
- 这个插件需要网络连接才能工作(要连接YouTube)
- 请遵守YouTube的使用条款,不要滥用
- 如果遇到安装问题,可以先删除Text2Image相关代码再使用
- 作者提供了详细的视频教程:https://youtu.be/Si4mwBQuzYQ
记住,这个插件主要是为了帮助你更好地处理YouTube视频中的字幕内容,让你的ComfyUI工作流程更加丰富多样。虽然目前功能还比较基础,但已经可以满足大部分字幕提取和简单图文生成的需求了!