Jockey是一个基于Twelve Labs API和LangGraph构建的对话式视频代理。它将现有的大型语言模型(Large Language Models, LLMs)的能力与Twelve Labs的API结合使用,通过LangGraph进行任务分配,将复杂视频工作流程的负载分配给适当的基础模型。LLMs用于逻辑规划执行步骤并与用户交互,而与视频相关的任务则传递给由视频基础模型(Video Foundation Models, VFMs)支持的Twelve Labs API,以原生方式处理视频,无需像预先生成的字幕这样的中介表示。Jockey主要面向需要处理复杂视频工作流程的开发者和团队,尤其是那些希望利用大型语言模型来增强视频内容创作和编辑流程的用户。它适合需要高度自定义和自动化视频处理任务的专业用户。

搜索