一句话让 Claude Code 自动剪视频,这开源项目有点猛...
渲染完成后,工具还会在每个剪切点做一次自检,扫描渲染结果,看有没有画面跳切、爆音、字幕遮挡。有问题就自动回炉重新渲染,最多 3 次,通过了才把预览交到我们面前。browser-use 是把 LLM 从「看网页截图」换成「读结构化 DOM」,Video Use 是把「看视频帧」换成「读带时间戳的转录文本」。不用再打开任何剪辑软件,只需把视频素材放到一个文件夹,然后在 Claude Code 里,用一
很多朋友不知道,让视频博主最烦恼的不是写脚本、不是录制,而是后期剪辑。
打开剪辑软件,一帧帧剪掉那些 “呃”、“嗯” 等多余的语气片段,还要配字幕加动效。
手动打点,不断裁剪,反复试听,一段简单几分钟视频,却要剪辑几个小时,极其耗时耗力。
最近在 GitHub 上发现一个叫 video-use 的 Claude Code 视频剪辑技能。

来自 Browser Use 团队开源,他们之前开源的 browser-use 让 AI 自动操控浏览器,已狂揽 8.8 万 Star。
这次他们把 AI 操控浏览器的同样思路,应用到视频编辑并制作成 Skill,安装到 Claude Code 后。
不用再打开任何剪辑软件,只需把视频素材放到一个文件夹,然后在 Claude Code 里,用一句人话告诉它想要什么。

比如说一句:“把 xxx 文件夹里的视频素材剪辑成一条可发布的视频”。
它就会自己盘点素材、给出剪辑方案、等我们确认,接着就自动识别并剪掉口头禅片段。
给每段素材做色彩调级,每个剪切点自动加 30 毫秒音频淡入淡出,还有加入字幕。
最后,直接输出一段剪辑合并完成的视频,并存放在素材目录旁边的文件夹里。
但最让我觉得牛的地方,不是它的功能,而是它背后的底层实现逻辑思路。
当把一段视频发给多模态模型进行读,通常的处理是将视频拆成一帧一帧塞给大模型识别,一条视频轻松干到几千万 Token。
而 video-use 的做法非常巧妙,主要分两层。
第一层是音频层,常驻加载。通过 ElevenLabs Scribe 转写,扒出带词级时间戳的文字稿,同时标好说话人、笑声、叹息这类信息。
词级时间戳是剪辑精度的命门,缺了它每一刀切在哪全靠瞎猜。其他主流转写工具要么只给句级时间戳,要么不做说话人区分,Scribe 是少数一家全配齐的。
第二层是视觉层,按需调用。遇到模糊停顿、重录比对、剪辑点确认这类关键决策,timeline_view 会现场合成一张图扔给 LLM,胶片缩略、音频波形、单词标签叠在一起。

这个思路作者在另一个项目 browser-use 里验证过一次,当时是给 LLM 喂结构化 DOM 代替网页截图。放到 Video Use 这里,换汤不换药。
渲染完成后,工具还会在每个剪切点做一次自检,扫描渲染结果,看有没有画面跳切、爆音、字幕遮挡。有问题就自动回炉重新渲染,最多 3 次,通过了才把预览交到我们面前。
整个流程是:转录 → 打包 → 模型推理 → 生成剪辑决策 → 渲染 → 自检。每一步策略都需要我们确认才会执行,不会偷偷下刀。
还有个非常贴心的小细节,每次剪辑的上下文会写进 project.md。
如果是剪辑同一个项目,它能从上次的状态继续,对做课程、长播客、连载 vlog 的创作者来说很实用。
安装使用也不复杂。
只需要把项目克隆到本地,再链接到 Claude Code 的 skills 目录,命令如下:
git clone https://github.com/browser-use/video-usecd video-useln-s"$(pwd)" ~/.claude/skills/video-use
然后再安装依赖,其中 ffmpeg 必装,yt-dlp 可选,用来下载在线素材:
pip install -e .brew install ffmpegbrew install yt-dlp
最后还需一个 ElevenLabs 的 API Key 用于语音转录,配置到 .env 文件后,打开 Claude Code 即可使用。

目前项目刚开源,处于早期阶段,复杂场景可能需要多轮对话才能达到预期效果。描述越具体,结果越准确。
写在最后
Video Use 真正让我觉得有意思的地方,其实不在它本身做得多好。
而在于作者之前在 browser-use 上用过的那套方法论,在 Video Use 里又跑通了一次。
browser-use 是把 LLM 从「看网页截图」换成「读结构化 DOM」,Video Use 是把「看视频帧」换成「读带时间戳的转录文本」。
再加上 Opus 4.7 模型学会了自我验证,AI agent 开始真正具备「独立交付」的能力,而不只是协助我们完成某一步。
未来我们可以把更多精力留给创作本身,而不是耗在那些重复、琐碎、磨时间的执行环节上。
GitHub 项目地址:https://github.com/browser-use/video-use
今天的分享到此结束,感谢大家抽空阅读,我们下期再见,Respect!
更多推荐


所有评论(0)