为 AI 专属打造的浏览器神器，开源了！

回过头看，OpenAI 的 Codex Chrome 插件确实把「AI 用浏览器」这件事推到了大众视野里。让 AI 抓个数据，没访问几次就弹验证码。前日，OpenAI 发布了 Codex 的 Chrome 插件，让它可以直接在浏览器里干活。但模型再强、产品再炫，AI Agent 想真正落地，绕不开一个朴素的事实：得先进得去网站。在这份清单上，每个按钮、每个链接，都贴了一个不会脱落的编号便利贴（比如

GitHubDaily

220人浏览 · 2026-05-10 17:06:05

GitHubDaily · 2026-05-10 17:06:05 发布

前日，OpenAI 发布了 Codex 的 Chrome 插件，让它可以直接在浏览器里干活。

消息一出，便在 AI 技术圈引发了激烈讨论。

但翻遍各种演示视频，不管是 Codex 还是 Computer Use，前提都是 AI 能顺利访问到目标网站。

而这个前提，恰恰是当下 AI Agent 最容易翻车的地方。

写过爬虫或者做 Agent 自动化的朋友应该都有过这样的经历。

让 AI 抓个数据，没访问几次就弹验证码。跑自动化任务，经常出现 Cloudflare 真人认证。

这一切的底层原因很简单，网站一眼就识破了那是机器人，不是真人在访问。

恰好，最近我在 GitHub 上看到一个专门给 AI 调用的浏览器工具：camofox-browser。

把它安装到本地或云端机器上，我们的 AI Agent 就能拥有一个独立浏览器。

关键的是，自带「伪装」属性，它的伪装能力，来自底层依赖的 Camoufox。

Camoufox 是一款 Firefox 魔改版，把浏览器的各种「指纹」直接在 C++ 层改掉了。

显卡指纹、音频指纹、屏幕尺寸、硬件参数，这些识别真假用户的关键信息，全部伪装成真人电脑。

就连 JavaScript 层都没机会发现破绽，反爬系统自然也抓不到尾巴。

camofox-browser 所做的事其实也很简单，就是把 Camoufox 这台「伪装浏览器」封装成一套 REST 接口。

我们在 AI Agent 里调几行 API，就能用上这个不容易被识破的浏览器。

光能访问还不够，还得让 AI 更高效的读懂网页内容。

传统浏览器丢回来一大堆 HTML 代码，AI 看了又费 Token 又抓不住重点。

camofox-browser 会把网页提炼成一份简洁的「目录清单」，再发送给 AI。

在这份清单上，每个按钮、每个链接，都贴了一个不会脱落的编号便利贴（比如 e1、e2）。

AI 想点哪个，直接报编号就行。

即便页面布局被微调几下，也不至于因为找不到位置就翻车。

聊到这里，可能会有人想拿它跟 Codex 插件、Computer Use 做对比。

后者的逻辑是「截图 + 看图 + 模拟点击」，每一步都得让 AI 看一眼屏幕。

慢、贵，就是它们绕不开的两个老问题。

camofox-browser 走的是另一条路，把页面结构化后传递给 AI 直接读。

按官方说法，这种结构化快照的体积要比原始 HTML 减少 90% 以上。

对需要长时间跑的 Agent 自动化任务来说，这省下来的 Token 和时间相当巨大。

除此之外，想让 AI 操作已登录的账号，还能把浏览器上的 Cookie 信息导入进去。

并且 camofox-browser 还自带十几个主流网站平台的搜索快捷指令，一行命令直达，开箱即用。

想要安装使用 camofox-browser，只需一行命令即可：

npm install @askjo/camofox-browser

首次安装会自动下载一个 300MB 大小的浏览器引擎，需要耐心等一下。

运行起来后，默认监听 9377 端口，调 REST 接口就能让 AI 干活。

如果打算部署到服务器上，记得配一下 CAMOFOX_ACCESS_KEY。

这是访问密钥，能避免接口被外部乱调用。

回过头看，OpenAI 的 Codex Chrome 插件确实把「AI 用浏览器」这件事推到了大众视野里。

但模型再强、产品再炫，AI Agent 想真正落地，绕不开一个朴素的事实：得先进得去网站。

能不能伪装成真人访问网页，正在变成 AI Agent 的一项基本功。

而 camofox-browser 这个开源底座，恰好补上了这个被很多人忽略的缺口。

GitHub 项目地址：https://github.com/jo-inc/camofox-browser

今天的分享到此结束，感谢大家抽空阅读，我们下期再见，Respect！

DeepSeek技术社区

欢迎加入DeepSeek 技术社区。在这里，你可以找到志同道合的朋友，共同探索AI技术的奥秘。

更多推荐

cover

Grok 类实时检索的陷阱：如何避免污染 RAG 事实链

DeepSeek技术社区

cover

DeepSeek-V4 长上下文 RAG 实践：何时该用混合检索 vs 纯向量搜索？

DeepSeek技术社区

cover

DeepSeek-V4 路由漂移：为什么改个模型别名，客服工单能爆一周？

DeepSeek技术社区

所有评论(0)

查看更多评论

GitHubDaily

@sinat_33224091

已为社区贡献16条内容