为 AI 专属打造的浏览器神器,开源了!
回过头看,OpenAI 的 Codex Chrome 插件确实把「AI 用浏览器」这件事推到了大众视野里。让 AI 抓个数据,没访问几次就弹验证码。前日,OpenAI 发布了 Codex 的 Chrome 插件,让它可以直接在浏览器里干活。但模型再强、产品再炫,AI Agent 想真正落地,绕不开一个朴素的事实:得先进得去网站。在这份清单上,每个按钮、每个链接,都贴了一个不会脱落的编号便利贴(比如
前日,OpenAI 发布了 Codex 的 Chrome 插件,让它可以直接在浏览器里干活。
消息一出,便在 AI 技术圈引发了激烈讨论。
但翻遍各种演示视频,不管是 Codex 还是 Computer Use,前提都是 AI 能顺利访问到目标网站。
而这个前提,恰恰是当下 AI Agent 最容易翻车的地方。
写过爬虫或者做 Agent 自动化的朋友应该都有过这样的经历。
让 AI 抓个数据,没访问几次就弹验证码。跑自动化任务,经常出现 Cloudflare 真人认证。
这一切的底层原因很简单,网站一眼就识破了那是机器人,不是真人在访问。

恰好,最近我在 GitHub 上看到一个专门给 AI 调用的浏览器工具:camofox-browser。
把它安装到本地或云端机器上,我们的 AI Agent 就能拥有一个独立浏览器。
关键的是,自带「伪装」属性,它的伪装能力,来自底层依赖的 Camoufox。
Camoufox 是一款 Firefox 魔改版,把浏览器的各种「指纹」直接在 C++ 层改掉了。
显卡指纹、音频指纹、屏幕尺寸、硬件参数,这些识别真假用户的关键信息,全部伪装成真人电脑。
就连 JavaScript 层都没机会发现破绽,反爬系统自然也抓不到尾巴。

camofox-browser 所做的事其实也很简单,就是把 Camoufox 这台「伪装浏览器」封装成一套 REST 接口。
我们在 AI Agent 里调几行 API,就能用上这个不容易被识破的浏览器。
光能访问还不够,还得让 AI 更高效的读懂网页内容。
传统浏览器丢回来一大堆 HTML 代码,AI 看了又费 Token 又抓不住重点。
camofox-browser 会把网页提炼成一份简洁的「目录清单」,再发送给 AI。
在这份清单上,每个按钮、每个链接,都贴了一个不会脱落的编号便利贴(比如 e1、e2)。
AI 想点哪个,直接报编号就行。
即便页面布局被微调几下,也不至于因为找不到位置就翻车。
聊到这里,可能会有人想拿它跟 Codex 插件、Computer Use 做对比。

后者的逻辑是「截图 + 看图 + 模拟点击」,每一步都得让 AI 看一眼屏幕。
慢、贵,就是它们绕不开的两个老问题。
camofox-browser 走的是另一条路,把页面结构化后传递给 AI 直接读。
按官方说法,这种结构化快照的体积要比原始 HTML 减少 90% 以上。
对需要长时间跑的 Agent 自动化任务来说,这省下来的 Token 和时间相当巨大。
除此之外,想让 AI 操作已登录的账号,还能把浏览器上的 Cookie 信息导入进去。
并且 camofox-browser 还自带十几个主流网站平台的搜索快捷指令,一行命令直达,开箱即用。

想要安装使用 camofox-browser,只需一行命令即可:
npm install @askjo/camofox-browser
首次安装会自动下载一个 300MB 大小的浏览器引擎,需要耐心等一下。
运行起来后,默认监听 9377 端口,调 REST 接口就能让 AI 干活。
如果打算部署到服务器上,记得配一下 CAMOFOX_ACCESS_KEY。
这是访问密钥,能避免接口被外部乱调用。
回过头看,OpenAI 的 Codex Chrome 插件确实把「AI 用浏览器」这件事推到了大众视野里。
但模型再强、产品再炫,AI Agent 想真正落地,绕不开一个朴素的事实:得先进得去网站。
能不能伪装成真人访问网页,正在变成 AI Agent 的一项基本功。
而 camofox-browser 这个开源底座,恰好补上了这个被很多人忽略的缺口。
GitHub 项目地址:https://github.com/jo-inc/camofox-browser
今天的分享到此结束,感谢大家抽空阅读,我们下期再见,Respect!
更多推荐



所有评论(0)