Read in English → · Leer en español →

我的 AI 智能体需要一个浏览器。不是沙箱里的无头 Chromium,而是一个真正的浏览器——带着我的登录状态、我的 Cookie、我的会话。
这样的工具不存在。所以我自己造了一个。
问题
智能体在写代码、搜索网页、阅读文档方面越来越强。但一旦需要真正使用网站,一切就崩了。
大多数浏览器工具给你一个全新的 Chromium 实例,零状态。每次会话都从头开始。没有登录、没有 Cookie、没有历史记录。拿来做爬虫还行,做正经事完全不够用。
我需要智能体从 Railway 拉取部署状态、截图内部仪表盘、填写表单、从需要登录的工具生成 PDF。这些都需要以我的身份登录,在我的浏览器里操作。
举个实际例子。Railway 需要登录才能看到部署状态。无头浏览器进不去,因为没有会话。用 Claw Relay,我的智能体直接导航到 railway.app,从页面读取部署状态,然后发回截图。不用折腾 API,不用重新认证。就是浏览器做浏览器该做的事。
Claw Relay 做什么
它位于智能体和 Chrome 之间。智能体通过 WebSocket 发送操作:导航、点击、截图、读取页面。Claw Relay 检查认证、执行权限控制、应用速率限制,然后通过 CDP(Chrome DevTools Protocol)将操作转发给 Chrome。
npx @acolombiadev/claw-relay
一条命令。它会启动一个专用 Chrome 窗口,启动中继,生成带有随机令牌的配置。在那个窗口登录你需要的任何账号。这些会话在重启之间持久化。
智能体连接后获得一个有真实会话的真实浏览器。不是模拟。
差异化特性
持久会话。登录一次。Cookie 在重启后保留。智能体不需要每次重新认证。
权限范围控制。你决定智能体能做什么。只能导航?完全交互?执行 JavaScript?按智能体单独设置,不是全局配置。
站点限制。白名单或黑名单特定域名。智能体可以读 docs.railway.app,但不能碰你的银行。
速率限制。内置节流,防止一个智能体每秒向站点发送 50 个请求。
审计追踪。每个操作都带时间戳记录。你可以看到智能体做了什么、试图做什么、什么被阻止了。
就是 Chrome。不是 Docker 容器里你看不见的 Playwright。不是隔了三层抽象的 Puppeteer。一个普通的 Chrome 窗口,你可以看到、点击、检查。
你的浏览器永远不离开你的机器。
我如何使用
我在 Railway 上运行 Claw Relay,配一个持久化的 Chrome 实例。我的智能体通过 WSS 连接,把它当作永久浏览器。用它截图部署预览、读取内部仪表盘、填写表单、从需要登录的工具生成 PDF。全部使用我的现有会话。
智能体看到一个真实的浏览器。浏览器看到一个真实的用户。
试试看
npx @acolombiadev/claw-relay
就这样。开源。MIT 许可证。
音频版本:本文也提供音频版本,使用 Fish Audio 和我的克隆声音生成。Fish Audio 让从文本创建自然语音变得非常简单 —— 我只需粘贴文章内容,几秒钟内就能获得高质量的音频。
本文由 Andrea Griffiths 撰写,AI 辅助翻译为中文。如有翻译问题,欢迎在 mainbranch-zh 仓库提交 PR。