这次更新真正改的,是浏览器会话的地位
如果按版本号说,这次变化属于 OpenClaw 的 2026.3.13 更新线。需要特别说明的是,GitHub 上首先公开写明该功能的是 v2026.3.13-beta.1 release,发布时间是 UTC 2026-03-14,对应北京时间 2026-03-14 13:17;之后官方又用 v2026.3.13-1 恢复破损的发布链路,并明确说明 npm 版本仍然是 2026.3.13。所以更准确的说法「2026.3.13 这一版功能线里正式引入了这项能力」。
这一版最关键的新点,是 release notes 里明确写出了 「official Chrome DevTools MCP attach mode for signed-in live Chrome sessions」。OpenClaw 不再只依赖浏览器扩展来桥接标签页,而是新增了一条可直接挂接用户当前 Chrome 实时会话的官方路径。
- 新的核心驱动是
driver: "existing-session",文档明确说明它走的是 Chrome DevTools MCP,而不是传统 raw CDP 直连。 - 浏览器 profile 也被重新分层。官方文档新增了
profile="user",表示优先使用用户当前登录的宿主浏览器;同时保留profile="chrome-relay",对应旧的扩展中继路径。 - release notes 还把
chrome://inspect/#remote-debugging的启用说明写进了文档链路,官方已经把「接入真实浏览器会话」从灰色技巧推进成了公开支持的能力。
为什么这一步值得单独看
如果对照 OpenClaw 旧的 Chrome Extension 文档来看,这次变化的价值会更清楚。旧文档的定位很直接,就是 「bridge your agent directly into your active browser tabs」。以前 OpenClaw 当然能碰浏览器,但主要方式是先安装扩展,再由扩展把当前标签页暴露给 Agent。
现在的不同之处在于,OpenClaw 开始把「用户已经在用、已经登录、已经打开若干业务页面的真实 Chrome」视为一等对象。这会带来三层变化。
- 第一,登录态不必再先绕到扩展桥接层。对需要使用企业后台、工单系统、IM 管理台或开发者控制台的任务来说,这会显著降低接入摩擦。
- 第二,人工交接会更自然。用户可以先在自己的浏览器里完成登录、验证和导航,再把当前会话 attach 给 Agent,而不是重新在一个隔离壳里复现整套前置步骤。
- 第三,产品语义更清楚了。
user和chrome-relay两个 profile 并存,说明 OpenClaw 已不再把「浏览器自动化」只理解成一个工具调用问题,而是开始区分真实用户环境与中继环境。
对 Agent 产品来说,这不是小修小补。很多所谓浏览器能力,卡住的重点是能不能自然进入用户已经存在的会话上下文。OpenClaw 这次改的,正是那道门槛。
已经有人把它往更高一层组合了
如果只问「有没有人已经拿这个能力做更高级的东西」,目前我看到的答案是:有,但多数还停留在组合式工作流,还没有长成一个公认成熟的新平台。更准确地说,live Chrome session attach 正在变成一块底座,大家开始往上叠更省 token、更稳定、或者更接近真实业务流程的浏览器操作层。
第一类组合,是把 OpenClaw 的实时会话 attach 和 Chrome DevTools MCP 的调试能力连起来。Chrome 官方在 2025 年 12 月的博客里就把两个场景说得很直接:一是复用现有登录态,把「登录之后才能重现的问题」直接交给 Agent;二是把 DevTools 里已经选中的元素或网络请求,直接交给编码代理继续调查。 OpenClaw 这次接入后,最先受益的是「人工排查到一半,再把上下文交给 Agent 接手」的调试流。
第二类组合,是把真实浏览器会话和更轻的浏览器操作 CLI 叠在一起。公开的《OpenClaw Browser Setup Guide》把 agent-browser 作为默认自动化层来用,OpenClaw 自己负责浏览器生命周期、截图和高阶控制,agent-browser 负责基于紧凑元素引用做点击、填写、切换标签和网络观察。这个组合最有价值的地方在于把浏览器上下文压缩成更适合 Agent 消费的结构,减少每一步都把整棵 DOM 树塞回模型。
第三类组合,是把浏览器 attach 做成更长流程的一部分,而不是单次点点点。GitHub 上有一份公开的 API Mapping Playbook,专门让 Claude Code 通过 Chrome DevTools MCP 导航网站、捕获网络请求、反推出接口,再生成 OpenAPI 文档和代码示例。它不是 OpenClaw 专属玩法,但和 OpenClaw 现在的 user profile 完全是同一条技术路线:先接入用户已登录的真实会话,再把浏览器交互升级成「发现接口、整理文档、沉淀资产」的工作流。
第四类组合,是围绕稳定性补上守护层。GitHub 上还有公开的 「Browser Mutex + Single-Tab Guardrails」 skill,把 X 这类高风险站点的自动化拆成互斥锁、单标签页、线程安全回复、失败退避几件事来管。这个例子很说明问题。真正把浏览器 attach 用起来之后,最先暴露出来的往往是错误标签页、过期元素引用、重复发帖和并发踩踏。
- 我目前没有找到很多已经完全建立在
userprofile 之上的成品 SaaS。 - 但我能确认,围绕这条能力链的上层组合已经出现了:低 token 操作层、调试接力流、API 发现流和并发守护层。
- live attach 的现实价值,不只是「让 Agent 看见浏览器」,而是让浏览器第一次可以被纳入更长的工程工作流。
效果到底如何:提升是真实的,但还远没到「浏览器万能自动驾驶」
把现在能看到的公开反馈放在一起看,结论更接近这样:它对「已登录、人工在场、目标清楚」的浏览器任务提升很明显;对「高对抗、长链路、完全无人值守」的网页自动化,依然不够稳。
提升最明显的地方有三类。第一类是已登录后台、控制台和内部工具。官方文档已经明确推荐在「existing logged-in sessions matter」时优先用 profile="user",因为这会直接复用用户浏览器里已经存在的标签页和登录态。第二类是调试流。Chrome 官方给出的演示就是让代理直接接手当前调试会话、读取网络请求和元素上下文,这比从零重开一个受控浏览器自然得多。第三类是结构化自动化。agent-browser 这类工具把浏览器交互压成 refs、快照、wait、network route、tab 和 diff 这些原语后,Agent 的动作完整流程会稳定很多。
公开材料里也能看到「效率提升」已经被写成比较明确的话。社区的 Browser Setup Guide 直接把 agent-browser 描述成比原始 DOM 路径节省 60% 到 93% token;awesome-openclaw-skills 里 agent-browser 这项技能在最近抓取时已有 4,765 次下载,说明它至少不是没人用的冷门搭配。这里我做一个谨慎推断:OpenClaw 新增 live attach 之后,最可能率先起量的,重点是这种「真实会话 + 结构化浏览器 CLI」的双层组合。
但问题也很清楚。从同一版 release 里对 existing-session 的连续修复、以及社区已经开始为 X 这类场景补 mutex 和 single-tab guardrails 这件事就能看出来,稳定性仍然是主问题。真实页面一旦进入长链路操作,错误标签页、过期元素引用、会话重连和重复提交都会迅速放大。也正因为如此,当前更稳的做法通常是先用真实会话 attach 解决登录态和上下文,再用结构化操作层和守护规则把动作边界收紧。
- 它最适合的重点是进入你已经打开、已经登录、已经知道目标的那几个页面。
- 它带来的效率提升,更多来自少一次登录、少一次环境重建、少很多无效 token,而不是来自模型突然变得会网页通吃。
- 现在最靠谱的路线,仍然是 human-in-the-loop,加上结构化浏览器工具和清楚的失败保护,而不是直接追求完全无人值守。
它仍然有边界,不等于浏览器被无摩擦接管
这项能力很值得关注,但也不应该被写成「浏览器插件已经彻底消失」或者「Agent 可以静默接管一切页面」。官方 Browser 文档反而把边界写得很清楚:当登录态重要时,推荐使用 profile="user",同时也明确提醒这种模式更适合用户本人就在电脑前、可以点击和批准 attach 提示的场景。
它的真实定位,更像「把真实会话纳入协作式工作流」,而不是「把用户浏览器完全黑箱化」。浏览器扩展没有彻底消失,而是从唯一通道变成了保留通道;Chrome 调试口和 attach 生命周期也仍然需要被显式管理;同一版 release 里甚至还专门修了 existing-session 的 driver 校验、重连和 list_pages / new_page 兼容问题,这也说明它还处在快速打磨阶段。
- 这一步减少的是额外插件依赖,不是减少安全边界。
- 它更适合「用户在场的半自动协作」,而不是完全无人值守的隐式接管。
- 技术突破,在于 OpenClaw 第一次把「真实登录浏览器会话」提升成官方支持的一等接口。
结尾:真实浏览器会话第一次成了一等接口
更关键的变化是:OpenClaw 这次把真实用户浏览器第一次接进了 Agent 的正式工作流。这比多一个更炫的浏览器功能重要得多。
这件事本身还不等于浏览器自动化已经成熟,但它已经把下一阶段最值得看的方向暴露出来了。接下来真正会拉开差距的,重点是谁能把真实会话 attach、结构化操作层、失败保护和长流程任务真正接成一套稳定系统。
更新附注
- 版本:v1.3
更新日期:2026-04-01 更新原因:重写首屏判断与结尾收束,并清理误插入正文中段的更新附注,统一 OpenClaw 系列文章结构。
- 版本:v1.2
更新日期:2026-03-25 更新原因:补充摘要长度以满足当前发布门禁要求,正文判断与引用结论未变。
- 版本:v1.1
更新日期:2026-03-15 更新原因:收紧标题与首屏文案,压缩重复表达,并补写更适合发布与传播的结尾判断。
- 版本:v1.0
更新日期:2026-03-15 更新原因:补充 live Chrome session attach 的现实使用场景、社区组合方式与效果判断,新增官方与 GitHub 公开资料引用。
- 版本:v0.9
更新日期:2026-03-15
更新原因:首发版本,基于 OpenClaw 2026.3.13 更新线整理 live Chrome session attach 的功能变化、意义与使用边界。
还没有评论,你可以写下第一条。