Infrastructure
2026-05-21
Coding Agent 的竞争焦点正在转向企业运行层
过去一周,OpenAI 把 Codex 放进企业 agentic coding 评价体系,Dropbox 公开 Nova 内部平台,GitHub 连续补 Copilot cloud agent 的 Actions 修复、review 反馈、REST API 和模型路由,Google 在 I/O 继续把 Gemini 放进开发者与搜索入口。这些动作共同说明,行业竞争正在从“谁更会写代码”转向“谁能把 agent 接进权限、沙箱、验证、审计和成本管理”。
- 企业真正放权给 coding agent 前,先要解决运行位置、权限边界、验证路径、失败回滚、成本归因和审计链路。
- Dropbox 的 Nova 代表内部平台化,GitHub 代表代码托管控制面,OpenAI 和 Google 代表企业采购与入口分发;四者共同把竞争推向运行层。
- 这条迁移会持续成立,因为大组织不会长期采购一个孤立助手,而会采购能嵌进工程系统并承担责任边界的 agent 平台。
Engineering
2026-05-18
上下文工程重新被算成本,窗口尺寸不再是核心约束
1M 级别窗口已经不稀奇,团队的真问题切回到上下文怎么组织、怎么裁剪、怎么去重。重读成本和注意稀释比 token 价格更难解决。本周 HN 上多条讨论都把焦点拉回这个层面:模型能力还在涨,但上下文如果脏了,谁也救不回来。
- 默认把所有历史塞进窗口的做法在多轮长任务里直接失效。
- 按角色分桶 + 工具结果去重 + 判断版本化已成为可见的最佳实践骨架。
- 可追溯性正在成为评估上下文质量的最朴素指标,比抽象的相关性指标更有用。
Infrastructure
2026-03-26
Agent 运行时正在下沉成企业工作流里的控制平面
过去一周,AWS 给 AgentCore Runtime 补上持久 session storage,又把 AgentCore 接进 Step Functions;GitHub 把 agent activity 写进 Issues / Projects,并把 coding agent usage 单列进组织级 metrics。这些动作合起来说明,行业开始补的不是新彩蛋,而是 agent 的状态、编排、恢复和审计底座。
- Agent 正在从前台体验问题转向后台运营问题:任务状态要能跨 stop / resume 持续,执行链要能接入现成工作流服务,管理员还要看得到真实使用与执行进度。
- AWS 把持久文件系统、Step Functions 编排和 AgentCore 连到一起,GitHub 把 agent session 和 coding agent usage 写进团队的项目面与管理面,本质上都在把 agent 变成可被组织接管的系统组件。
- 这条迁移会持续成立,因为企业真正愿意放权给 agent 的前提,不是它偶尔惊艳,而是它能被恢复、被并行、被审计、被纳入既有流程。
Interface
2026-03-23
Agent 主战场正在从独立 AI App 转向默认工作台与现成入口
过去一周,OpenAI 把 Astral 并进 Codex 补工具链,Anthropic 把 Claude Cowork 推成跨手机和桌面的持续任务位,腾讯把 OpenClaw 接进 WeChat;这些动作合起来说明,行业争的已经不是“再做一个 AI App”,而是谁先占住用户原本就会打开的工作表面。
- 独立 AI 助手的问题不只是获客贵,而是用户还得先切出浏览器、微信、IDE、文档或桌面工作台,才能让 Agent 开始工作。
- 谁把 Agent 长进默认入口,谁就更容易顺手接住文件、联系人、代码库、标签页、日历和权限体系,后面的执行链路也更容易做深。
- 这条迁移会持续成立,因为入口位一旦被占住,留存、分发、企业采购、工具扩展和模型替换都会顺着这一层发生,真正稀缺的是工作表面,不是助手名字。