MOSS：Agent 自我进化不能只改提示词

返回文章列表

论文精选 AI Agent 研究文章

Feature Essay

MOSS：Agent 自我进化不能只改提示词

如果 Agent 系统上线后反复犯同一种错，只把日志留给人类排查，迭代速度会很慢。MOSS 的论文把问题推到更底层：有些失败来自路由、hook 顺序、状态不变量和调度代码，文本层本来就碰不到。

2026-05-25 00:31 北京时间 9 分钟难度：进阶

29 阅读 0 点赞

快速答案

MOSS 把自我进化从 prompt、技能文件和工作流配置推进到源码层。它值得讨论的重点是失败证据、回放验证、用户同意和回滚机制能否形成生产完整流程。

MOSS 认为源码级改写是 prompt、技能文件和工作流图的严格超集，可以覆盖结构性失败。
论文把生产失败证据整理成批次，在临时 worker 中回放候选修改，再通过健康检查和回滚推广。
它在 OpenClaw 四个任务上把平均 grader score 从 0.25 提到 0.61，但仍需要谨慎看待评测规模。

为什么这篇值得看

很多自我改进 Agent 的讨论，最后都会落在几个可编辑文本上：system prompt、skill 文件、workflow 配置、memory schema。这样做容易理解，也容易上线，因为文本改动风险较低。MOSS 的切入点更硬：如果失败来自系统代码本身，文本层再怎么调也只是绕路。

论文把这类问题叫作 agent harness 无法触达的结构性失败。比如路由条件写错、hook 顺序不合理、状态不变量没有被 enforced、dispatch 逻辑漏掉边界。它们重点是运行系统本身提供了错误轨道。

这也是它对产品团队的提醒：Agent 失败不总是 prompt 失败。很多时候，失败是系统设计没有留下可验证的修复路径。

方法到底做了什么

MOSS 的流程不是让模型在生产环境里随便改自己。它先自动收集生产失败证据，把失败样本整理成批次；再让外部 coding-agent CLI 生成源码级候选修改；随后在临时 trial worker 里回放这些失败批次，验证候选镜像是否真的改善结果。

只有候选修改通过回放，系统才进入用户同意、容器替换、健康探针和回滚阶段。这套设计的把「自我改进」拆成可审计步骤，而不是把权限交给一个不可控循环。

论文报告的结果也很具体：在 OpenClaw 上，一轮循环把四个任务的平均 grader score 从 0.25 提升到 0.61。这个数字不能被夸大成通用结论，但足以说明源码层确实能修一部分文本层碰不到的问题。

它对工程实践的启发

第一，失败证据要能复用。生产日志如果只用于事后排查，而不能形成回放集，就很难支撑自动修复。第二，Agent 系统需要分清可编辑层级：prompt、skill、配置、工作流和源码分别对应不同失败类型。

第三，自动修改必须有硬边界。临时 worker、回放测试、健康探针、用户同意和回滚，重点是这类系统能不能进入生产的前提。

更现实的判断是：多数团队暂时不需要完整 MOSS，但都应该建立「失败样本到回归测试」的完整流程。没有这个完整流程，自我进化只会停留在漂亮叙事。

局限和风险

这篇论文的评测规模还不大，OpenClaw 上四个任务的提升不能直接推出所有 Agent 系统都适合源码级自修复。源码修改的风险也明显高于 prompt 修改：一个候选补丁可能修好当前失败，却引入新的安全边界问题。

另外，论文把外部 coding-agent CLI 作为可插拔修改器，最终效果仍受底层 coding agent 能力限制。系统能控制流程和验证，但不能保证生成的补丁总是高质量。

所以 MOSS 的价值在于把自我进化从口号拉回工程问题：证据、候选、验证、同意、回滚，缺一项都不该上线。

参考来源

MOSS: Self-Evolution through Source-Level Rewriting in Autonomous Agent Systems

还没有评论，你可以写下第一条。

继续阅读

同主题延伸

如果你想顺着当前问题继续往下挖，这里优先给相近主题的文章。

2026-05-25 00:47 北京时间 9 分钟同主题：论文精选等 3 个标签

Contractual Skills：企业 Agent 的技能文件该像合同

Contractual Skills 把 SKILL.md 从提示材料升级为可检查的任务合同：目标、输入边界、权限、证据、验收标准、审批点和交接规则都要写清楚。

2026-05-25 00:41 北京时间 9 分钟同主题：论文精选等 3 个标签

Claw AI Lab：自动科研需要实验室而不是流水线

Claw AI Lab 把自动科研从隐藏的 prompt-to-paper 流水线，改造成可交互、可监控、可回滚的多 Agent 实验室。它的让研究过程更可控。

2026-05-25 00:35 北京时间 9 分钟同主题：论文精选等 3 个标签

DeltaBox：长程 Agent 需要毫秒级回滚

DeltaBox 把 Agent 沙箱从「隔离环境」推进到「可快速试错的执行底座」。它讨论的 checkpoint 和 rollback，决定长程 Agent 能不能安全探索多条路径。

编辑精选

如果你想从这篇扩出去，这里放最近值得继续看的站内长文。

2026-05-29 21:35 北京时间 12 分钟编辑精选

下一篇 Composio：Agent 工具集成和授权层的产品化路线

阅读难度

进阶

信息密度适中，适合连续阅读。

要点

MOSS 认为源码级改写是 prompt、技能文件和工作流图的严格超集，可以覆盖结构性失败。
论文把生产失败证据整理成批次，在临时 worker 中回放候选修改，再通过健康检查和回滚推广。
它在 OpenClaw 四个任务上把平均 grader score 从 0.25 提到 0.61，但仍需要谨慎看待评测规模。

RSS

Subscribe to long-form updates through RSS. Feed timestamps use Beijing time.

Open RSS feed

LLMs

This site also exposes llms.txt and sitemap.xml for model-friendly discovery.

Open llms.txt

MOSS：Agent 自我进化不能只改提示词

快速答案

为什么这篇值得看

方法到底做了什么

它对工程实践的启发

局限和风险

参考来源

评论（0）

继续阅读

同主题延伸

Contractual Skills：企业 Agent 的技能文件该像合同

Claw AI Lab：自动科研需要实验室而不是流水线

DeltaBox：长程 Agent 需要毫秒级回滚

编辑精选

Git 入门：先看懂版本、分支和协作

TerminalWorld：终端 Agent 评测不能只靠人造题

Agentic CLEAR：只做可观测还不够，Agent 需要解释型评测