LCGuard：多 Agent 共享 KV 缓存的隐私边界

返回文章列表

论文精选 AI Agent 研究文章

Feature Essay

LCGuard：多 Agent 共享 KV 缓存的隐私边界

多 Agent 系统为了协同，可能从文本通信走向 latent communication。KV cache 共享更高效，也可能保留更丰富的任务信息；问题是，这种隐藏通道不容易被传统内容审核看见。

2026-05-25 00:33 北京时间 8 分钟难度：进阶

25 阅读 0 点赞

快速答案

LCGuard 关注一个容易被忽略的通道：多 Agent 系统不只会通过自然语言泄密，也可能通过共享 KV cache 泄漏上下文、推理状态和角色私有信息。

论文把共享 KV cache 视作 latent working memory，并用可重构敏感输入来定义泄漏风险。
LCGuard 通过表示层变换降低可恢复敏感信息，同时尽量保留任务相关语义。
这篇论文提醒多 Agent 产品：安全审计不能只盯聊天文本，隐式状态也要成为边界。

问题不在说了什么，而在传了什么

多 Agent 系统的默认通信方式是自然语言：一个 Agent 把中间结论写出来，另一个 Agent 接着用。这样的好处是可读、可审计，坏处是啰嗦、损耗信息，也会暴露推理过程。

近期研究开始讨论 latent communication，尤其是通过 transformer 的 key-value cache 共享中间状态。它可以更高效，也可能保留比自然语言摘要更完整的任务上下文。LCGuard 抓住的风险是：KV cache 不是空白缓存，它可能编码了用户输入、角色私有信息和中间推理状态。

如果这些 cache 在 Agent 之间流动，系统表面上没有发送敏感文本，实际却可能把敏感内容藏在表示里传走。传统「检查输出文本是否泄密」的做法，在这里会失效。

LCGuard 的核心做法

论文把共享 KV cache 定义为 latent working memory。判断它是否安全，看攻击者能否从共享 cache 中重构 agent-specific sensitive inputs。这个定义很务实：泄漏重点是可恢复信息。

LCGuard 使用表示层变换，在 cache 传给其他 Agent 前做处理。训练时引入对抗式目标：攻击者学习从 cache 里恢复敏感输入，LCGuard 则学习降低这种可恢复性，同时保留任务相关语义。

论文称，在多个模型家族和多 Agent benchmark 上，LCGuard 能降低 reconstruction-based leakage 和 attack success rate，并保持有竞争力的任务表现。它是在隐私和协作效率之间找平衡。

为什么对产品重要

很多多 Agent 产品现在把风险主要放在文本层：prompt injection、越权调用、工具输出污染、消息路由错误。LCGuard 提醒我们，随着系统为了效率共享更多内部状态，隐式通道会变成新的攻击面。

这对企业场景尤其重要。不同 Agent 可能代表不同部门、权限、客户或数据域。即便它们协同完成同一任务，也不意味着所有中间状态都可以共享。权限边界必须覆盖文本、工具调用、文件、向量库，也包括模型内部状态和 cache artifact。

如果未来 Agent runtime 支持 KV reuse、prefix cache、latent handoff 或跨 Agent memory，安全设计就不能停在「别把敏感文本写出来」。系统需要知道什么状态被共享、共享给谁、是否可逆、能否审计。

谨慎看待这条路线

LCGuard 的局限也明显。表示层隐私保护很难给普通工程团队调试；「降低可重构性」不等于绝对不泄漏；不同模型架构、cache 格式和任务分布变化后，效果也需要重新验证。

另外，把安全压到表示变换层，不能替代权限系统。生产边界仍然需要最小权限、隔离执行、数据分级、审计日志和外部策略控制。

但这篇论文的价值在于提前指出一个方向：Agent 的安全对象正在从文本扩展到状态。越是追求低延迟和深协作的多 Agent 系统，越不能忽视这些看不见的通道。

参考来源

LCGuard: Latent Communication Guard for Safe KV Sharing in Multi-Agent Systems

还没有评论，你可以写下第一条。

继续阅读

同主题延伸

如果你想顺着当前问题继续往下挖，这里优先给相近主题的文章。

2026-05-25 00:43 北京时间 8 分钟同主题：论文精选等 3 个标签

Boiling the Frog：Agent 安全要看多轮动作

Boiling the Frog 把安全评测从单轮有害回答，转向企业办公环境里的多轮渐进攻击。它提醒我们，Agent 风险往往是在状态被慢慢改坏后出现。

2026-05-25 00:35 北京时间 9 分钟同主题：论文精选等 3 个标签

DeltaBox：长程 Agent 需要毫秒级回滚

DeltaBox 把 Agent 沙箱从「隔离环境」推进到「可快速试错的执行底座」。它讨论的 checkpoint 和 rollback，决定长程 Agent 能不能安全探索多条路径。

2026-05-25 00:31 北京时间 9 分钟同主题：论文精选等 3 个标签

MOSS：Agent 自我进化不能只改提示词

MOSS 把自我进化从 prompt、技能文件和工作流配置推进到源码层。它值得讨论的重点是失败证据、回放验证、用户同意和回滚机制能否形成生产完整流程。

编辑精选

如果你想从这篇扩出去，这里放最近值得继续看的站内长文。

2026-05-29 21:35 北京时间 12 分钟编辑精选

下一篇 MOSS：Agent 自我进化不能只改提示词

阅读难度

进阶

信息密度适中，适合连续阅读。

要点

论文把共享 KV cache 视作 latent working memory，并用可重构敏感输入来定义泄漏风险。
LCGuard 通过表示层变换降低可恢复敏感信息，同时尽量保留任务相关语义。
这篇论文提醒多 Agent 产品：安全审计不能只盯聊天文本，隐式状态也要成为边界。

RSS

Subscribe to long-form updates through RSS. Feed timestamps use Beijing time.

Open RSS feed

LLMs

This site also exposes llms.txt and sitemap.xml for model-friendly discovery.

Open llms.txt

LCGuard：多 Agent 共享 KV 缓存的隐私边界

快速答案

问题不在说了什么，而在传了什么

LCGuard 的核心做法

为什么对产品重要

谨慎看待这条路线

参考来源

评论（0）

继续阅读

同主题延伸

Boiling the Frog：Agent 安全要看多轮动作

DeltaBox：长程 Agent 需要毫秒级回滚

MOSS：Agent 自我进化不能只改提示词

编辑精选

Git 入门：先看懂版本、分支和协作

TerminalWorld：终端 Agent 评测不能只靠人造题

Agentic CLEAR：只做可观测还不够，Agent 需要解释型评测