📌 📌 核心问题

企业级 Agent 在受监管领域(承保、理赔、税务)部署时,面临一个悖论:十年来不断演进的有状态记忆架构(stateful memory)在学术界大放异彩,但企业界仍然在用最朴素的检索增强管道(RAG)。为什么?

这篇论文(与昨天发布的四轴决策对齐框架出自同一团队)揭示了一个隐藏需求:受监管部署需要四个系统属性——确定性重放、可审计推理、多租户隔离、无状态水平扩展——而有状态架构在设计上就违反了这些属性。

🔬 🔬 关键数据

  • 测试场景:10 个受监管决策案例,3 种记忆预算
  • DPM vs 摘要记忆:在慷慨预算下持平,在紧缩预算下大幅领先
  • 20x 压缩比下,DPM 事实精确度 +0.52(Cohen's h=1.17, p=0.0014)
  • 推理连贯性 +0.53(h=1.13, p=0.0034)
  • 速度提升 7-15 倍:DPM 在决策时只做 1 次 LLM 调用,摘要记忆做 N 次
  • 审计面差异巨大:DPM 每次决策记录 2 次 LLM 调用,摘要记忆记录 83-97 次

🏗️ 🏗️ DPM 架构详解

核心思想:无状态决定性投影记忆(Deterministic Projection Memory)

  • append-only 事件日志:所有决策历史以不可变的方式追加记录
  • 一次任务条件投影:在决策时,根据当前任务从日志中投影出需要的上下文
  • 只做一次 LLM 调用:投影过程是一次性的,不像摘要记忆需要 N 次调用

为什么企业选择 RAG 而不选记忆架构?

  • 确定性重放:DPM 的日志是 append-only 的,可以完整重放任何历史决策
  • 可审计推理:每次决策只涉及 2 次 LLM 调用,审计面极小
  • 多租户隔离:日志天然按租户分隔,不存在跨租户的状态污染
  • 无状态水平扩展:决策时不需要维护会话状态,可以任意水平扩展

🔑 🔑 关键洞察

💡 无状态是负载承载属性:论文最核心的论点是——企业选择 RAG 不是因为它更强,而是因为它是无状态的。无状态意味着可审计、可重放、可扩展。这些属性在受监管环境中比「更好的回答质量」更重要。
💡 压缩比是关键变量:在慷慨预算下 DPM 和摘要记忆持平,但当记忆预算收紧(20x 压缩)时,DPM 的优势才真正显现。这说明企业场景的核心约束不是算力,而是记忆预算。
💡 与四轴框架的联动:这篇论文是四轴决策对齐框架的实操落地。四轴框架告诉你「怎么评估」,DPM 告诉你「怎么实现」。两者结合构成了企业级 Agent 记忆系统的完整方法论。

🤔 🤔 引发思考

这篇论文揭示了一个深刻的行业洞察:在学术界,我们追求的是「更好的记忆」;在企业界,我们追求的是「更可审计的记忆」。当 Agent 做出一个承保决定导致数百万美元损失时,法官不关心你的记忆架构有多精妙,他只关心你能不能完整重放这个决策的每一步。

DPM 的价值在于它证明了「无状态」和「高性能」可以兼得。这为企业级 Agent 的记忆系统选型提供了一个清晰的判断标准:如果你的场景需要审计和合规,DPM 可能比任何花哨的记忆架构都更适合。

*逍遥云初 | 2026.04.23*