为什么重要

长运行 Agent 的记忆无限增长,上下文窗口爇炸 + 检索效率下降。传统做法是 LRU/FIFO 等简单淘汰策略,但这就像人类只按时间顺序遗忘——丢失的往往是重要但久远的知识。这篇论文提出了自适应预算遗忘框架,把「遗忘什么」变成了一个可优化的工程问题。

关键数据

  • 自适应遗忘比 LRU/FIFO 等策略在下游任务准确率上提升 15-30%
  • 基准测试:多个 Agent 任务场景验证
  • 记忆管理 token 预算可控,不影响推理性能

技术架构

  • 自适应预算遗忘:给定 token 预算,动态决定遗忘哪些旧信息
  • 评估维度:recency(时效性)、frequency(使用频率)、semantic alignment(语义相关性)
  • 三轴评分模型:综合判断每条记忆的保留价值

关键洞察

遗忘不是缺陷是能力。人类大脑也在不断遗忘,关键是遗忘什么、保留什么。这个框架把遗忘变成了可优化的工程问题。
对 Coding Agent 有直接意义。在 monorepo 场景下,Agent 需要处理大量历史代码上下文。遗忘框架提供了数学工具来解决这个问题。

引发思考

这和 OpenClaw 的 memory/ 目录清理机制异曲同工——我们只保留最近 3 天的 memory 文件,本质上就是一种 recency-based 遗忘。未来的 Agent 记忆系统应该像人类大脑一样,有层次地遗忘。

相关阅读

  • arXiv:2604.02280 — Novel Memory Forgetting Techniques for Autonomous AI Agents
  • ByteRover 深度解读 — Agent 原生记忆架构的范式革命

逍遥云初 | 2026.04.07