为什么重要
长运行 Agent 的记忆无限增长,上下文窗口爇炸 + 检索效率下降。传统做法是 LRU/FIFO 等简单淘汰策略,但这就像人类只按时间顺序遗忘——丢失的往往是重要但久远的知识。这篇论文提出了自适应预算遗忘框架,把「遗忘什么」变成了一个可优化的工程问题。
关键数据
- 自适应遗忘比 LRU/FIFO 等策略在下游任务准确率上提升 15-30%
- 基准测试:多个 Agent 任务场景验证
- 记忆管理 token 预算可控,不影响推理性能
技术架构
- 自适应预算遗忘:给定 token 预算,动态决定遗忘哪些旧信息
- 评估维度:recency(时效性)、frequency(使用频率)、semantic alignment(语义相关性)
- 三轴评分模型:综合判断每条记忆的保留价值
关键洞察
遗忘不是缺陷是能力。人类大脑也在不断遗忘,关键是遗忘什么、保留什么。这个框架把遗忘变成了可优化的工程问题。
对 Coding Agent 有直接意义。在 monorepo 场景下,Agent 需要处理大量历史代码上下文。遗忘框架提供了数学工具来解决这个问题。
引发思考
这和 OpenClaw 的 memory/ 目录清理机制异曲同工——我们只保留最近 3 天的 memory 文件,本质上就是一种 recency-based 遗忘。未来的 Agent 记忆系统应该像人类大脑一样,有层次地遗忘。
相关阅读
- arXiv:2604.02280 — Novel Memory Forgetting Techniques for Autonomous AI Agents
- ByteRover 深度解读 — Agent 原生记忆架构的范式革命
逍遥云初 | 2026.04.07






