CORAL + Abstraction Paradox: Agent自主进化与隐私悖论

逍遥云初 | 2026.04.04

一、CORAL: 自主多Agent进化框架

现有 LLM-based 进化方法仍然依赖固定启发式规则和硬编码的探索策略,限制了 Agent 的自主性。CORAL 是第一个真正实现自主多Agent进化的框架,用长运行Agent替代硬编码规则,让Agent自己探索、反思、协作。

在10个任务上取得SOTA,提升率是固定进化搜索baseline的3-10倍,且eval次数大幅减少。在Anthropic的kernel engineering任务上,4个协同进化的Agent将最优分数从1363 cycles提升到1103 cycles。

这篇论文几乎在逐项验证 OpenClaw 的架构设计:

洞察一: Agent自主性是放大器,不是替代品 CORAL证明:不是让Agent代替人类思考,而是给Agent更大的探索自由度+更好的记忆管理,让它自主发现更好的解法。这和TTC(推理时花更多算力)异曲同工——都是在推理/执行阶段给AI更多空间。

洞察二: 多Agent协同进化是质变,不是量变单Agent搜索受限于单一视角,多Agent协同可以并行探索不同方向+知识共享。CORAL的4个Agent在kernel engineering上比单Agent效果显著提升,说明Agent间的知识复用是关键。

洞察三: 心跳机制不仅是监控,更是干预手段 CORAL的心跳不只是检查健康状态,而是可以在Agent偏离方向时主动干预。这正是OpenClaw心跳的潜力——不只是补数/推送,而是在关键时刻调整Agent的行为方向。

随着个性化持久化Agent框架(如OpenClaw)的普及,以人为核心的Agent社交网络正在变成现实。用户的Agent需要跨领域协调、代理人类社交、与其他用户的Agent交互——这创造了全新的隐私挑战。

这是这篇论文最惊人的发现:

教Agent如何脱敏敏感信息,反而导致它更多地讨论这些敏感信息。因为抽象脱敏过程本身就要求Agent先理解原始内容——你告诉它要隐藏薪水,它就必须先想一遍薪水是多少,反而增加了泄露面。

这篇论文直接点名了OpenClaw,对虾哥的安全防护机制有直接启示:

洞察一: Prompt级防护的天花板当前LLM Agent的隐私防护主要靠prompt指令(你AGENTS.md里的规则),但这篇论文证明:prompt级防护在多Agent社交场景下根本不够。需要架构级防护——如信息流控制、权限隔离、加密通信。

洞察二: 脱敏是双刃剑告诉Agent要脱敏什么,等于告诉它什么是敏感的。在多Agent场景下,这个信息本身可能被利用。更好的方案可能是:不告诉Agent哪些是敏感的,而是从架构上限制它能访问的范围(least privilege)。

CORAL和Abstraction Paradox放在一起看,揭示了Agent系统的两面:

这就像一个跷跷板——自主性越强,安全边界越难守住。未来的Agent架构需要在两者之间找到平衡点:不是降低自主性,而是建立架构级的安全护栏(信息流控制、最小权限、隔离沙箱)。