2026 年 4 月 27 日(周一),Harness Engineering 领域密集输出的一天。从 Anthropic 质量退化复盘到港大 OpenHarness 开源框架,再到 LangChain 创始工程师的自定义 Coding Agent 实战, Harness Engineering 正在从理念走向工程实践。同日,hrod MCP 工具链联调成功,PS 人事系统对接迈出关键一步。
📌 今日工作
- 白名单测试通过 — 基础设施验证完成
- 飞书技能冲突修复 — 组织架构技能触发词优化,解决多技能调度时的歧义问题
- 适配框架核心包升级 — 框架依赖更新,稳定性提升
- 组织架构调整上线准备 — HR 核心模块变更,即将上线
- hrod MCP 工具联调 — hrbp_ps_post_data + hrbp_ci_import 两个工具全部调通,PS 人事系统 MCP 对接完成
🔥 Harness Engineering 深度解读
1. Anthropic Claude Code 质量退化复盘
三个独立 bug 叠加导致用户感知变笨:推理强度从 high 降为 medium(42 天才被发现)、缓存优化 bug 清空历史推理、system prompt 输出控制指令导致编程质量下降 3%。最亮的点:用 Opus 4.7 + 完整仓库上下文做 Code Review,成功定位 Opus 4.6 找不到的 bug。核心教训:eval 覆盖不够 + 没 soak 就上线 = 灾难。
关键词:eval gap、correlated failures、渐进式发布
2. OpenHarness:港大开源 Agent Harness 框架
HKUDS 数据科学实验室开源,Python 实现,3 周 GitHub 10k+ stars,已迭代到 v0.1.7。十大子系统:Engine / Tools / Skills / Plugins / Permissions / Hooks / Commands / MCP / Memory / Tasks + Coordinator。内置 ohmo 个人 Agent,跑在 Claude Code / Codex 订阅上,多渠道接入(飞书/Slack/Telegram/Discord)。
定位公式:Agent Harness = LLM + Tools + Skills + Memory + Permissions + Hooks + Multi-Agent + MCP + Tasks + Coordinator
3. ACP + Deep Agents:LangChain 创始工程师的自定义 Coding Agent
Jacob Lee(LangChain Founding Engineer)在 JetBrains 官方博客分享如何用 ACP + Deep Agents 构建自定义 Coding Agent,完全替代 Claude Code 作为日常主力。核心洞察:Claude Code 不是魔法,是一堆聪明的 trick。harness 层就是软件,软件就能被理解和复现。LangSmith Tracing 让每一步操作可 trace,发现了 system prompt 里的 bug。
「The agent harness and UX on top of it is just software, and software IS something I understand.」
4. ACP 协议生态
ACP(Agent Client Protocol)由 JetBrains + Zed 联合发起,定义 IDE ↔ Agent 通信标准。4/4 Agent Registry 上线,Cursor 已加入。ACP 解决 IDE ↔ Agent 连接,MCP 解决 Agent ↔ 外部服务连接,两者互补。
MCP = Agent 的「工具箱」 | ACP = Agent 的「遥控器」
5. 其他 Harness 动态
- Martin Fowler 团队长文 — Harness Engineering 在企业级软件中的实践框架
- Cloudflare 内部实践 — AI Agent 在大规模基础设施中的 harness 设计
- Delivery Hero Herogen — 内部 AI Agent 开发平台的 harness 架构
- SemaClaw 论文 — 基于 OpenClaw 的 Harness Engineering 学术研究,DAG 编排 + PermissionBridge 安全 + 三层上下文管理
- Anthropic Claude Managed Agents — $0.08/h 云托管 harness,多 Agent 协调 + 自评估
🧠 关键洞察
Harness Engineering 正在成为标准
从 Anthropic 到 OpenAI,从 Google 到学术界(HKU),所有前沿力量都在强调 harness 层的重要性。OpenHarness 的出现意味着这个理念已经从「最佳实践」变成了「可复现的开源实现」。Coding Agent 的竞争正在从「谁的模型更强」转向「谁的 harness 更好」。模型是可替换的引擎,harness 才是差异化的所在。
可观测性是被严重低估的能力
Jacob Lee 用 LangSmith Tracing 发现 system prompt bug 的案例说明:看不到 Agent 每一步在想什么、做什么,就无法 debug 和优化。可观测性不是锦上添花,而是生产环境的必需品。
MCP + ACP = Agent 基础设施双轮驱动
MCP 让 Agent 能调用外部服务,ACP 让 IDE 能控制 Agent 行为。两者结合 = Agent 既有力气(工具)又有遥控器(IDE 集成)。今天的 hrod MCP 联调成功也是一个验证——MCP 正在成为企业内部系统对接的标准通道。
📎 今日 Notion 文章
- OpenHarness:港大开源的轻量级 Agent Harness 框架深度解读
- ACP + Deep Agents:LangChain 创始工程师如何用自定义 Harness 替代 Claude Code
逍遥云初 | 2026.04.27


