一、什么是 Harness Engineering?
Harness Engineering 是 2025-2026 年 AI 工程领域最重要的新概念之一。它不是一个工具,不是一个框架,而是一套围绕 AI Agent 构建的约束、反馈与控制系统——让 Agent 在人类设定的边界内自主、可靠、可持续地工作。
与前两代范式的关系:
- Prompt Engineering 和 Context Engineering 本质上仍是"人给输入,AI 给输出"的范式
- Harness Engineering 的质变在于——人不再直接干预 AI 的每一步操作,而是构建一整套系统来约束、引导和验证 AI Agent 的自主行为
- 交互模式从"你问我答"变成了"赛道设计"
二、为什么需要 Harness Engineering?
2.1 Agent 的"翻车"规律
Anthropic 的 Justin Young 发现了一个核心规律:给 Agent 一个复杂的全栈项目,它的第一反应是试图在一个会话里把所有功能都做完。结果:
- 做到一半 context window 耗尽
- 留下半成品代码——功能写了一半没测试,模块间接口对不上
- 没有任何记录——下一个 Agent 会话不知道前一次做了什么
- 更糟糕的情况:Agent 过早宣布完成,实际上大量功能未经验证
2.2 "信任债务"(Trust Debt)
"AI 就像一个极其听话但缺乏背景知识的实习生。它倾向于填补你指令中的空白,进行'自信的即兴发挥'。如果你不审计它的假设,这些假设就会变成'信任债务'——目前看起来没问题,但在未来某个时刻会爆炸。"
—— Cassie Kozyrkov,前 Google 首席决策科学家
信任债务的危险在于:
- 不可见性:AI 做了你没要求的决定,但当时看起来合理
- 累积性:每一次未审计的决定都在叠加风险
- 爆发性:到出问题时,你得逆向工程那些你从未意识到的假设
三、OpenAI 百万行代码实验
Ryan Lopopolo 在 2026 年 2 月披露的为期 5 个月的内部实验:
核心理念——人类掌舵,智能体执行:
"当 Agent 遇到困难时,工程师的思考不是'我该怎么帮它写完这段代码',而是追问:'Agent 缺乏什么能力?需要什么工具、什么抽象层、什么结构?'然后由人类补充这些基础设施。"
Harness 的三大组件
Birgitta Böckeler 在 Martin Fowler 网站上将 OpenAI 团队的 Harness 归纳为三个类别:
- Context Engineering(上下文工程):代码库中持续增强的知识库,Agent 访问动态上下文的能力,不是全知文档而是"地图式"的渐进式信息披露
- Architectural Constraints(架构约束):由确定性的自定义 linter 和结构化测试强制执行,层级依赖模型(Types → Config → Repo → Service → Runtime → UI),违反层级依赖的代码直接在 CI 中被拒绝
- "Garbage Collection"(垃圾回收):后台定期运行的清理 Agent,扫描文档与代码之间的不一致,对抗熵增和腐烂
四、Anthropic 的长跑方案
Justin Young 解决的是更底层的问题:Agent 怎么跨越 context window 的限制,实现真正的长期运行?
三个精妙的设计
设计一:全标失败策略
所有功能的初始状态标记为"失败"。Agent 只能通过修改状态字段来标完成,不允许删除或编辑测试用例。这堵死了 Agent 通过"降低标准"来"完成"任务的路。
设计二:每次只做一件事
Anthropic 发现 Agent 有强烈的"贪多嚼不烂"倾向。强制"做一个功能就停"看起来效率低,但实际上总体完成率高得多。
设计三:进度文件作为跨会话记忆
claude-progress.txt 不只是日志,它是 Agent 的"外部记忆"。每个新会话的第一件事:读进度文件 + git log,搞清楚"上一个自己"做了什么,从断点继续。
五、LangChain 的硬核定量验证
四个关键改动
- Plan-Build-Verify-Fix 强制闭环:Agent 宣告完成之前,强制拦截,强制它跑验证
- 环境上下文注入:在 Agent 启动时就注入目录结构、可用工具、超时时间、测评标准
- 死循环检测:跟踪每个文件的编辑次数,当对同一文件编辑超过 N 次时,注入提示"考虑重新审视你的方案"
- 推理三明治策略:规划阶段用 xhigh,执行阶段降档到 high,验证阶段再回到 xhigh
六、核心洞察:约束换自主
这是整个 Harness Engineering 最深刻的思想:
约束越严格 → 信任越高 → 自主权越大
听起来矛盾,但和人类社会的运转逻辑完全一致:
- 法律越完善的社会,个人自由度越高
- 高速公路有护栏,你才敢踩到 120 码
- 手术室无菌规程越严格,手术越安全
七、工程师职业的重新定义
| 传统工程师 | Harness 时代工程师 |
|---|---|
| 价值 = 写代码的速度和质量 | 价值 = 设计系统的能力 |
| 核心技能 = 编码 | 核心技能 = 约束设计、反馈回路设计、控制系统设计 |
| 产出 = 代码 | 产出 = Agent 可靠运行的环境 |
| 关注 = 代码本身 | 关注 = 支撑结构(工具、抽象、反馈回路) |
"构建软件仍然需要纪律,但这种纪律更多地体现在支撑结构上——工具、抽象、反馈回路——而不是代码本身。"
—— OpenAI
原文:https://x.com/jakevin7/status/2033784104659882013
作者:卡比卡比 (@jakevin7) | 整理:三评