Agent Harness 专题
目录
本专题讲什么
2026 年业界越来越统一的表述是:Agent = Model + Harness。模型负责推理与生成;Harness(运行时束具)负责把一次「可能出错、可能越权、可能无限循环」的 LLM 调用,变成可观测、可中断、可回归、可上线的工程系统。
本专题回答三类问题:
- 概念:Harness 与 Context Engineering、Eval Harness、Workflow 的边界分别是什么?
- 架构:生产级 Agent Harness 由哪些组件构成?七大模式(预防 / 检测 / 纠正)如何落地?
- 工程:如何优化 Harness、如何用 Eval Harness 做发布门禁?
文末 06-踩坑与常见问题 汇总面试高频追问;前端最小闭环见 05.3 Harness 最小项目。
一张图建立心智模型
适合谁
| 读者 | 建议路径 |
|---|---|
| 面试准备 | 01 → 02 → 03,背「Agent=Model+Harness」与七大模式 |
| 前端 / 全栈 | 01 → 02 → 05.3 最小项目 |
| 平台 / 架构 | 全文 + AI 系统评测与基准方法 |
| 已有 Agent 上线 | 03 → 04 → 05 → 06 |
章节导读
| 章节 | 内容 |
|---|---|
| 01-介绍与定位 | 定义、与 Context / Eval 的区分、2026 生态位 |
| 02-Harness核心组件与架构 | 编排环、工具层、记忆、可观测性 |
| 03-生产Harness七大模式 | 预防 / 检测 / 纠正;熔断、HITL、审计 |
| 04-Harness优化与Meta-Harness | 延迟、成本、自愈、Meta-Harness |
| 05-Eval-Harness与发布门禁 | Golden Set、CI 门禁、与 10 模块衔接 |
| 06-踩坑与常见问题 | 无限循环、上下文爆炸、工具越权等 |
与仓库内其他文档的关系
- Agent 基础:AI-Agent基础概念与核心原理、AI-Agent系统架构设计
- 工具与协议:MCP 开发与应用、Agent 工具集成与扩展
- Context:Skills 与插件专题(渐进披露是 Context 子问题)
- 评测:AI 系统评测与基准方法
- 前端实战:05.3 Harness 最小项目