跳到主要内容

Agent Harness 专题

目录

本专题讲什么

2026 年业界越来越统一的表述是:Agent = Model + Harness。模型负责推理与生成;Harness(运行时束具)负责把一次「可能出错、可能越权、可能无限循环」的 LLM 调用,变成可观测、可中断、可回归、可上线的工程系统。

本专题回答三类问题:

  1. 概念:Harness 与 Context Engineering、Eval Harness、Workflow 的边界分别是什么?
  2. 架构:生产级 Agent Harness 由哪些组件构成?七大模式(预防 / 检测 / 纠正)如何落地?
  3. 工程:如何优化 Harness、如何用 Eval Harness 做发布门禁?

文末 06-踩坑与常见问题 汇总面试高频追问;前端最小闭环05.3 Harness 最小项目

一张图建立心智模型

适合谁

读者建议路径
面试准备01 → 02 → 03,背「Agent=Model+Harness」与七大模式
前端 / 全栈01 → 02 → 05.3 最小项目
平台 / 架构全文 + AI 系统评测与基准方法
已有 Agent 上线03 → 04 → 05 → 06

章节导读

章节内容
01-介绍与定位定义、与 Context / Eval 的区分、2026 生态位
02-Harness核心组件与架构编排环、工具层、记忆、可观测性
03-生产Harness七大模式预防 / 检测 / 纠正;熔断、HITL、审计
04-Harness优化与Meta-Harness延迟、成本、自愈、Meta-Harness
05-Eval-Harness与发布门禁Golden Set、CI 门禁、与 10 模块衔接
06-踩坑与常见问题无限循环、上下文爆炸、工具越权等

与仓库内其他文档的关系