Harness:介绍与定位
目录
- 一句话定义
- 为什么 2026 必须单独讲 Harness
- 三个容易混淆的概念
- Harness vs Workflow vs Framework
- 2026 生态中的 Harness 落点
- 面试可答:Harness 解决什么痛点?
- 延伸阅读
一句话定义
Agent Harness(智能体运行时束具)是包裹在大模型之外的工程运行时:负责编排循环、工具调用、上下文组装、记忆、护栏、可观测性与容错,使「一次 LLM 调用」升级为「可交付的 Agent 行为」。
2026 年主流表述:Agent = Model + Harness。模型换版本、换供应商,Harness 应尽量稳定;Harness 设计好坏,往往比「多换一个更强模型」更能决定上线成功率。
为什么 2026 必须单独讲 Harness
| 阶段 | 关注点 | 典型问题 |
|---|---|---|
| 2023–2024 | Prompt + 单次 API | 回答质量不稳定 |
| 2024–2025 | RAG + Function Calling | 检索错、工具乱调 |
| 2025–2026 | Agent + MCP + 推理模型 | 无限循环、越权、不可回归、成本失控 |
当系统进入 多步工具链 + 长会话 + 自主决策 时,失败模式从「答错」变成「做错」——Harness 正是把「做错」变成「可控失败」的那一层。
三个容易混淆的概念
1. Agent Harness(本专题主角)
在线、有状态、面向单次或连续会话的运行时。职责包括:
- 编排环(ReAct / Plan-Execute / Graph)
- 工具网关(鉴权、参数校验、超时、重试)
- Context Engineering(拼 system / history / RAG / tool result)
- 护栏与 HITL(Human-in-the-Loop)
- Trace、日志、成本计量
2. Context Engineering(Harness 的子集)
只回答:模型这一步看到什么 token。包括:
- 系统提示与 Skill 渐进披露
- 历史裁剪、摘要、窗口预算
- RAG 片段排序与引用格式
- Tool result 的截断与结构化
Context Engineering 不负责工具是否该被调用、循环是否该终止——那是 Harness 编排环的职责。
3. Eval Harness(离线评测束具)
不在用户请求路径上,用于:
- Golden Set 回归(改 prompt / 改模型 / 改工具后跑分)
- CI 发布门禁(分数跌破阈值则 block deploy)
- A/B 与 Red Team 批量跑
详见 05-Eval-Harness与发布门禁 与 AI 系统评测与基准方法。
Harness vs Workflow vs Framework
| 维度 | Workflow(工作流) | Agent Harness | Agent Framework |
|---|---|---|---|
| 控制流 | 人预先画好 DAG | 模型参与分支决策 | 提供抽象与 SDK |
| 灵活性 | 低、可预测 | 高、需护栏 | 取决于你怎么配 |
| 典型产品 | n8n、Temporal 固定流 | 自研 orchestrator + 模型 | LangGraph、Vercel AI SDK、OpenAI Agents SDK |
| 面试一句话 | 「步骤写死了」 | 「步骤运行时决定,但要有束具」 | 「帮你搭 Harness 的积木」 |
实践建议:高合规、低容错用 Workflow;探索型任务用 Agent + 强 Harness;不要「为了 Agent 而 Agent」——很多业务 80% 是 Workflow,20% 是 Agent 节点。
2026 生态中的 Harness 落点
| 层级 | 代表 | Harness 体现 |
|---|---|---|
| 模型 API | OpenAI / Anthropic / DeepSeek | Tool use、Structured Outputs、Prompt Caching |
| SDK | Vercel AI SDK、OpenAI Agents SDK | streamText + tools、maxSteps、middleware |
| 协议 | MCP | 工具发现、传输、权限边界 |
| 宿主 | Cursor、OpenClaw、Hermes | Skill 注入、Gateway、会话与审批 |
| 自研 | 企业内部 BFF | 编排环、审计、多租户配额 |
前端工程师最常见路径:Next.js API Route + Vercel AI SDK + 自研 traceId / 护栏——即最小 Agent Harness,见 05.3 最小项目。
面试可答:Harness 解决什么痛点?
标准答法(30 秒):
Agent 不是「模型会调工具」就够了。生产上要解决四类问题:循环控制(max steps、超时)、工具安全(白名单、参数校验、HITL)、上下文预算(裁剪与摘要)、可回归(Eval Harness + trace)。这些合起来叫 Harness;Context Engineering 只管模型看到什么,Eval Harness 管改代码后有没有变差。
延伸阅读
- 02-Harness核心组件与架构
- AI-Agent系统架构设计
- [Agent工作流与MCP落地](../../../前端/前端+AI/06-实时多模态与 Agent/Agent工作流与MCP落地.md)