跳到主要内容

Harness:介绍与定位

目录

一句话定义

Agent Harness(智能体运行时束具)是包裹在大模型之外的工程运行时:负责编排循环、工具调用、上下文组装、记忆、护栏、可观测性与容错,使「一次 LLM 调用」升级为「可交付的 Agent 行为」。

2026 年主流表述:Agent = Model + Harness。模型换版本、换供应商,Harness 应尽量稳定;Harness 设计好坏,往往比「多换一个更强模型」更能决定上线成功率。

为什么 2026 必须单独讲 Harness

阶段关注点典型问题
2023–2024Prompt + 单次 API回答质量不稳定
2024–2025RAG + Function Calling检索错、工具乱调
2025–2026Agent + MCP + 推理模型无限循环、越权、不可回归、成本失控

当系统进入 多步工具链 + 长会话 + 自主决策 时,失败模式从「答错」变成「做错」——Harness 正是把「做错」变成「可控失败」的那一层。

三个容易混淆的概念

1. Agent Harness(本专题主角)

在线、有状态、面向单次或连续会话的运行时。职责包括:

  • 编排环(ReAct / Plan-Execute / Graph)
  • 工具网关(鉴权、参数校验、超时、重试)
  • Context Engineering(拼 system / history / RAG / tool result)
  • 护栏与 HITL(Human-in-the-Loop)
  • Trace、日志、成本计量

2. Context Engineering(Harness 的子集)

只回答:模型这一步看到什么 token。包括:

  • 系统提示与 Skill 渐进披露
  • 历史裁剪、摘要、窗口预算
  • RAG 片段排序与引用格式
  • Tool result 的截断与结构化

Context Engineering 不负责工具是否该被调用、循环是否该终止——那是 Harness 编排环的职责。

3. Eval Harness(离线评测束具)

不在用户请求路径上,用于:

  • Golden Set 回归(改 prompt / 改模型 / 改工具后跑分)
  • CI 发布门禁(分数跌破阈值则 block deploy)
  • A/B 与 Red Team 批量跑

详见 05-Eval-Harness与发布门禁AI 系统评测与基准方法

Harness vs Workflow vs Framework

维度Workflow(工作流)Agent HarnessAgent Framework
控制流人预先画好 DAG模型参与分支决策提供抽象与 SDK
灵活性低、可预测高、需护栏取决于你怎么配
典型产品n8n、Temporal 固定流自研 orchestrator + 模型LangGraph、Vercel AI SDK、OpenAI Agents SDK
面试一句话「步骤写死了」「步骤运行时决定,但要有束具」「帮你搭 Harness 的积木」

实践建议:高合规、低容错用 Workflow;探索型任务用 Agent + 强 Harness;不要「为了 Agent 而 Agent」——很多业务 80% 是 Workflow,20% 是 Agent 节点。

2026 生态中的 Harness 落点

层级代表Harness 体现
模型 APIOpenAI / Anthropic / DeepSeekTool use、Structured Outputs、Prompt Caching
SDKVercel AI SDK、OpenAI Agents SDKstreamText + tools、maxSteps、middleware
协议MCP工具发现、传输、权限边界
宿主Cursor、OpenClaw、HermesSkill 注入、Gateway、会话与审批
自研企业内部 BFF编排环、审计、多租户配额

前端工程师最常见路径:Next.js API Route + Vercel AI SDK + 自研 traceId / 护栏——即最小 Agent Harness,见 05.3 最小项目

面试可答:Harness 解决什么痛点?

标准答法(30 秒):

Agent 不是「模型会调工具」就够了。生产上要解决四类问题:循环控制(max steps、超时)、工具安全(白名单、参数校验、HITL)、上下文预算(裁剪与摘要)、可回归(Eval Harness + trace)。这些合起来叫 Harness;Context Engineering 只管模型看到什么,Eval Harness 管改代码后有没有变差。

延伸阅读