Agent Harness:AI Agent 基础设施的新范式

Agent Harness:AI Agent 基础设施的新范式

2026 年,GitHub 上一类新型项目正在爆发——它们不叫「Agent 框架」,而叫「Agent Harness」。这个词背后,是一场关于 AI Agent 认知范式的深刻转变。


一、什么是 Agent?

如果你在过去两年关注 AI 领域,一定对「Agent」这个词不陌生。但先停一下——当我们说「Agent」的时候,到底在说什么?

1.1 智能体(Agency)从何而来?

答案可能颠覆直觉:智能体的行动能力(Agency)来自模型训练,而不是外部代码编排。

回顾 AI 历史上的里程碑:

  • 2013 年,DeepMind 的 DQN 仅接收原始像素和分数信号,在 7 款 Atari 游戏中超越了人类专家——没有游戏规则硬编码,一个神经网络从经验中学习。
  • 2019 年,OpenAI Five 通过 45,000 年的自我对弈训练,在 Dota 2 中击败了 TI8 世界冠军 OG——五个神经网络学会了团队协作,没有脚本策略。
  • 2019 年,DeepMind AlphaStar 在《星际争霸 II》中达到宗师段位(前 0.15%)——不完全信息、实时决策、组合动作空间远超围棋。
  • 2024-2025 年,LLM Agent 重塑软件工程——Claude、GPT、Gemini 阅读代码库、编写实现、调试错误、团队协作。

每一个里程碑都指向同一个事实:智能 = 训练出来的,不是代码堆出来的。

1.2 「Agent 框架」的迷思

但市面上充斥着一种东西:拖拽式工作流构建器、无代码「AI Agent」平台、Prompt 链编排库。它们的共同幻觉是:把 LLM API 调用用 if-else 分支、节点图、硬编码路由逻辑串起来,就叫做「构建 Agent」。

这不是 Agent。这是披着 AI 外衣的 shell 脚本。你无法通过堆积过程式逻辑(庞大的规则树、节点图、链式 Prompt 瀑布)来「暴力制造」智能。智能是学出来的,不是写出来的。


二、Agent Harness:从造大脑到造身体

2.1 范式转变

当有人说「我在构建 Agent」,实际上只能指两件事之一:

  1. 训练模型——通过强化学习、微调、RLHF 等方法调整模型权重,塑造其行为。这是 DeepMind、OpenAI、Anthropic 做的事。
  2. 构建 Harness——编写代码,为模型提供可操作的运行环境。这才是我们大多数人在做的事。

这是一个根本性的范式转变:

模型是驾驶员,Harness 是车辆。模型提供智能,Harness 提供手、眼、记忆和安全边界。

2.2 Harness 的定义

那么,Agent Harness 到底是什么?

Agent Harness 是包裹在大语言模型周围的一整套基础设施,使它从一个只会输出文本的模型,变成一个能够在特定环境中感知、推理、行动的完整 Agent。

用公式表达:

Harness = Tools + Knowledge + Observation + Action + Permissions
组件 说明 示例
Tools(工具) 给 Agent 双手 文件读写、Shell 执行、API 调用、浏览器控制
Knowledge(知识) 给 Agent 领域专长 产品文档、API 规范、代码风格指南、架构决策记录
Observation(感知) 给 Agent 眼睛 git diff、错误日志、浏览器状态、传感器数据
Action(行动) 给 Agent 触达世界的能力 CLI 命令、API 调用、UI 交互
Permissions(权限) 给 Agent 安全边界 沙箱隔离、审批工作流、信任边界

2.3 Harness 工程师到底在做什么?

如果你在阅读这篇文章,你很可能就是一位 Harness 工程师。以下是这个角色真正在做的事:

  1. 实现工具——给 Agent 双手。每个工具是 Agent 在其环境中可以执行的一个原子操作。
  2. 管理知识——给 Agent 领域专长。按需加载,而非一股脑塞进上下文。
  3. 管理上下文——给 Agent 干净的「工作记忆」。子 Agent 隔离防止噪声泄漏,上下文压缩防止历史淹没当下。
  4. 控制权限——给 Agent 安全边界。沙箱化文件访问,对破坏性操作要求审批。
  5. 收集轨迹数据——Agent 在 Harness 中执行的每一个动作序列都是训练信号。真实的部署轨迹是微调下一代 Agent 模型的原始材料。

三、2026 年 Agent Harness 生态全景

2026 年,Agent Harness 已经从概念变成了一个蓬勃发展的开源生态。以下是目前最值得关注的几个项目:

3.1 ECC — 王者级项目(192K ⭐)

GitHub: affaan-m/ECC

ECC 是目前 GitHub 上最大的 Agent Harness 项目,从 Anthropic 黑客松获奖作品演化而来。它不仅仅是一套配置——而是一个完整的系统:

  • 61 个 Agent + 246 个 Skill + 76 个 Command Shim
  • 跨 Harness 适配:Claude Code、Codex、Cursor、OpenCode、Gemini、GitHub Copilot
  • 内置 AgentShield 安全扫描、记忆持久化、持续学习
  • 支持 12+ 编程语言生态
  • v2.0 已引入 Rust 控制平面、Tkinter 桌面 GUI

ECC 代表了「Harness 即操作系统」的愿景——Agent 在上面运行,Harness 提供所有底层能力。

3.2 DeerFlow — 字节跳动的超级 Agent Harness(69K ⭐)

GitHub: bytedance/deer-flow

DeerFlow 从「深度研究」(Deep Research)框架演进为超级 Agent Harness

  • 子 Agent 编排 + 沙箱 + 记忆 + 可扩展 Skill
  • 支持 Docker 部署、MCP Server、多 IM 渠道(飞书/Slack/Telegram/Discord)
  • 推荐使用 Doubao-Seed-2.0-Code、DeepSeek v3.2、Kimi 2.5 运行
  • 内置 InfoQuest 智能搜索与爬虫工具集
  • 2.0 版本是完全重写,不与 1.x 共享任何代码

3.3 learn-claude-code — Harness 工程教材(62K ⭐)

GitHub: shareAI-lab/learn-claude-code

“Bash is all you need.”

这不是一个拿来就用的框架,而是一本从 0 到 1 教你构建 Agent Harness 的教科书。核心理念:

  • Agency 来自模型,Agent 产品 = 模型 + Harness
  • 彻底批判「Prompt 管道」式的伪 Agent 构建方式
  • 教授 Harness 工程师真正该做的事:实现工具、管理知识、管理上下文、控制权限、收集轨迹数据

3.4 DeepAgents — LangChain 的「电池全配」Harness(23K ⭐)

GitHub: langchain-ai/deepagents

LangChain 团队出品,定位为开箱即用的 Agent Harness

  • 基于 LangGraph(流式输出、持久化、检查点)
  • 内置子 Agent、文件系统、上下文管理、Shell 访问、持久记忆
  • Human-in-the-loop 审批机制
  • 模型无关,支持任何支持 tool calling 的 LLM
  • 提供 Python 和 TypeScript 双版本

LangChain 的定位很清晰:LangGraph 是图运行时 → LangChain 的 create_agent 是最小 Harness → DeepAgents 是全配 Harness。

3.5 OpenAI Agents SDK(26K ⭐)

GitHub: openai/openai-agents-python

OpenAI 官方的轻量级 Agent 框架:

  • Agent、Handoff、Guardrails、Tracing、Sessions
  • Sandbox Agent(0.14.0 新增):Agent 在容器中操作真实文件系统
  • Human-in-the-loop 机制
  • Realtime Agent 支持(语音)
  • Provider-agnostic,支持 100+ LLM

3.6 OpenHarness — 学术界的开源 Harness(13K ⭐)

GitHub: HKUDS/OpenHarness

香港大学出品,定位为轻量级 Agent 基础设施

  • 43 个工具(文件、Shell、搜索、Web、MCP)
  • 按需 Skill 加载、插件生态
  • CLAUDE.md 发现与注入、上下文自动压缩
  • 多级权限模式、路径级命令规则
  • Swarm 多 Agent 协调

OpenHarness 的特别之处在于它同时提供了 ohmo——一个运行在 Harness 之上的个人 AI 助手,支持飞书/Slack/Telegram/Discord,可以自主 fork 分支、写代码、跑测试、提 PR。

3.7 OpenClaw — 个人 AI 助手的 Harness 范式(374K ⭐)

GitHub: openclaw/openclaw

OpenClaw 是全 GitHub Star 数最高的 Agent 项目,定位为「你自己的个人 AI 助手」。它由 Peter Steinberger 等社区开发者维护,TypeScript 编写,赞助商包括 OpenAI、GitHub、NVIDIA、Vercel。

它的核心理念与 Agent Harness 的定义高度吻合:

  • Gateway 控制平面:单一进程管理会话、渠道、工具和事件——这就是 Harness 中「调度核心」的角色
  • 多渠道路由:WhatsApp、Telegram、Slack、Discord、Signal、iMessage、WeChat、QQ 等 20+ 渠道——Harness 的「感知层」和「行动层」合二为一
  • Multi-Agent 路由:将不同渠道/账户路由到隔离的 Agent 实例(独立工作区 + 独立会话)
  • 沙箱机制:非主会话自动运行在 Docker/SSH 沙箱中,可配置工具白名单——标准的 Harness 安全边界
  • Skill 系统:内置 + 社区 Skill,通过 ClawHub 分发——Harness 的「可复用知识模块」
  • Cron 调度:自然语言定时任务,自动分发到连接平台——Harness 的「自动化层」
  • Voice Wake + Talk Mode:语音唤醒和连续对话——Harness 的「多模态感知」
  • Live Canvas:Agent 驱动的可视化工作区——Harness 的「行动界面」

OpenClaw 的架构完美诠释了 Harness 公式:

OpenClaw Harness = 
    Gateway (调度核心)
    + Channels (感知 + 行动)
    + Agents (智能调度)
    + Sandbox (安全边界)
    + Skills (可复用知识)
    + Cron (自动化)
    + Memory (持久记忆)

3.8 Hermes Agent — 自我进化的 Agent Harness(167K ⭐)

GitHub: NousResearch/hermes-agent

Hermes Agent 由 Nous Research 构建,是全 GitHub Star 数第二的 Agent 项目。它的独特性在于内置学习闭环——这是 Harness 范式的一次激进推进:

“The agent that grows with you.”

与 Harness 模式的对照:

  • Agent LoopPrompt Builder → Provider Runtime → Tool Dispatch 的标准循环,支持流式工具调用、并行工具执行、Token 计数和成本追踪
  • Tools 系统:40+ 工具,支持 toolset 分组、37 个实时工具、MCP 协议——Harness 的「双手」
  • Skill 系统:Agent 在完成复杂任务后自动创建 Skill;Skill 在使用中自我改进;兼容 agentskills.io 开放标准——这超越了「静态知识注入」,实现了 Harness 知识的自我生长
  • Memory 系统:持久记忆(MEMORY.md)+ 用户画像(USER.md)+ Honcho 辩证用户建模 + FTS5 全文搜索——Harness 的「记忆层」被推到了新高度
  • Context Engineering:AGENTS.md 发现与注入、自动压缩、会话搜索——标准的 Harness 上下文管理
  • Gateway:Telegram、Discord、Slack、WhatsApp、Signal、WeChat、QQ——Harness 的「感知/行动层」
  • Cron 调度:内置定时任务,自然语言配置——Harness 的「自动化层」
  • Delegation:子 Agent 并行工作流 + Python 脚本 RPC 调用——Harness 的「分布式协调」
  • Security:命令审批、DM 配对、容器隔离、沙箱模式——Harness 的「安全边界」
  • Terminal Backends:本地、Docker、SSH、Singularity、Modal、Daytona、Vercel Sandbox——七种执行后端,Harness 的「运行环境抽象」
  • Trajectory:批量轨迹生成、轨迹压缩——Harness 的「数据引擎」,为训练下一代工具调用模型提供原料

Hermes Agent 与 OpenClaw 的特殊关系:Hermes Agent 内置了从 OpenClaw 迁移的工具(hermes claw migrate),可以自动导入 OpenClaw 的人格文件、记忆、Skill、API 密钥和渠道配置。这说明两个项目共享同一套 Harness 接口标准,它们不是竞争关系,而是同一范式下的不同演进分支。

3.9 从 ECC、OpenClaw 到 Hermes:同一张 Harness 蓝图

当你把 ECC、OpenClaw、Hermes Agent、DeerFlow、DeepAgents 放在一起审视,你会发现一个惊人的事实:它们的核心架构是同一张蓝图的不同着色。

Harness 组件 ECC OpenClaw Hermes Agent DeerFlow DeepAgents
Agent Loop 跨 Harness 适配 Gateway Agent Prompt Builder → Provider → Tool Dispatch LangGraph 驱动 LangGraph 驱动
Tools 61 Agent + Hook Browser/Canvas/Nodes 40+ Tools + MCP InfoQuest + MCP FileSystem + Shell
Skills 246 Skills ClawHub 自创建 + 自改进 + agentskills.io 可扩展 Skill 可复用行为模块
Memory 记忆持久化 + 持续学习 Session Store MEMORY.md + Honcho + FTS5 长期记忆 持久 State Store
Context 上下文压缩 + 知识注入 多 Agent 隔离 AGENTS.md + 压缩 + 搜索 Context Engineering 上下文管理 + 文件卸载
Sub-Agent 子 Agent 编排 Multi-Agent 路由 Delegate + Parallel Sub-Agent 编排 Sub-Agent 隔离
Sandbox AgentShield Docker/SSH 沙箱 7 种 Terminal Backend Sandbox Mode 可插拔后端
Automation Hooks + PM2 Cron + Webhooks Cron 调度
Channels 跨 Harness 适配 20+ 平台 多 IM Gateway 多 IM 渠道
Learning 持续学习 + 本能 内置学习闭环
Trajectory 批量轨迹 + 压缩 LangSmith 追踪

这张表说明了一件事:Agent Harness 不是某个具体项目的名称,而是一套已经收敛的架构模式。 不同项目在相同的骨架上做出不同的设计选择——ECC 强调安全与优化,OpenClaw 强调个人助手体验,Hermes Agent 强调自我进化——但它们的骨架是同一张蓝图。

3.10 其他值得关注的项目

项目 Stars 一句话描述
oh-my-openagent 59K 「最好的 Agent Harness」
CowAgent 45K 多模型、多渠道的开源超级助手
Trellis 8.4K 另一个「最好的 Agent Harness」
hive 10K 面向生产的 Multi-Agent Harness
jcode 6.5K 专为编码场景设计的 Agent Harness
Yuxi 5.3K 结合知识图谱的多租户 Agent Harness 平台

💡 生态观察:OpenClaw 和 Hermes Agent 已经形成了庞大的周边生态——cc-switch(80K⭐ 跨平台桌面助手)、claude-mem(78K⭐ 跨会话持久上下文)、AionUi(26K⭐ 24/7 Cowork 应用)、clawpanelOpenClaw-Adminagent-sessions 等工具让这两个 Harness 的使用体验远超独立项目。这印证了一个规律:好的 Harness 会催生生态,生态反过来验证 Harness 的设计正确性。


四、Agent Harness vs 传统 Agent 框架:本质区别

理解 Agent Harness 的最佳方式,是对比它与传统「Agent 框架」的本质区别:

维度 传统 Agent 框架 Agent Harness
核心理念 通过代码编排实现「智能」 模型自带智能,Harness 提供运行环境
智能来源 代码逻辑(if-else、流程控制) 模型训练(权重、梯度)
设计哲学 Top-down:预先定义工作流 Bottom-up:提供能力,让模型自主决策
架构重心 流程编排、节点图、DAG 工具、知识、感知、权限
灵活性 受限于预设流程 模型根据当前上下文动态决策
典型案例 LangChain Chain、Flowise、Dify 工作流 ECC、OpenClaw、Hermes Agent、DeerFlow、DeepAgents
适用场景 确定性、可预测的任务 开放式、探索性、长周期任务

4.1 一个具象的类比

想象你在训练一个实习生:

  • 传统框架的做法:给实习生一本厚厚的 SOP 手册,告诉他「遇到情况 A 执行步骤 1-2-3,遇到情况 B 执行步骤 4-5-6」。
  • Harness 的做法:教会实习生使用电脑、给他相关文档和代码库权限、告诉他什么操作需要审批——然后信任他的判断力

前者是「编排」,后者是「赋能」。


五、Agent Harness 的核心架构模式

虽然各个 Harness 项目实现不同,但它们共享一套核心架构模式:

5.1 Agent Loop(代理循环)

┌─────────────────────────────────────────────────┐
│                  Agent Loop                       │
│                                                   │
│   User Input → Model Reasoning → Tool Calls       │
│        ↑                              ↓           │
│        └── Observation/Tool Results ←─┘           │
│                                                   │
│   (repeat until task complete or stop condition)  │
└─────────────────────────────────────────────────┘

这是所有 Agent Harness 的心脏——模型接收任务、推理、调用工具、观察结果、继续推理,直到完成。

5.2 Sub-Agent 隔离

长周期任务会产生大量上下文。Harness 通过子 Agent 机制解决这个问题:

  • 主 Agent 将子任务委派给拥有隔离上下文窗口的子 Agent
  • 子 Agent 完成后只返回摘要结果
  • 主 Agent 保持上下文清洁,不会被中间细节淹没

5.3 Context Engineering(上下文工程)

这是 Harness 工程中最被低估的技能:

  • 上下文压缩:自动摘要长对话历史
  • 文件卸载:将大量工具输出写入文件,只保留引用
  • 知识注入:CLAUDE.md / AGENTS.md 的发现与注入机制
  • 记忆持久化:跨会话的 MEMORY.md 持久记忆

5.4 Skill 系统

Skill 是可复用的行为模块,Agent 按需加载:

  • 声明式定义(通常是 Markdown 文件)
  • 按需加载(不占用常驻上下文)
  • 可组合(多个 Skill 协同工作)
  • 社区生态(分享和复用)

5.5 安全边界

Harness 必须在能力和安全之间取得平衡:

  • 沙箱隔离:Agent 在受限环境中运行
  • 权限分级:读/写/执行/网络 分级控制
  • 审批机制:Human-in-the-loop 对关键操作进行审批
  • Pre/Post Hook:工具调用前后的检查与审计

六、为什么 2026 年是 Agent Harness 的爆发年?

6.1 模型能力已过临界点

GPT-5、Claude Sonnet 4.6、Gemini 3、DeepSeek v3.2、Kimi 2.5……这些模型在做复杂任务时已经具备了足够强的推理和规划能力。模型不再是瓶颈,瓶颈在于如何为模型提供合适的运行环境。

6.2 「Agent 框架」的幻灭

过去两年,大量「Agent 框架」试图通过代码编排来「制造智能」。结果呢?脆弱的流程链、高昂的维护成本、无法应对开放式任务。人们开始意识到:你需要的是一个 Harness,不是一个工作流引擎。

6.3 Claude Code 的启发

Claude Code 是目前最成功的 AI 编程 Agent 之一。人们开始深入研究它的架构——不是因为它的模型特别强(当然模型也很强),而是因为它的 Harness 设计:工具设计、上下文管理、CLAUDE.md 知识注入、权限控制。这直接催生了 learn-claude-code 这样的 Harness 工程教材。

6.4 开源社区的共识

当 OpenClaw 被数万个项目引用为 Agent 运行时,当 Hermes Agent 自称 “The agent that grows with you”,当 DeepAgents 自称 “The batteries-included agent harness”,当 ECC 被描述为 “The harness-native operator system for agentic work”,当 DeerFlow 定位为 “Super Agent Harness”——你会发现,这不是偶然的用词选择,而是一个行业共识的形成


七、Agent Harness 的未来

7.1 Harness 即操作系统

ECC v2.0 已经引入了 Rust 控制平面、「操作员」工作流、状态快照等概念。这暗示了 Agent Harness 的终极形态:Agent 的操作系统

就像 Linux 管理进程、内存、文件系统、网络一样,Agent Harness 管理 Agent 的工具、知识、上下文、权限、子 Agent 编排。

7.2 从单 Agent 到 Multi-Agent Swarm

当前大多数 Harness 以单 Agent 为主,子 Agent 机制是初步的分布式尝试。未来方向是 Agent Swarm——多个 Agent 在统一 Harness 下协调工作,无需人类逐步指导。

7.3 Harness 的标准化

不同的 Harness 项目(ECC、OpenClaw、Hermes Agent、DeerFlow、OpenHarness、DeepAgents)目前各有自己的 Skill 格式、Hook 机制、配置方式。但 OpenClaw 和 Hermes Agent 之间的互迁移(hermes claw migrate)已经展示了互操作的可能性。未来可能出现类似容器标准化的 Harness 互操作标准。

7.4 轨迹数据闭环

Harness 工程师做的不只是让 Agent 跑起来,而是收集 Agent 在真实环境中的运行轨迹。这些轨迹数据是微调下一代 Agent 模型的黄金原料。Harness 将不仅是 Agent 的运行环境,更是 Agent 进化的数据引擎。


八、写在最后

Agent Harness 这个概念之所以重要,不是因为又一个新名词诞生了,而是因为它重新校准了我们对 AI Agent 的理解

智能无法被代码编排出来。它来自模型训练。我们所能做的最好的事,不是试图用代码「制造」智能,而是构建一个足够好的环境,让智能得以发挥。

这就是 Agent Harness 的意义。

它不是一个框架,不是一个库,不是一个工作流引擎。它是一个范式——从「编排出智能」到「为智能提供环境」。

作为开发者,你的角色不是写越来越复杂的 if-else 分支来控制模型行为。你是 Harness 工程师——你给模型双手、双眼、记忆和安全边界,然后信任它。


参考资源

项目/资源 链接
OpenClaw https://github.com/openclaw/openclaw
Hermes Agent https://github.com/NousResearch/hermes-agent
ECC https://github.com/affaan-m/ECC
DeerFlow https://github.com/bytedance/deer-flow
learn-claude-code https://github.com/shareAI-lab/learn-claude-code
DeepAgents https://github.com/langchain-ai/deepagents
OpenAI Agents SDK https://github.com/openai/openai-agents-python
OpenHarness https://github.com/HKUDS/OpenHarness
oh-my-openagent https://github.com/code-yeongyu/oh-my-openagent
CowAgent https://github.com/zhayujie/CowAgent
Trellis https://github.com/mindfold-ai/Trellis
《御舆:解码 Agent Harness》 https://github.com/lintsinghua/claude-code-book

本文写于 2026 年 5 月。Agent Harness 生态正在以周为单位快速演进,建议持续关注上述项目的更新。