Agent Harness:AI Agent 基础设施的新范式
2026 年,GitHub 上一类新型项目正在爆发——它们不叫「Agent 框架」,而叫「Agent Harness」。这个词背后,是一场关于 AI Agent 认知范式的深刻转变。
一、什么是 Agent?
如果你在过去两年关注 AI 领域,一定对「Agent」这个词不陌生。但先停一下——当我们说「Agent」的时候,到底在说什么?
1.1 智能体(Agency)从何而来?
答案可能颠覆直觉:智能体的行动能力(Agency)来自模型训练,而不是外部代码编排。
回顾 AI 历史上的里程碑:
- 2013 年,DeepMind 的 DQN 仅接收原始像素和分数信号,在 7 款 Atari 游戏中超越了人类专家——没有游戏规则硬编码,一个神经网络从经验中学习。
- 2019 年,OpenAI Five 通过 45,000 年的自我对弈训练,在 Dota 2 中击败了 TI8 世界冠军 OG——五个神经网络学会了团队协作,没有脚本策略。
- 2019 年,DeepMind AlphaStar 在《星际争霸 II》中达到宗师段位(前 0.15%)——不完全信息、实时决策、组合动作空间远超围棋。
- 2024-2025 年,LLM Agent 重塑软件工程——Claude、GPT、Gemini 阅读代码库、编写实现、调试错误、团队协作。
每一个里程碑都指向同一个事实:智能 = 训练出来的,不是代码堆出来的。
1.2 「Agent 框架」的迷思
但市面上充斥着一种东西:拖拽式工作流构建器、无代码「AI Agent」平台、Prompt 链编排库。它们的共同幻觉是:把 LLM API 调用用 if-else 分支、节点图、硬编码路由逻辑串起来,就叫做「构建 Agent」。
这不是 Agent。这是披着 AI 外衣的 shell 脚本。你无法通过堆积过程式逻辑(庞大的规则树、节点图、链式 Prompt 瀑布)来「暴力制造」智能。智能是学出来的,不是写出来的。
二、Agent Harness:从造大脑到造身体
2.1 范式转变
当有人说「我在构建 Agent」,实际上只能指两件事之一:
- 训练模型——通过强化学习、微调、RLHF 等方法调整模型权重,塑造其行为。这是 DeepMind、OpenAI、Anthropic 做的事。
- 构建 Harness——编写代码,为模型提供可操作的运行环境。这才是我们大多数人在做的事。
这是一个根本性的范式转变:
模型是驾驶员,Harness 是车辆。模型提供智能,Harness 提供手、眼、记忆和安全边界。
2.2 Harness 的定义
那么,Agent Harness 到底是什么?
Agent Harness 是包裹在大语言模型周围的一整套基础设施,使它从一个只会输出文本的模型,变成一个能够在特定环境中感知、推理、行动的完整 Agent。
用公式表达:
Harness = Tools + Knowledge + Observation + Action + Permissions
| 组件 | 说明 | 示例 |
|---|---|---|
| Tools(工具) | 给 Agent 双手 | 文件读写、Shell 执行、API 调用、浏览器控制 |
| Knowledge(知识) | 给 Agent 领域专长 | 产品文档、API 规范、代码风格指南、架构决策记录 |
| Observation(感知) | 给 Agent 眼睛 | git diff、错误日志、浏览器状态、传感器数据 |
| Action(行动) | 给 Agent 触达世界的能力 | CLI 命令、API 调用、UI 交互 |
| Permissions(权限) | 给 Agent 安全边界 | 沙箱隔离、审批工作流、信任边界 |
2.3 Harness 工程师到底在做什么?
如果你在阅读这篇文章,你很可能就是一位 Harness 工程师。以下是这个角色真正在做的事:
- 实现工具——给 Agent 双手。每个工具是 Agent 在其环境中可以执行的一个原子操作。
- 管理知识——给 Agent 领域专长。按需加载,而非一股脑塞进上下文。
- 管理上下文——给 Agent 干净的「工作记忆」。子 Agent 隔离防止噪声泄漏,上下文压缩防止历史淹没当下。
- 控制权限——给 Agent 安全边界。沙箱化文件访问,对破坏性操作要求审批。
- 收集轨迹数据——Agent 在 Harness 中执行的每一个动作序列都是训练信号。真实的部署轨迹是微调下一代 Agent 模型的原始材料。
三、2026 年 Agent Harness 生态全景
2026 年,Agent Harness 已经从概念变成了一个蓬勃发展的开源生态。以下是目前最值得关注的几个项目:
3.1 ECC — 王者级项目(192K ⭐)
GitHub: affaan-m/ECC
ECC 是目前 GitHub 上最大的 Agent Harness 项目,从 Anthropic 黑客松获奖作品演化而来。它不仅仅是一套配置——而是一个完整的系统:
- 61 个 Agent + 246 个 Skill + 76 个 Command Shim
- 跨 Harness 适配:Claude Code、Codex、Cursor、OpenCode、Gemini、GitHub Copilot
- 内置 AgentShield 安全扫描、记忆持久化、持续学习
- 支持 12+ 编程语言生态
- v2.0 已引入 Rust 控制平面、Tkinter 桌面 GUI
ECC 代表了「Harness 即操作系统」的愿景——Agent 在上面运行,Harness 提供所有底层能力。
3.2 DeerFlow — 字节跳动的超级 Agent Harness(69K ⭐)
GitHub: bytedance/deer-flow
DeerFlow 从「深度研究」(Deep Research)框架演进为超级 Agent Harness:
- 子 Agent 编排 + 沙箱 + 记忆 + 可扩展 Skill
- 支持 Docker 部署、MCP Server、多 IM 渠道(飞书/Slack/Telegram/Discord)
- 推荐使用 Doubao-Seed-2.0-Code、DeepSeek v3.2、Kimi 2.5 运行
- 内置 InfoQuest 智能搜索与爬虫工具集
- 2.0 版本是完全重写,不与 1.x 共享任何代码
3.3 learn-claude-code — Harness 工程教材(62K ⭐)
GitHub: shareAI-lab/learn-claude-code
“Bash is all you need.”
这不是一个拿来就用的框架,而是一本从 0 到 1 教你构建 Agent Harness 的教科书。核心理念:
- Agency 来自模型,Agent 产品 = 模型 + Harness
- 彻底批判「Prompt 管道」式的伪 Agent 构建方式
- 教授 Harness 工程师真正该做的事:实现工具、管理知识、管理上下文、控制权限、收集轨迹数据
3.4 DeepAgents — LangChain 的「电池全配」Harness(23K ⭐)
GitHub: langchain-ai/deepagents
LangChain 团队出品,定位为开箱即用的 Agent Harness:
- 基于 LangGraph(流式输出、持久化、检查点)
- 内置子 Agent、文件系统、上下文管理、Shell 访问、持久记忆
- Human-in-the-loop 审批机制
- 模型无关,支持任何支持 tool calling 的 LLM
- 提供 Python 和 TypeScript 双版本
LangChain 的定位很清晰:LangGraph 是图运行时 → LangChain 的 create_agent 是最小 Harness → DeepAgents 是全配 Harness。
3.5 OpenAI Agents SDK(26K ⭐)
GitHub: openai/openai-agents-python
OpenAI 官方的轻量级 Agent 框架:
- Agent、Handoff、Guardrails、Tracing、Sessions
- Sandbox Agent(0.14.0 新增):Agent 在容器中操作真实文件系统
- Human-in-the-loop 机制
- Realtime Agent 支持(语音)
- Provider-agnostic,支持 100+ LLM
3.6 OpenHarness — 学术界的开源 Harness(13K ⭐)
GitHub: HKUDS/OpenHarness
香港大学出品,定位为轻量级 Agent 基础设施:
- 43 个工具(文件、Shell、搜索、Web、MCP)
- 按需 Skill 加载、插件生态
- CLAUDE.md 发现与注入、上下文自动压缩
- 多级权限模式、路径级命令规则
- Swarm 多 Agent 协调
OpenHarness 的特别之处在于它同时提供了 ohmo——一个运行在 Harness 之上的个人 AI 助手,支持飞书/Slack/Telegram/Discord,可以自主 fork 分支、写代码、跑测试、提 PR。
3.7 OpenClaw — 个人 AI 助手的 Harness 范式(374K ⭐)
GitHub: openclaw/openclaw
OpenClaw 是全 GitHub Star 数最高的 Agent 项目,定位为「你自己的个人 AI 助手」。它由 Peter Steinberger 等社区开发者维护,TypeScript 编写,赞助商包括 OpenAI、GitHub、NVIDIA、Vercel。
它的核心理念与 Agent Harness 的定义高度吻合:
- Gateway 控制平面:单一进程管理会话、渠道、工具和事件——这就是 Harness 中「调度核心」的角色
- 多渠道路由:WhatsApp、Telegram、Slack、Discord、Signal、iMessage、WeChat、QQ 等 20+ 渠道——Harness 的「感知层」和「行动层」合二为一
- Multi-Agent 路由:将不同渠道/账户路由到隔离的 Agent 实例(独立工作区 + 独立会话)
- 沙箱机制:非主会话自动运行在 Docker/SSH 沙箱中,可配置工具白名单——标准的 Harness 安全边界
- Skill 系统:内置 + 社区 Skill,通过 ClawHub 分发——Harness 的「可复用知识模块」
- Cron 调度:自然语言定时任务,自动分发到连接平台——Harness 的「自动化层」
- Voice Wake + Talk Mode:语音唤醒和连续对话——Harness 的「多模态感知」
- Live Canvas:Agent 驱动的可视化工作区——Harness 的「行动界面」
OpenClaw 的架构完美诠释了 Harness 公式:
OpenClaw Harness =
Gateway (调度核心)
+ Channels (感知 + 行动)
+ Agents (智能调度)
+ Sandbox (安全边界)
+ Skills (可复用知识)
+ Cron (自动化)
+ Memory (持久记忆)
3.8 Hermes Agent — 自我进化的 Agent Harness(167K ⭐)
GitHub: NousResearch/hermes-agent
Hermes Agent 由 Nous Research 构建,是全 GitHub Star 数第二的 Agent 项目。它的独特性在于内置学习闭环——这是 Harness 范式的一次激进推进:
“The agent that grows with you.”
与 Harness 模式的对照:
- Agent Loop:
Prompt Builder → Provider Runtime → Tool Dispatch的标准循环,支持流式工具调用、并行工具执行、Token 计数和成本追踪 - Tools 系统:40+ 工具,支持 toolset 分组、37 个实时工具、MCP 协议——Harness 的「双手」
- Skill 系统:Agent 在完成复杂任务后自动创建 Skill;Skill 在使用中自我改进;兼容 agentskills.io 开放标准——这超越了「静态知识注入」,实现了 Harness 知识的自我生长
- Memory 系统:持久记忆(MEMORY.md)+ 用户画像(USER.md)+ Honcho 辩证用户建模 + FTS5 全文搜索——Harness 的「记忆层」被推到了新高度
- Context Engineering:AGENTS.md 发现与注入、自动压缩、会话搜索——标准的 Harness 上下文管理
- Gateway:Telegram、Discord、Slack、WhatsApp、Signal、WeChat、QQ——Harness 的「感知/行动层」
- Cron 调度:内置定时任务,自然语言配置——Harness 的「自动化层」
- Delegation:子 Agent 并行工作流 + Python 脚本 RPC 调用——Harness 的「分布式协调」
- Security:命令审批、DM 配对、容器隔离、沙箱模式——Harness 的「安全边界」
- Terminal Backends:本地、Docker、SSH、Singularity、Modal、Daytona、Vercel Sandbox——七种执行后端,Harness 的「运行环境抽象」
- Trajectory:批量轨迹生成、轨迹压缩——Harness 的「数据引擎」,为训练下一代工具调用模型提供原料
Hermes Agent 与 OpenClaw 的特殊关系:Hermes Agent 内置了从 OpenClaw 迁移的工具(hermes claw migrate),可以自动导入 OpenClaw 的人格文件、记忆、Skill、API 密钥和渠道配置。这说明两个项目共享同一套 Harness 接口标准,它们不是竞争关系,而是同一范式下的不同演进分支。
3.9 从 ECC、OpenClaw 到 Hermes:同一张 Harness 蓝图
当你把 ECC、OpenClaw、Hermes Agent、DeerFlow、DeepAgents 放在一起审视,你会发现一个惊人的事实:它们的核心架构是同一张蓝图的不同着色。
| Harness 组件 | ECC | OpenClaw | Hermes Agent | DeerFlow | DeepAgents |
|---|---|---|---|---|---|
| Agent Loop | 跨 Harness 适配 | Gateway Agent | Prompt Builder → Provider → Tool Dispatch | LangGraph 驱动 | LangGraph 驱动 |
| Tools | 61 Agent + Hook | Browser/Canvas/Nodes | 40+ Tools + MCP | InfoQuest + MCP | FileSystem + Shell |
| Skills | 246 Skills | ClawHub | 自创建 + 自改进 + agentskills.io | 可扩展 Skill | 可复用行为模块 |
| Memory | 记忆持久化 + 持续学习 | Session Store | MEMORY.md + Honcho + FTS5 | 长期记忆 | 持久 State Store |
| Context | 上下文压缩 + 知识注入 | 多 Agent 隔离 | AGENTS.md + 压缩 + 搜索 | Context Engineering | 上下文管理 + 文件卸载 |
| Sub-Agent | 子 Agent 编排 | Multi-Agent 路由 | Delegate + Parallel | Sub-Agent 编排 | Sub-Agent 隔离 |
| Sandbox | AgentShield | Docker/SSH 沙箱 | 7 种 Terminal Backend | Sandbox Mode | 可插拔后端 |
| Automation | Hooks + PM2 | Cron + Webhooks | Cron 调度 | — | — |
| Channels | 跨 Harness 适配 | 20+ 平台 | 多 IM Gateway | 多 IM 渠道 | — |
| Learning | 持续学习 + 本能 | — | 内置学习闭环 | — | — |
| Trajectory | — | — | 批量轨迹 + 压缩 | — | LangSmith 追踪 |
这张表说明了一件事:Agent Harness 不是某个具体项目的名称,而是一套已经收敛的架构模式。 不同项目在相同的骨架上做出不同的设计选择——ECC 强调安全与优化,OpenClaw 强调个人助手体验,Hermes Agent 强调自我进化——但它们的骨架是同一张蓝图。
3.10 其他值得关注的项目
| 项目 | Stars | 一句话描述 |
|---|---|---|
| oh-my-openagent | 59K | 「最好的 Agent Harness」 |
| CowAgent | 45K | 多模型、多渠道的开源超级助手 |
| Trellis | 8.4K | 另一个「最好的 Agent Harness」 |
| hive | 10K | 面向生产的 Multi-Agent Harness |
| jcode | 6.5K | 专为编码场景设计的 Agent Harness |
| Yuxi | 5.3K | 结合知识图谱的多租户 Agent Harness 平台 |
💡 生态观察:OpenClaw 和 Hermes Agent 已经形成了庞大的周边生态——cc-switch(80K⭐ 跨平台桌面助手)、claude-mem(78K⭐ 跨会话持久上下文)、AionUi(26K⭐ 24/7 Cowork 应用)、clawpanel、OpenClaw-Admin、agent-sessions 等工具让这两个 Harness 的使用体验远超独立项目。这印证了一个规律:好的 Harness 会催生生态,生态反过来验证 Harness 的设计正确性。
四、Agent Harness vs 传统 Agent 框架:本质区别
理解 Agent Harness 的最佳方式,是对比它与传统「Agent 框架」的本质区别:
| 维度 | 传统 Agent 框架 | Agent Harness |
|---|---|---|
| 核心理念 | 通过代码编排实现「智能」 | 模型自带智能,Harness 提供运行环境 |
| 智能来源 | 代码逻辑(if-else、流程控制) | 模型训练(权重、梯度) |
| 设计哲学 | Top-down:预先定义工作流 | Bottom-up:提供能力,让模型自主决策 |
| 架构重心 | 流程编排、节点图、DAG | 工具、知识、感知、权限 |
| 灵活性 | 受限于预设流程 | 模型根据当前上下文动态决策 |
| 典型案例 | LangChain Chain、Flowise、Dify 工作流 | ECC、OpenClaw、Hermes Agent、DeerFlow、DeepAgents |
| 适用场景 | 确定性、可预测的任务 | 开放式、探索性、长周期任务 |
4.1 一个具象的类比
想象你在训练一个实习生:
- 传统框架的做法:给实习生一本厚厚的 SOP 手册,告诉他「遇到情况 A 执行步骤 1-2-3,遇到情况 B 执行步骤 4-5-6」。
- Harness 的做法:教会实习生使用电脑、给他相关文档和代码库权限、告诉他什么操作需要审批——然后信任他的判断力。
前者是「编排」,后者是「赋能」。
五、Agent Harness 的核心架构模式
虽然各个 Harness 项目实现不同,但它们共享一套核心架构模式:
5.1 Agent Loop(代理循环)
┌─────────────────────────────────────────────────┐
│ Agent Loop │
│ │
│ User Input → Model Reasoning → Tool Calls │
│ ↑ ↓ │
│ └── Observation/Tool Results ←─┘ │
│ │
│ (repeat until task complete or stop condition) │
└─────────────────────────────────────────────────┘
这是所有 Agent Harness 的心脏——模型接收任务、推理、调用工具、观察结果、继续推理,直到完成。
5.2 Sub-Agent 隔离
长周期任务会产生大量上下文。Harness 通过子 Agent 机制解决这个问题:
- 主 Agent 将子任务委派给拥有隔离上下文窗口的子 Agent
- 子 Agent 完成后只返回摘要结果
- 主 Agent 保持上下文清洁,不会被中间细节淹没
5.3 Context Engineering(上下文工程)
这是 Harness 工程中最被低估的技能:
- 上下文压缩:自动摘要长对话历史
- 文件卸载:将大量工具输出写入文件,只保留引用
- 知识注入:CLAUDE.md / AGENTS.md 的发现与注入机制
- 记忆持久化:跨会话的 MEMORY.md 持久记忆
5.4 Skill 系统
Skill 是可复用的行为模块,Agent 按需加载:
- 声明式定义(通常是 Markdown 文件)
- 按需加载(不占用常驻上下文)
- 可组合(多个 Skill 协同工作)
- 社区生态(分享和复用)
5.5 安全边界
Harness 必须在能力和安全之间取得平衡:
- 沙箱隔离:Agent 在受限环境中运行
- 权限分级:读/写/执行/网络 分级控制
- 审批机制:Human-in-the-loop 对关键操作进行审批
- Pre/Post Hook:工具调用前后的检查与审计
六、为什么 2026 年是 Agent Harness 的爆发年?
6.1 模型能力已过临界点
GPT-5、Claude Sonnet 4.6、Gemini 3、DeepSeek v3.2、Kimi 2.5……这些模型在做复杂任务时已经具备了足够强的推理和规划能力。模型不再是瓶颈,瓶颈在于如何为模型提供合适的运行环境。
6.2 「Agent 框架」的幻灭
过去两年,大量「Agent 框架」试图通过代码编排来「制造智能」。结果呢?脆弱的流程链、高昂的维护成本、无法应对开放式任务。人们开始意识到:你需要的是一个 Harness,不是一个工作流引擎。
6.3 Claude Code 的启发
Claude Code 是目前最成功的 AI 编程 Agent 之一。人们开始深入研究它的架构——不是因为它的模型特别强(当然模型也很强),而是因为它的 Harness 设计:工具设计、上下文管理、CLAUDE.md 知识注入、权限控制。这直接催生了 learn-claude-code 这样的 Harness 工程教材。
6.4 开源社区的共识
当 OpenClaw 被数万个项目引用为 Agent 运行时,当 Hermes Agent 自称 “The agent that grows with you”,当 DeepAgents 自称 “The batteries-included agent harness”,当 ECC 被描述为 “The harness-native operator system for agentic work”,当 DeerFlow 定位为 “Super Agent Harness”——你会发现,这不是偶然的用词选择,而是一个行业共识的形成。
七、Agent Harness 的未来
7.1 Harness 即操作系统
ECC v2.0 已经引入了 Rust 控制平面、「操作员」工作流、状态快照等概念。这暗示了 Agent Harness 的终极形态:Agent 的操作系统。
就像 Linux 管理进程、内存、文件系统、网络一样,Agent Harness 管理 Agent 的工具、知识、上下文、权限、子 Agent 编排。
7.2 从单 Agent 到 Multi-Agent Swarm
当前大多数 Harness 以单 Agent 为主,子 Agent 机制是初步的分布式尝试。未来方向是 Agent Swarm——多个 Agent 在统一 Harness 下协调工作,无需人类逐步指导。
7.3 Harness 的标准化
不同的 Harness 项目(ECC、OpenClaw、Hermes Agent、DeerFlow、OpenHarness、DeepAgents)目前各有自己的 Skill 格式、Hook 机制、配置方式。但 OpenClaw 和 Hermes Agent 之间的互迁移(hermes claw migrate)已经展示了互操作的可能性。未来可能出现类似容器标准化的 Harness 互操作标准。
7.4 轨迹数据闭环
Harness 工程师做的不只是让 Agent 跑起来,而是收集 Agent 在真实环境中的运行轨迹。这些轨迹数据是微调下一代 Agent 模型的黄金原料。Harness 将不仅是 Agent 的运行环境,更是 Agent 进化的数据引擎。
八、写在最后
Agent Harness 这个概念之所以重要,不是因为又一个新名词诞生了,而是因为它重新校准了我们对 AI Agent 的理解:
智能无法被代码编排出来。它来自模型训练。我们所能做的最好的事,不是试图用代码「制造」智能,而是构建一个足够好的环境,让智能得以发挥。
这就是 Agent Harness 的意义。
它不是一个框架,不是一个库,不是一个工作流引擎。它是一个范式——从「编排出智能」到「为智能提供环境」。
作为开发者,你的角色不是写越来越复杂的 if-else 分支来控制模型行为。你是 Harness 工程师——你给模型双手、双眼、记忆和安全边界,然后信任它。
参考资源
| 项目/资源 | 链接 |
|---|---|
| OpenClaw | https://github.com/openclaw/openclaw |
| Hermes Agent | https://github.com/NousResearch/hermes-agent |
| ECC | https://github.com/affaan-m/ECC |
| DeerFlow | https://github.com/bytedance/deer-flow |
| learn-claude-code | https://github.com/shareAI-lab/learn-claude-code |
| DeepAgents | https://github.com/langchain-ai/deepagents |
| OpenAI Agents SDK | https://github.com/openai/openai-agents-python |
| OpenHarness | https://github.com/HKUDS/OpenHarness |
| oh-my-openagent | https://github.com/code-yeongyu/oh-my-openagent |
| CowAgent | https://github.com/zhayujie/CowAgent |
| Trellis | https://github.com/mindfold-ai/Trellis |
| 《御舆:解码 Agent Harness》 | https://github.com/lintsinghua/claude-code-book |
本文写于 2026 年 5 月。Agent Harness 生态正在以周为单位快速演进,建议持续关注上述项目的更新。
