Agent Harness：AI Agent 基础设施的新范式

2026 年，GitHub 上一类新型项目正在爆发——它们不叫「Agent 框架」，而叫「Agent Harness」。这个词背后，是一场关于 AI Agent 认知范式的深刻转变。

一、什么是 Agent？

如果你在过去两年关注 AI 领域，一定对「Agent」这个词不陌生。但先停一下——当我们说「Agent」的时候，到底在说什么？

1.1 智能体（Agency）从何而来？

答案可能颠覆直觉：智能体的行动能力（Agency）来自模型训练，而不是外部代码编排。

回顾 AI 历史上的里程碑：

2013 年，DeepMind 的 DQN 仅接收原始像素和分数信号，在 7 款 Atari 游戏中超越了人类专家——没有游戏规则硬编码，一个神经网络从经验中学习。
2019 年，OpenAI Five 通过 45,000 年的自我对弈训练，在 Dota 2 中击败了 TI8 世界冠军 OG——五个神经网络学会了团队协作，没有脚本策略。
2019 年，DeepMind AlphaStar 在《星际争霸 II》中达到宗师段位（前 0.15%）——不完全信息、实时决策、组合动作空间远超围棋。
2024-2025 年，LLM Agent 重塑软件工程——Claude、GPT、Gemini 阅读代码库、编写实现、调试错误、团队协作。

每一个里程碑都指向同一个事实：智能 = 训练出来的，不是代码堆出来的。

1.2 「Agent 框架」的迷思

但市面上充斥着一种东西：拖拽式工作流构建器、无代码「AI Agent」平台、Prompt 链编排库。它们的共同幻觉是：把 LLM API 调用用 if-else 分支、节点图、硬编码路由逻辑串起来，就叫做「构建 Agent」。

这不是 Agent。这是披着 AI 外衣的 shell 脚本。你无法通过堆积过程式逻辑（庞大的规则树、节点图、链式 Prompt 瀑布）来「暴力制造」智能。智能是学出来的，不是写出来的。

二、Agent Harness：从造大脑到造身体

2.1 范式转变

当有人说「我在构建 Agent」，实际上只能指两件事之一：

训练模型——通过强化学习、微调、RLHF 等方法调整模型权重，塑造其行为。这是 DeepMind、OpenAI、Anthropic 做的事。
构建 Harness——编写代码，为模型提供可操作的运行环境。这才是我们大多数人在做的事。

这是一个根本性的范式转变：

模型是驾驶员，Harness 是车辆。模型提供智能，Harness 提供手、眼、记忆和安全边界。

2.2 Harness 的定义

那么，Agent Harness 到底是什么？

Agent Harness 是包裹在大语言模型周围的一整套基础设施，使它从一个只会输出文本的模型，变成一个能够在特定环境中感知、推理、行动的完整 Agent。

用公式表达：

Harness = Tools + Knowledge + Observation + Action + Permissions

组件	说明	示例
Tools（工具）	给 Agent 双手	文件读写、Shell 执行、API 调用、浏览器控制
Knowledge（知识）	给 Agent 领域专长	产品文档、API 规范、代码风格指南、架构决策记录
Observation（感知）	给 Agent 眼睛	git diff、错误日志、浏览器状态、传感器数据
Action（行动）	给 Agent 触达世界的能力	CLI 命令、API 调用、UI 交互
Permissions（权限）	给 Agent 安全边界	沙箱隔离、审批工作流、信任边界

2.3 Harness 工程师到底在做什么？

如果你在阅读这篇文章，你很可能就是一位 Harness 工程师。以下是这个角色真正在做的事：

实现工具——给 Agent 双手。每个工具是 Agent 在其环境中可以执行的一个原子操作。
管理知识——给 Agent 领域专长。按需加载，而非一股脑塞进上下文。
管理上下文——给 Agent 干净的「工作记忆」。子 Agent 隔离防止噪声泄漏，上下文压缩防止历史淹没当下。
控制权限——给 Agent 安全边界。沙箱化文件访问，对破坏性操作要求审批。
收集轨迹数据——Agent 在 Harness 中执行的每一个动作序列都是训练信号。真实的部署轨迹是微调下一代 Agent 模型的原始材料。

三、2026 年 Agent Harness 生态全景

2026 年，Agent Harness 已经从概念变成了一个蓬勃发展的开源生态。以下是目前最值得关注的几个项目：

3.1 ECC — 王者级项目（192K ⭐）

GitHub: affaan-m/ECC

ECC 是目前 GitHub 上最大的 Agent Harness 项目，从 Anthropic 黑客松获奖作品演化而来。它不仅仅是一套配置——而是一个完整的系统：

61 个 Agent + 246 个 Skill + 76 个 Command Shim
跨 Harness 适配：Claude Code、Codex、Cursor、OpenCode、Gemini、GitHub Copilot
内置 AgentShield 安全扫描、记忆持久化、持续学习
支持 12+ 编程语言生态
v2.0 已引入 Rust 控制平面、Tkinter 桌面 GUI

ECC 代表了「Harness 即操作系统」的愿景——Agent 在上面运行，Harness 提供所有底层能力。

3.2 DeerFlow — 字节跳动的超级 Agent Harness（69K ⭐）

GitHub: bytedance/deer-flow

DeerFlow 从「深度研究」（Deep Research）框架演进为超级 Agent Harness：

子 Agent 编排 + 沙箱 + 记忆 + 可扩展 Skill
支持 Docker 部署、MCP Server、多 IM 渠道（飞书/Slack/Telegram/Discord）
推荐使用 Doubao-Seed-2.0-Code、DeepSeek v3.2、Kimi 2.5 运行
内置 InfoQuest 智能搜索与爬虫工具集
2.0 版本是完全重写，不与 1.x 共享任何代码

3.3 learn-claude-code — Harness 工程教材（62K ⭐）

GitHub: shareAI-lab/learn-claude-code

“Bash is all you need.”

这不是一个拿来就用的框架，而是一本从 0 到 1 教你构建 Agent Harness 的教科书。核心理念：

Agency 来自模型，Agent 产品 = 模型 + Harness
彻底批判「Prompt 管道」式的伪 Agent 构建方式
教授 Harness 工程师真正该做的事：实现工具、管理知识、管理上下文、控制权限、收集轨迹数据

3.4 DeepAgents — LangChain 的「电池全配」Harness（23K ⭐）

GitHub: langchain-ai/deepagents

LangChain 团队出品，定位为开箱即用的 Agent Harness：

基于 LangGraph（流式输出、持久化、检查点）
内置子 Agent、文件系统、上下文管理、Shell 访问、持久记忆
Human-in-the-loop 审批机制
模型无关，支持任何支持 tool calling 的 LLM
提供 Python 和 TypeScript 双版本

LangChain 的定位很清晰：LangGraph 是图运行时 → LangChain 的 create_agent 是最小 Harness → DeepAgents 是全配 Harness。

3.5 OpenAI Agents SDK（26K ⭐）

GitHub: openai/openai-agents-python

OpenAI 官方的轻量级 Agent 框架：

Agent、Handoff、Guardrails、Tracing、Sessions
Sandbox Agent（0.14.0 新增）：Agent 在容器中操作真实文件系统
Human-in-the-loop 机制
Realtime Agent 支持（语音）
Provider-agnostic，支持 100+ LLM

3.6 OpenHarness — 学术界的开源 Harness（13K ⭐）

GitHub: HKUDS/OpenHarness

香港大学出品，定位为轻量级 Agent 基础设施：

43 个工具（文件、Shell、搜索、Web、MCP）
按需 Skill 加载、插件生态
CLAUDE.md 发现与注入、上下文自动压缩
多级权限模式、路径级命令规则
Swarm 多 Agent 协调

OpenHarness 的特别之处在于它同时提供了 ohmo——一个运行在 Harness 之上的个人 AI 助手，支持飞书/Slack/Telegram/Discord，可以自主 fork 分支、写代码、跑测试、提 PR。

3.7 OpenClaw — 个人 AI 助手的 Harness 范式（374K ⭐）

GitHub: openclaw/openclaw

OpenClaw 是全 GitHub Star 数最高的 Agent 项目，定位为「你自己的个人 AI 助手」。它由 Peter Steinberger 等社区开发者维护，TypeScript 编写，赞助商包括 OpenAI、GitHub、NVIDIA、Vercel。

它的核心理念与 Agent Harness 的定义高度吻合：

Gateway 控制平面：单一进程管理会话、渠道、工具和事件——这就是 Harness 中「调度核心」的角色
多渠道路由：WhatsApp、Telegram、Slack、Discord、Signal、iMessage、WeChat、QQ 等 20+ 渠道——Harness 的「感知层」和「行动层」合二为一
Multi-Agent 路由：将不同渠道/账户路由到隔离的 Agent 实例（独立工作区 + 独立会话）
沙箱机制：非主会话自动运行在 Docker/SSH 沙箱中，可配置工具白名单——标准的 Harness 安全边界
Skill 系统：内置 + 社区 Skill，通过 ClawHub 分发——Harness 的「可复用知识模块」
Cron 调度：自然语言定时任务，自动分发到连接平台——Harness 的「自动化层」
Voice Wake + Talk Mode：语音唤醒和连续对话——Harness 的「多模态感知」
Live Canvas：Agent 驱动的可视化工作区——Harness 的「行动界面」

OpenClaw 的架构完美诠释了 Harness 公式：

OpenClaw Harness = 
    Gateway (调度核心)
    + Channels (感知 + 行动)
    + Agents (智能调度)
    + Sandbox (安全边界)
    + Skills (可复用知识)
    + Cron (自动化)
    + Memory (持久记忆)

3.8 Hermes Agent — 自我进化的 Agent Harness（167K ⭐）

GitHub: NousResearch/hermes-agent

Hermes Agent 由 Nous Research 构建，是全 GitHub Star 数第二的 Agent 项目。它的独特性在于内置学习闭环——这是 Harness 范式的一次激进推进：

“The agent that grows with you.”

与 Harness 模式的对照：

Agent Loop：Prompt Builder → Provider Runtime → Tool Dispatch 的标准循环，支持流式工具调用、并行工具执行、Token 计数和成本追踪
Tools 系统：40+ 工具，支持 toolset 分组、37 个实时工具、MCP 协议——Harness 的「双手」
Skill 系统：Agent 在完成复杂任务后自动创建 Skill；Skill 在使用中自我改进；兼容 agentskills.io 开放标准——这超越了「静态知识注入」，实现了 Harness 知识的自我生长
Memory 系统：持久记忆（MEMORY.md）+ 用户画像（USER.md）+ Honcho 辩证用户建模 + FTS5 全文搜索——Harness 的「记忆层」被推到了新高度
Context Engineering：AGENTS.md 发现与注入、自动压缩、会话搜索——标准的 Harness 上下文管理
Gateway：Telegram、Discord、Slack、WhatsApp、Signal、WeChat、QQ——Harness 的「感知/行动层」
Cron 调度：内置定时任务，自然语言配置——Harness 的「自动化层」
Delegation：子 Agent 并行工作流 + Python 脚本 RPC 调用——Harness 的「分布式协调」
Security：命令审批、DM 配对、容器隔离、沙箱模式——Harness 的「安全边界」
Terminal Backends：本地、Docker、SSH、Singularity、Modal、Daytona、Vercel Sandbox——七种执行后端，Harness 的「运行环境抽象」
Trajectory：批量轨迹生成、轨迹压缩——Harness 的「数据引擎」，为训练下一代工具调用模型提供原料

Hermes Agent 与 OpenClaw 的特殊关系：Hermes Agent 内置了从 OpenClaw 迁移的工具（hermes claw migrate），可以自动导入 OpenClaw 的人格文件、记忆、Skill、API 密钥和渠道配置。这说明两个项目共享同一套 Harness 接口标准，它们不是竞争关系，而是同一范式下的不同演进分支。

3.9 从 ECC、OpenClaw 到 Hermes：同一张 Harness 蓝图

当你把 ECC、OpenClaw、Hermes Agent、DeerFlow、DeepAgents 放在一起审视，你会发现一个惊人的事实：它们的核心架构是同一张蓝图的不同着色。

Harness 组件	ECC	OpenClaw	Hermes Agent	DeerFlow	DeepAgents
Agent Loop	跨 Harness 适配	Gateway Agent	Prompt Builder → Provider → Tool Dispatch	LangGraph 驱动	LangGraph 驱动
Tools	61 Agent + Hook	Browser/Canvas/Nodes	40+ Tools + MCP	InfoQuest + MCP	FileSystem + Shell
Skills	246 Skills	ClawHub	自创建 + 自改进 + agentskills.io	可扩展 Skill	可复用行为模块
Memory	记忆持久化 + 持续学习	Session Store	MEMORY.md + Honcho + FTS5	长期记忆	持久 State Store
Context	上下文压缩 + 知识注入	多 Agent 隔离	AGENTS.md + 压缩 + 搜索	Context Engineering	上下文管理 + 文件卸载
Sub-Agent	子 Agent 编排	Multi-Agent 路由	Delegate + Parallel	Sub-Agent 编排	Sub-Agent 隔离
Sandbox	AgentShield	Docker/SSH 沙箱	7 种 Terminal Backend	Sandbox Mode	可插拔后端
Automation	Hooks + PM2	Cron + Webhooks	Cron 调度	—	—
Channels	跨 Harness 适配	20+ 平台	多 IM Gateway	多 IM 渠道	—
Learning	持续学习 + 本能	—	内置学习闭环	—	—
Trajectory	—	—	批量轨迹 + 压缩	—	LangSmith 追踪

这张表说明了一件事：Agent Harness 不是某个具体项目的名称，而是一套已经收敛的架构模式。 不同项目在相同的骨架上做出不同的设计选择——ECC 强调安全与优化，OpenClaw 强调个人助手体验，Hermes Agent 强调自我进化——但它们的骨架是同一张蓝图。

3.10 其他值得关注的项目

项目	Stars	一句话描述
oh-my-openagent	59K	「最好的 Agent Harness」
CowAgent	45K	多模型、多渠道的开源超级助手
Trellis	8.4K	另一个「最好的 Agent Harness」
hive	10K	面向生产的 Multi-Agent Harness
jcode	6.5K	专为编码场景设计的 Agent Harness
Yuxi	5.3K	结合知识图谱的多租户 Agent Harness 平台

💡 生态观察：OpenClaw 和 Hermes Agent 已经形成了庞大的周边生态——cc-switch（80K⭐ 跨平台桌面助手）、claude-mem（78K⭐ 跨会话持久上下文）、AionUi（26K⭐ 24/7 Cowork 应用）、clawpanel、OpenClaw-Admin、agent-sessions 等工具让这两个 Harness 的使用体验远超独立项目。这印证了一个规律：好的 Harness 会催生生态，生态反过来验证 Harness 的设计正确性。

四、Agent Harness vs 传统 Agent 框架：本质区别

理解 Agent Harness 的最佳方式，是对比它与传统「Agent 框架」的本质区别：

维度	传统 Agent 框架	Agent Harness
核心理念	通过代码编排实现「智能」	模型自带智能，Harness 提供运行环境
智能来源	代码逻辑（if-else、流程控制）	模型训练（权重、梯度）
设计哲学	Top-down：预先定义工作流	Bottom-up：提供能力，让模型自主决策
架构重心	流程编排、节点图、DAG	工具、知识、感知、权限
灵活性	受限于预设流程	模型根据当前上下文动态决策
典型案例	LangChain Chain、Flowise、Dify 工作流	ECC、OpenClaw、Hermes Agent、DeerFlow、DeepAgents
适用场景	确定性、可预测的任务	开放式、探索性、长周期任务

4.1 一个具象的类比

想象你在训练一个实习生：

传统框架的做法：给实习生一本厚厚的 SOP 手册，告诉他「遇到情况 A 执行步骤 1-2-3，遇到情况 B 执行步骤 4-5-6」。
Harness 的做法：教会实习生使用电脑、给他相关文档和代码库权限、告诉他什么操作需要审批——然后信任他的判断力。

前者是「编排」，后者是「赋能」。

五、Agent Harness 的核心架构模式

虽然各个 Harness 项目实现不同，但它们共享一套核心架构模式：

5.1 Agent Loop（代理循环）

┌─────────────────────────────────────────────────┐
│                  Agent Loop                       │
│                                                   │
│   User Input → Model Reasoning → Tool Calls       │
│        ↑                              ↓           │
│        └── Observation/Tool Results ←─┘           │
│                                                   │
│   (repeat until task complete or stop condition)  │
└─────────────────────────────────────────────────┘

这是所有 Agent Harness 的心脏——模型接收任务、推理、调用工具、观察结果、继续推理，直到完成。

5.2 Sub-Agent 隔离

长周期任务会产生大量上下文。Harness 通过子 Agent 机制解决这个问题：

主 Agent 将子任务委派给拥有隔离上下文窗口的子 Agent
子 Agent 完成后只返回摘要结果
主 Agent 保持上下文清洁，不会被中间细节淹没

5.3 Context Engineering（上下文工程）

这是 Harness 工程中最被低估的技能：

上下文压缩：自动摘要长对话历史
文件卸载：将大量工具输出写入文件，只保留引用
知识注入：CLAUDE.md / AGENTS.md 的发现与注入机制
记忆持久化：跨会话的 MEMORY.md 持久记忆

5.4 Skill 系统

Skill 是可复用的行为模块，Agent 按需加载：

声明式定义（通常是 Markdown 文件）
按需加载（不占用常驻上下文）
可组合（多个 Skill 协同工作）
社区生态（分享和复用）

5.5 安全边界

Harness 必须在能力和安全之间取得平衡：

沙箱隔离：Agent 在受限环境中运行
权限分级：读/写/执行/网络分级控制
审批机制：Human-in-the-loop 对关键操作进行审批
Pre/Post Hook：工具调用前后的检查与审计

六、为什么 2026 年是 Agent Harness 的爆发年？

6.1 模型能力已过临界点

GPT-5、Claude Sonnet 4.6、Gemini 3、DeepSeek v3.2、Kimi 2.5……这些模型在做复杂任务时已经具备了足够强的推理和规划能力。模型不再是瓶颈，瓶颈在于如何为模型提供合适的运行环境。

6.2 「Agent 框架」的幻灭

过去两年，大量「Agent 框架」试图通过代码编排来「制造智能」。结果呢？脆弱的流程链、高昂的维护成本、无法应对开放式任务。人们开始意识到：你需要的是一个 Harness，不是一个工作流引擎。

6.3 Claude Code 的启发

Claude Code 是目前最成功的 AI 编程 Agent 之一。人们开始深入研究它的架构——不是因为它的模型特别强（当然模型也很强），而是因为它的 Harness 设计：工具设计、上下文管理、CLAUDE.md 知识注入、权限控制。这直接催生了 learn-claude-code 这样的 Harness 工程教材。

6.4 开源社区的共识

当 OpenClaw 被数万个项目引用为 Agent 运行时，当 Hermes Agent 自称 “The agent that grows with you”，当 DeepAgents 自称 “The batteries-included agent harness”，当 ECC 被描述为 “The harness-native operator system for agentic work”，当 DeerFlow 定位为 “Super Agent Harness”——你会发现，这不是偶然的用词选择，而是一个行业共识的形成。

七、Agent Harness 的未来

7.1 Harness 即操作系统

ECC v2.0 已经引入了 Rust 控制平面、「操作员」工作流、状态快照等概念。这暗示了 Agent Harness 的终极形态：Agent 的操作系统。

就像 Linux 管理进程、内存、文件系统、网络一样，Agent Harness 管理 Agent 的工具、知识、上下文、权限、子 Agent 编排。

7.2 从单 Agent 到 Multi-Agent Swarm

当前大多数 Harness 以单 Agent 为主，子 Agent 机制是初步的分布式尝试。未来方向是 Agent Swarm——多个 Agent 在统一 Harness 下协调工作，无需人类逐步指导。

7.3 Harness 的标准化

不同的 Harness 项目（ECC、OpenClaw、Hermes Agent、DeerFlow、OpenHarness、DeepAgents）目前各有自己的 Skill 格式、Hook 机制、配置方式。但 OpenClaw 和 Hermes Agent 之间的互迁移（hermes claw migrate）已经展示了互操作的可能性。未来可能出现类似容器标准化的 Harness 互操作标准。

7.4 轨迹数据闭环

Harness 工程师做的不只是让 Agent 跑起来，而是收集 Agent 在真实环境中的运行轨迹。这些轨迹数据是微调下一代 Agent 模型的黄金原料。Harness 将不仅是 Agent 的运行环境，更是 Agent 进化的数据引擎。

八、写在最后

Agent Harness 这个概念之所以重要，不是因为又一个新名词诞生了，而是因为它重新校准了我们对 AI Agent 的理解：

智能无法被代码编排出来。它来自模型训练。我们所能做的最好的事，不是试图用代码「制造」智能，而是构建一个足够好的环境，让智能得以发挥。

这就是 Agent Harness 的意义。

它不是一个框架，不是一个库，不是一个工作流引擎。它是一个范式——从「编排出智能」到「为智能提供环境」。

作为开发者，你的角色不是写越来越复杂的 if-else 分支来控制模型行为。你是 Harness 工程师——你给模型双手、双眼、记忆和安全边界，然后信任它。

参考资源

项目/资源	链接
OpenClaw	https://github.com/openclaw/openclaw
Hermes Agent	https://github.com/NousResearch/hermes-agent
ECC	https://github.com/affaan-m/ECC
DeerFlow	https://github.com/bytedance/deer-flow
learn-claude-code	https://github.com/shareAI-lab/learn-claude-code
DeepAgents	https://github.com/langchain-ai/deepagents
OpenAI Agents SDK	https://github.com/openai/openai-agents-python
OpenHarness	https://github.com/HKUDS/OpenHarness
oh-my-openagent	https://github.com/code-yeongyu/oh-my-openagent
CowAgent	https://github.com/zhayujie/CowAgent
Trellis	https://github.com/mindfold-ai/Trellis
《御舆：解码 Agent Harness》	https://github.com/lintsinghua/claude-code-book

本文写于 2026 年 5 月。Agent Harness 生态正在以周为单位快速演进，建议持续关注上述项目的更新。

阅读: 432