深度拆解：Hermes Agent 从入门到精通橙皮书

作者：花叔（公众号「花叔」· B站「AI进化论-花生」）
基于 Hermes Agent v0.7.0 编写

一句话定位

Hermes Agent 是 Nous Research 发布的开源自主AI智能体框架，核心特色是 「持久化记忆」与「自我进化」能力 ——它不是又一个OpenClaw，而是Harness Engineering概念的第一次产品化：从「你给AI造缰绳」变成「AI自己给自己造缰绳」。

全书结构：5大板块 · 17章

Part 1 概念（2章）      → 为什么不是又一个Agent？它是什么？
Part 2 核心机制（4章）   → 学习循环 / 三层记忆 / Skill系统 / 工具与MCP
Part 3 动手搭建（5章）   → 安装配置 / 首次对话 / 多平台 / 自定义Skill / MCP集成
Part 4 实战场景（4章）   → 知识助手 / 开发自动化 / 内容创作 / 多Agent编排
Part 5 深度思考（2章）   → vs OpenClaw/Claude Code / 自改进边界

Part 1：概念

不是又一个Agent：从Harness到Hermes

核心论点：2026年初AI编程圈出现共识——瓶颈不是模型，是环境。LangChain团队实验证明，用同一个模型只调整「缰绳」配置，成绩从52.8%涨到66.5%，排名从Top 30跳到Top 5。Mitchell Hashimoto（Terraform创造者）将此命名为 Harness Engineering——每次AI犯错就加一条规则，让它永远不再犯同一个错。

Hermes做了什么：把Harness Engineering的五个组件全部内建，从手动实现变成自动运行：

Harness五组件	手动实现方式	Hermes内建系统
指令层	手写CLAUDE.md / AGENTS.md	Skill系统（markdown文件，自动创建+自改进）
约束层	配置hooks / linter / CI	Tool permissions + sandbox + toolset按需启用
反馈层	人工审查 / 评估者Agent	自改进学习循环（完成后自动复盘优化）
记忆层	手动维护knowledge base	三层记忆（会话/持久/Skill）+ Honcho用户建模
编排层	自己搭多Agent pipeline	子Agent委派 + cron调度

与OpenClaw的本质区别：OpenClaw给你配置即行为的系统，记忆功能完善但主要靠人工编写和维护；Hermes把五个维度全部内建，让它们自动运转。

Hermes Agent全景：60秒看懂

发布方：Nous Research（开源AI研究实验室，以Hermes模型家族闻名）
核心Slogan：The Agent That Grows With You（和你一起成长的Agent）
GitHub Stars：2个月飙到27000+
开源协议：MIT
模型自由：支持200+种模型（OpenAI、Anthropic、Gemini、OpenRouter等）

Part 2：核心机制

学习循环：Agent自己给自己造缰绳

这是Hermes最核心的机制——自改进学习循环：

接收任务 → 执行 → 复盘 → 改进Skill → 下次更快更准

Agent完成任务后自动复盘
识别可优化的环节
自动修改或创建Skill文件
形成正向循环：用得越多越聪明

三层记忆：从金鱼到老友

记忆层级	作用	技术实现
会话记忆 (Session Memory)	处理当前对话上下文	对话历史
持久记忆 (Persistent Memory)	跨会话记住用户偏好、事实和历史交互	SQLite + FTS5全文检索
技能记忆 (Skill Memory)	从任务执行中萃取成功模式，下次直接调用	Markdown Skill文件

关键区别：传统AI助手是「金鱼」（每次对话都失忆），Hermes是「老友」（越用越懂你）。

Skill系统：会自我进化的能力

Skill以Markdown文件形式存在，可读、可审计、可回滚
Agent可以自动创建新Skill
Agent可以自动修改已有Skill（基于任务复盘）
不是黑箱权重，而是透明文本——改了什么，你能看到diff

40+工具与MCP：连接一切

内置工具：终端执行、文件操作、网页检索、浏览器自动化、视觉、语音生成等40+
MCP协议：支持Model Context Protocol，可连接任意MCP兼容工具
工具权限：沙箱机制，工具集需显式配置，Agent不能随意获取新权限

Part 3：动手搭建

安装与配置：三种方式

Docker部署（推荐）
本地Python安装
云端部署

第一次对话：让Hermes认识你

初始配置向导
用户偏好设定
记忆系统激活

多平台接入：在哪都能找到它

支持接入的平台：

通讯：Telegram、Discord、Slack、WhatsApp、Signal
邮件：IMAP/SMTP
智能家居：Home Assistant
关键特性：跨平台记忆和技能同步共享

自定义Skill：教Hermes新技能

手动编写Skill文件
Skill文件格式与结构
从任务日志自动生成Skill

MCP集成：连接你的工具栈

MCP服务器配置
常用MCP工具集成示例
自定义MCP工具开发

Part 4：实战场景

个人知识助手：跨会话记忆的威力

利用持久记忆实现知识积累
跨会话上下文衔接
Honcho用户建模实现个性化

开发自动化：代码审查到部署

代码审查自动化
CI/CD流程集成
利用Skill记忆固定开发模式

内容创作：从调研到成稿

调研→大纲→成稿的完整工作流
Skill记忆写作风格和偏好
跨会话持续迭代内容

多Agent编排：让三匹马同时跑

子Agent委派机制
cron定时任务调度
多Agent协作模式

Part 5：深度思考

Hermes vs OpenClaw vs Claude Code：不是选择题

维度	Hermes Agent	OpenClaw	Claude Code
核心理念	自改进Agent	配置即行为	商业级编程助手
记忆系统	三层自动记忆	Daily Logs + MEMORY.md + 语义搜索	项目上下文理解
Skill/能力	自动创建+自改进	人工编写维护Skill生态	内建编程能力
开源	MIT开源	开源	闭源
适用场景	重复性结构性工作	一次性复杂任务/代码助手	专业编程场景
投资回报	随时间递增	即时回报	订阅制

核心洞察：Hermes适合有大量重复性工作、希望AI越用越懂你的用户；OpenClaw适合即插即用的一次性任务。

自改进Agent的边界：它能走多远

技术层面受控：

Skill文件是可读markdown，不是黑箱
记忆数据在本地（SQLite），可查看删除
工具权限有沙箱，需显式配置

实际层面的问题：

审计悖论：自主Agent的价值在于不用盯着，但安全需要你盯着——你会真的每天去看Agent改了哪些Skill吗？
反馈信号天花板：自改进依赖「判断自己的改进是好是坏」，但「更好」是谁定义的？
方向vs效率：自改进让Agent在已知方向上越跑越快，但方向本身还是得人来定

开源vs闭源信任问题：

开源（Hermes）：信任自己的审计能力，MIT许可但后果自负
闭源（Claude Code）：信任商业动机，有商业压力保证行为可预测

花叔的核心判断：

自改进Agent是这个领域最让人兴奋的方向，但它的天花板由人的参与程度决定。完全放手不管的自改进Agent，会在效率上赢、在方向上输。最好的状态可能是：让Agent在「怎么做」上自改进，你只管「做什么」和「别做什么」。

核心洞察提炼

1. Harness Engineering的第一次产品化

Hermes不是「又一个Agent工具」，它代表了一个范式转变：从手动给AI造缰绳 → AI自己给自己造缰绳。Harness Engineering五组件（指令层/约束层/反馈层/记忆层/编排层）全部内建并自动化。

2. Skill系统的双重意义

技术意义：Markdown格式，可读、可审计、可回滚，不是黑箱
哲学意义：Skill记忆是「程序化记忆」——不是记住信息，而是记住「怎么做」。这是从「知识积累」到「能力进化」的质变。

3. 自改进的信任困境

技术上受控 ≠ 实际上受控。「你能看到代码」和「你看了代码」是两回事。自改进Agent的真正挑战不在技术，而在反馈信号的质量——Agent不知道自己不知道什么。

4. 人与Agent的最佳关系

人管：做什么 + 别做什么（方向与边界）
Agent管：怎么做（执行与优化）

这是on the loop而不是in the loop——不是审查每一行代码，而是理解整个系统在做什么、为什么这么做。