Hermes详细介绍｜面向新手小白

本文经原作者授权转载，版权归原作者所有。原作者：知野（@knoYee_）。查看原文 →

Hermes详细介绍｜面向新手小白

相信大家最近的社媒都被 Hermes agent 刷屏了吧。

那么 Hermes agent 到底是什么？它和前段时间大火的 OpenClaw 有什么关系？新手小白又该怎么选择？这篇我帮大家一次性捋清楚。

一、Hermes agent 为什么会火？

想搞清楚 Hermes agent 为什么会爆火，先要搞明白 Harness engineering 是什么。

AI 圈这几年其实经历了一条很清晰的演进路径：

Prompt engineering（提示词工程）
Context engineering（上下文工程）
Harness engineering（驾驭工程）

本质上，是需求在变：

一开始，只要求agent能读懂提示词；后来，需要加入更多上下文，让它更好地理解任务；到了现在，已经演变成要求 agent 会调用 skills、会做策略选择、会自己复查纠错，来处理复杂任务。

Harness engineering 怎么理解？

一个类比：把 LLM 想象成一个智力极强、但极度健忘、极度自信、容易跑偏的新员工。

Prompt engineering 是给他一张任务列表；
Context engineering 是给他看完整的项目背景文档；
Harness engineering，是给他配一套完整的工作系统：记忆系统（他做过什么）、技能库（他会什么）、纠错机制（他错了怎么被拉回来）、反馈回路（他怎么越干越好）。

Harness engineering 的核心逻辑是：不改变模型本身，而是在模型外围建立一套"环境"，让一个"容易出错的 LLM"变成一个"优秀员工"。

而 Hermes agent 的运行机制，正是这种思路的体现。

二、Hermes agent 和 OpenClaw 到底是什么关系？

它们是同一类逻辑下的不同实现。都是在做harness agent，但设计思路不同，由此导致了记忆系统、skills 机制、上下文管理的一系列差异。

接下来逐层拆解。

1. 记忆系统的差异

OpenClaw 的记忆系统

OpenClaw 的记忆系统有两个重点：

第一是 memory.md，用于刻画用户画像，整体相对稳定，但也会通过周总结、月总结持续积累和更新。

第二是记忆文件系统，它会把日常对话总结成类似"日记"的压缩内容写入文件，像一个数据库。当触发关键词时，会结合向量检索 + 关键词索引来召回相关内容。

向量检索的优势在于模糊匹配——你不需要记得当时用的是什么词，语义相近的内容都能被找回来。

Hermes agent 的记忆系统

Hermes agent 的记忆系统有三个重点：

第一是 memory.md，这部分主要记录的是工作经验。例如：我今天用 A 方法解决了这类问题，后续再遇到类似问题时，A 方法会被优先使用。

第二是 USER.md，这里刻画的是用户画像。在每轮对话结束后，Hermes agent 会总结哪些信息适合写入 memory.md 和 USER.md，再持续扩充进去。Hermes 会把这些内置记忆持续带入后续对话；如果启用了外部 memory provider，还会在每轮开始前预取相关记忆，并在会话结束后同步。

第三是检索机制，它同样会做总结、写入文件，但在触发关键词时，更偏向使用 FTS5 的全文精确索引。

两种检索方式的本质区别

FTS5 全文索引（Hermes）向量检索（OpenClaw）优势精确、快、可控，边界清晰语义模糊匹配，容错率高劣势表述方式不同时召回可能失败可能召回不相关内容，造成上下文污染底层假设工作记录需要精确复现用户的语言习惯会漂移

两种方式没有绝对优劣，而是对记忆系统的不同假设。至于哪种在实际长期使用中表现更好，更适合基于实测来说话，而不是先下结论。

2. Skills 的差异

OpenClaw 的 skills 机制

OpenClaw 的 skills 更像一套预装模块：用户需要先定义好技能，明确输入输出，技能才能被调用。ClawHub 上集成了大量现成的第三方 skills，这是它生态上的核心优势。

但这个优势也是风险点：生态越大，第三方 skills 的质量和安全性越需要甄别。不要把"安装 skill"理解成"安装提示词"，部分 skills 实质上是在向外部发送你的上下文数据。

Hermes agent 的 skills 机制

Hermes 的 skills 是从对话中生长出来的。它会在每轮结束后判断：这次解决问题的方式有没有可复用的价值？如果有，就把它沉淀成一个技能模板，供后续对话调用。

这意味着，你用 Hermes 的时间越长，它的技能库越贴合你自己的工作方式。但代价是：前期没有任何技能储备，什么都要从零积累，团队协作时也无法直接共享技能库。

本质差异

skills 的差异，本质上是封装方式的差异：

OpenClaw 的 skills，更像是明确写好的标准操作流程——先结构化，再调用；
Hermes 的 skills，更像是在持续使用中把有效做法慢慢固化下来——先跑出经验，再沉淀。

这个差异，决定了它们适合的不是同一种工作流。

3. 上下文窗口管理的差异

这是两者一个被忽视但非常关键的差异。

任何 agent 在执行长任务时都会面临同一个问题：上下文窗口满了怎么办？

OpenClaw 的策略更偏向主动压缩：当上下文接近阈值时，会触发结构化摘要，把历史信息压缩后写回，腾出空间。好处是任务连续性强，坏处是压缩过程中可能丢失细节。
Hermes 的策略更偏向分段归档：将历史对话阶段性地写入记忆文件，在下一轮需要时按需召回，而不是一次性塞回上下文。好处是保留原始信息，坏处是召回的延迟和准确性依赖检索机制的质量。

4. 二者并没有绝对优劣

从宏观角度看，二者并没有简单的优劣之分，关键还是看场景。

如果是团队做大项目

团队通常需要大量、明确、稳定的 skills。这时候如果只依赖 Hermes agent 的自总结，往往会拖慢项目进度。更合理的做法通常是：先在 OpenClaw 里创建好所需的技术 skills，再基于已有技能体系进行复用和协作。

如果是个人使用

如果是个人用户，没有那么严苛的流程和规模化要求，那么 Hermes agent 的自总结 skills 机制就会非常适合。你越用，它越懂你；不需要事先规划任何东西，上手即用。

5. 选型决策框架

不确定用哪个？问自己三个问题：

Q1：你的工作流是否已经固定？

是 → 倾向 OpenClaw，把固定流程标准化成 skills
否 → 倾向 Hermes，让它跟着你的工作方式生长

Q2：你是否需要和他人共享 skills？

是 → OpenClaw，技能库可以显式导出和共享
否 → 两者均可

Q3：你能接受多长的冷启动期？

不能接受 → OpenClaw，ClawHub 上的现成 skills 可以立刻用
可以接受 → Hermes，前几周积累期之后体验会快速上升

三、总结二者定位

在我看来：

OpenClaw 更像：先搭框架，再装模块
Hermes 更像：先上手使用，再边用边长

因此：

前者更适合目标明确、流程稳定、要规模化复用的团队
后者更适合个人用户，以及愿意让 agent 跟自己一起持续迭代的人

详细下载过程已更新在主⻚，包括下载准备、下载过程、模型选择，以及如何接⼊ Discord，感谢⼤家耐心阅读，有帮助的话辛苦点赞、转发、关注

Hermes详细介绍｜面向新手小白

Hermes详细介绍｜面向新手小白

一、Hermes agent 为什么会火？

二、Hermes agent 和 OpenClaw 到底是什么关系？

三、总结二者定位

Written by:

Lnotice