本文经原作者授权转载,版权归原作者所有。原作者:知野(@knoYee_)。查看原文 →


Hermes详细介绍|面向新手小白

相信大家最近的社媒都被 Hermes agent 刷屏了吧。

那么 Hermes agent 到底是什么?它和前段时间大火的 OpenClaw 有什么关系?新手小白又该怎么选择?这篇我帮大家一次性捋清楚。

一、Hermes agent 为什么会火?

想搞清楚 Hermes agent 为什么会爆火,先要搞明白 Harness engineering 是什么。

AI 圈这几年其实经历了一条很清晰的演进路径:

  • Prompt engineering(提示词工程)
  • Context engineering(上下文工程)
  • Harness engineering(驾驭工程)

本质上,是需求在变:

一开始,只要求agent能读懂提示词;后来,需要加入更多上下文,让它更好地理解任务;到了现在,已经演变成要求 agent 会调用 skills、会做策略选择、会自己复查纠错,来处理复杂任务。

Harness engineering 怎么理解?

一个类比:把 LLM 想象成一个智力极强、但极度健忘、极度自信、容易跑偏的新员工。

  • Prompt engineering 是给他一张任务列表;
  • Context engineering 是给他看完整的项目背景文档;
  • Harness engineering,是给他配一套完整的工作系统:记忆系统(他做过什么)、技能库(他会什么)、纠错机制(他错了怎么被拉回来)、反馈回路(他怎么越干越好)。
Harness engineering 的核心逻辑是:不改变模型本身,而是在模型外围建立一套"环境",让一个"容易出错的 LLM"变成一个"优秀员工"。

而 Hermes agent 的运行机制,正是这种思路的体现。

二、Hermes agent 和 OpenClaw 到底是什么关系?

它们是同一类逻辑下的不同实现。都是在做harness agent,但设计思路不同,由此导致了记忆系统、skills 机制、上下文管理的一系列差异。

接下来逐层拆解。

1. 记忆系统的差异

OpenClaw 的记忆系统

OpenClaw 的记忆系统有两个重点:

第一是 memory.md,用于刻画用户画像,整体相对稳定,但也会通过周总结、月总结持续积累和更新。

第二是记忆文件系统,它会把日常对话总结成类似"日记"的压缩内容写入文件,像一个数据库。当触发关键词时,会结合向量检索 + 关键词索引来召回相关内容。

向量检索的优势在于模糊匹配——你不需要记得当时用的是什么词,语义相近的内容都能被找回来。

Hermes agent 的记忆系统

Hermes agent 的记忆系统有三个重点:

第一是 memory.md,这部分主要记录的是工作经验。例如:我今天用 A 方法解决了这类问题,后续再遇到类似问题时,A 方法会被优先使用。

第二是 USER.md,这里刻画的是用户画像。在每轮对话结束后,Hermes agent 会总结哪些信息适合写入 memory.md 和 USER.md,再持续扩充进去。Hermes 会把这些内置记忆持续带入后续对话;如果启用了外部 memory provider,还会在每轮开始前预取相关记忆,并在会话结束后同步。

第三是检索机制,它同样会做总结、写入文件,但在触发关键词时,更偏向使用 FTS5 的全文精确索引。

两种检索方式的本质区别

FTS5 全文索引(Hermes) 向量检索(OpenClaw) 优势 精确、快、可控,边界清晰 语义模糊匹配,容错率高 劣势 表述方式不同时召回可能失败 可能召回不相关内容,造成上下文污染 底层假设 工作记录需要精确复现 用户的语言习惯会漂移

两种方式没有绝对优劣,而是对记忆系统的不同假设。至于哪种在实际长期使用中表现更好,更适合基于实测来说话,而不是先下结论。

2. Skills 的差异

OpenClaw 的 skills 机制

OpenClaw 的 skills 更像一套预装模块:用户需要先定义好技能,明确输入输出,技能才能被调用。ClawHub 上集成了大量现成的第三方 skills,这是它生态上的核心优势。

但这个优势也是风险点:生态越大,第三方 skills 的质量和安全性越需要甄别。不要把"安装 skill"理解成"安装提示词",部分 skills 实质上是在向外部发送你的上下文数据。

Hermes agent 的 skills 机制

Hermes 的 skills 是从对话中生长出来的。它会在每轮结束后判断:这次解决问题的方式有没有可复用的价值?如果有,就把它沉淀成一个技能模板,供后续对话调用。

这意味着,你用 Hermes 的时间越长,它的技能库越贴合你自己的工作方式。但代价是:前期没有任何技能储备,什么都要从零积累,团队协作时也无法直接共享技能库。

本质差异

skills 的差异,本质上是封装方式的差异:

  • OpenClaw 的 skills,更像是明确写好的标准操作流程——先结构化,再调用;
  • Hermes 的 skills,更像是在持续使用中把有效做法慢慢固化下来——先跑出经验,再沉淀。

这个差异,决定了它们适合的不是同一种工作流。

3. 上下文窗口管理的差异

这是两者一个被忽视但非常关键的差异。

任何 agent 在执行长任务时都会面临同一个问题:上下文窗口满了怎么办?

  • OpenClaw 的策略更偏向主动压缩:当上下文接近阈值时,会触发结构化摘要,把历史信息压缩后写回,腾出空间。好处是任务连续性强,坏处是压缩过程中可能丢失细节。
  • Hermes 的策略更偏向分段归档:将历史对话阶段性地写入记忆文件,在下一轮需要时按需召回,而不是一次性塞回上下文。好处是保留原始信息,坏处是召回的延迟和准确性依赖检索机制的质量。

4. 二者并没有绝对优劣

从宏观角度看,二者并没有简单的优劣之分,关键还是看场景。

如果是团队做大项目

团队通常需要大量、明确、稳定的 skills。这时候如果只依赖 Hermes agent 的自总结,往往会拖慢项目进度。更合理的做法通常是:先在 OpenClaw 里创建好所需的技术 skills,再基于已有技能体系进行复用和协作。

如果是个人使用

如果是个人用户,没有那么严苛的流程和规模化要求,那么 Hermes agent 的自总结 skills 机制就会非常适合。你越用,它越懂你;不需要事先规划任何东西,上手即用。

5. 选型决策框架

不确定用哪个?问自己三个问题:

Q1:你的工作流是否已经固定?

  • 是 → 倾向 OpenClaw,把固定流程标准化成 skills
  • 否 → 倾向 Hermes,让它跟着你的工作方式生长

Q2:你是否需要和他人共享 skills?

  • 是 → OpenClaw,技能库可以显式导出和共享
  • 否 → 两者均可

Q3:你能接受多长的冷启动期?

  • 不能接受 → OpenClaw,ClawHub 上的现成 skills 可以立刻用
  • 可以接受 → Hermes,前几周积累期之后体验会快速上升

三、总结二者定位

在我看来:

  • OpenClaw 更像:先搭框架,再装模块
  • Hermes 更像:先上手使用,再边用边长

因此:

  • 前者更适合目标明确、流程稳定、要规模化复用的团队
  • 后者更适合个人用户,以及愿意让 agent 跟自己一起持续迭代的人

详细下载过程已更新在主⻚,包括下载准备、下载过程、模型选择,以及如何接⼊ Discord,感谢⼤家耐心阅读,有帮助的话辛苦点赞、转发、关注