本文经原作者授权转载,版权归原作者所有。原作者:知野(@knoYee_)。查看原文 →
Hermes详细介绍|面向新手小白
相信大家最近的社媒都被 Hermes agent 刷屏了吧。
那么 Hermes agent 到底是什么?它和前段时间大火的 OpenClaw 有什么关系?新手小白又该怎么选择?这篇我帮大家一次性捋清楚。
一、Hermes agent 为什么会火?
想搞清楚 Hermes agent 为什么会爆火,先要搞明白 Harness engineering 是什么。
AI 圈这几年其实经历了一条很清晰的演进路径:
- Prompt engineering(提示词工程)
- Context engineering(上下文工程)
- Harness engineering(驾驭工程)
本质上,是需求在变:
一开始,只要求agent能读懂提示词;后来,需要加入更多上下文,让它更好地理解任务;到了现在,已经演变成要求 agent 会调用 skills、会做策略选择、会自己复查纠错,来处理复杂任务。
Harness engineering 怎么理解?
一个类比:把 LLM 想象成一个智力极强、但极度健忘、极度自信、容易跑偏的新员工。
- Prompt engineering 是给他一张任务列表;
- Context engineering 是给他看完整的项目背景文档;
- Harness engineering,是给他配一套完整的工作系统:记忆系统(他做过什么)、技能库(他会什么)、纠错机制(他错了怎么被拉回来)、反馈回路(他怎么越干越好)。
Harness engineering 的核心逻辑是:不改变模型本身,而是在模型外围建立一套"环境",让一个"容易出错的 LLM"变成一个"优秀员工"。
而 Hermes agent 的运行机制,正是这种思路的体现。
二、Hermes agent 和 OpenClaw 到底是什么关系?
它们是同一类逻辑下的不同实现。都是在做harness agent,但设计思路不同,由此导致了记忆系统、skills 机制、上下文管理的一系列差异。
接下来逐层拆解。
1. 记忆系统的差异
OpenClaw 的记忆系统
OpenClaw 的记忆系统有两个重点:
第一是 memory.md,用于刻画用户画像,整体相对稳定,但也会通过周总结、月总结持续积累和更新。
第二是记忆文件系统,它会把日常对话总结成类似"日记"的压缩内容写入文件,像一个数据库。当触发关键词时,会结合向量检索 + 关键词索引来召回相关内容。
向量检索的优势在于模糊匹配——你不需要记得当时用的是什么词,语义相近的内容都能被找回来。
Hermes agent 的记忆系统
Hermes agent 的记忆系统有三个重点:
第一是 memory.md,这部分主要记录的是工作经验。例如:我今天用 A 方法解决了这类问题,后续再遇到类似问题时,A 方法会被优先使用。
第二是 USER.md,这里刻画的是用户画像。在每轮对话结束后,Hermes agent 会总结哪些信息适合写入 memory.md 和 USER.md,再持续扩充进去。Hermes 会把这些内置记忆持续带入后续对话;如果启用了外部 memory provider,还会在每轮开始前预取相关记忆,并在会话结束后同步。
第三是检索机制,它同样会做总结、写入文件,但在触发关键词时,更偏向使用 FTS5 的全文精确索引。
两种检索方式的本质区别
FTS5 全文索引(Hermes) 向量检索(OpenClaw) 优势 精确、快、可控,边界清晰 语义模糊匹配,容错率高 劣势 表述方式不同时召回可能失败 可能召回不相关内容,造成上下文污染 底层假设 工作记录需要精确复现 用户的语言习惯会漂移
两种方式没有绝对优劣,而是对记忆系统的不同假设。至于哪种在实际长期使用中表现更好,更适合基于实测来说话,而不是先下结论。
2. Skills 的差异
OpenClaw 的 skills 机制
OpenClaw 的 skills 更像一套预装模块:用户需要先定义好技能,明确输入输出,技能才能被调用。ClawHub 上集成了大量现成的第三方 skills,这是它生态上的核心优势。
但这个优势也是风险点:生态越大,第三方 skills 的质量和安全性越需要甄别。不要把"安装 skill"理解成"安装提示词",部分 skills 实质上是在向外部发送你的上下文数据。
Hermes agent 的 skills 机制
Hermes 的 skills 是从对话中生长出来的。它会在每轮结束后判断:这次解决问题的方式有没有可复用的价值?如果有,就把它沉淀成一个技能模板,供后续对话调用。
这意味着,你用 Hermes 的时间越长,它的技能库越贴合你自己的工作方式。但代价是:前期没有任何技能储备,什么都要从零积累,团队协作时也无法直接共享技能库。
本质差异
skills 的差异,本质上是封装方式的差异:
- OpenClaw 的 skills,更像是明确写好的标准操作流程——先结构化,再调用;
- Hermes 的 skills,更像是在持续使用中把有效做法慢慢固化下来——先跑出经验,再沉淀。
这个差异,决定了它们适合的不是同一种工作流。
3. 上下文窗口管理的差异
这是两者一个被忽视但非常关键的差异。
任何 agent 在执行长任务时都会面临同一个问题:上下文窗口满了怎么办?
- OpenClaw 的策略更偏向主动压缩:当上下文接近阈值时,会触发结构化摘要,把历史信息压缩后写回,腾出空间。好处是任务连续性强,坏处是压缩过程中可能丢失细节。
- Hermes 的策略更偏向分段归档:将历史对话阶段性地写入记忆文件,在下一轮需要时按需召回,而不是一次性塞回上下文。好处是保留原始信息,坏处是召回的延迟和准确性依赖检索机制的质量。
4. 二者并没有绝对优劣
从宏观角度看,二者并没有简单的优劣之分,关键还是看场景。
如果是团队做大项目
团队通常需要大量、明确、稳定的 skills。这时候如果只依赖 Hermes agent 的自总结,往往会拖慢项目进度。更合理的做法通常是:先在 OpenClaw 里创建好所需的技术 skills,再基于已有技能体系进行复用和协作。
如果是个人使用
如果是个人用户,没有那么严苛的流程和规模化要求,那么 Hermes agent 的自总结 skills 机制就会非常适合。你越用,它越懂你;不需要事先规划任何东西,上手即用。
5. 选型决策框架
不确定用哪个?问自己三个问题:
Q1:你的工作流是否已经固定?
- 是 → 倾向 OpenClaw,把固定流程标准化成 skills
- 否 → 倾向 Hermes,让它跟着你的工作方式生长
Q2:你是否需要和他人共享 skills?
- 是 → OpenClaw,技能库可以显式导出和共享
- 否 → 两者均可
Q3:你能接受多长的冷启动期?
- 不能接受 → OpenClaw,ClawHub 上的现成 skills 可以立刻用
- 可以接受 → Hermes,前几周积累期之后体验会快速上升
三、总结二者定位
在我看来:
- OpenClaw 更像:先搭框架,再装模块
- Hermes 更像:先上手使用,再边用边长
因此:
- 前者更适合目标明确、流程稳定、要规模化复用的团队
- 后者更适合个人用户,以及愿意让 agent 跟自己一起持续迭代的人
详细下载过程已更新在主⻚,包括下载准备、下载过程、模型选择,以及如何接⼊ Discord,感谢⼤家耐心阅读,有帮助的话辛苦点赞、转发、关注