Skip to main content
返回 Hermes 学习中心
第 3 / 8 课14 分钟阅读
作者:SetupOpenClaw 团队发布于 Apr 23, 2026

Hermes 能力矩阵:记忆、技能、工具与语音模式

让 Hermes 超越聊天机器人的四大支柱 —— 持久记忆文件、按需加载的技能、工具集以及语音交互 —— 以及它们如何协同工作。

目录

Hermes 的四大支柱

Hermes 真正从「又一个 CLI 聊天工具」跃迁出来,是因为它有四个互相咬合的系统:持久记忆、按需技能、工具集、语音 / 多模态输入输出。每一个独立用就已经很强,但它们是为组合而生 —— 记忆告诉智能体你是谁,技能告诉它你怎么干活,工具集让它能动手,语音则让整件事脱离键盘。

主要来源:功能总览 https://hermes-agent.nousresearch.com/docs/user-guide/features/overview。权威最新的清单请以该页为准。

记忆:`MEMORY.md` 与 `USER.md`

Hermes 把长期状态放在普通文本文件里 —— MEMORY.md 存系统与项目层面的事实,USER.md 存关于你的事实。它们人类可读、人类可改,并且刻意有容量上限:塞满时 Hermes 会把条目合并整理,而不是让它无限膨胀。

记忆刻意小。设计初衷是:存那些未来会话想知道、但靠读代码又无法重新发现的东西 —— 偏好、环境怪癖、历史事件、约束。别把已经在 repo 里的东西搬进来。

技能:渐进披露,而不是臃肿

记忆存事实,技能存流程。一个技能是一份结构化的文档(遵循 agentskills.io 开放标准),智能体在相关场景触发时按需加载。「按需」这一点是关键:你装了 40 个技能,上下文窗口并不会因此少 40 份空间,因为只有当前正在使用的那几个技能会进入 prompt。

这是「把一堆指令塞进一个巨大的系统 prompt」与真正的技能系统之间最大的区别。渐进加载让你在库很大时也能保持上下文小而相关。

工具与工具集

工具是智能体可以调用的函数 —— 网页搜索、终端执行、文件编辑、任务委派。工具集是工具的逻辑分组,可以按平台独立启用/禁用。消息网关大量使用这套机制:你可以让 Slack 机器人能读文件但不能跑终端命令,而 CLI 继续享有全套工具。

上下文感知与 `@` 引用

Hermes 会自动发现并加载代码旁边的 .hermes.mdAGENTS.mdCLAUDE.mdSOUL.md。不需要配置、不需要标志 —— 只要文件存在就会影响行为。这就是你跨会话保持一致约定、又不用每次重复解释的方式。

在会话内,@ 符号可以直接把文件、目录或 URL 注入上下文。智能体会展开并整合这些引用 —— 所以 @src/auth/ 能把整个 auth 目录塞进 prompt,不用你手工复制。

快照与回滚

在修改文件前,Hermes 会自动对工作目录做快照。如果一次变更被证明是错的,/rollback 把它回退到上一个快照。这种安全网在你不需要时感觉不到,一旦需要,你就再也舍不得丢掉。

自动化:定时任务、子智能体、钩子、批处理

一组功能把 Hermes 从被动聊天工具变成后台工人:

  • 定时任务 —— 用自然语言描述的周期性任务,按 cron 运行。
  • 子智能体委派 —— 派生受限权限的隔离子进程,最多三个并发,用于并行调研。
  • 事件钩子 —— 在生命周期关键时刻插入自定义逻辑(工具调用、会话开始等),做日志、告警或拦截。
  • 批处理 —— 以编程方式跑成百上千条提示,并产出结构化轨迹数据用于分析。

语音、视觉与生图

语音模式在 CLI 与消息平台上提供完整的双向语音交互 —— 麦克风输入、语音输出。支持 5 家 TTS 提供商,默认免费的 Edge TTS —— 可以零成本先试一试。

视觉通过剪贴板图像粘贴(CLI 里 Ctrl+V)实现,把截图和示意图直接拖进来,不用管文件。生图接 FAL.ai 的 8 个模型;浏览器自动化支持 Browserbase、Browser Use,或本地 Chrome 走 CDP。

提供商路由与回退

Hermes 把大模型当作可插拔组件看待。提供商路由让你按请求选择谁来处理 —— 优化成本、延迟或质量 —— 回退提供商则在主路故障时自动切换。凭证池在多把 key 之间轮换,既分摊流量,也能在 key 被吊销时不宕机。

API 服务器与 IDE 集成

两个值得注意的出口。API 服务器把 Hermes 暴露为 OpenAI 兼容的 HTTP 端点 —— 接 Open WebUI、LobeChat 或任何 OpenAI 兼容的客户端。ACP 支持把 Hermes 直接连进 VS Code、Zed 和 JetBrains,让你在编辑器里就有智能体能力,不用离开。

人格与插件

SOUL.md 定义智能体的身份 —— 语气、偏好、不可妥协的原则。每个会话都能选预设人格(helpfulconcisekawaii 等)。插件让你在不改核心代码的前提下扩展 Hermes —— 自定义工具、钩子、记忆提供商、备选上下文引擎 —— 从 ~/.hermes/plugins/ 之类的标准位置发现。

下一步

第 4 课消息平台讲如何通过 Slack 或 Telegram 把这些能力分享给团队;第 5 课集成讲 MCP、网页搜索和语音后端的细节。如果你已经被记忆 / 技能的模型说服,想直接落地,SetupClaw 的托管服务也坚持「先稳定基础」的原则,同时替你处理安全加固。

继续学习