Hermes Agent 研究報告 2026

research framework AI-agent

研究日期: 2026-04-11 來源: Nous Research (nousresearch.com) GitHub: github.com/nousresearch/hermes-agent


係咩?

Nous Research 出品嘅開源 self-improving AI agent,主打「同你一齊成長」。核心係一個閉環學習系統,單一 agent 不斷進化,唔係多 agent 協作架構。

截至 2026-04,已到 v0.8.0,超過 3,496 commits,係最活躍嘅開源 agent 框架之一。


四層記憶系統

層次技術說明
Prompt MemoryMEMORY.md + USER.md每次 session 自動載入,上限 3,575 字,強迫 curation
Session SearchSQLite + FTS5 全文搜尋搜尋所有過往對話,LLM 摘要再注入 context,~10ms 搜尋延遲
Skills Memory~/.hermes/skills/ markdown可重用流程,只載入 summary,需要時先載全文
User ModelingHoncho(可選外掛)跨 session 建立用戶 profile,動態推理

自我進化機制(最重要)

Skills 自動生成觸發條件

  • 用咗 5+ 個 tool calls
  • 從錯誤中恢復
  • 用戶糾正咗佢
  • 發現非直覺但有效嘅做法

自動學習循環

  1. 15 個 task → 系統自動 inject prompt:「回顧一下,有冇嘢值得記落去?」
  2. Agent 自己評估,寫成 skill 文件(markdown,agentskills.io 標準)
  3. 下次類似任務 → 直接載入 skill,唔使重新摸索
  4. 發現更好方法 → patch action 更新 skill(唔係重寫,防止破壞已有邏輯)

Context 壓縮策略

對話太長時,輔助 model 掃描全文,提取重要資訊壓縮入 3,575 字限制,保留 lineage reference 追蹤原始來源。


Agent Loop(每個回合)

收訊息 → 生成 task ID
→ 建立 system prompt(memory + skills + context)
→ 壓縮檢查
→ 呼叫 LLM(支援 tool use)
→ 執行 tools → 繼續 loop
→ 存入 SQLite
→ 透過 gateway 路由回覆

Honcho User Modeling(可選)

唔係固定 N 個維度,係動態推理系統:

  • 每次對話結束後,用 LLM 分析整個對話
  • 自動提煉「結論」— 關於用戶嘅 preferences、habits、goals
  • 呢啲結論累積喺 peer profile 入面

Dialectic API 係獨特之處:

  • Agent 可以向 Honcho 問「呢個用戶會點睇呢件事?」
  • Honcho 用 LLM 推理,返回 user-specific 預測
  • LLM-to-LLM 對話,唔係死板嘅欄位

多平台支援

Telegram、Discord、Slack、WhatsApp、Signal、CLI — 單一 gateway process

  • 跨平台 session 連續性(Telegram 講到一半,Discord 繼續)
  • 支援 15+ 平台

部署選項

Local、Docker、SSH、Daytona、Modal、Singularity(HPC)— $5 VPS 都跑得到


同我們系統對比分析

功能Hermes我們(Claude Code)
四層記憶✅ Mem0+LanceDB+claude-mem+MEMORY.md
Skills 系統✅ ~/.claude/skills/
自動 skill 生成✅ 全自動❌ 手動
跨平台 session❌ 只有 Telegram
User modeling✅ Honcho(可選)✅ Mem0(已有)
Dialectic API❌ 未有
自動 skill 更新✅ 每 15 task❌ 手動 learning.md

最值得複製的功能

優先級排序

1. 自動化 learning.md → skill 更新流程(最值得做)

  • 原理:每 X sessions → 自動讀 learning.md → 評估有冇 skill 值得更新 → 更新對應 skill
  • 零新依賴,用現有架構實現
  • 直接解決「越用越聰明」嘅核心需求

2. Skill 自動生成 hook(次優先)

  • 加 PostToolUse hook,符合觸發條件時自動評估
  • 需要 hook 設計同測試

3. Dialectic User Modeling(唔急)

  • Honcho 係外部服務,多一層依賴
  • Mem0 已做緊 80% 相同嘅嘢
  • 等前兩個穩定後再考慮

參考資料