從 Stateless 到 Persistent:
Hermes Agent 三層記憶架構與 Mac Mini M4 硬體實測(2026)

如果你在選型前只問一句「Hermes Agent 重啟會丟記憶嗎」,答案取決於你理解它的三層記憶,而不只是會不會關機。本文面向準備本機部署 Hermes 的開發者:先講清 Nous Research 如何從 Stateless 聊天走向 Persistent Agent,再用樹莓派 / VPS / Mac Mini M4 的資源輪廓對照各層壓力,最後給出月租 Mac Mini M4 的 TCO 思路與六步落地清單

01

Hermes Agent 為什麼需要一台一直開著的機器?

2026 年 2 月,Nous Research 開源的 Hermes Agent 在 GitHub 上迅速走紅——賣點不是「多聊兩句」,而是真正住在你機器上的 Agent:跨會話持久記憶、自動產生 Skill 文件、任務做得越多越像「老同事」。MIT 授權、一條 curl 安裝、支援 Telegram / Discord / Slack 等 20+ 渠道,讓它成為許多開發者從雲端 Copilot 轉向本機 AI Agent 部署 的第一站。

但 Hermes 和一次性腳本不同:Gateway 需要 7×24 在線,記憶層要持續寫入 ~/.hermes/,Skill 要在使用中迭代。筆電合蓋、樹莓派 SD 卡磨損、VPS 維護窗口——都會讓「複利」斷檔。官方文件也要求模型上下文至少 64K tokens,多步工具呼叫才能穩定;這進一步把硬體從「能跑」推到「能連續跑」。

因此選型核心問題不是「能不能裝」,而是:哪台機器能讓三層記憶穩定累積、檢索不慢、渠道不掉線? 下文用架構拆解 + 實測對照回答;若你更關心從 VPS 遷出的親身時間線,可參考本站昨日的VPS 三個月遷移實測

  1. 01

    短期上下文層:目前會話與工具鏈狀態,Gateway 行程內維護,重啟後取決於是否已落盤。

  2. 02

    Skill 文件層:複雜任務沉澱為 Markdown Skill,磁碟成長 → 檢索與 IO 壓力上升。

  3. 03

    使用者模型層:USER.mdMEMORY.mdstate.db 跨會話複利,最忌快照回滾與長期離線。

  4. 04

    渠道層:Telegram 等 20+ 接入需常駐監聽,掉線 = 自動化任務排隊或失敗。

  5. 05

    推理層(可選):本機 Hermes-3 / MLX 吃 UMA;純 API 模式仍要留足 Gateway 記憶體。

  6. 06

    結論:「一直開著」是為 Persistent,而非浪費電——月租 Mac Mini M4 把 CapEx 換成可預測的 OpEx。

02

三層記憶架構拆解:從會話上下文到 Skill 與使用者模型

社群常把 Hermes 的記憶概括為三層(與 Nous 文件中的 SOUL.md、Skill、episodic 儲存一致):

第一層:短期會話上下文

目前對話、工具呼叫鏈路與 Gateway 記憶體態。它像傳統 Chatbot 的 context window,但 Hermes 會主動把高價值片段推進長期層。這一層對CPU 與網路頻寬、延遲敏感:手機下發任務經 Telegram 往返,機器若在遠端 VPS 伺服器,體感延遲會放大。

第二層:可複用 Skill Documents

完成複雜任務後,Hermes 會把解決過程提煉成 Skill——下次類似問題不從零推理。Skill 以 Markdown 形式落盤,數量上來後,ripgrep / FTS 檢索 與磁碟隨機讀寫成為瓶頸。我在測試中見過 state.db 超過 2GB 後檢索從毫秒級升到百毫秒級——Agent「變笨」往往是 IO,不是模型變差。

第三層:跨會話持久使用者模型

USER.mdMEMORY.md 與 SQLite state.db 記錄偏好、事實與 episodic 檢索索引。這是 Hermes 相對「Stateless API」的護城河:Atropos RL 微調的 Hermes-3 擅長長任務與工具呼叫,但只有第三層連續,才會出現「越用越懂你」的複利。

記憶層主要儲存典型硬體壓力掉線/重啟影響
L1 會話上下文Gateway 行程 + 部分日誌CPU、網路 RTT未落盤則遺失當輪細節
L2 Skill~/.hermes/skills/磁碟容量、檢索 IO檔案在則不丟,但索引需重建時間
L3 使用者模型state.db、Markdown 記憶記憶體快取、FTS5快照回滾會傷檢索品質

「選硬體前先看記憶層:L1 要延遲,L2 要磁碟,L3 要連續性——三者都怕『偶爾在線』。」

03

樹莓派、VPS 還是 Mac Mini M4?硬體資源實測對照

下表基於社群部署經驗與筆者監控資料整理的定性對照(非廠商 benchmark),用於回答「2026 年跑 Hermes Agent 用什麼機器」:

方案記憶連續性本機 Hermes-3 / Metal7×24 適合度典型瓶頸
樹莓派 4/5易因 SD 卡與記憶體不足中斷基本不可行低(IO 與散熱)8GB 記憶體、慢儲存
Linux VPS可用,維護窗口風險無 Metal中(機房穩定)跨區延遲、macOS 腳本斷層
Mac Mini M4 月租原生 macOS + Time MachineUMA 16/32GB高(靜音低功耗)需選對記憶體檔位

Mac Mini M4 的優勢在於統一記憶體架構(UMA):CPU、GPU 與神經引擎共享高頻寬記憶體池,本機推理不必在 CPU 與「顯存」間拷貝。Hermes 官方支援 macOS,curl -fsSL https://get.hermes-agent.org | bash 即可安裝;配合 launchd 常駐 Gateway,適合放在桌面或弱電間長期開機(閒置功耗約 5–8W 量級,社群經驗值)。

bash
# macOS 一鍵安裝(租機到手後)
curl -fsSL https://get.hermes-agent.org | bash

# 備份三層記憶核心目錄
tar czf hermes-backup.tgz -C ~ .hermes

# 查看 Gateway 狀態(安裝精靈會設定服務)
# 具體子命令以目前版本 hermes --help 為準
warning

注意:Hermes 要求模型上下文 ≥ 64K。本機 llama.cpp / Ollama 須明確設定 --ctx-size 65536 或等價參數,否則啟動階段會被拒絕。

04

租 Mac Mini M4 跑 Hermes:24 個月 TCO 與「決策成本」

自購 Mac Mini M4 適合已確定 3 年以上獨佔的場景;但對多數想驗證「Persistent Agent 工作流」的人,月租把首付與折舊轉成固定 OpEx,並保留到期升配 M 系新機的彈性。下表為決策矩陣(具體月租見 租賃價格說明):

維度(24 個月)自購 M4(16GB)月租 M4
現金占用一次性硬體支出高分散月費、低首付
記憶資產風險自管維修與遷移換機可遷移 ~/.hermes 備份
Hermes 適配最優同樣原生 macOS
適合誰長期獨佔 + 自擔折舊先讓 Agent 跑滿 30 天再決定買斷
info

提示:開發者可讓 Hermes 持續跟進程式碼庫;創作者可累積選題 Skill;研究者可把論文處理流程沉澱為可複用 Skill——硬體職責是讓這三類複利別掉線

05

六步落地:從選型到 Hermes 常駐運行

  1. 01

    明確記憶層需求:僅雲端 API → 16GB 起步;本機推理 + 大 Skill 庫 → 32GB。

  2. 02

    選擇獨佔硬體:對照上表,排除樹莓派與「會合蓋的筆電」。

  3. 03

    月租下單:線上選配 Mac Mini M4,簽約收貨,接電聯網(無需深厚維運背景)。

  4. 04

    安裝 Hermes:執行官方 curl 安裝,hermes model 設定 Nous Portal / OpenRouter 等提供商。

  5. 05

    設定渠道與 Gateway:接入 Telegram 等,確認 Gateway 7×24 由 launchd 拉起。

  6. 06

    備份 ~/.hermes:定期 tar 備份;退租前匯出並清除裝置資料,記憶可遷移到新機。

  • 安裝路徑:預設 ~/.hermes/(Linux/macOS);資料留在本機,MIT 開源無遙測上傳(以官方 README 為準)。
  • 自我進化:任務完成後自動提煉 Skill,屬於 L2 層複利機制。
  • 底層模型:Hermes-3 + Atropos RL 針對工具呼叫與長任務;本機可選 MLX / llama.cpp 路線。

樹莓派適合玩具級驗證,VPS 適合短期 Demo;一旦你把 Hermes 當作「會成長的同事」,記憶連續性就會一票否決「偶爾在線」的方案。自購 Mac 可行,但先月租 30 天往往比直接砸首付更理性。

若團隊還要在同一台機器跑 iOS 建置、Xcode 自動化或遠端 SSH,繼續擠低配 VPS 會遇到簽名環境不完整、鄰居干擾與合蓋休眠等問題。對需要穩定常駐 Hermes Agent、並保留 macOS 原生工具鏈的生產環境,NodeMini 的 Mac Mini 雲端租賃通常比「將就的 Linux VPS 伺服器 + 純雲端 API」更省心——你專注讓 Agent 從 Stateless 走向 Persistent,而不是半夜修 Gateway。

FAQ

常見問題

L2/L3 在 ~/.hermes/,重啟不丟檔案;但 L1 未落盤內容會丟。長期離線會讓 episodic 檢索變「鈍」。換機前請打包備份。

NodeMini 提供按月/按季獨佔 Mac Mini,機型與價格見 租賃價格說明。模型 API 費用由你選的 Hermes 提供商(如 Nous Portal、OpenRouter)單獨結算。

昨日文是親身遷移時間線 + TCO;本篇聚焦三層記憶架構與硬體輪廓。兩篇可搭配閱讀。更多接入問題見 說明中心