如果你在選型前只問一句「Hermes Agent 重啟會丟記憶嗎」,答案取決於你理解它的三層記憶,而不只是會不會關機。本文面向準備本機部署 Hermes 的開發者:先講清 Nous Research 如何從 Stateless 聊天走向 Persistent Agent,再用樹莓派 / VPS / Mac Mini M4 的資源輪廓對照各層壓力,最後給出月租 Mac Mini M4 的 TCO 思路與六步落地清單。
2026 年 2 月,Nous Research 開源的 Hermes Agent 在 GitHub 上迅速走紅——賣點不是「多聊兩句」,而是真正住在你機器上的 Agent:跨會話持久記憶、自動產生 Skill 文件、任務做得越多越像「老同事」。MIT 授權、一條 curl 安裝、支援 Telegram / Discord / Slack 等 20+ 渠道,讓它成為許多開發者從雲端 Copilot 轉向本機 AI Agent 部署 的第一站。
但 Hermes 和一次性腳本不同:Gateway 需要 7×24 在線,記憶層要持續寫入 ~/.hermes/,Skill 要在使用中迭代。筆電合蓋、樹莓派 SD 卡磨損、VPS 維護窗口——都會讓「複利」斷檔。官方文件也要求模型上下文至少 64K tokens,多步工具呼叫才能穩定;這進一步把硬體從「能跑」推到「能連續跑」。
因此選型核心問題不是「能不能裝」,而是:哪台機器能讓三層記憶穩定累積、檢索不慢、渠道不掉線? 下文用架構拆解 + 實測對照回答;若你更關心從 VPS 遷出的親身時間線,可參考本站昨日的VPS 三個月遷移實測。
短期上下文層:目前會話與工具鏈狀態,Gateway 行程內維護,重啟後取決於是否已落盤。
Skill 文件層:複雜任務沉澱為 Markdown Skill,磁碟成長 → 檢索與 IO 壓力上升。
使用者模型層:USER.md、MEMORY.md、state.db 跨會話複利,最忌快照回滾與長期離線。
渠道層:Telegram 等 20+ 接入需常駐監聽,掉線 = 自動化任務排隊或失敗。
推理層(可選):本機 Hermes-3 / MLX 吃 UMA;純 API 模式仍要留足 Gateway 記憶體。
結論:「一直開著」是為 Persistent,而非浪費電——月租 Mac Mini M4 把 CapEx 換成可預測的 OpEx。
社群常把 Hermes 的記憶概括為三層(與 Nous 文件中的 SOUL.md、Skill、episodic 儲存一致):
目前對話、工具呼叫鏈路與 Gateway 記憶體態。它像傳統 Chatbot 的 context window,但 Hermes 會主動把高價值片段推進長期層。這一層對CPU 與網路頻寬、延遲敏感:手機下發任務經 Telegram 往返,機器若在遠端 VPS 伺服器,體感延遲會放大。
完成複雜任務後,Hermes 會把解決過程提煉成 Skill——下次類似問題不從零推理。Skill 以 Markdown 形式落盤,數量上來後,ripgrep / FTS 檢索 與磁碟隨機讀寫成為瓶頸。我在測試中見過 state.db 超過 2GB 後檢索從毫秒級升到百毫秒級——Agent「變笨」往往是 IO,不是模型變差。
USER.md、MEMORY.md 與 SQLite state.db 記錄偏好、事實與 episodic 檢索索引。這是 Hermes 相對「Stateless API」的護城河:Atropos RL 微調的 Hermes-3 擅長長任務與工具呼叫,但只有第三層連續,才會出現「越用越懂你」的複利。
| 記憶層 | 主要儲存 | 典型硬體壓力 | 掉線/重啟影響 |
|---|---|---|---|
| L1 會話上下文 | Gateway 行程 + 部分日誌 | CPU、網路 RTT | 未落盤則遺失當輪細節 |
| L2 Skill | ~/.hermes/skills/ 等 | 磁碟容量、檢索 IO | 檔案在則不丟,但索引需重建時間 |
| L3 使用者模型 | state.db、Markdown 記憶 | 記憶體快取、FTS5 | 快照回滾會傷檢索品質 |
「選硬體前先看記憶層:L1 要延遲,L2 要磁碟,L3 要連續性——三者都怕『偶爾在線』。」
下表基於社群部署經驗與筆者監控資料整理的定性對照(非廠商 benchmark),用於回答「2026 年跑 Hermes Agent 用什麼機器」:
| 方案 | 記憶連續性 | 本機 Hermes-3 / Metal | 7×24 適合度 | 典型瓶頸 |
|---|---|---|---|---|
| 樹莓派 4/5 | 易因 SD 卡與記憶體不足中斷 | 基本不可行 | 低(IO 與散熱) | 8GB 記憶體、慢儲存 |
| Linux VPS | 可用,維護窗口風險 | 無 Metal | 中(機房穩定) | 跨區延遲、macOS 腳本斷層 |
| Mac Mini M4 月租 | 原生 macOS + Time Machine | UMA 16/32GB | 高(靜音低功耗) | 需選對記憶體檔位 |
Mac Mini M4 的優勢在於統一記憶體架構(UMA):CPU、GPU 與神經引擎共享高頻寬記憶體池,本機推理不必在 CPU 與「顯存」間拷貝。Hermes 官方支援 macOS,curl -fsSL https://get.hermes-agent.org | bash 即可安裝;配合 launchd 常駐 Gateway,適合放在桌面或弱電間長期開機(閒置功耗約 5–8W 量級,社群經驗值)。
# macOS 一鍵安裝(租機到手後) curl -fsSL https://get.hermes-agent.org | bash # 備份三層記憶核心目錄 tar czf hermes-backup.tgz -C ~ .hermes # 查看 Gateway 狀態(安裝精靈會設定服務) # 具體子命令以目前版本 hermes --help 為準
注意:Hermes 要求模型上下文 ≥ 64K。本機 llama.cpp / Ollama 須明確設定 --ctx-size 65536 或等價參數,否則啟動階段會被拒絕。
自購 Mac Mini M4 適合已確定 3 年以上獨佔的場景;但對多數想驗證「Persistent Agent 工作流」的人,月租把首付與折舊轉成固定 OpEx,並保留到期升配 M 系新機的彈性。下表為決策矩陣(具體月租見 租賃價格說明):
| 維度(24 個月) | 自購 M4(16GB) | 月租 M4 |
|---|---|---|
| 現金占用 | 一次性硬體支出高 | 分散月費、低首付 |
| 記憶資產風險 | 自管維修與遷移 | 換機可遷移 ~/.hermes 備份 |
| Hermes 適配 | 最優 | 同樣原生 macOS |
| 適合誰 | 長期獨佔 + 自擔折舊 | 先讓 Agent 跑滿 30 天再決定買斷 |
提示:開發者可讓 Hermes 持續跟進程式碼庫;創作者可累積選題 Skill;研究者可把論文處理流程沉澱為可複用 Skill——硬體職責是讓這三類複利別掉線。
明確記憶層需求:僅雲端 API → 16GB 起步;本機推理 + 大 Skill 庫 → 32GB。
選擇獨佔硬體:對照上表,排除樹莓派與「會合蓋的筆電」。
月租下單:線上選配 Mac Mini M4,簽約收貨,接電聯網(無需深厚維運背景)。
安裝 Hermes:執行官方 curl 安裝,hermes model 設定 Nous Portal / OpenRouter 等提供商。
設定渠道與 Gateway:接入 Telegram 等,確認 Gateway 7×24 由 launchd 拉起。
備份 ~/.hermes:定期 tar 備份;退租前匯出並清除裝置資料,記憶可遷移到新機。
~/.hermes/(Linux/macOS);資料留在本機,MIT 開源無遙測上傳(以官方 README 為準)。樹莓派適合玩具級驗證,VPS 適合短期 Demo;一旦你把 Hermes 當作「會成長的同事」,記憶連續性就會一票否決「偶爾在線」的方案。自購 Mac 可行,但先月租 30 天往往比直接砸首付更理性。
若團隊還要在同一台機器跑 iOS 建置、Xcode 自動化或遠端 SSH,繼續擠低配 VPS 會遇到簽名環境不完整、鄰居干擾與合蓋休眠等問題。對需要穩定常駐 Hermes Agent、並保留 macOS 原生工具鏈的生產環境,NodeMini 的 Mac Mini 雲端租賃通常比「將就的 Linux VPS 伺服器 + 純雲端 API」更省心——你專注讓 Agent 從 Stateless 走向 Persistent,而不是半夜修 Gateway。