Если перед выбором железа вы спрашиваете только «теряет ли Hermes память после ребута», ответ зависит от трёх слоёв памяти, а не от факта shutdown. Статья для тех, кто деплоит Hermes локально: сначала как Nous Research ушёл от stateless-чата к persistent agent, затем профиль нагрузки на Raspberry Pi / VPS / Mac Mini M4 с акцентом на Metal и UMA, и в конце TCO аренды плюс чеклист из шести шагов.
В феврале 2026 Nous Research выкатил open-source Hermes Agent на GitHub — не «ещё один чат», а agent, который живёт на вашем железе: cross-session persistent memory, auto-generated Skill docs, накопление контекста как у «старого коллеги». MIT, install через один curl, 20+ каналов (Telegram, Discord, Slack) — для многих первая точка входа из cloud copilot в локальный AI agent deploy.
Hermes — не one-shot script: Gateway должен быть online 7×24, memory layers пишут в ~/.hermes/, Skills итерируются в runtime. Sleep ноутбука, wear SD-карты на Pi, maintenance window на VPS — всё рвёт compound effect памяти. Документация требует model context ≥ 64K tokens для стабильных multi-step tool calls; hardware bar смещается от «заводится» к «не падает неделями».
Ключевой вопрос: какая машина держит три слоя памяти, не тормозит retrieval и не роняет каналы? Timeline миграции с VPS — в соседней статье три месяца на VPS, потом Mac Mini M4.
L1 — short-term context:текущая сессия и tool chain в процессе Gateway; после reboot остаётся только то, что успело persist.
L2 — Skill documents:сложные задачи упаковываются в Markdown Skills; растущая библиотека бьёт по disk IO и FTS retrieval.
L3 — user model:USER.md, MEMORY.md, state.db копят cross-session state; snapshot rollback и long offline — worst case.
Channel layer:Telegram и 20+ endpoints требуют persistent listener; offline = queued или failed automation.
Inference (optional):local Hermes-3 / MLX жрёт UMA; pure API mode всё равно нужен запас RAM под Gateway.
Вывод:always-on — это про persistent agent, не про waste of watts; аренда Mac Mini M4 конвертирует CapEx в предсказуемый OpEx.
Комьюнити сводит память Hermes к трём слоям (совпадает с Nous docs: SOUL.md, Skills, episodic storage):
Текущий диалог, tool call chain и in-memory state Gateway. Как context window, но Hermes nudge'ит ценные куски в long-term layer. Чувствителен к CPU и network RTT: команда с телефона через Telegram на удалённый VPS умножает perceived latency.
После hard task Hermes дистиллирует pipeline в Skill — похожие кейсы не стартуют с нулевого prompt. Markdown on disk; когда Skills считаются десятками, ripgrep / FTS5 и random read становятся bottleneck. В наших замерах при state.db > 2 GB retrieval уехал с ms на ~100 ms — agent «тупеет» из-за IO, не из-за model weights.
USER.md, MEMORY.md, SQLite state.db — preferences, facts, episodic index. Это moat Hermes против stateless API: Hermes-3 с Atropos RL заточен под long-horizon tasks и tool use, но «знает меня» появляется только когда L3 непрерывен.
| Слой | Storage | Hardware pressure | Offline / reboot |
|---|---|---|---|
| L1 context | Gateway process + logs | CPU, network RTT | Unpersisted теряется |
| L2 Skills | ~/.hermes/skills/ etc. | Disk, retrieval IO | Files OK, index rebuild |
| L3 user model | state.db, Markdown | RAM cache, FTS5 | Snapshot rollback бьёт quality |
«Перед hardware смотри слой: L1 хочет latency, L2 — disk IO, L3 — continuity. Все три ненавидят “иногда online”.»
Качественная таблица из community deploys и нашего monitoring (не vendor benchmark) — ответ на «какое железо под Hermes Agent в 2026»:
| Setup | Memory continuity | Local Hermes-3 / Metal | 7×24 fit | Typical bottleneck |
|---|---|---|---|---|
| Raspberry Pi 4/5 | SD wear, RAM ceiling | Non-starter | Low (IO, thermals) | 8 GB RAM, slow storage |
| Linux VPS | OK, maintenance risk | No Metal backend | Mid (DC stable) | Cross-region RTT, no native macOS |
| Mac Mini M4 rent | native macOS + Time Machine | UMA 16/32 GB + Metal | High (~5–8 W idle) | Pick RAM tier |
Mac Mini M4 выигрывает за счёт Unified Memory Architecture (UMA): CPU, GPU и Neural Engine делят один high-bandwidth pool — local inference без CPU↔VRAM copy overhead, который на x86+dGPU съедает latency. Hermes официально на macOS; curl -fsSL https://get.hermes-agent.org | bash; launchd держит Gateway always-on. Для локального Hermes-3 через MLX/llama.cpp Metal — primary backend; на VPS его просто нет.
# macOS one-liner (после доставки арендованного Mac) curl -fsSL https://get.hermes-agent.org | bash # Backup трёх слоёв памяти tar czf hermes-backup.tgz -C ~ .hermes # Gateway status (wizard настраивает launchd) # Subcommands: hermes --help (проверь версию)
Важно:Hermes требует model context ≥ 64K. Для local llama.cpp / Ollama явно --ctx-size 65536, иначе reject на старте.
Покупка имеет смысл при 3+ годах exclusive use; для валидации persistent agent workflow месячная аренда переводит down payment и depreciation в фиксированный OpEx. Decision matrix (актуальные цены аренды):
| Dimension (24 mo) | Buy M4 (16 GB) | Rent M4 |
|---|---|---|
| Cash lock | Large upfront | Monthly fee, low down |
| Memory asset risk | Self-managed ops | ~/.hermes tarball migrates |
| Hermes fit | Optimal | Same native macOS |
| Who | Long exclusive + own depreciation | Run agent 30 days, then buy |
Pattern:devs пускают Hermes в codebase; creators копят Skill library; researchers persist paper pipelines — hardware не должен рвать эти три compound curves.
Map memory layers:cloud API only → 16 GB; local inference + fat Skill lib → 32 GB UMA.
Exclusive hardware:см. таблицу — вычеркни Pi и laptop с sleep.
Rent order:Mac Mini M4 online, delivery, power+net — без deep ops background.
Install Hermes:official curl; hermes model для Nous Portal / OpenRouter.
Channels + Gateway:Telegram etc.; launchd держит process 7×24.
Backup ~/.hermes:regular tar; перед end of rent — export и wipe; memory едет на новый node.
~/.hermes/; data on-box, MIT без telemetry (README).Pi — toy validation, VPS — short demo; когда Hermes становится «растущим коллегой», memory continuity veto'ит «иногда online». Buy возможен, но сначала 30 дней rent — рациональнее для большинства.
Если на той же машине нужны iOS builds, Xcode automation или team SSH — low-tier VPS и sleep laptop ломаются на incomplete signing env, noisy neighbors и lid-close. Для prod, где нужен стабильный Hermes Agent с native macOS toolchain, аренда Mac Mini в облаке NodeMini обычно спокойнее, чем Linux VPS + remote API — вы двигаете agent от Stateless к Persistent, а не чините Gateway в 3 ночи.
L2/L3 в ~/.hermes/ — files survive. L1 без persist — gone. Long offline тупит episodic retrieval. Перед migration — tarball backup.
NodeMini — exclusive monthly/quarterly rent. Модели и цены: цены аренды. Model API billing — отдельно у вашего Hermes provider.
Соседняя — migration timeline + TCO; эта — трёхслойная архитектура и hardware profile. Читайте в паре. Подключение: центр помощи.