Hermes Agent perd-il la mémoire au redémarrage ?

Pas entièrement : L2/L3 résident dans ~/.hermes/. Le contenu L1 non persisté disparaît. Une longue indisponibilité dégrade la recherche épisodique. Sauvegardes régulières et fonctionnement 7×24 recommandés.

Quel niveau de mémoire sollicite le plus le matériel ?

À moyen terme, la bibliothèque de Skills et l'IO de state.db ; avec inférence locale Hermes-3, la mémoire unifiée et le GPU deviennent le goulot.

Faut-il obligatoirement acheter un Mac Mini ?

Non : une location mensuelle Mac Mini M4 permet de valider le workflow avant achat. L'essentiel est l'exclusivité, la faible latence, macOS natif et une alimentation stable.

De Stateless à Persistent : architecture mémoire à trois niveaux de Hermes Agent et tests matériels Mac Mini M4 (2026)

Pourquoi Hermes Agent exige une machine toujours allumée

En février 2026, Nous Research a publié Hermes Agent en open source sur GitHub. L'enjeu n'était pas « un chat de plus », mais un agent qui habite votre machine : mémoire persistante entre sessions, documentation automatique des Skills, familiarité croissante avec vos flux de travail. Licence MIT, installation en une ligne curl, plus de 20 canaux (Telegram, Discord, Slack) : pour beaucoup, la première étape concrète hors du copilote cloud vers un agent IA local.

Hermes n'est pas un script ponctuel : le Gateway doit rester en ligne 7×24, les couches mémoire écrivent en continu dans ~/.hermes/, les Skills évoluent en production. Un portable en veille, une carte SD usée sur Raspberry Pi, une fenêtre de maintenance VPS : autant d'interruptions qui brisent l'effet cumulatif de la mémoire. La documentation exige un contexte modèle d'au moins 64K tokens pour des appels d'outils multi-étapes fiables ; la barre matérielle passe de « ça tourne » à « ça tourne sans rupture ».

La question centrale devient : quelle machine permet aux trois niveaux de s'accumuler, de rechercher vite et de garder les canaux connectés ? Pour un récit de migration depuis un VPS, voir l'article compagnon trois mois sur VPS, puis Mac Mini M4.

01
Contexte court terme :session courante et chaîne d'outils dans le processus Gateway ; après redémarrage, seul le contenu déjà persisté subsiste.
02
Documents Skill :les tâches complexes deviennent des Skills Markdown ; la bibliothèque croissante augmente la pression IO et de recherche.
03
Modèle utilisateur :USER.md, MEMORY.md, state.db capitalisent entre sessions ; rollback de snapshot et offline prolongé sont les pires ennemis.
04
Couche canaux :Telegram et 20+ intégrations exigent une écoute permanente ; hors ligne signifie tâches en échec ou en attente.
05
Inférence (optionnelle) :Hermes-3 local / MLX consomme l'UMA ; mode API pur demande quand même assez de RAM Gateway.
06
Conclusion :« toujours allumé » sert l'agent persistant, pas le gaspillage — la location mensuelle Mac Mini M4 transforme le CapEx en OpEx prévisible.

Architecture à trois niveaux : du contexte de session au modèle utilisateur

La communauté résume la mémoire Hermes en trois niveaux (alignés sur SOUL.md, Skills et stockage épisodique dans la doc Nous) :

Niveau 1 : contexte de session à court terme

Conversation en cours, chaîne d'appels d'outils et état RAM du Gateway. Comme une fenêtre de contexte, sauf que Hermes pousse les fragments utiles vers la couche longue durée. Sensible à la CPU et à la latence réseau : un ordre Telegram depuis le mobile via un VPS distant multiplie la latence ressentie.

Niveau 2 : documents Skill réutilisables

Après une tâche complexe, Hermes distille la résolution en Skill — les problèmes similaires ne repartent pas de zéro. Markdown sur disque ; au-delà de quelques dizaines de Skills, ripgrep / recherche FTS et IO aléatoire deviennent le goulot. En test, au-delà de 2 Go dans state.db, la recherche passe de millisecondes à ~100 ms : l'agent semble « moins sharp », sans que le modèle ait changé.

Niveau 3 : modèle utilisateur persistant inter-sessions

USER.md, MEMORY.md et SQLite state.db enregistrent préférences, faits et index épisodiques. C'est l'avantage de Hermes face aux API stateless : Hermes-3 affiné par Atropos RL pour les longues tâches et les outils — mais seul le niveau 3 produit l'effet « il me connaît ».

Niveau	Stockage principal	Pression matérielle	Offline / redémarrage
L1 contexte	Processus Gateway + logs	CPU, RTT réseau	Détails non persistés perdus
L2 Skills	`~/.hermes/skills/` etc.	Disque, IO recherche	Fichiers conservés, index à reconstruire
L3 modèle utilisateur	`state.db`, Markdown	Cache RAM, FTS5	Rollback snapshot dégrade la qualité

« Avant le matériel, regardez la couche : L1 veut de la latence, L2 du disque, L3 de la continuité — les trois détestent le “parfois en ligne”. »

Raspberry Pi, VPS ou Mac Mini M4 ? Comparatif matériel

Tableau qualitatif issu de déploiements communautaires et de nos mesures (pas un benchmark constructeur) — pour répondre à « quelle machine pour Hermes Agent en 2026 » :

Option	Continuité mémoire	Hermes-3 local / Metal	Adéquation 7×24	Goulot typique
Raspberry Pi 4/5	SD et RAM limitées	Quasi impossible	Faible (IO, thermique)	8 Go RAM, stockage lent
VPS Linux	Possible, risque maintenance	Pas de Metal	Moyenne (datacenter stable)	Latence inter-régions, pas de macOS natif
Location Mac Mini M4	macOS + Time Machine	UMA 16/32 Go	Élevée (silencieux, ~5–8 W idle)	Choisir la bonne RAM

Le Mac Mini M4 tire parti de l'architecture mémoire unifiée (UMA) : CPU, GPU et Neural Engine partagent un pool à haute bande passante — l'inférence locale évite les copies CPU↔VRAM. Hermes supporte macOS nativement ; curl -fsSL https://get.hermes-agent.org | bash pour installer ; launchd maintient le Gateway en permanence, adapté au bureau ou au local technique en fonctionnement continu.

bash

# Installation macOS (après livraison location)
curl -fsSL https://get.hermes-agent.org | bash

# Sauvegarde du répertoire mémoire à trois niveaux
tar czf hermes-backup.tgz -C ~ .hermes

# Vérifier l'état Gateway (wizard configure le service)
# Sous-commandes : hermes --help (selon version)

warning

Attention :Hermes exige un contexte modèle ≥ 64K. En local llama.cpp / Ollama, définir --ctx-size 65536 ou équivalent, sinon refus au démarrage.

Louer un Mac Mini M4 pour Hermes : TCO 24 mois et coût de décision

L'achat convient si vous êtes certain de trois ans d'exclusivité ; pour valider un workflow « agent persistant », la location mensuelle convertit l'acompte et l'amortissement en OpEx fixe. Matrice de décision (tarifs actuels : tarifs de location) :

Dimension (24 mois)	Achat M4 (16 Go)	Location M4
Trésorerie	Dépense unique élevée	Mensualités, faible acompte
Risque sur la mémoire	Ops et migration à votre charge	Backup ~/.hermes migrable
Adéquation Hermes	Optimale	macOS natif identique
Profil	Exclusivité long terme	Tester l'agent 30 jours avant achat

info

En pratique :les développeurs laissent Hermes suivre le dépôt ; les créateurs accumulent des Skills ; les chercheurs persistent des pipelines — le matériel doit éviter de couper ces trois courbes de capitalisation.

Six étapes : de la sélection au fonctionnement permanent de Hermes

01
Clarifier les besoins par niveau :API cloud seule → 16 Go ; inférence locale + grande bibliothèque Skills → 32 Go.
02
Choisir du matériel exclusif :voir le tableau — exclure Raspberry Pi et portable qui se ferme.
03
Commander la location :configurer le Mac Mini M4 en ligne, réception, alimentation et réseau sans expertise ops avancée.
04
Installer Hermes :script curl officiel ; hermes model pour Nous Portal / OpenRouter.
05
Canaux et Gateway :Telegram etc. ; launchd maintient le Gateway 7×24.
06
Sauvegarder ~/.hermes :tar régulier ; avant fin de location, exporter et effacer l'appareil — la mémoire migre.

Chemin des données :défaut ~/.hermes/ ; données sur la machine, MIT sans télémétrie (README officiel).
Auto-évolution :Skills générés après chaque tâche — capitalisation niveau L2.
Modèle :Hermes-3 + Atropos RL pour outils et longues tâches ; local via MLX / llama.cpp.

Raspberry Pi pour une validation légère, VPS pour une démo courte — dès que Hermes devient un « collègue qui grandit », la continuité mémoire élimine toute solution « parfois en ligne ». L'achat reste viable ; 30 jours de location d'abord est souvent plus rationnel.

Si l'équipe doit aussi builder iOS, automatiser Xcode ou partager un SSH sur la même machine, un VPS bas de gamme ou un portable en veille posent des problèmes de signature, de voisinage et de disponibilité. Pour un environnement de production exigeant un Hermes Agent stable avec toolchain macOS native, la location Mac Mini cloud de NodeMini est en général plus sereine qu'un VPS Linux couplé à une API distante — vous concentrez l'énergie sur le passage de Stateless à Persistent, pas sur la réparation nocturne du Gateway.

FAQ

Questions fréquentes

L2/L3 résident dans ~/.hermes/ — les fichiers restent. Le L1 non persisté disparaît. Un offline prolongé adoucit la recherche épisodique. Avant migration : archiver la sauvegarde.

NodeMini propose une location exclusive mensuelle ou trimestrielle. Modèles et tarifs : tarifs de location. L'API modèle est facturée séparément par votre fournisseur Hermes.

L'article compagnon raconte la timeline de migration et le TCO ; celui-ci se concentre sur l'architecture à trois niveaux et le profil matériel. Les deux se complètent. Plus d'aide : centre d'aide.

De Stateless à Persistent : architecture mémoire Hermes Agent et tests Mac Mini M4 (2026)

Pourquoi Hermes Agent exige une machine toujours allumée

Architecture à trois niveaux : du contexte de session au modèle utilisateur

Niveau 1 : contexte de session à court terme

Niveau 2 : documents Skill réutilisables

Niveau 3 : modèle utilisateur persistant inter-sessions

Raspberry Pi, VPS ou Mac Mini M4 ? Comparatif matériel

Louer un Mac Mini M4 pour Hermes : TCO 24 mois et coût de décision

Six étapes : de la sélection au fonctionnement permanent de Hermes

Questions fréquentes

De Stateless à Persistent :
architecture mémoire Hermes Agent et tests Mac Mini M4 (2026)