De Stateless à Persistent :
architecture mémoire Hermes Agent et tests Mac Mini M4 (2026)

Avant de choisir du matériel, la question pertinente n'est pas seulement « Hermes perd-il la mémoire au redémarrage », mais comment ses trois niveaux de mémoire interagissent avec l'infrastructure. Ce guide s'adresse aux équipes qui préparent un déploiement local de Hermes : d'abord le passage de Nous Research du chat stateless à l'agent persistant, puis un profil ressources Raspberry Pi / VPS / Mac Mini M4, et enfin le TCO de location mensuelle avec une checklist en six étapes.

01

Pourquoi Hermes Agent exige une machine toujours allumée

En février 2026, Nous Research a publié Hermes Agent en open source sur GitHub. L'enjeu n'était pas « un chat de plus », mais un agent qui habite votre machine : mémoire persistante entre sessions, documentation automatique des Skills, familiarité croissante avec vos flux de travail. Licence MIT, installation en une ligne curl, plus de 20 canaux (Telegram, Discord, Slack) : pour beaucoup, la première étape concrète hors du copilote cloud vers un agent IA local.

Hermes n'est pas un script ponctuel : le Gateway doit rester en ligne 7×24, les couches mémoire écrivent en continu dans ~/.hermes/, les Skills évoluent en production. Un portable en veille, une carte SD usée sur Raspberry Pi, une fenêtre de maintenance VPS : autant d'interruptions qui brisent l'effet cumulatif de la mémoire. La documentation exige un contexte modèle d'au moins 64K tokens pour des appels d'outils multi-étapes fiables ; la barre matérielle passe de « ça tourne » à « ça tourne sans rupture ».

La question centrale devient : quelle machine permet aux trois niveaux de s'accumuler, de rechercher vite et de garder les canaux connectés ? Pour un récit de migration depuis un VPS, voir l'article compagnon trois mois sur VPS, puis Mac Mini M4.

  1. 01

    Contexte court terme :session courante et chaîne d'outils dans le processus Gateway ; après redémarrage, seul le contenu déjà persisté subsiste.

  2. 02

    Documents Skill :les tâches complexes deviennent des Skills Markdown ; la bibliothèque croissante augmente la pression IO et de recherche.

  3. 03

    Modèle utilisateur :USER.md, MEMORY.md, state.db capitalisent entre sessions ; rollback de snapshot et offline prolongé sont les pires ennemis.

  4. 04

    Couche canaux :Telegram et 20+ intégrations exigent une écoute permanente ; hors ligne signifie tâches en échec ou en attente.

  5. 05

    Inférence (optionnelle) :Hermes-3 local / MLX consomme l'UMA ; mode API pur demande quand même assez de RAM Gateway.

  6. 06

    Conclusion :« toujours allumé » sert l'agent persistant, pas le gaspillage — la location mensuelle Mac Mini M4 transforme le CapEx en OpEx prévisible.

02

Architecture à trois niveaux : du contexte de session au modèle utilisateur

La communauté résume la mémoire Hermes en trois niveaux (alignés sur SOUL.md, Skills et stockage épisodique dans la doc Nous) :

Niveau 1 : contexte de session à court terme

Conversation en cours, chaîne d'appels d'outils et état RAM du Gateway. Comme une fenêtre de contexte, sauf que Hermes pousse les fragments utiles vers la couche longue durée. Sensible à la CPU et à la latence réseau : un ordre Telegram depuis le mobile via un VPS distant multiplie la latence ressentie.

Niveau 2 : documents Skill réutilisables

Après une tâche complexe, Hermes distille la résolution en Skill — les problèmes similaires ne repartent pas de zéro. Markdown sur disque ; au-delà de quelques dizaines de Skills, ripgrep / recherche FTS et IO aléatoire deviennent le goulot. En test, au-delà de 2 Go dans state.db, la recherche passe de millisecondes à ~100 ms : l'agent semble « moins sharp », sans que le modèle ait changé.

Niveau 3 : modèle utilisateur persistant inter-sessions

USER.md, MEMORY.md et SQLite state.db enregistrent préférences, faits et index épisodiques. C'est l'avantage de Hermes face aux API stateless : Hermes-3 affiné par Atropos RL pour les longues tâches et les outils — mais seul le niveau 3 produit l'effet « il me connaît ».

NiveauStockage principalPression matérielleOffline / redémarrage
L1 contexteProcessus Gateway + logsCPU, RTT réseauDétails non persistés perdus
L2 Skills~/.hermes/skills/ etc.Disque, IO rechercheFichiers conservés, index à reconstruire
L3 modèle utilisateurstate.db, MarkdownCache RAM, FTS5Rollback snapshot dégrade la qualité

« Avant le matériel, regardez la couche : L1 veut de la latence, L2 du disque, L3 de la continuité — les trois détestent le “parfois en ligne”. »

03

Raspberry Pi, VPS ou Mac Mini M4 ? Comparatif matériel

Tableau qualitatif issu de déploiements communautaires et de nos mesures (pas un benchmark constructeur) — pour répondre à « quelle machine pour Hermes Agent en 2026 » :

OptionContinuité mémoireHermes-3 local / MetalAdéquation 7×24Goulot typique
Raspberry Pi 4/5SD et RAM limitéesQuasi impossibleFaible (IO, thermique)8 Go RAM, stockage lent
VPS LinuxPossible, risque maintenancePas de MetalMoyenne (datacenter stable)Latence inter-régions, pas de macOS natif
Location Mac Mini M4macOS + Time MachineUMA 16/32 GoÉlevée (silencieux, ~5–8 W idle)Choisir la bonne RAM

Le Mac Mini M4 tire parti de l'architecture mémoire unifiée (UMA) : CPU, GPU et Neural Engine partagent un pool à haute bande passante — l'inférence locale évite les copies CPU↔VRAM. Hermes supporte macOS nativement ; curl -fsSL https://get.hermes-agent.org | bash pour installer ; launchd maintient le Gateway en permanence, adapté au bureau ou au local technique en fonctionnement continu.

bash
# Installation macOS (après livraison location)
curl -fsSL https://get.hermes-agent.org | bash

# Sauvegarde du répertoire mémoire à trois niveaux
tar czf hermes-backup.tgz -C ~ .hermes

# Vérifier l'état Gateway (wizard configure le service)
# Sous-commandes : hermes --help (selon version)
warning

Attention :Hermes exige un contexte modèle ≥ 64K. En local llama.cpp / Ollama, définir --ctx-size 65536 ou équivalent, sinon refus au démarrage.

04

Louer un Mac Mini M4 pour Hermes : TCO 24 mois et coût de décision

L'achat convient si vous êtes certain de trois ans d'exclusivité ; pour valider un workflow « agent persistant », la location mensuelle convertit l'acompte et l'amortissement en OpEx fixe. Matrice de décision (tarifs actuels : tarifs de location) :

Dimension (24 mois)Achat M4 (16 Go)Location M4
TrésorerieDépense unique élevéeMensualités, faible acompte
Risque sur la mémoireOps et migration à votre chargeBackup ~/.hermes migrable
Adéquation HermesOptimalemacOS natif identique
ProfilExclusivité long termeTester l'agent 30 jours avant achat
info

En pratique :les développeurs laissent Hermes suivre le dépôt ; les créateurs accumulent des Skills ; les chercheurs persistent des pipelines — le matériel doit éviter de couper ces trois courbes de capitalisation.

05

Six étapes : de la sélection au fonctionnement permanent de Hermes

  1. 01

    Clarifier les besoins par niveau :API cloud seule → 16 Go ; inférence locale + grande bibliothèque Skills → 32 Go.

  2. 02

    Choisir du matériel exclusif :voir le tableau — exclure Raspberry Pi et portable qui se ferme.

  3. 03

    Commander la location :configurer le Mac Mini M4 en ligne, réception, alimentation et réseau sans expertise ops avancée.

  4. 04

    Installer Hermes :script curl officiel ; hermes model pour Nous Portal / OpenRouter.

  5. 05

    Canaux et Gateway :Telegram etc. ; launchd maintient le Gateway 7×24.

  6. 06

    Sauvegarder ~/.hermes :tar régulier ; avant fin de location, exporter et effacer l'appareil — la mémoire migre.

  • Chemin des données :défaut ~/.hermes/ ; données sur la machine, MIT sans télémétrie (README officiel).
  • Auto-évolution :Skills générés après chaque tâche — capitalisation niveau L2.
  • Modèle :Hermes-3 + Atropos RL pour outils et longues tâches ; local via MLX / llama.cpp.

Raspberry Pi pour une validation légère, VPS pour une démo courte — dès que Hermes devient un « collègue qui grandit », la continuité mémoire élimine toute solution « parfois en ligne ». L'achat reste viable ; 30 jours de location d'abord est souvent plus rationnel.

Si l'équipe doit aussi builder iOS, automatiser Xcode ou partager un SSH sur la même machine, un VPS bas de gamme ou un portable en veille posent des problèmes de signature, de voisinage et de disponibilité. Pour un environnement de production exigeant un Hermes Agent stable avec toolchain macOS native, la location Mac Mini cloud de NodeMini est en général plus sereine qu'un VPS Linux couplé à une API distante — vous concentrez l'énergie sur le passage de Stateless à Persistent, pas sur la réparation nocturne du Gateway.

FAQ

Questions fréquentes

L2/L3 résident dans ~/.hermes/ — les fichiers restent. Le L1 non persisté disparaît. Un offline prolongé adoucit la recherche épisodique. Avant migration : archiver la sauvegarde.

NodeMini propose une location exclusive mensuelle ou trimestrielle. Modèles et tarifs : tarifs de location. L'API modèle est facturée séparément par votre fournisseur Hermes.

L'article compagnon raconte la timeline de migration et le TCO ; celui-ci se concentre sur l'architecture à trois niveaux et le profil matériel. Les deux se complètent. Plus d'aide : centre d'aide.