Anfang 2026 veröffentlichte Nous Research Hermes Agent — innerhalb von zwei Monaten über 160.000 GitHub Stars, Leitmotiv „the agent that grows with you“. Tragend ist das Skills-System: standardisierte, evolvierbare, sitzungsübergreifende prozedurale Wissensbasis nach agentskills.io. Wer Hermes bereits installiert hat (siehe Installations-Guide), erhält hier die vollständige Fortgeschrittenen-Roadmap: SKILL.md-Format, Progressive Disclosure zur Token-Steuerung, Skill Bundles, bedingte Aktivierung, Tap-Community-Veröffentlichung, GEPA+DSPy-Selbstevolution sowie kuratierte Open-Source-Tap-Repositories — mit Vergleichstabellen, Acht-Schritte-Runbook und vier zitierfähigen Kennzahlen für den Produktionsbetrieb.
Im Gegensatz zu Einmal-Prompts folgen Hermes Skills dem offenen Standard agentskills.io und lassen sich zwischen Hermes, Claude Code und Cursor portieren. Merkhilfe: Prompt = Haftnotiz (nur aktuelle Runde), Memory = Notizbuch (permanent, automatisch injiziert), Skill = SOP-Handbuch (Schrittfolge, bei Bedarf geladen).
| Dimension | Normaler Prompt | Memory | Skills |
|---|---|---|---|
| Persistenz | Aktuelle Konversation | Sitzungsübergreifend, permanent | Sitzungsübergreifend, permanent |
| Ladezeitpunkt | Immer im Kontext | Automatisch pro Sitzung | On-Demand (Kernunterschied) |
| Token-Kosten | Pro Runde | Klein und stabil | Null vor Aktivierung |
| Inhaltstyp | Beliebige Absicht | Nutzerpräferenzen / Fakten | Prozedurale Schritte (Wie) |
| Teilbarkeit | Schwer wiederverwendbar | Privat | Als Community-Tap veröffentlichbar |
Schmerzpunkt: Skill als vollständigen Prompt in den Kontext legen — Token-Kosten skalieren linear mit der Skill-Anzahl.
Schmerzpunkt: Verwandte Skills einzeln per /skill-name triggern — komplexe Workflows brechen ab.
Schmerzpunkt: Kostenloses DuckDuckGo und bezahltes web_search gleichzeitig im Prompt — redundante Tool-Beschreibungen verschwenden Token.
Schmerzpunkt: Jedes Teammitglied baut dieselben Skills neu — kein Ein-Klick-Abonnement für geteilte Skills.
Schmerzpunkt: Skills evolvieren nicht — dieselben Fehler wiederholen sich sitzungsübergreifend.
Dieser Artikel liefert: Vollständige Fortgeschrittenen-Roadmap von SKILL.md-Standard bis GEPA-Selbstevolution — alle Kernmechanismen abgedeckt.
Alle Hermes Skills folgen agentskills.io. Empfohlene Struktur: ~/.hermes/skills/my-category/my-skill/ mit SKILL.md (Kernschritte, Ziel ≤500 Zeilen), references/ (API-Referenz on-demand), templates/ (wiederverwendbare Vorlagen), scripts/ (vom Agent ausführbare Skripte).
---
name: my-skill # Pflicht: Kleinbuchstaben + Bindestrich, max. 64 Zeichen
description: | # Pflicht: max. 1024 Zeichen, mit "Use when..." beginnen
Use when the user needs to [...].
version: 1.0.0
metadata:
hermes:
tags: [devops, automation]
requires_toolsets: [terminal]
fallback_for_toolsets: [web]
---
# My Skill Title
## Overview / When to Use / Procedure / Common Pitfalls / Verification Checklist
| Ladeebene | Inhalt | Auslöser | Token-Kosten |
|---|---|---|---|
| Level 0 | name + description | Sitzungsstart, alle Skills | ca. 3K Token gesamt |
| Level 1 | Vollständiger SKILL.md-Text | Nutzer /skill-name oder LLM-Entscheidung | Abhängig von Dateilänge |
| Level 2 | references/, scripts/ | LLM während Ausführung | On-demand, pro Datei |
Schreibempfehlung: description ist die einzige Level-0-Information — das LLM entscheidet danach über vollständiges Laden. „Wann nutzen“ ist wichtiger als „Was es ist“. Skills >1.000 Zeilen in references/ auslagern; >15KB überschreiten GEPA-Evolutionslimits und müssen gesplittet werden.
Ein Bundle ist eine leichte YAML-Datei, die mehrere verwandte Skills in einen Slash-Befehl bündelt. Bei /bundle-name werden alle gelisteten Skills gleichzeitig geladen. Pfad: ~/.hermes/skill-bundles/<slug>.yaml. Bei Namenskollision gewinnt das Bundle; fehlende Skills werden still übersprungen; Bundles ändern den System-Prompt nicht — token-effizient.
name: backend-dev description: Full backend feature workflow — code review, TDD, and PR management. skills: - github-code-review - test-driven-development - github-pr-workflow instruction: | Always write failing tests first before implementation. Never push directly to main. # CLI-Schnellerstellung: # hermes bundles create backend-dev \ # --skills github-code-review,test-driven-development,github-pr-workflow
Skills können je nach Tool-Verfügbarkeit in der aktuellen Sitzung automatisch ein- oder ausgeblendet werden. Vier Regeltypen unter metadata.hermes:
| Feld | Logik |
|---|---|
requires_toolsets | Skill ausblenden, wenn gelistete Toolsets fehlen |
requires_tools | Skill ausblenden, wenn gelistete Tools fehlen |
fallback_for_toolsets | Ausblenden, wenn Toolsets vorhanden (Fallback-Rolle) |
fallback_for_tools | Ausblenden, wenn Tools vorhanden (Fallback-Rolle) |
Klassisches Szenario: Nach FIRECRAWL_KEY / BRAVE_SEARCH_KEY aktiviert sich bezahltes web_search; DuckDuckGo verschwindet per fallback_for_tools: [web_search] aus dem Prompt — Token gespart. Bei API-Ausfall taucht der Fallback automatisch wieder auf. Plattform-Skills nutzen requires_toolsets: [messaging] plus platforms: [telegram, discord]; pro Plattform schaltbar in der hermes skills-TUI.
hermes skills install official/research/arxiv hermes skills install github:openai/skills/k8s hermes skills tap add github:my-org/my-skills hermes skills tap update && hermes skills tap list
| Repository | Schwerpunkte | Stars |
|---|---|---|
| ChuckSRQ/awesome-hermes-skills | Kuratierte Produktions-Skills: Deep Research, MLOps, Apple-Integration | 67 |
| amanning3390/hermeshub | Community-Registry mit Prompt-Injection-Prüfung pro Skill | 166 |
| kevinnft/ai-agent-skills | 191 Skills, 28 Kategorien, Hermes / Claude / Cursor | 10 |
| NousResearch/hermes-agent | Offizielle Quelle, alle Built-in-Skills | — |
GitHub-Repository als Tap anlegen; Team abonniert mit einem Befehl: hermes skills tap add github:your-org/your-skills-tap. Private Repos: --token $GH_TOKEN. Optional skills.sh.json für Hub-Kategorien. ~/.hermes/skills/ in Git versionieren für geräteübergreifende Sync — bei personenbezogenen Session-Daten in Skills oder Traces DSGVO-konforme Zugriffs- und Löschkonzepte mitdenken.
GEPA (Genetic-Pareto Prompt Evolution) fine-tuned keine Modellgewichte. Es verbessert SKILL.md-Text durch Analyse von Ausführungstraces, Variantenerzeugung und multiobjektive Pareto-Optimierung. Pro Lauf ca. 2–10 USD reine API-Kosten — keine GPU nötig. Fünf Phasen: ① Trace-Sammlung (SQLite) → ② reflektive Fehleranalyse → ③ gezielte Mutation (10–20 Varianten) → ④ Pareto-Bewertung (Erfolgsrate × Token-Effizienz × Geschwindigkeit) → ⑤ manuelles PR-Review.
git clone https://github.com/NousResearch/hermes-agent-self-evolution
cd hermes-agent-self-evolution && pip install -r requirements.txt
export HERMES_AGENT_PATH=~/.hermes
# Synthetische Daten (Einstieg)
python -m evolution.skills.evolve_skill \
--skill github-code-review --iterations 10 --eval-source synthetic
# Echte Sitzungsdaten (bessere Ergebnisse)
python -m evolution.skills.evolve_skill \
--skill github-code-review --iterations 10 --eval-source sessiondb
# Kombinierte Claude/Gemini-Traces (experimentell)
python -m evolution.skills.evolve_skill \
--skill github-code-review --eval-source mixed \
--trace-dirs ~/.claude/traces,~/.hermes/sessions
Vier Sicherheits-Schutzgeländer: ① volle Testsuite 100 % bestanden; ② Skills ≤15KB, Tool-Beschreibungen ≤500 Zeichen; ③ Prompt-Cache-Kompatibilität erhalten; ④ semantische Erhaltungsprüfung gegen Zweckabweichung. Offizielle Roadmap: Phase 1 Skill-Dateien (erledigt) → Phase 2 Tool-Beschreibungen → Phase 3 System-Prompt → Phase 4 Tool-Implementierung → Phase 5 vollautomatische Dauerverbesserung.
Plugin-Skills laden unter dem Namespace plugin:skill (z. B. skill_view("superpowers:writing-plans")). Sie erscheinen nicht in der Standardliste — nur Opt-in-Aktivierung. Der Agent pflegt Skills dynamisch via skill_manage(action='patch'|'create', ...). In config.yaml setzt skills.agent_writes_require_approval: true ein manuelles Freigabe-Gate für Produktionsumgebungen — empfohlen für DSGVO-relevante Workflows mit auditierbaren Änderungen.
Frontmatter nach agentskills.io: name (Kleinbuchstaben-Bindestrich, max. 64 Zeichen), description mit „Use when…“ (max. 1.024 Zeichen), Trigger und Ausschlussfälle präzise formulieren.
Modulares Verzeichnis: Hauptdatei ≤500 Zeilen, API-Details in references/, ausführbare Skripte in scripts/; validieren mit skills-ref validate ./my-skill.
Skill Bundle anlegen: YAML unter ~/.hermes/skill-bundles/ oder hermes bundles create CLI für zusammengehörige Workflow-Skills.
Bedingte Aktivierung: requires_toolsets / fallback_for_tools in metadata.hermes für intelligentes Free/Paid-Tool-Switching.
Tap-Repository veröffentlichen: GitHub-Repo mit Kategorien + optional skills.sh.json; Team führt hermes skills tap add github:your-org/tap aus.
Versionskontrolle: cd ~/.hermes/skills && git init, geräteübergreifend git pull && hermes skills reset.
GEPA-Evolution ausführen: hermes-agent-self-evolution klonen, evolve_skill gegen Fehler-Traces, PR manuell prüfen vor Merge.
Freigabe-Gate aktivieren: Produktion agent_writes_require_approval: true; Pitfalls-Abschnitt mit konkreten Fehlermustern und Fixes — Qualitätsgrenze zwischen Hobby und Betrieb.
name: blog-workflow description: Full tech blog writing workflow. skills: - seo-keyword-research - outline-generator - code-example-validator - bilingual-checker - publish-to-platform instruction: | Always research SEO keywords before writing. Ensure all code examples are tested and runnable.
description-Felder zusammen ca. 3.000 Token — erste Kosten-Schranke.~/.claude/skills/ kopieren oder via kevinnft/ai-agent-skills multi-client installieren.
Skills sind prozedurales Wissen, MCP ist die Tool-Schnittstelle — beides ergänzt sich. Nach Skill-Änderungen gilt die alte Version in der laufenden Sitzung bis /reset oder Install mit --now. description idealerweise auf Englisch (oder zweisprachig) — unterliegende LLMs matchen englische Beschreibungen präziser.
Zugeklapptes Notebook, Low-End-VPS ohne macOS-native Pfade oder instabiles Heim-WLAN unterbrechen Gateway und GEPA-Jobs im kritischen Moment — ein messbares Stabilitätsrisiko für 7×24-Betrieb. Für Produktionsumgebungen, die stabile Hermes-Skills-Kumulation mit nativem macOS-launchd-Daemon und planbare Verfügbarkeit brauchen, ist die NodeMini Mac Mini M4 Cloud-Miete meist zuverlässiger als provisorisches Notebook plus manuelle Neustarts — aktuelle Modelle und Preise unter Mietpreise.
Skills sind prozedurale Wissensdokumente (dem Agent beibringen, wie etwas zu tun ist). MCP ist eine Tool-Schnittstelle (dem Agent zusätzliche Tool-Aufrufe geben). Beides ergänzt sich: MCP liefert Datenbankzugriff; ein Skill lehrt die korrekte Migrations-Prozedur.
Die aktuelle Sitzung cached die alte Version. /reset startet eine neue Sitzung; beim Install --now erzwingt Refresh (invalidiert Prompt Cache, höherer Token-Verbrauch).
GEPA-Evolution und Gateway 7×24 benötigen stabile Online-Verfügbarkeit und native macOS-Pfade. NodeMini bietet dedizierte Mac Mini M4 Monatsmiete — aktuelle Preise unter Mietpreise; Zugangsfragen im Hilfezentrum.
Vier Schutzgeländer: volle Testsuite, Größenlimits, semantische Erhaltung, manuelles PR-Review. Semantische-Drift-Erkennung verhindert Zweckabweichung. Trotzdem jeden PR-Diff vor Merge manuell prüfen — besonders bei DSGVO-relevanten Workflows.