Was ist der Unterschied zwischen Hermes Skills und MCP?

Skills sind prozedurale Wissensdokumente (wie etwas zu tun ist). MCP ist eine Tool-Schnittstelle für zusätzliche Tool-Aufrufe. Beides ergänzt sich.

Warum greift eine Skill-Änderung nicht?

Die aktuelle Sitzung cached die alte Version. /reset startet eine neue Sitzung; --now beim Install erzwingt Refresh (invalidiert Prompt Cache).

Welcher Host eignet sich für Hermes Skills Selbstevolution?

GEPA-Evolution und Gateway 7×24 benötigen stabile Verfügbarkeit und macOS-native Pfade. Mac Mini M4 Monatsmiete schlägt oft ein zugeklapptes Notebook. Siehe NodeMini Mietpreise.

2026 Hermes Agent Skills Fortgeschrittenen-Guide: SKILL.md, Bundles, GEPA-Evolution & Tap-Veröffentlichung

Warum das Skills-System eine eigene Deep-Dive-Analyse verdient — Skills ≠ Prompts ≠ Memory

Im Gegensatz zu Einmal-Prompts folgen Hermes Skills dem offenen Standard agentskills.io und lassen sich zwischen Hermes, Claude Code und Cursor portieren. Merkhilfe: Prompt = Haftnotiz (nur aktuelle Runde), Memory = Notizbuch (permanent, automatisch injiziert), Skill = SOP-Handbuch (Schrittfolge, bei Bedarf geladen).

Dimension	Normaler Prompt	Memory	Skills
Persistenz	Aktuelle Konversation	Sitzungsübergreifend, permanent	Sitzungsübergreifend, permanent
Ladezeitpunkt	Immer im Kontext	Automatisch pro Sitzung	On-Demand (Kernunterschied)
Token-Kosten	Pro Runde	Klein und stabil	Null vor Aktivierung
Inhaltstyp	Beliebige Absicht	Nutzerpräferenzen / Fakten	Prozedurale Schritte (Wie)
Teilbarkeit	Schwer wiederverwendbar	Privat	Als Community-Tap veröffentlichbar

01
Schmerzpunkt: Skill als vollständigen Prompt in den Kontext legen — Token-Kosten skalieren linear mit der Skill-Anzahl.
02
Schmerzpunkt: Verwandte Skills einzeln per /skill-name triggern — komplexe Workflows brechen ab.
03
Schmerzpunkt: Kostenloses DuckDuckGo und bezahltes web_search gleichzeitig im Prompt — redundante Tool-Beschreibungen verschwenden Token.
04
Schmerzpunkt: Jedes Teammitglied baut dieselben Skills neu — kein Ein-Klick-Abonnement für geteilte Skills.
05
Schmerzpunkt: Skills evolvieren nicht — dieselben Fehler wiederholen sich sitzungsübergreifend.
06
Dieser Artikel liefert: Vollständige Fortgeschrittenen-Roadmap von SKILL.md-Standard bis GEPA-Selbstevolution — alle Kernmechanismen abgedeckt.

SKILL.md-Format im Detail und Progressive Disclosure (dreistufiges Laden)

Alle Hermes Skills folgen agentskills.io. Empfohlene Struktur: ~/.hermes/skills/my-category/my-skill/ mit SKILL.md (Kernschritte, Ziel ≤500 Zeilen), references/ (API-Referenz on-demand), templates/ (wiederverwendbare Vorlagen), scripts/ (vom Agent ausführbare Skripte).

yaml — SKILL.md frontmatter

---
name: my-skill                    # Pflicht: Kleinbuchstaben + Bindestrich, max. 64 Zeichen
description: |                    # Pflicht: max. 1024 Zeichen, mit "Use when..." beginnen
  Use when the user needs to [...].
version: 1.0.0
metadata:
  hermes:
    tags: [devops, automation]
    requires_toolsets: [terminal]
    fallback_for_toolsets: [web]
---

# My Skill Title
## Overview / When to Use / Procedure / Common Pitfalls / Verification Checklist

Ladeebene	Inhalt	Auslöser	Token-Kosten
Level 0	`name` + `description`	Sitzungsstart, alle Skills	ca. 3K Token gesamt
Level 1	Vollständiger SKILL.md-Text	Nutzer `/skill-name` oder LLM-Entscheidung	Abhängig von Dateilänge
Level 2	`references/`, `scripts/`	LLM während Ausführung	On-demand, pro Datei

info

Schreibempfehlung: description ist die einzige Level-0-Information — das LLM entscheidet danach über vollständiges Laden. „Wann nutzen“ ist wichtiger als „Was es ist“. Skills >1.000 Zeilen in references/ auslagern; >15KB überschreiten GEPA-Evolutionslimits und müssen gesplittet werden.

Skill Bundles und bedingte Aktivierung — ein Befehl für den vollständigen Workflow

Skill Bundles (Neuerung 2026, noch unterbewertet)

Ein Bundle ist eine leichte YAML-Datei, die mehrere verwandte Skills in einen Slash-Befehl bündelt. Bei /bundle-name werden alle gelisteten Skills gleichzeitig geladen. Pfad: ~/.hermes/skill-bundles/<slug>.yaml. Bei Namenskollision gewinnt das Bundle; fehlende Skills werden still übersprungen; Bundles ändern den System-Prompt nicht — token-effizient.

yaml — backend-dev bundle

name: backend-dev
description: Full backend feature workflow — code review, TDD, and PR management.
skills:
  - github-code-review
  - test-driven-development
  - github-pr-workflow
instruction: |
  Always write failing tests first before implementation.
  Never push directly to main.

# CLI-Schnellerstellung:
# hermes bundles create backend-dev \
#   --skills github-code-review,test-driven-development,github-pr-workflow

Bedingte Aktivierung (Conditional Activation)

Skills können je nach Tool-Verfügbarkeit in der aktuellen Sitzung automatisch ein- oder ausgeblendet werden. Vier Regeltypen unter metadata.hermes:

Feld	Logik
`requires_toolsets`	Skill ausblenden, wenn gelistete Toolsets fehlen
`requires_tools`	Skill ausblenden, wenn gelistete Tools fehlen
`fallback_for_toolsets`	Ausblenden, wenn Toolsets vorhanden (Fallback-Rolle)
`fallback_for_tools`	Ausblenden, wenn Tools vorhanden (Fallback-Rolle)

Klassisches Szenario: Nach FIRECRAWL_KEY / BRAVE_SEARCH_KEY aktiviert sich bezahltes web_search; DuckDuckGo verschwindet per fallback_for_tools: [web_search] aus dem Prompt — Token gespart. Bei API-Ausfall taucht der Fallback automatisch wieder auf. Plattform-Skills nutzen requires_toolsets: [messaging] plus platforms: [telegram, discord]; pro Plattform schaltbar in der hermes skills-TUI.

Skills-Hub-Ökosystem, Tap-Veröffentlichung und GEPA-Selbstevolution

Offizielle Installation und Open-Source-Skill-Repositories

bash

hermes skills install official/research/arxiv
hermes skills install github:openai/skills/k8s
hermes skills tap add github:my-org/my-skills
hermes skills tap update && hermes skills tap list

Repository	Schwerpunkte	Stars
ChuckSRQ/awesome-hermes-skills	Kuratierte Produktions-Skills: Deep Research, MLOps, Apple-Integration	67
amanning3390/hermeshub	Community-Registry mit Prompt-Injection-Prüfung pro Skill	166
kevinnft/ai-agent-skills	191 Skills, 28 Kategorien, Hermes / Claude / Cursor	10
NousResearch/hermes-agent	Offizielle Quelle, alle Built-in-Skills	—

Eigenen Skill-Tap veröffentlichen

GitHub-Repository als Tap anlegen; Team abonniert mit einem Befehl: hermes skills tap add github:your-org/your-skills-tap. Private Repos: --token $GH_TOKEN. Optional skills.sh.json für Hub-Kategorien. ~/.hermes/skills/ in Git versionieren für geräteübergreifende Sync — bei personenbezogenen Session-Daten in Skills oder Traces DSGVO-konforme Zugriffs- und Löschkonzepte mitdenken.

GEPA + DSPy: automatische Skill-Evolution (ICLR 2026 Oral)

GEPA (Genetic-Pareto Prompt Evolution) fine-tuned keine Modellgewichte. Es verbessert SKILL.md-Text durch Analyse von Ausführungstraces, Variantenerzeugung und multiobjektive Pareto-Optimierung. Pro Lauf ca. 2–10 USD reine API-Kosten — keine GPU nötig. Fünf Phasen: ① Trace-Sammlung (SQLite) → ② reflektive Fehleranalyse → ③ gezielte Mutation (10–20 Varianten) → ④ Pareto-Bewertung (Erfolgsrate × Token-Effizienz × Geschwindigkeit) → ⑤ manuelles PR-Review.

bash — GEPA Schnellstart

git clone https://github.com/NousResearch/hermes-agent-self-evolution
cd hermes-agent-self-evolution && pip install -r requirements.txt
export HERMES_AGENT_PATH=~/.hermes

# Synthetische Daten (Einstieg)
python -m evolution.skills.evolve_skill \
    --skill github-code-review --iterations 10 --eval-source synthetic

# Echte Sitzungsdaten (bessere Ergebnisse)
python -m evolution.skills.evolve_skill \
    --skill github-code-review --iterations 10 --eval-source sessiondb

# Kombinierte Claude/Gemini-Traces (experimentell)
python -m evolution.skills.evolve_skill \
    --skill github-code-review --eval-source mixed \
    --trace-dirs ~/.claude/traces,~/.hermes/sessions

Vier Sicherheits-Schutzgeländer: ① volle Testsuite 100 % bestanden; ② Skills ≤15KB, Tool-Beschreibungen ≤500 Zeichen; ③ Prompt-Cache-Kompatibilität erhalten; ④ semantische Erhaltungsprüfung gegen Zweckabweichung. Offizielle Roadmap: Phase 1 Skill-Dateien (erledigt) → Phase 2 Tool-Beschreibungen → Phase 3 System-Prompt → Phase 4 Tool-Implementierung → Phase 5 vollautomatische Dauerverbesserung.

Plugin-Skills und skill_manage-Selbstwartung

Plugin-Skills laden unter dem Namespace plugin:skill (z. B. skill_view("superpowers:writing-plans")). Sie erscheinen nicht in der Standardliste — nur Opt-in-Aktivierung. Der Agent pflegt Skills dynamisch via skill_manage(action='patch'|'create', ...). In config.yaml setzt skills.agent_writes_require_approval: true ein manuelles Freigabe-Gate für Produktionsumgebungen — empfohlen für DSGVO-relevante Workflows mit auditierbaren Änderungen.

Acht Schritte zur Umsetzung: von SKILL.md bis Team-Tap und GEPA-Evolution

01
Frontmatter nach agentskills.io: name (Kleinbuchstaben-Bindestrich, max. 64 Zeichen), description mit „Use when…“ (max. 1.024 Zeichen), Trigger und Ausschlussfälle präzise formulieren.
02
Modulares Verzeichnis: Hauptdatei ≤500 Zeilen, API-Details in references/, ausführbare Skripte in scripts/; validieren mit skills-ref validate ./my-skill.
03
Skill Bundle anlegen: YAML unter ~/.hermes/skill-bundles/ oder hermes bundles create CLI für zusammengehörige Workflow-Skills.
04
Bedingte Aktivierung: requires_toolsets / fallback_for_tools in metadata.hermes für intelligentes Free/Paid-Tool-Switching.
05
Tap-Repository veröffentlichen: GitHub-Repo mit Kategorien + optional skills.sh.json; Team führt hermes skills tap add github:your-org/tap aus.
06
Versionskontrolle: cd ~/.hermes/skills && git init, geräteübergreifend git pull && hermes skills reset.
07
GEPA-Evolution ausführen: hermes-agent-self-evolution klonen, evolve_skill gegen Fehler-Traces, PR manuell prüfen vor Merge.
08
Freigabe-Gate aktivieren: Produktion agent_writes_require_approval: true; Pitfalls-Abschnitt mit konkreten Fehlermustern und Fixes — Qualitätsgrenze zwischen Hobby und Betrieb.

Praxisbeispiel: blog-workflow Bundle

yaml — blog-workflow bundle

name: blog-workflow
description: Full tech blog writing workflow.
skills:
  - seo-keyword-research
  - outline-generator
  - code-example-validator
  - bilingual-checker
  - publish-to-platform
instruction: |
  Always research SEO keywords before writing.
  Ensure all code examples are tested and runnable.

Level-0-Token-Budget: alle Skill-description-Felder zusammen ca. 3.000 Token — erste Kosten-Schranke.
GEPA-Kosten pro Lauf: ca. 2–10 USD API-Gebühren, keine GPU — geeignet für periodische Evolution auf dauerhaft online gehaltenen Hosts.
GEPA-Größenlimit: Skill-Dateien müssen ≤15KB sein, sonst blockieren Schutzgeländer die PR-Erzeugung.
Plattformübergreifende Nutzung: dieselbe SKILL.md nach ~/.claude/skills/ kopieren oder via kevinnft/ai-agent-skills multi-client installieren.

Skills sind prozedurales Wissen, MCP ist die Tool-Schnittstelle — beides ergänzt sich. Nach Skill-Änderungen gilt die alte Version in der laufenden Sitzung bis /reset oder Install mit --now. description idealerweise auf Englisch (oder zweisprachig) — unterliegende LLMs matchen englische Beschreibungen präziser.

Zugeklapptes Notebook, Low-End-VPS ohne macOS-native Pfade oder instabiles Heim-WLAN unterbrechen Gateway und GEPA-Jobs im kritischen Moment — ein messbares Stabilitätsrisiko für 7×24-Betrieb. Für Produktionsumgebungen, die stabile Hermes-Skills-Kumulation mit nativem macOS-launchd-Daemon und planbare Verfügbarkeit brauchen, ist die NodeMini Mac Mini M4 Cloud-Miete meist zuverlässiger als provisorisches Notebook plus manuelle Neustarts — aktuelle Modelle und Preise unter Mietpreise.

FAQ

Häufig gestellte Fragen

Skills sind prozedurale Wissensdokumente (dem Agent beibringen, wie etwas zu tun ist). MCP ist eine Tool-Schnittstelle (dem Agent zusätzliche Tool-Aufrufe geben). Beides ergänzt sich: MCP liefert Datenbankzugriff; ein Skill lehrt die korrekte Migrations-Prozedur.

Die aktuelle Sitzung cached die alte Version. /reset startet eine neue Sitzung; beim Install --now erzwingt Refresh (invalidiert Prompt Cache, höherer Token-Verbrauch).

GEPA-Evolution und Gateway 7×24 benötigen stabile Online-Verfügbarkeit und native macOS-Pfade. NodeMini bietet dedizierte Mac Mini M4 Monatsmiete — aktuelle Preise unter Mietpreise; Zugangsfragen im Hilfezentrum.

Vier Schutzgeländer: volle Testsuite, Größenlimits, semantische Erhaltung, manuelles PR-Review. Semantische-Drift-Erkennung verhindert Zweckabweichung. Trotzdem jeden PR-Diff vor Merge manuell prüfen — besonders bei DSGVO-relevanten Workflows.