Worin unterscheidet sich Split-brain von einem schlicht «zu alten» Binary?

Split-brain: neuere OpenClaw schreibt die Konfig und setzt Felder wie meta.lastTouchedVersion, aber gateway install oder restart läuft noch mit einem älteren Binary. Nur das npm-Paket zu aktualisieren ohne Neuinstallation der Service-Metadaten führt zu einem halben Zustand: doctor sieht Konflikte, Gateway-Unterbefehle brechen ab.

Wann sind destruktive Umgebungsvariablen wie OPENCLAW_ALLOW_OLDER_BINARY angemessen?

Nur in Notfall- oder Downgrade-Szenarien laut offizieller Troubleshooting-Doku und wenn Sie Metadaten-Schäden bewusst in Kauf nehmen. Der normale Pfad: PATH korrigieren, Gateway mit derselben Quelle neu installieren, doctor erneut.

Kanäle funktionieren, aber cron triggert nach dem Upgrade nicht — mit welchem Artikel beginnen?

Zuerst Split-brain ausschließen; dann die kombinierte Reihenfolge aus eingebautem cron und Gateway-Lebenszyklus wie in der Produktions-Anleitung zu openclaw cron und im Remote-Modus-Artikel auf dieser Website.

2026 OpenClaw Upgrade-Troubleshooting: Split-brain (alte/neue Binary), PATH sowie gateway install --force und doctor – Checkliste

Sieben versteckte Annahmen aus der Postmortem-Analyse, für die «das Upgrade» bezahlt wird

Die offizielle Troubleshooting-Hilfe: Schreibt eine neuere OpenClaw-Version openclaw.json und Aktualisierungen wie meta.lastTouchedVersion, bleibt aber der alte openclaw-Binary auf dem PATH, sind Lesezugriffe noch möglich — doch bei Installation/Neustart/Deinstallation des Gateways lehnt die CLI schreibende Aktionen ab, um keine halb gemischten Metadaten zu erzeugen — umgangssprachlich Split-brain in Produktion.

01
«npm war erfolgreich» = «der Dienst nutzt die neue Binary»: npm install -g aktualisiert nur Binaries im globalen Präfix; in launchd/systemd --user kann noch ein alter absoluter Pfad stehen — beim nächsten Neustart wieder dasselbe.
02
Login-Shell-PATH und PATH im Dienst-Kontext vermischen: Wenn which openclaw in der interaktiven Session stimmt, gilt das nicht automatisch für die Daemon-Umgebung.
03
Mehrere Installationsquellen ignorieren: Homebrew, offizielles Script und npm-global können parallel mehrere Binaries liefern; die Reihenfolge bestimmt nur der PATH-Präfix.
04
Nach dem Upgrade gateway install --force überspringen: Dokumentation empfiehlt Dienst-Metadaten neu zu schreiben, wenn Service und Binary drift sind; nur Gateway manuell starten hinterlässt eine Sprengfalle für den nächsten Reboot.
05
Jeden doctor-Fehler als korrupte Konfig deuten: Oft ist es Wächter-Binary-Mismatch — zuerst Versionen angleichen, erst dann Einzelfelder.
06
Zwischen Remote und lokal ohne Config-Screenshots pendeln: Wie im Remote-Modus-Artikel: zuerst openclaw config get gateway.mode, dann entscheiden, welche Host die Sonden treffen.
07
Nach Upgrade nur Kanäle checken, Scheduling ignorieren: Cron und Gateway teilen die Prozessfamilie — Regression lesen Sie in der Cron-Checkliste.

Die gemeinsame Wurzel: «Konfig lässt sich lesen» mit «Ausführungsseite ist konsistent» verwechseln. Richtig: der Stempel zeigt nur, wer zuletzt schrieb — das laufende Binary muss separat verifiziert werden.

Symptome: Split-brain vs. Auth-Drift vs. Remote-URL

Tabelle, um Einsatzzentrale von «Upgrade fühlt sich kaputt an» zu signierbaren Zweigen zu führen:

Signal	eher Split-brain	eher Auth / Session	eher Remote-URL / Topologie
Schlüsselwörter in doctor	Hinweis auf alte/neue Binary, blockiert zerstörerische Gateway-Aktionen	Token-/Gerätecodes, unabhängig von der Binary-Version	RPC-Sonden scheitern und `gateway status --deep` zeigt unerwarteten Host
gateway status	Runtime widerspricht `--version` der CLI deutlich	Runtime läuft, bleibt aber unauthorized	Lokal gestoppt, entfernt tatsächlich aktiv
Erste Maßnahme	PATH angleichen → `gateway install --force` → restart	Token rotieren / Gerätehandshake angleichen	`gateway.remote.url` und Env mit Remote-Modus vergleichen

Die goldene Frage in der Upgrade-Nacht: (A) Welches Binary läuft? (B) Welcher Stempel wurde zuletzt geschrieben? Erst wenn beides passt, Kanäle und cron.

Setzen Sie Tailscale / private Tunnels ein, verwechseln Sie «Tunnel steht» nicht mit «RPC gesund» — prüfen Sie beide Enden wie im Tailscale-Privatfreigabe-Artikel.

Sechsstufiges Recovery-Runbook (Reihenfolge; keine «Bastelrezepte»)

Reihenfolge-kritisch — bei alter/neu-Diskrepanz einen Schritt zurück, nicht parallel Konfig und Binaries frisieren.

Szene einfrieren: openclaw --version, sichtbarer Binary-Pfad in der Unit, doctor-Ausgabe dokumentieren.

PATH und Aliase bereinigen: In nicht-interaktiver Session muss which openclaw zur gewollten Release zeigen; Shell-Aliase entfernen.

Eine Installationsquelle wählen: Ein wartbarer Kanal (empfohlenes npm/Script) — kein Dauer-Mix «altes brew, neues npm».

Dienst-Install neu ausführen: Für denselben Nutzer nach verifiziertem PATH openclaw gateway install --force — launchd/systemd-Metadaten erneuern.

Gateway kalt starten: openclaw gateway restart, dann gateway status und RPC-Sonden.

Regression: openclaw doctor → channels status --probe → wie in cron list registriert?

bash · Diagnosereihenfolge (Beispiel)

openclaw --version
command -v openclaw
openclaw gateway status
openclaw doctor
openclaw gateway install --force
openclaw gateway restart
openclaw channels status --probe

info

Hinweis: Bei Portkollision, Speicher-Spikes oder Compose-Reihenfolge parallel Gateway not ready und closed(1000) RPC lesen — Ressourcenfehler nicht als Split-brain interpretieren.

Destruktive Umgebungsvariablen — wann «altes Binary darf zerstören» überhaupt in Frage kommt

Offizielles Troubleshooting: «neuere Konfig + altes Binary» ist riskant — könnte Plattenzustände unbrauchbar mischen. Neuere OpenClaw-Versionen können harte Sperren für zerstörerische Gateway-Operationen haben — OPENCLAW_*-Variablen nur setzen, wenn ein Notfall mit dem alten Binary einmalig nötig ist (Namen laut aktueller Dokumentation).

warning

Achtung: Das ist kein «alles überspringen»-Schalter — nur die enge Klasse «Risiko akzeptiert, möglicherweise Dienst-Metadaten beschädigt». Standard: unset, außer dokumentierter Rollback-Eintrag.

Ingenieurpraxis: PATH reparieren → Dienst neu → vollständiges Upgrade mit neuer Binary — Downgrade nur als separater Change mit Audit, z. B. wenn Lieferanten alte Pakete sperren.

Drei messbare Anker fürs Ticket (und Abschluss)

Interne Messpunkte für Plattform-Alignment:

Zwei Signaturen: Screenshots von openclaw --version in der interaktiven Shell und in der systemd-/launchd-Unit — nach Recovery identisch.

Fenster destruktiver Aktionen: Offizielle Notfall-Variablen im Ticket: Dauer, Bearbeiter, Rollback sowie sauberes doctor nachher.

Geschäftsregression: Nach Upgrade mindestens eine volle cron-Periode und eine manuelle Message-Runde, bevor Wartungsfenster zu — konsistent zur Observability-Log-Policy.

Reine Notebooks oder geteilte Dev-Maschinen leiden oft unter Schlafmodus und Multi-User-. OpenClaw auf einem dedizierten 24/7-Remote-Mac mit SSH und vertraglich fixierter Platte/Netz amortisiert sich gegen wiederholtes «Upgrade dann wieder Split». NodeMini Cloud Mac Mini liefert feste SSH und exklusive CPU — Referenz Mac-Mini-Mietpreise und Onboarding im Hilfezentrum. Filter OpenClaw : Observability → cron → Remote → dieser Upgrade-Fork.

2026 OpenClaw: Troubleshooting nach Upgrade Split brain, PATH, gateway install --force und doctor in einem konsistenten Ablauf

Sieben versteckte Annahmen aus der Postmortem-Analyse, für die «das Upgrade» bezahlt wird

Symptome: Split-brain vs. Auth-Drift vs. Remote-URL

Sechsstufiges Recovery-Runbook (Reihenfolge; keine «Bastelrezepte»)

Destruktive Umgebungsvariablen — wann «altes Binary darf zerstören» überhaupt in Frage kommt

Drei messbare Anker fürs Ticket (und Abschluss)

Häufige Fragen