26. Juni 2026 — OpenAI veröffentlicht GPT-5.6 mit drei Varianten: Flaggschiff Sol, ausgewogenes Terra, leichtes Luna (erstes Sonnensystem-Namenschema). Datenbasierte Übersicht für KI-Entwickler und Tech-Leads: Preistabelle, Max/Ultra-Inferenzmodi, TerminalBench 2.1: 91,9 % (Weltspitze), CTF-Trefferquote 96,7 %, Cerebras 750 token/s ab Juli, US-Regierungs-Limitrelease, Vergleich vs. Claude Mythos 5, 6-Schritte-Zugangsplan und FAQ. Aktuell nur ~20 geprüfte Partner — breiter Rollout in wenigen Wochen erwartet.
Juni 2026 sollte ein Super-Release-Monat werden — stattdessen blockieren drei Faktoren den produktiven Einsatz. Messbare Auswirkungen für Entwicklerteams:
Zugang limitiert: Auf US-Regierungsanweisung nur ~20 vorab genehmigte Trusted Partners mit API- und Codex-Zugang — keine ChatGPT- oder Public-API-Nutzung für reguläre Accounts
Wettbewerbsvakuum: Claude Mythos 5 am 12. Juni wegen Exportkontrolle abgeschaltet, Gemini 3.5 Pro auf Juli verschoben — Programmier-Agent-Markt ohne klaren Spitzenreiter
Policy-Risiko (EU-relevant): Executive Order vom 2. Juni 2026 etabliert staatliche Release-Prüfung als Präzedenz — für DSGVO-konforme Teams erhöht das Planungsunsicherheit bei Datenverarbeitung und Modellverfügbarkeit in der EU
| Modell | Positionierung | Input | Output | Kernmetrik |
|---|---|---|---|---|
| GPT-5.6 Sol | Flaggschiff | $5 / M Token | $30 / M Token | TerminalBench 2.1: 91,9 % |
| GPT-5.6 Terra | Enterprise-Workhorse | $2,50 / M Token | $15 / M Token | ~GPT-5.5-Niveau, −50 % Kosten |
| GPT-5.6 Luna | Leicht / schnell | $1 / M Token | $6 / M Token | 80 % Preisvorteil vs. Sol |
Aktueller Status: Nur ~20 geprüfte Partner im Preview. Polymarket-Prognose für vollständigen Release bis 31. Juli 2026: 87 %.
Am 27. Juni 2026 (MESZ-Nacht) stellte OpenAI GPT-5.6 vor — erstmals mit Sonnensystem-Nomenklatur: Sol (Sonne), Terra (Erde), Luna (Mond) für Flaggschiff, Mittelklasse und Leichtgewicht.
Der Release verlief unter staatlicher Auflage: Erstmals verlangte die US-Regierung ein Limitrelease vor breiter Veröffentlichung. CEO Sam Altman kooperierte, kritisierte aber öffentlich:
Regierungs-Genehmigungsmodelle sollten nicht zur Branchennorm werden — sie entfernen die besten Werkzeuge von den Nutzern, Entwicklern und Partnern, die sie am dringendsten brauchen.
Stärkstes OpenAI-Modell bisher. Ziel-Use-Cases: komplexe Programmierung, Langkettige Cybersecurity-Forschung, Multi-Step-Agentic Workflows.
Zwei neue Inferenzmodi:
Preis: $5/M Input, $30/M Output (identisch zu GPT-5.5).
Kernmodell für Massen-Deployment: Support, interne Tools, Dokumentenanalyse. Performance nahe GPT-5.5 bei 50 % niedrigeren Kosten. Preis: $2,50/M Input, $15/M Output.
Optimiert für Hochfrequenz und niedrige Latenz: Zusammenfassungen, Entwürfe, Alltagsautomatisierung. Erstes Nicht-Flaggschiff mit High-Rating sowohl in Cybersecurity als auch Biologie. Preis: $1/M Input, $6/M Output.
| Modell | Primärer Use Case | Kontext | Cyber-Rating |
|---|---|---|---|
| Sol | Komplexes Coding, Security Research, Agent-Pipelines | ~1,5M Token | High |
| Terra | Enterprise-Docs, Support, Massen-API | ~1,5M Token | High |
| Luna | Summary, Drafting, Automatisierung | ~1,5M Token | High |
89 komplexe CLI-Planungsaufgaben; misst Multi-Step-Tool-Use, iterative Fixes und Task-Koordination.
| Modell | Score | Modus |
|---|---|---|
| GPT-5.6 Sol | 91,9 % — Weltspitze | Ultra (Multi-Agent) |
| GPT-5.6 Sol | 88,8 % | Standard |
| Claude Mythos 5 | 88,0 % | Standard |
| GPT-5.5 | 83,4 % | Standard |
| Gemini 3.1 Pro Preview | 70,7 % | Standard |
Sol überholte Mythos 5 nach nur 17 Tagen an der Spitze (Mythos 5 hatte am 9. Juni den Rekord gesetzt). Hintergrund: GPT-5.6 Pre-Release-Leaks.
| Modell | Task-Completion (Code-Modus) |
|---|---|
| GPT-5.6 Sol | 50,9 % — einziger Wert über 50 % |
| GPT-5.6 Luna | Leicht über GPT-5.5 |
Erste OpenAI-Produktfamilie, bei der alle drei Varianten das Rating High in Cybersecurity erreichen.
| Modell | CTF-Trefferquote |
|---|---|
| Sol | 96,7 % |
| Terra | 91,84 % |
| Luna | 85,19 % |
ExploitBench: Sol nahezu gleichwertig zu Anthropic Mythos Preview, aber mit ~⅓ Output-Token — deutlich niedrigere Kosten für Security Research.
Sicherheitsgrenze: Sol erkennt Schwachstellen in Chromium/Firefox-Codebasen, kann aber laut OpenAI-Tests keine vollständig nutzbaren Exploit-Chains autonom bauen — unterhalb der «Cyber Critical»-Schwelle.
GPT-5.6 Sol über Cerebras-Hardware: bis 750 token/s — Referenz: aktuelle Flaggschiffe liegen bei 50–150 token/s (Faktor 5–15). Relevant für Echtzeit-Coding-Assistenten und Streaming-Apps.
US-Regierung erhält bis zu 30 Tage Vorabzugang für Sicherheitsprüfung — nicht bindend, aber wirkungsvoll. Am 26. Juni limitierte OpenAI auf ~20 Trusted Partners (koordiniert durch OSTP/ONCD).
| Anbieter | Modell | Status |
|---|---|---|
| OpenAI | GPT-5.6 Sol/Terra/Luna | Preview für ~20 Partner |
| Anthropic | Claude Fable 5 / Mythos 5 | 12. Juni: Exportkontrolle, weltweit offline |
| Gemini 3.5 Pro | Verschoben auf Juli (geplant: Juni) |
| Dimension | GPT-5.6 Sol | Claude Mythos 5 |
|---|---|---|
| TerminalBench 2.1 | 91,9 % (Ultra) / 88,8 % | 88,0 % |
| ExploitBench | Parität zu Mythos Preview, ~⅓ Token | Keine öffentlichen Daten |
| Input-Preis | $5 / M | $10 / M (offline) |
| Verfügbarkeit | Limit-Preview, breiter Rollout in Wochen | Exportkontrolle — offline |
| Kontext | ~1,5M Token | 200K Token |
Sol führt bei Coding- und Security-Benchmarks, halbiert Input-Kosten vs. Mythos 5. Fable 5 bleibt bei SWE-bench Pro stark — vollständiger Vergleich nach System Card. Kontext: Claude Fable 5 Exportkontrolle.
OpenAI Status-Page abonnieren: Alert für Public-API-Freigabe setzen
Produktions-Baseline halten: GPT-5.5 oder Claude Opus 4.8 bis breiter Zugang
Modell-Mapping vorbereiten: Sol für Agenten, Terra für Massen-API, Luna für Lightweight
Prioritäts-Tests nach Freigabe: TerminalBench-ähnliche Pipelines, CTF-Research, Long-Context-Docs
Token-Kosten modellieren: Ultra nur für echte Komplexität — Verbrauch steigt signifikant
Cerebras-ROI prüfen: Ab Juli Enterprise-Kanal für 750 token/s evaluieren
| Anforderung | Empfohlenes Modell |
|---|---|
| Komplexes Coding, Debugging, Multi-Agent | Sol |
| Enterprise-Docs, Support, Massen-API | Terra |
| Hochfrequenz-Summary, Drafting, Automatisierung | Luna |
| GPT-5.5-Niveau bei Budget-Constraint | Terra (−50 % Kosten) |
| Latenz-kritische Echtzeit-Apps (ab Juli) | Sol on Cerebras |
Reine Cloud-APIs bieten schnellen Modellwechsel, aber Policy-Volatilität, Long-Context-Kosten und unkontrollierbaren Ultra-Token-Verbrauch. Self-Hosting erfordert A100/H100 und Ops-Overhead. Für 7×24 AI-Agenten, Multi-Agent-Coding-Pipelines oder iOS-CI/CD mit DSGVO-konformer Datenisolation liefert NodeMini Mac Mini M4 Cloud-Miete Unified Memory und Apple-Silicon-Effizienz als stabile Execution-Schicht. Details: Mietpreise.
Für Endnutzer noch nicht. Nur ~20 Trusted Partners haben API-/Codex-Zugang. ChatGPT-Rollout voraussichtlich Juli 2026; Polymarket: 87 % Wahrscheinlichkeit bis 31. Juli.
TerminalBench: 91,9 % (Ultra) vs. 88,0 %. ExploitBench nahezu gleichwertig bei ~⅓ Token. Mythos 5 führt bei SWE-bench Pro — vollständiger Vergleich nach System Card. Siehe Exportkontrolle-Analyse.
Multi-Agenten-Kollaboration: Aufgabenzerlegung, parallele Sub-Agenten, Aggregation. Treiber für TerminalBench-Spitzenwert — höherer Token-Verbrauch, nur für komplexe Workloads empfohlen.
Executive Order vom 2. Juni 2026 → OSTP/ONCD koordinierten Regierungs-Review. OpenAI limitiert auf ~20 Partner; CEO kritisiert Langzeit-Normierung staatlicher Release-Gates.
Ab Juli 2026: bis 750 token/s für GPT-5.6 Sol — 5–15× schneller als typische 50–150 token/s. Zunächst für ausgewählte Enterprise-Kunden.
Sol: komplexe Programmierung und Multi-Step-Agenten. Terra: Enterprise-Docs und Massen-API. Luna: Summary und Automatisierung. Hardware-Umgebung: Hilfezentrum oder KI-Assistenten-Vergleich.