2026年6月26日、OpenAI は GPT-5.6 シリーズ三モデル——フラッグシップ Sol、バランス型 Terra、軽量 Luna——を正式発表し、初めて太陽系天体の命名体系を採用しました。本記事は AI 開発者と技術責任者向けに、コア料金一覧、Max/Ultra 推論モード、TerminalBench 2.1 世界1位(91.9%)、CTF 命中率 96.7%、Cerebras 750 token/s 加速、米国政府による初の限定公開審査、vs Claude Mythos 5 対決表、6ステップアクセス取得ガイド、完全 FAQを網羅します。現在は約20社の承認パートナーのみがプレビュー可能で、数週間以内の全面公開が見込まれます。
6月は AI の「スーパーリリース月」のはずでしたが、三大トップラボのフラッグシップ製品が一斉に公開の門前で足踏みしています。開発者にとって現在の三大課題は次のとおりです。
アクセス制限:米国政府の要請により、GPT-5.6 は現在約20社の承認パートナーに限定プレビューされており、一般ユーザーは ChatGPT や公開 API では利用できません
競合の一斉停止:Claude Mythos 5 は6月12日に輸出規制により強制停止、Gemini 3.5 Pro は7月に延期——プログラミング Agent 市場に空白が生じています
政策の不確実性:トランプ大統領の6月2日行政令が政府による AI 公開介入の先例を作り、今後のモデル公開スケジュールの予測がより困難になりました
| モデル | ポジション | 入力料金 | 出力料金 | ハイライト |
|---|---|---|---|---|
| GPT-5.6 Sol | フラッグシップ / 最強 | $5 / 100万 Token | $30 / 100万 Token | TerminalBench 2.1 世界1位(91.9%) |
| GPT-5.6 Terra | バランス / 主力 | $2.50 / 100万 Token | $15 / 100万 Token | GPT-5.5 に近い性能、コスト50%削減 |
| GPT-5.6 Luna | 軽量 / 高速 | $1 / 100万 Token | $6 / 100万 Token | 高頻度タスク向け、80%の価格優位 |
現状:米国政府の要請により、現在は約20社の承認パートナーに限定プレビューされており、数週間以内の全面公開が見込まれます。Polymarket は「7月31日までに全面公開」の確率を約 87% と予測しています。
日本時間2026年6月27日未明、OpenAI は GPT-5.6 シリーズを正式発表し、初めて太陽系天体の命名体系——Sol(太陽)、Terra(大地)、Luna(月)——を導入しました。それぞれフラッグシップ、バランス、軽量の三層に対応します。
今回のリリースは順調ではありませんでした。トランプ政権が6月2日に署名した行政令の影響で、OpenAI は広範な公開前に政府セキュリティ審査を受けるよう求められました——これは米国政府が初めて AI 企業に先端モデルの限定公開を要求した事例です。OpenAI CEO のサム・アルトマンは協力姿勢を示しつつ、次のように公開声明を出しました。
このような政府承認モデルは業界の長期的なデフォルト慣行となるべきではないと考えています。最高のツールが、本当に必要とするユーザー、開発者、企業、グローバルパートナーから遠ざけられています。
Sol は OpenAI がこれまでにリリースした最強のモデルで、高難度プログラミング、長鎖サイバーセキュリティ研究、多段階自律実行が必要な Agentic Workflow 向けに設計されています。
二つの新推論モード:
料金:入力 $5 / 100万 Token、出力 $30 / 100万 Token(GPT-5.5 と同水準)
Terra は日常のエンタープライズ業務の中核主力で、大規模カスタマーサポート、社内ツール、文書分析などの高頻度ビジネスシーンに適しています。性能は GPT-5.5 に近い一方、コストは 50% 削減され、大規模デプロイ時のコストパフォーマンス最高の選択肢です。料金:入力 $2.50 / 100万、出力 $15 / 100万。
Luna は高頻度・低レイテンシシーン向けに最適化され、テキスト要約、ドラフト作成、日常自動化に適しています。Luna は OpenAI 史上初めてサイバーセキュリティと生物学の両分野で High 能力評価を獲得した非フラッグシップモデルでもあります。料金:入力 $1 / 100万、出力 $6 / 100万。
| モデル | 最適シーン | コンテキストウィンドウ | サイバーセキュリティ評価 |
|---|---|---|---|
| Sol | 複雑なプログラミング、セキュリティ研究、長鎖 Agent | 約1.5M Token | High |
| Terra | エンタープライズ文書分析、カスタマーサポート、大規模 API | 約1.5M Token | High |
| Luna | 要約、ドラフト、日常自動化 | 約1.5M Token | High |
TerminalBench 2.1 は現在最も権威あるコードエージェント評価ベンチマークの一つで、89問の複雑なコマンドライン計画問題を含み、多段階ツール呼び出し、反復修正、タスク調整の実能力を測定します。
| モデル | スコア | モード |
|---|---|---|
| GPT-5.6 Sol | 91.9% 世界1位 | Ultra(マルチエージェント) |
| GPT-5.6 Sol | 88.8% | 標準モード |
| Claude Mythos 5 | 88.0% | 標準 |
| GPT-5.5 | 83.4% | 標準 |
| Gemini 3.1 Pro Preview | 70.7% | 標準 |
Sol はわずか17日で Claude Mythos 5 を首位から引きずり下ろしました——後者は6月9日に首位に立ったばかりでした。詳細は以前の GPT-5.6 リリース前リークまとめをご覧ください。
| モデル | タスク完了率(コードモード) |
|---|---|
| GPT-5.6 Sol | 50.9%(50%を突破した唯一のモデル) |
| GPT-5.6 Luna | GPT-5.5 をわずかに上回る |
GPT-5.6 は OpenAI 史上初めて三モデルすべてが「High(高)」サイバーセキュリティリスク等級に達した製品シリーズです。
| モデル | CTF 命中率 |
|---|---|
| Sol | 96.7% |
| Terra | 91.84% |
| Luna | 85.19% |
ExploitBench:Sol の ExploitBench 性能は Anthropic の Mythos Preview とほぼ同等ですが、出力 Token は約3分の1のみで、エンタープライズセキュリティ研究の利用コストを大幅に削減します。
セキュリティ注記:OpenAI のテストによると、Sol は Chromium と Firefox コードベースの評価で脆弱性とエクスプロイトプリミティブを識別できますが、完全に利用可能なエクスプロイトチェーンを自律的に構築することはできません。したがって OpenAI の「Cyber Critical」警戒線以下にとどまっています。
7月から、GPT-5.6 Sol は Cerebras ハードウェア加速プラットフォームを通じて一部の顧客に展開され、生成速度は最大 750 token/s に達します。参考:現在のほとんどのフラッグシップモデルの出力速度は 50–150 token/s の範囲です。750 token/s は同等品質で応答時間が現行モデルの 1/5 から 1/15 に短縮される可能性を意味し、リアルタイムプログラミングアシスタントやストリーミング AI アプリにとって質的な飛躍となります。
トランプ大統領は行政令に署名し、米国政府が AI モデルの一般公開前に最大30日間のアクセス権を取得してセキュリティ審査を行えるようにしました。この命令は強制力を持ちませんが、実質的な拘束効果を生み出しました。6月26日、ホワイトハウン科学技術政策局(OSTP)と国家サイバー監督官室(ONCD)の調整の下、OpenAI は GPT-5.6 の公開を約 20社の事前承認「信頼できるパートナー」組織に限定することに同意しました。
| 企業 | モデル | 状態 |
|---|---|---|
| OpenAI | GPT-5.6 Sol/Terra/Luna | 約20社のパートナーに限定プレビュー |
| Anthropic | Claude Fable 5 / Mythos 5 | 6月12日に輸出規制令により強制停止 |
| Gemini 3.5 Pro | 6月予定から7月に延期 |
| 次元 | GPT-5.6 Sol | Claude Mythos 5 |
|---|---|---|
| TerminalBench 2.1 | 91.9%(Ultra)/ 88.8% 優位 | 88.0% |
| ExploitBench | Mythos Preview と同等、Token 用量は 1/3 優位 | データ未公開 |
| 入力料金 | $5 / M 優位 | 元 $10/M(現在停止中) |
| 利用可能性 | 限定プレビュー中、数週間以内に全面公開 | 輸出規制により現在停止 |
| コンテキストウィンドウ | 約1.5M Token | 200K Token |
Sol はプログラミングとサイバーセキュリティの特定ベンチマークで Mythos 5 を上回り、半額で同等のセキュリティ研究能力を実現しています。ただし Fable 5 は SWE-bench Pro など他の次元で依然優位であり、GPT-5.6 の完全な System Card データが公開されてからさらなる比較が必要です。背景は Claude Fable 5 輸出規制解析をご覧ください。
OpenAI 公式ステータスページをフォロー:GPT-5.6 全面公開の通知を設定し、API 公開ウィンドウを見逃さないようにします
現行モデルスタックを評価:GPT-5.6 が全面利用可能になるまで、GPT-5.5 または Claude Opus 4.8 を本番ベースラインとして維持します
シーン別にモデルを事前選定:複雑な Agent タスクには Sol、大規模ビジネス API には Terra、高頻度軽量タスクには Luna を予約します
API 公開後に優先テスト:TerminalBench 型の多段階プログラミング、CTF セキュリティ研究、長コンテキスト文書分析の三大シーンを検証します
Token コストを比較:Ultra モードは最高性能ですが Token 消費が大幅に増加するため、真に複雑なタスクでのみ有効化します
Cerebras 加速接続を計画:7月以降、750 token/s がエンタープライズリアルタイムプログラミングアシスタントに与える ROI を評価し、OpenAI エンタープライズチャネルに連絡します
| ニーズ | 推奨モデル |
|---|---|
| 複雑なコード生成、デバッグ、多段階エージェントタスク | Sol |
| エンタープライズ文書分析、カスタマーサポート、大規模 API 呼び出し | Terra |
| 高頻度要約、ドラフト、日常自動化 | Luna |
| 予算が限られているが GPT-5.5 級の能力が必要 | Terra(同等性能、コスト50%削減) |
| レイテンシに極めて敏感なリアルタイムアプリ(7月以降) | Sol on Cerebras |
純粋なクラウド API はモデル切り替えが迅速ですが、政策の急変、長コンテキストコストの急騰、Ultra モードの Token 消費の不確実性などのリスクがあります。完全なセルフホスティングには A100/H100 級 GPU と継続的な運用が必要です。安定した 7×24 AI Agent、マルチエージェントプログラミングパイプライン、iOS CI/CD 自動化を必要とする本番環境では、NodeMini の Mac Mini M4 クラウドレンタルが統一メモリアーキテクチャと Apple Silicon の電力効率により、性能、コンプライアンス分離、運用コストのバランスに優れた選択肢です。詳細は レンタル料金をご覧ください。
一般ユーザーはまだ利用できません。現在は政府承認を受けた約20社の信頼できるパートナーのみが API と Codex 経由でアクセス可能です。ChatGPT への全面展開は2026年7月が見込まれ、Polymarket は7月31日までの全面公開確率を約 87% と予測しています。
Sol は TerminalBench 2.1 で 91.9%(Ultra)を記録し、Mythos 5 の 88.0% を上回ります。ExploitBench では同等の性能ですが Token 消費は約3分の1です。ただし Mythos 5 は SWE-bench Pro など一部の指標で依然優位であり、完全な System Card 公開を待つ必要があります。
Ultra モードはマルチエージェント協調アーキテクチャを採用しています。Sol が複雑なタスクを分解し、複数の並列サブエージェントに配分して最終的に統合出力します。TerminalBench 首位獲得の核心ですが、Token 消費が大幅に増加するため、真に複雑なタスクでのみ使用することをお勧めします。
2026年6月2日のトランプ大統領令以降、ホワイトハウスが OSTP と ONCD を調整し、OpenAI に広範な公開前の政府セキュリティ審査を求めました。OpenAI は協力していますが、このモデルが長期的な慣行となるべきではないと公開で反対しています。
2026年7月から、GPT-5.6 Sol は Cerebras ハードウェア加速により最大 750 token/s に達します。現在のフラッグシップモデルの 50–150 token/s の約5〜15倍です。初期は選定されたエンタープライズ顧客向けです。
複雑なプログラミングと多段階 Agent には Sol、エンタープライズ文書分析と大規模 API 呼び出しには Terra、高頻度要約と日常自動化には Luna が適しています。ハードウェア実行環境は ヘルプセンターを参照するか、四大プログラミングアシスタント比較をご覧ください。