2026년 6월 26일, OpenAI가 GPT-5.6 시리즈 세 모델——플래그십 Sol, 균형형 Terra, 경량 Luna——를 정식 발표하며 처음으로 태양계 천체 명명 체계를 도입했습니다. 본 글은 AI 개발자와 기술 책임자를 위해 핵심 가격 요약, Max/Ultra 추론 모드, TerminalBench 2.1 세계 1위(91.9%), CTF 적중률 96.7%, Cerebras 750 token/s 가속, 미국 정부 최초 제한 공개 심사, vs Claude Mythos 5 대결표, 6단계 접근 권한 가이드, 전체 FAQ를 다룹니다. 현재 약 20개 승인 파트너만 프리뷰 가능하며, 수주 내 전면 공개가 예상됩니다.
6월은 AI의 「슈퍼 출시의 달」이어야 했지만, 세 대 최고 연구소의 플래그십 제품이 일제히 공개 문 앞에서 멈춰 있습니다. 개발자에게 현재의 세 가지 핵심 과제는 다음과 같습니다.
접근 제한: 미국 정부 요청에 따라 GPT-5.6은 현재 약 20개 승인 파트너에 한정 프리뷰되며, 일반 사용자는 ChatGPT나 공개 API에서 사용할 수 없습니다
경쟁 제품 일제 중단: Claude Mythos 5는 6월 12일 수출 규제로 강제 중단되었고, Gemini 3.5 Pro는 7월로 연기——프로그래밍 Agent 시장에 공백이 생겼습니다
정책 불확실성: 트럼프 대통령의 6월 2일 행정명령이 정부의 AI 공개 개입 선례를 만들어, 향후 모델 출시 일정 예측이 더 어려워졌습니다
| 모델 | 포지션 | 입력 가격 | 출력 가격 | 하이라이트 |
|---|---|---|---|---|
| GPT-5.6 Sol | 플래그십 / 최강 | $5 / 100만 Token | $30 / 100만 Token | TerminalBench 2.1 세계 1위(91.9%) |
| GPT-5.6 Terra | 균형 / 주력 | $2.50 / 100만 Token | $15 / 100만 Token | GPT-5.5에 근접한 성능, 비용 50% 절감 |
| GPT-5.6 Luna | 경량 / 고속 | $1 / 100만 Token | $6 / 100만 Token | 고빈도 작업 최적, 80% 가격 우위 |
현재 상태: 미국 정부 요청에 따라 현재 약 20개 승인 파트너에 한정 프리뷰되며, 수주 내 전면 공개가 예상됩니다. Polymarket은 「7월 31일 이전 전면 공개」 확률을 약 87%로 예측합니다.
한국 시간 2026년 6월 27일 새벽, OpenAI가 GPT-5.6 시리즈를 정식 발표하며 처음으로 태양계 천체 명명 체계——Sol(태양), Terra(대지), Luna(달)——를 도입했습니다. 각각 플래그십, 균형, 경량 세 계층에 해당합니다.
이번 출시는 순탄치 않았습니다. 트럼프 정부가 6월 2일에 서명한 행정명령의 영향으로 OpenAI는 광범위한 공개 전 정부 보안 심사를 받도록 요구받았습니다——이는 미국 정부가 처음으로 AI 기업에 최첨단 모델의 제한 공개를 요구한 사례입니다. OpenAI CEO 샘 알트먼은 협조 의사를 보이면서도 다음과 같이 공개 성명을 발표했습니다.
이러한 정부 승인 모델은 업계의 장기적 기본 관행이 되어서는 안 된다고 믿습니다. 최고의 도구가 정말 필요한 사용자, 개발자, 기업, 글로벌 파트너로부터 멀어지고 있습니다.
Sol은 OpenAI가 지금까지 출시한 가장 강력한 모델로, 고난이도 프로그래밍, 장기 사이버보안 연구, 다단계 자율 실행이 필요한 Agentic Workflow에 설계되었습니다.
두 가지 새로운 추론 모드:
가격: 입력 $5 / 100만 Token, 출력 $30 / 100만 Token(GPT-5.5와 동일)
Terra는 일상 엔터프라이즈 업무의 핵심 주력으로, 대규모 고객 지원, 내부 도구, 문서 분석 등 고빈도 비즈니스 시나리오에 적합합니다. 성능은 GPT-5.5에 근접하면서 비용은 50% 절감되어, 대규모 배포 시 가성비 최고의 선택입니다. 가격: 입력 $2.50 / 100만, 출력 $15 / 100만.
Luna는 고빈도·저지연 시나리오에 최적화되어 텍스트 요약, 초안 작성, 일상 자동화에 적합합니다. Luna는 OpenAI 역사상 사이버보안과 생물학 두 분야에서 동시에 High 능력 등급을 획득한 최초의 비플래그십 모델이기도 합니다. 가격: 입력 $1 / 100만, 출력 $6 / 100만.
| 모델 | 최적 시나리오 | 컨텍스트 윈도우 | 사이버보안 등급 |
|---|---|---|---|
| Sol | 복잡한 프로그래밍, 보안 연구, 장기 Agent | 약 1.5M Token | High |
| Terra | 엔터프라이즈 문서 분석, 고객 지원, 대규모 API | 약 1.5M Token | High |
| Luna | 요약, 초안, 일상 자동화 | 약 1.5M Token | High |
TerminalBench 2.1은 현재 가장 권위 있는 코드 에이전트 평가 벤치마크 중 하나로, 89개의 복잡한 명령줄 계획 문제를 포함하여 다단계 도구 호출, 반복 수정, 작업 조율의 실제 능력을 측정합니다.
| 모델 | 점수 | 모드 |
|---|---|---|
| GPT-5.6 Sol | 91.9% 세계 1위 | Ultra(멀티 에이전트) |
| GPT-5.6 Sol | 88.8% | 표준 모드 |
| Claude Mythos 5 | 88.0% | 표준 |
| GPT-5.5 | 83.4% | 표준 |
| Gemini 3.1 Pro Preview | 70.7% | 표준 |
Sol은 단 17일 만에 Claude Mythos 5를 1위에서 끌어내렸습니다——후자는 6월 9일에 막 1위에 올랐습니다. 자세한 내용은 이전 GPT-5.6 출시 전 유출 요약을 참고하세요.
| 모델 | 작업 완료율(코드 모드) |
|---|---|
| GPT-5.6 Sol | 50.9%(50%를 돌파한 유일한 모델) |
| GPT-5.6 Luna | GPT-5.5를 약간 상회 |
GPT-5.6은 OpenAI 역사상 처음으로 세 모델 모두 「High(높음)」 사이버보안 위험 등급에 도달한 제품 시리즈입니다.
| 모델 | CTF 적중률 |
|---|---|
| Sol | 96.7% |
| Terra | 91.84% |
| Luna | 85.19% |
ExploitBench: Sol의 ExploitBench 성능은 Anthropic의 Mythos Preview와 거의 동등하지만, 출력 Token은 약 3분의 1만 소비하여 엔터프라이즈 보안 연구 이용 비용을 대폭 절감합니다.
보안 안내: OpenAI 테스트에 따르면 Sol은 Chromium과 Firefox 코드베이스 평가에서 취약점과 익스플로잇 프리미티브를 식별할 수 있지만, 완전히 사용 가능한 익스플로잇 체인을 자율적으로 구성할 수는 없습니다. 따라서 OpenAI의 「Cyber Critical」경계선 이하에 머물고 있습니다.
7월부터 GPT-5.6 Sol은 Cerebras 하드웨어 가속 플랫폼을 통해 일부 고객에 배포되며, 생성 속도는 최대 750 token/s에 도달합니다. 참고: 현재 대부분의 플래그십 모델 출력 속도는 50–150 token/s 범위입니다. 750 token/s는 동일 품질에서 응답 시간이 현행 모델의 1/5에서 1/15로 단축될 수 있음을 의미하며, 실시간 프로그래밍 어시스턴트와 스트리밍 AI 앱에 질적 도약이 됩니다.
트럼프 대통령은 행정명령에 서명하여 미국 정부가 AI 모델 일반 공개 전 최대 30일간 접근 권한을 획득해 보안 심사를 수행할 수 있도록 했습니다. 이 명령은 강제력이 없지만 실질적 구속 효과를 냈습니다. 6월 26일, 백악관 과학기술정책국(OSTP)과 국가 사이버 감독관실(ONCD)의 조율 하에 OpenAI는 GPT-5.6 공개를 약 20개 사전 승인 「신뢰 파트너」 조직으로 제한하는 데 동의했습니다.
| 기업 | 모델 | 상태 |
|---|---|---|
| OpenAI | GPT-5.6 Sol/Terra/Luna | 약 20개 파트너에 한정 프리뷰 |
| Anthropic | Claude Fable 5 / Mythos 5 | 6월 12일 수출 규제 명령으로 강제 중단 |
| Gemini 3.5 Pro | 6월 예정에서 7월로 연기 |
| 차원 | GPT-5.6 Sol | Claude Mythos 5 |
|---|---|---|
| TerminalBench 2.1 | 91.9%(Ultra) / 88.8% 우위 | 88.0% |
| ExploitBench | Mythos Preview와 동등, Token 사용량 1/3 우위 | 데이터 미공개 |
| 입력 가격 | $5 / M 우위 | 원래 $10/M(현재 중단) |
| 이용 가능성 | 한정 프리뷰 중, 수주 내 전면 공개 | 수출 규제로 현재 중단 |
| 컨텍스트 윈도우 | 약 1.5M Token | 200K Token |
Sol은 프로그래밍과 사이버보안 특정 벤치마크에서 Mythos 5를 상회하며, 절반 가격으로 유사한 보안 연구 능력을 구현합니다. 다만 Fable 5는 SWE-bench Pro 등 다른 차원에서 여전히 우위이며, GPT-5.6의 완전한 System Card 데이터가 공개된 후 추가 비교가 필요합니다. 배경은 Claude Fable 5 수출 규제 분석을 참고하세요.
OpenAI 공식 상태 페이지 팔로우: GPT-5.6 전면 출시 알림을 설정하여 API 공개 창을 놓치지 않습니다
현재 모델 스택 평가: GPT-5.6이 전면 이용 가능해지기 전까지 GPT-5.5 또는 Claude Opus 4.8을 프로덕션 기준선으로 유지합니다
시나리오별 모델 사전 선정: 복잡한 Agent 작업에는 Sol, 대규모 비즈니스 API에는 Terra, 고빈도 경량 작업에는 Luna를 예약합니다
API 공개 후 우선 테스트: TerminalBench형 다단계 프로그래밍, CTF 보안 연구, 장기 컨텍스트 문서 분석 세 가지 시나리오를 검증합니다
Token 비용 비교: Ultra 모드는 최고 성능이지만 Token 소비가 크게 증가하므로 진정으로 복잡한 작업에서만 활성화합니다
Cerebras 가속 연결 계획: 7월 이후 750 token/s가 엔터프라이즈 실시간 프로그래밍 어시스턴트에 주는 ROI를 평가하고 OpenAI 엔터프라이즈 채널에 연락합니다
| 요구 사항 | 추천 모델 |
|---|---|
| 복잡한 코드 생성, 디버깅, 다단계 에이전트 작업 | Sol |
| 엔터프라이즈 문서 분석, 고객 지원, 대규모 API 호출 | Terra |
| 고빈도 요약, 초안, 일상 자동화 | Luna |
| 예산이 제한적이지만 GPT-5.5급 능력이 필요 | Terra(동등 성능, 비용 50% 절감) |
| 지연에 극도로 민감한 실시간 앱(7월 이후) | Sol on Cerebras |
순수 클라우드 API는 모델 전환이 빠르지만 정책 급변, 장기 컨텍스트 비용 급등, Ultra 모드 Token 소비 불확실성 등의 리스크가 있습니다. 완전 자체 호스팅에는 A100/H100급 GPU와 지속적 운영이 필요합니다. 안정적인 7×24 AI Agent, 멀티 에이전트 프로그래밍 파이프라인, iOS CI/CD 자동화가 필요한 프로덕션 환경에서는 NodeMini Mac Mini M4 클라우드 대여가 통합 메모리 아키텍처와 Apple Silicon 전력 효율로 성능, 컴플라이언스 격리, 운영 비용의 균형에 우수한 선택입니다. 자세한 내용은 대여 가격 안내를 참고하세요.
일반 사용자는 아직 사용할 수 없습니다. 현재 정부 승인을 받은 약 20개 신뢰 파트너만 API와 Codex를 통해 접근할 수 있습니다. ChatGPT 전면 출시는 2026년 7월로 예상되며, Polymarket은 7월 31일 이전 전면 공개 확률을 약 87%로 예측합니다.
Sol은 TerminalBench 2.1에서 91.9%(Ultra)를 기록하여 Mythos 5의 88.0%를 상회합니다. ExploitBench에서는 비슷한 성능이지만 Token 소비는 약 3분의 1입니다. 다만 Mythos 5는 SWE-bench Pro 등 일부 지표에서 여전히 우위이며, 완전한 System Card 공개를 기다려야 합니다.
Ultra 모드는 멀티 에이전트 협업 아키텍처를 채택합니다. Sol이 복잡한 작업을 분해하여 여러 병렬 서브 에이전트에 배분한 뒤 최종적으로 통합 출력합니다. TerminalBench 1위의 핵심이지만 Token 소비가 크게 증가하므로 진정으로 복잡한 작업에서만 사용하는 것을 권장합니다.
2026년 6월 2일 트럼프 행정명령 이후, 백악관이 OSTP와 ONCD를 조율하여 OpenAI에 광범위한 공개 전 정부 보안 심사를 요구했습니다. OpenAI는 협조하고 있지만, 이 모델이 장기적 관행이 되어서는 안 된다고 공개적으로 반대했습니다.
2026년 7월부터 GPT-5.6 Sol은 Cerebras 하드웨어 가속으로 최대 750 token/s에 도달합니다. 현재 플래그십 모델의 50–150 token/s의 약 5–15배입니다. 초기에는 선정된 엔터프라이즈 고객 대상입니다.
복잡한 프로그래밍과 다단계 Agent에는 Sol, 엔터프라이즈 문서 분석과 대규모 API 호출에는 Terra, 고빈도 요약과 일상 자동화에는 Luna가 적합합니다. 하드웨어 실행 환경은 고객센터를 참고하거나 4대 프로그래밍 어시스턴트 비교를 확인하세요.