MMLU·HumanEval 순위만으로 「최강 모델」에 베팅하면서 월 네 자리 API 청구서는 외면하고 있다면——OpenRouter의 7일 롤링 Token 처리량 주간 순위가 더 냉정한 답을 제공합니다. 통계 기간 2026년 5월 18일–24일, 글로벌 주간 호출량은 28.9조 Token에 달하며 중국 모델이 4주 연속 미국을 앞섰습니다. DeepSeek V4-Flash가 3.43T로 1위를 차지했고, Anthropic은 「Token 점유 하락·달러 수익은 여전히 높음」이라는 전형적 프리미엄 역설을 보입니다. 본 글은 다중 모델 라우팅 개발자와 기술 책임자를 대상으로 데이터 출처, Top 10 주간 순위, 벤더 이중 진실, Benchmark 역비 현상을 분석하고 청구 기반 6단계 선정 체크리스트를 제시합니다.
OpenRouter는 글로벌 최대 규모의 중립 AI 모델 API 집계 플랫폼 중 하나입니다. 300+ 모델, 60+ 공급사, 800만+ 사용자를 보유하며 월 약 100조 Token을 처리합니다. 순위는 최근 주간 Token 총량(입력+출력)으로 정렬됩니다——지출한 금액과 실제 트래픽은 키노트 발표를 꾸미지 않습니다. 실험실 고정 벤치마크 대비, 실제 호출량은 Agent 워크플로·배치 프로그래밍·다중 턴 툴체인에서의 「발로 투표」를 더 잘 반영합니다.
Benchmark는 상한을, 청구서는 습관을 측정합니다: MMLU 0.3점 상승이 다음 달 청구서를 바꾸지 않을 수 있습니다. DeepSeek Flash 단가가 Opus의 약 1/50이라면 Agent 루프는 즉시 라우팅을 바꿉니다.
무료 라우팅이 「유료 의지」를 왜곡합니다: Owl Alpha 등 $0 모델이 주간 순위 상단에 오르면 개발자는 「최강」보다 「동작」을 우선합니다——무료 계층을 무시하면 폐쇄 플래그십 점유를 과대평가합니다.
프로그래밍이 최대 단일 용도가 되었습니다: OpenRouter와 a16z 공동 보고서(약 100조 Token 익명 메타데이터)에 따르면 프로그래밍 작업 비중이 2025년 초 약 11%에서 50% 초과로 상승했습니다——순위 상위는 코딩·Agent 친화 모델이 많습니다.
안정성과 지연이 극한 추론보다 중요합니다: 프로덕션 Agent는 단일 올림피아드 만점보다 API 응답 속도와 툴 호출 성공률을 더 중시합니다.
주간 집계가 「히트」를 포착합니다: 7일 롤링 통계에서 Hy3 Preview는 한시 무료 종료 후에도 주간 +16%를 기록했으며, 월평균보다 신규 강자를 더 빨리 발견합니다.
투자자와 언론이 Token 지표로 전환했습니다: OpenRouter 밸류에이션은 약 26× PS 수준이며, 순위표는 기술 지표에서 상업 기상계로 격상되었습니다——이를 무시하면 시장의 실제 자금 흐름을 놓칩니다.
「누가 가장 똑똑한가가 아니라 누가 가장 많이 호출되는가——Token 호출량은 AI 실제 도입과 시장 인정의 체온계입니다.」
아래 표는 OpenRouter 공개 데이터를 요약한 것입니다. 통계 기간은 2026년 5월 18일–24일(7일 롤링 Token 처리량, openrouter.ai/rankings와 동일)입니다. 1년 전 플랫폼 주간 처리량은 약 2.4조였고 현재 28.9조로 약 12배 성장했습니다——AI 애플리케이션이 규모 폭발 단계에 진입했음을 보여 줍니다.
| 지표 | 데이터 | 전주 대비 | 해석 |
|---|---|---|---|
| 글로벌 주간 호출량 | 28.9조 Token | +7.4%(5주 연속 상승) | 총량 확장이 단일 모델 점유 재편보다 빠름 |
| 중국 모델 주간 호출량 | 9.223조 Token | +19.89% | 글로벌 평균보다 현저히 높은 증가율 |
| 미국 모델 주간 호출량 | 4.93조 Token | +16.27% | 절대량은 증가하나 점유는 압박 |
| 중미 격국 | 중국 4주 연속 1위 | 중국 비중 약 45%+ | 2025년 초 중국 모델 트래픽 비중은 2% 미만 |
인용 가능 핵심 수치: ① 글로벌 주간 28.9T, 전주 +7.4%, 5주 연속 상승. ② 중국 모델 주간 9.223T, +19.89%. ③ 미국 모델 주간 4.93T, +16.27%. ④ 플랫폼 월 Token 규모 약 100T(OpenRouter 공개 기준). 작성 시점 이후에는 공식 사이트 실시간 순위로 하위 순위를 갱신하십시오.
통계 안내: 주간 순위는 자연주 달력이 아닌 7일 롤링 윈도우입니다. 모델 차원과 벤더 시장 점유는 동일 페이지에서 전환할 수 있습니다. 달러 수익 점유와 Token 점유는 별도 표시되며, 4절에서 이 둘의 괴리를 해석합니다.
해당 주 Top 10은 주간 Token량 기준입니다. DeepSeek 3개 모델이 동시에 상위권에 진입했으며 시리즈 합계 약 5.74T Token(전주 +25.9%)으로 2주 연속 벤더 Token량 1위를 기록했습니다. Kimi K2.6은 전주 6위였으나 해당 주 Top 10에서 이탈했으며, 주간 순위가 「히트」 교체에 매우 민감함을 보여 줍니다.
| 순위 | 모델 | 벤더 | 주간 Token량 | 전주 대비 | 특징 |
|---|---|---|---|---|---|
| 1 | DeepSeek-V4-Flash | DeepSeek(중국) | 3.43T | +66% | Agent 워크플로 1순위, 극저가 |
| 2 | 腾讯 Hy3 Preview | Tencent(중국) | 3.07T | +16% | 한시 무료 종료 후에도 고성장 |
| 3 | Claude Sonnet 4.6 | Anthropic(미국) | 1.35T | — | 백만 컨텍스트, 기업 프로그래밍 주력 |
| 4 | DeepSeek-V3.2 | DeepSeek(중국) | 1.31T | — | 저가 롱테일, 롤플레이 활발 |
| 5 | Owl Alpha(익명) | OpenRouter | 1.15T | +29% | 무료 Agent 특화, 백만 컨텍스트 |
| 6 | Gemini 3 Flash Preview | Google(미국) | 1.06T | — | 멀티모달, 학술·의료 시나리오 |
| 7 | DeepSeek-V4-Pro | DeepSeek(중국) | 1.00T | — | 매트릭스 플래그십(시리즈 합 5.74T) |
| 8 | MiniMax M2.7 | MiniMax(중국) | 806B | — | 장컨텍스트 가성비 |
| 9 | Grok 4.1 Fast | xAI(미국) | 721B | — | 2M 컨텍스트, 법률 시나리오 강세 |
| 10 | Step 3.5 Flash | StepFun(중국) | 673B | — | 고속 저가, 배치 처리 |
[고가치·저트래픽] Anthropic Claude Opus → 기업 복잡 추론, 높은 지불 의사 [가성비·중트래픽] Google Gemini Flash → 멀티모달, 학술·검색 생태계 [극저가·고트래픽] DeepSeek / MiniMax / StepFun → Agent, 프로그래밍, 배치
데이터 교차 검증: 1–2·5위 주간량은 2026-05-25 《每日经济新闻》 보도를 참고할 수 있습니다. 3–4·6·8–10위는 OpenRouter 공개 순위 및 동기 업계 해석과 교차 확인했습니다. V4-Pro 주간량은 시리즈 합 5.74T에서 V4-Flash·V3.2를 차감해 추정할 수 있습니다. 최신 주 데이터는 공식 사이트에서 확인하십시오.
Token 순위만 보면 Anthropic의 수익화 능력을 과소평가하고, 수익만 보면 트래픽 주도권을 과대평가합니다. OpenRouter는 Token 점유와 달러 수익 점유를 동시에 공개하여 가격 차이 아래의 실제 계층을 드러냅니다.
| 차원 | Anthropic | DeepSeek 계열 | 해석 |
|---|---|---|---|
| Token 점유 | 약 12%(1년 전 약 25%) | 시리즈 주간 5.74T, 벤더 Token 1위 | 트래픽 주도권이 저가 오픈 라인으로 이동 |
| 달러 수익 점유 | 약 46% | 극저 단가, 수익 점유는 Token 점유보다 훨씬 낮음 | 기업은 여전히 Claude에 고가 지불 |
| 대표 단품 | Claude Opus 4.6 월 수익 약 $2,500만 규모 | V4-Flash가 Agent 대량 호출 주도 | Opus Token량은 DeepSeek 대비 극소 수준 |
| 중국 모델 타임라인 | 2025년 초 <2% → 2026년 2월 미국 최초 추월 → 2026년 5월 약 45%+ | 오픈소스+극저가가 글로벌 호출 격국 재편 | |
OpenRouter와 a16z 《2025 AI 사용 보고서》는 반직관적 현상을 지적합니다: 모델 Benchmark 점수와 실제 시장 점유는 거의 역비 관계에 가깝습니다——개발자는 극한 점수보다 추론 비용·API 안정성·Agent 적합성을 더 중시합니다. 이는 프로그래밍 비중 50% 초과와 Flash 계열 독점 현상과 상호 증명합니다.
순위를 「뉴스」가 아닌 「운영 규범」으로 전환하려면 매주 아래 단계를 실행하고 OpenRouter 트렌드 선정 가이드, OpenClaw 다중 모델 라우팅과 연계하십시오.
매주 월요일 openrouter.ai/rankings를 확인합니다: 글로벌 주간 총량·중미 비중·Top 10 변동을 기록하여 내부 주간 보고를 만듭니다(상단 표 4행 지표 복사 가능).
자사 청구서와 Token vs 달러를 대조합니다: Token 대부분이 Flash 계열인데 수익(비용) 대부분이 Claude라면 라우팅이 이미 계층화된 것입니다——게이트웨이 규칙에 명시하고 Opus를 배치 보완에 오용하지 마십시오.
시나리오별 3계층 매핑: Agent/배치 → DeepSeek-V4-Flash; 기업 복잡 추론 → Claude Opus/Sonnet; 멀티모달 → Gemini Flash.
신규 Top 10 진입 모델을 추적합니다: Hy3 Preview·Owl Alpha 등 변동은 다음 히트 신호입니다——비민감 프로토타입은 무료 계층으로 툴체인을 먼저 검증하십시오.
프로그래밍 비중 50% 초과로 평가를 보정합니다: 선정 회의에서 MMLU 논의를 줄이고 SWE-bench·Terminal-Bench·실제 실패율을 중심으로 논의하십시오.
하이브리드 연산을 평가합니다: 월 API 비용이 고사양 Mac 임대료를 넘으면 장세션 CLI Agent·Ollama prefill을 SSH 독점 노드로 이전하고 OpenRouter는 탄력 피크만 담당합니다. 사양은 임대 가격 안내를 참고하십시오.
노트북 덮개 수면이나 저가 Linux VPS는 12시간 이상 Agent 루프를 감당하기 어렵고 xcodebuild·notarytool 등 macOS 툴체인도 실행할 수 없습니다. 「주간 순위 확인」과 「고정 실행 환경」을 묶는 것이 매주 단일 「최강 모델」을 쫓는 것보다 지속 가능합니다.
안정적 SSH 장세션·Keychain 격리·예측 가능한 대역폭이 필요한 iOS CI/CD·AI Agent 자동화 팀에게는 게이트웨이에 OpenRouter 라우팅을 명시하고 중부하를 독점 클라우드 Mac에 두는 편이 모든 Token을 공용 API에 맡기는 것보다 통제 가능합니다. NodeMini Mac Mini 클라우드 임대는 Agent 실행층으로 적합합니다——API Key나 모델 엔드포인트를 바꿔도 SSH 노드와 CI 라벨은 유지됩니다. 접속 절차는 고객센터, 요금·사양은 임대 가격을 참고하십시오.
Benchmark는 단일 능력 상한 비교에 적합합니다. OpenRouter는 7일 롤링 Token 처리량으로 정렬하며 실제 유료·무료 호출을 반영합니다. 예산 예측·시장 점유·Agent 배치 선정에는 청구 데이터가 보통 더 정직합니다. 둘은 역할을 나누어 사용해야 하며 상호 대체하지 않습니다.
Claude 가격은 DeepSeek 등 오픈 라인보다 현저히 높습니다. 기업 복잡 추론 사용자는 프리미엄을 지불하지만 대량 Agent·프로그래밍 작업은 저가 모델로 흐릅니다. 「고가치·저트래픽」과 「극저가·고트래픽」이 공존합니다——선정 시 Token 점유와 달러 수익 점유를 함께 봐야 합니다.