OpenRouter 週間ランキングと MMLU などの Benchmark はどちらが信頼できますか？

Benchmark は単項能力の上限を測ります。OpenRouter は 7 日間ローリングの Token スループットで並べ、開発者の実際の有料・無料呼び出しを反映します。予算予測と市場シェア判断には、請求データの方が通常より正直です。

なぜ Anthropic の Token シェアは下がるのに収入シェアは高いのですか？

Claude の価格は DeepSeek などのオープン系より著しく高く、企業の複雑推論ユーザーはプレミアムを払います。一方 Agent バッチ処理とコーディングは低価格モデルへ流れ、Token 量とドル収入が階層化します。

OpenRouter 最新週間Tokenランキング：請求データは嘘をつかない——真の王者は誰か？

Q: Agent パイプラインで API とリモート Mac をどう組み合わせますか？

OpenRouter がマルチモデル弾力ルーティングを担います。機密リポジトリの prefill や長時間 CLI Agent は SSH 到達可能な専用クラウド Mac に置き、外部 API 依存と変動コストを抑えられます。

なぜ「請求書上の Token」が Benchmark より正直なのか

OpenRouter は世界最大級の中立 AI モデル API 集約プラットフォームの一つです。300+ モデル、60+ ベンダー、800 万超のユーザーに対応し、月間約 100 兆 Token を処理します。ランキングは直近週の Token 総量（入力 + 出力）で並びます——支払った金額と流れたトラフィックはキーノート向けに装飾されません。固定ベンチマークセットより、実呼び出し量の方が Agent ワークフロー、バッチコーディング、多段ツールチェーンにおける「足で投票」した選択を反映します。

01
Benchmark は上限、請求は習慣を測る：MMLU が 0.3 点上がっても来月の請求は変わらないかもしれません。しかし DeepSeek Flash の単価が Opus の約 1/50 なら、Agent ループは即座にルートを変えます。
02
無料ルートが「支払意思」を歪める：Owl Alpha など $0 モデルが週間榜で急上昇するのは、開発者が「最強」より「動くこと」を優先している証拠です。無料層を無視すると、クローズド旗艦のシェアを過大評価します。
03
コーディングが最大の単一用途に：OpenRouter と a16z の共同レポート（約 100 兆 Token の匿名メタデータ）によると、コーディングタスクの割合は 2025 年初の約 11% から 50% 超へ上昇しました——上位はコーディングと Agent 向きモデルが占めます。
04
安定性とレイテンシが極限推論より重要：本番 Agent は API 応答速度とツール呼び出し成功率を重視し、単発の数学満点より実用性を優先します。
05
週次口径が「ヒット」を捉える：7 日間ローリング集計では、Hy3 Preview が無料終了後も週次 +16% を記録し、月次平均より新興モデルを発見しやすくなります。
06
投資家とメディアが Token 指標へシフト：OpenRouter の評価は約 26× PS——ランキングは技術指標から商業の晴雨計へ昇格しました。無視すれば、市場の実際の資金の流れを見逃すことになります。

「最も賢いのではなく、最も呼ばれる——Token 呼び出し量は AI の実装度と市場承認の体温計です。」

28.9 兆週間呼び出し：グローバルと中国モデルの数量級ジャンプ

下表は OpenRouter 公開データの要約です。集計期間は 2026 年 5 月 18 日–24 日（7 日間ローリング Token スループット、openrouter.ai/rankings と同一口径）。1 年前の週間処理量は約 2.4 兆、現在は 28.9 兆——約 12 倍 の成長で、AI 利用は規模化爆発の段階に入っています。

指標	データ	週次変化	解釈
グローバル週間呼び出し	28.9 兆 Token	+7.4%（5 週連続上昇）	総量拡大は単一モデルのシェア入れ替えより速い
中国モデル週間呼び出し	9.223 兆 Token	+19.89%	グローバル平均を大きく上回る成長
米国モデル週間呼び出し	4.93 兆 Token	+16.27%	絶対量は増えるがシェアは圧迫
米中構図	中国が 4 週連続首位	中国シェア約 45%+	2025 年初の中国モデル流量は 2% 未満

引用可能なハードデータ：① グローバル週量 28.9T、週次 +7.4%、5 週連続上昇。② 中国モデル週量 9.223T、週次 +19.89%。③ 米国モデル週量 4.93T、週次 +16.27%。④ プラットフォーム月間 Token 規模は約 100T 級（OpenRouter 公開口径）。執筆時は公式サイトの最新榜で下位順位を更新してください。

info

統計上の注意：週間榜は 7 日間ローリングウィンドウであり、暦週ではありません。モデル次元とベンダー市場シェアは同一ページで切り替え可能です。ドル収入シェアと Token シェアは別表示——第 5 節で二者の乖離を解説します。

2026 年 5 月第 3 週モデル週間呼び出し Top 10

当週の上位 10 モデルは週 Token 量で並びます。DeepSeek の 3 モデルが同時に上位入りし、シリーズ合計約 5.74T Token（週次 +25.9%）で、2 週連続ベンダー Token 量首位です。Kimi K2.6 は前週 6 位だったものの当週は圏外——週間榜は「ヒット」のローテーションに極めて敏感です。

順位	モデル	ベンダー	週 Token 量	週次	特徴
1	DeepSeek-V4-Flash	DeepSeek（中国）	3.43T	+66%	Agent ワークフロー向け、極低価格
2	Tencent Hy3 Preview	Tencent（中国）	3.07T	+16%	無料終了後も高成長
3	Claude Sonnet 4.6	Anthropic（米国）	1.35T	—	百万コンテキスト、企業コーディング主力
4	DeepSeek-V3.2	DeepSeek（中国）	1.31T	—	低価格ロングテール、ロールプレイ活発
5	Owl Alpha（匿名）	OpenRouter	1.15T	+29%	無料 Agent 特化、百万コンテキスト
6	Gemini 3 Flash Preview	Google（米国）	1.06T	—	マルチモーダル、学術/医療
7	DeepSeek-V4-Pro	DeepSeek（中国）	1.00T	—	マトリクス旗艦（シリーズ合計 5.74T）
8	MiniMax M2.7	MiniMax（中国）	806B	—	長コンテキストのコスパ
9	Grok 4.1 Fast	xAI（米国）	721B	—	2M コンテキスト、法務に強い
10	Step 3.5 Flash	StepFun（中国）	673B	—	高速低価格、バッチ処理向け

市場階層：三類モデルの「請求書上の役割」

structure

[高価値・低流量]  Anthropic Claude Opus → 企業複雑推論、支払能力が高い
[コスパ・中流量]  Google Gemini Flash   → マルチモーダル、学術と検索エコシステム
[極低価格・高流量]  DeepSeek / MiniMax / StepFun → Agent、コーディング、バッチ処理

warning

データ相互検証：第 1–2、5 位の週量は 2026-05-25 の業界報道を参照できます。第 3–4、6、8–10 位は OpenRouter 公開榜と同期の業界解説と照合しました。V4-Pro の週量はシリーズ合計 5.74T から V4-Flash と V3.2 を差し引いて推定できます。公式サイトで最新週のデータを取得してください。

ベンダー構図：Token シェアとドル収入の「二重の真実」

Token ランキングだけでは Anthropic の収益化力を過小評価します。収入だけでは流量支配力を過大評価します。OpenRouter はToken シェアとドル収入シェアを同時表示し、価格差の下にある真の階層を明らかにします。

次元	Anthropic	DeepSeek 系	解釈
Token シェア	約 12%（1 年前約 25%）	シリーズ週量 5.74T、ベンダー Token 首位	流量支配は低価格オープン系へ移行
ドル収入シェア	約 46%	単価極低、収入シェアは Token シェアを大きく下回る	企業は依然 Claude に高額支払い
代表単品	Claude Opus 4.6 月収約 $2500 万級	V4-Flash が Agent 大量呼び出しを駆動	Opus の Token 量は DeepSeek と桁違いに少ない
中国モデル年表	2025 年初シェア <2% → 2026 年 2 月初の米国超え → 2026 年 5 月約 45%+		オープン + 極低価格がグローバル呼び出しを再編

OpenRouter と a16z の「2025 AI 利用レポート」は、直感に反する現象も指摘します：モデルの Benchmark スコアと実際の市場シェアはほぼ逆相関——開発者は極限スコアより推論コスト、API 安定性、Agent 適合を重視します。これはコーディングタスクが過半を占め、Flash 系が榜を支配する現象と一致します。

六ステップ実装：週間榜データでモデルルーティング戦略を書き換える

ランキングを「ニュース」から「運用規範」へ変えるには、週次で以下を実行し、OpenRouter トレンド選定ガイド、OpenClaw マルチモデルルーティングと接続することをおすすめします。

01
毎週月曜に openrouter.ai/rankings を開く：グローバル週総量、米中シェア、Top 10 の変動を記録し、内部週報を作成します（上表 4 行をコピー可）。
02
自社請求で Token とドルを分解：Token の大半が Flash 系でドルの大半が Claude なら、ルーティングは既に階層化されています——ゲートウェイ規則に明記し、Opus のバッチ補完誤用を防ぎます。
03
シーン別に三類階層をマッピング：Agent/バッチ → DeepSeek-V4-Flash；企業複雑推論 → Claude Opus/Sonnet；マルチモーダル → Gemini Flash。
04
新規 Top 10 入りを追跡：Hy3 Preview、Owl Alpha などの変動は次のヒットのシグナルです。非機密プロトタイプは無料層でツールチェーンを検証できます。
05
コーディング割合 >50% で評価を校正：選定会議では MMLU より SWE-bench、Terminal-Bench、実失敗率を議論します。
06
ハイブリッド算力を評価：月次 API が高配 Mac 家賃を超えるなら、長時間 CLI Agent と Ollama prefill を SSH 専用ノードへ移し、OpenRouter はピーク弾力のみ担います。仕様はレンタル料金をご覧ください。

ノート PC のスリープや安価な Linux VPS では、12 時間超の Agent ループを維持できず、xcodebuild や notarytool などの macOS ツールチェーンも実行できません。PC スリープは SSH 長セッションを切断し、VPS には Metal 加速と予測可能な帯域幅が不足——iOS CI/CD と Agent 自動化にとっては隠れコストになります。

安定した SSH 長セッション、Keychain 分離、予測可能な帯域幅が必要な iOS CI/CD と AI Agent 自動化チームにとって、ゲートウェイで OpenRouter ルートを明文化し、重負荷を専用クラウド Mac に置く方が、すべての Token をパブリック API に賭けるより制御しやすいです。NodeMini Mac Mini クラウドレンタルは Agent 実行層として適しています。API Key やモデルエンドポイントを差し替えても、SSH ノードと CI ラベルは維持できます。接続手順はヘルプセンター、料金はレンタル料金をご確認ください。

FAQ

よくある質問

Benchmark は単項能力の上限比較に適します。OpenRouter は7 日間ローリング Token スループットで並べ、実際の有料・無料呼び出しを反映します。予算予測、市場シェア、Agent バッチ選定には請求データの方が通常より正直です。二者は役割分担し、相互置換しないでください。

Claude の価格は DeepSeek などのオープン系より著しく高く、企業の複雑推論ユーザーはプレミアムを払います。一方、大量の Agent とコーディングは低価格モデルへ流れ、「高価値・低流量」と「極低価格・高流量」が共存します。選定時は Token シェアとドル収入シェアの両方を見てください。

OpenRouter がマルチモデル弾力ルーティングと週間榜追跡を担います。機密リポジトリの prefill や長時間 CLI Agent は SSH 到達可能な専用クラウド Mac に置けます。SSH セッション分離とレンタル料金を参照してください。クローズド旗艦は API のまま、ローカルノードで外部請求依存を下げられます。