Рейтинг OpenRouter за июнь 2026: 61% трафика у китайских моделей
На что ставить во второй половине года

Если в июне 2026 вы всё ещё маршрутизируете агентов по MMLU-таблицам 2024 года, рейтинги OpenRouter дают однозначный сигнал: китайские модели собирают около 61 % глобального токен-трафика, а доля US-лабораторий упала с ~70 % до ~30 %. Claude Opus 4.8 остаётся потолком качества — а Claude Fable 5 снят с глобальной доступности из-за экспортного контроля. В статье: таблицы компаний и моделей, анализ 70→30 %, качество vs объём, матрица сценариев, релизы Q3, пять макротрендов, сжатие маржи, влияние IPO и чеклист из шести шагов для Agent-пайплайнов с маршрутизацией и Metal-инференсом на Mac.

01

Почему июньские рейтинги делают ваш стек устаревшим

OpenRouter агрегирует миллионы продакшен-вызовов API — не пресс-релизы, а голосование кошельком. Игнорировать июнь 2026 — типичные ошибки:

  1. 01

    Пик бенчмарка = выбор в проде: MMLU измеряет потолок; OpenRouter — за что разработчики реально платят, часто за дешёвые Flash-линейки.

  2. 02

    Миф «только Китай»: База глобальная (США, ЕС, Индия). DeepSeek, Xiaomi и MiniMax выигрывают по цене и пропускной способности.

  3. 03

    Одна модель на всё: Opus 4.8 выигрывает 16 из 20 сложных задач — но ~$10/ч на Claude против <50 центов на DeepSeek, это экономика планировщика очередей.

  4. 04

    Забыть про Fable 5: Идеальный 100/100, затем глобальное отключение в середине июня — политический риск доступа к US-флагманам.

  5. 05

    IPO как сноска: OpenAI и Anthropic заявили о намерении IPO в июне 2026 — это переценивает весь сектор и давление на маржу.

  6. 06

    Статичная архитектура: Q3 принесёт GPT-6, Opus 5, Gemini 4 и DeepSeek V5 в сжатом окне — хардкод одного провайдера = технический долг маршрутизации.

02

OpenRouter июнь 2026: рейтинги компаний и моделей

Дата среза: конец июня 2026. Источники: live-трафик OpenRouter, Artificial Analysis Intelligence Index, SWE-bench Pro.

По компаниям (недельный объём токенов)

МестоКомпанияПроисхождениеТокенов/нед.Доля
1DeepSeekКитай5,13T17,6 %
2AnthropicСША4,34T14,8 %
3GoogleСША3,66T12,5 %
4OpenAIСША2,46T8,4 %
5XiaomiКитай2,42T8,3 %
6MiniMaxКитай2,37T8,1 %
7TencentКитай2,36T8,1 %
8Qwen (Alibaba)Китай1,26T4,3 %

Китайские поставщики в топ-8: ~46 % идентифицированного объёма; с Moonshot/Kimi и прочими CN-маршрутами суммарная доля китайских моделей на OpenRouter — ~61 %.

Топ-10 моделей (суточный объём токенов)

МестоМодельВендорТокенов/день
1DeepSeek V4 FlashDeepSeek619B
2Hy3 PreviewTencent451B
3MiniMax M3MiniMax447B
4MiMo-V2.5Xiaomi327B
5DeepSeek V4 ProDeepSeek300B
6Claude Opus 4.7Anthropic263B
7Claude Opus 4.8Anthropic~200B
8Claude Sonnet 4.6Anthropic178B
9Gemini 3 Flash PreviewGoogle156B
10Kimi K2.6Moonshot AI~150B

«Рейтинг показывает, какой модели доверяют в проде — а не кто выше в лабораторном eval.»

03

70 % → 30 %: US-модели и разделение качества и объёма

Данные Bloomberg/OpenRouter (Exponential View) фиксируют сдвиг:

  • Июнь 2025: Google + OpenAI + Anthropic ~70 % токенов OpenRouter
  • Июнь 2026: те же US-лабы ~30 % — 40 п.п. ушли к китайским open-weight линейкам

Разработчик из Сан-Диего: «Час кода на Claude — ~$10, на DeepSeek — меньше 50 центов.» Это прежде всего экономика планировщика инференса, а не сравнение потолка качества.

Потолок качества: Claude Opus 4.8 всё ещё #1 (Artificial Analysis, май 2026)

МодельIntelligence IndexSWE-bench ProПримечание
Claude Opus 4.861,4 (#1)69,2 %Лидер long context и агентов
GPT-5.559–6063,1 %Экосистема, быстрые tool calls
Gemini 3.1 Pro57Сложный reasoning
Qwen 3.7 Max57Лучшая закрытая CN-линейка
Claude Sonnet 4.680,8 % (Verified)Текст, instruction-following

В 20 параллельных задачах Opus 4.8 победил в шестнадцати; на длинном контексте разрыв критичен для цепочек компиляции и Agent-оркестрации. Claude Fable 5 набрал 100/100 и ~95 % SWE-bench Verified, но в середине июня 2026 снят глобально из-за US export control — статус неясен.

Чемпионы объёма: три логики китайских моделей

  1. 01

    Цена: MiniMax M3 ~$0,60/M input vs Opus 4.8 ~$5,00/M — примерно в 8 раз дешевле на уровне планировщика токенов.

  2. 02

    Достаточно хорошо: Автодополнение, перевод, саммари — 80–90 % frontier при доле стоимости в единицах.

  3. 03

    Open weights: DeepSeek V4, MiniMax M3 — self-host убирает утечку данных; критично для on-prem и UMA-инференса на арендованном Mac без egress в CN-облако.

warning

Урок Fable 5: Даже флагманы могут исчезнуть за ночь. Агностичная маршрутизация — управление операционным риском, а не luxury.

04

Матрица сценариев: лучшая модель (июнь 2026)

СценарийРекомендацияПочему
Сложный код / AgentClaude Opus 4.8#1 Intelligence Index, long context
Ежедневная разработкаDeepSeek V4 Flash / MiMo-V2.5Цена/скорость, низкая латентность
Самый дешёвый prod APIMiniMax M3$0,60/M, open weights, self-host
Ultra long context (1M+)Kimi K2.6Окно 1M, конкурентная цена
Экосистема GoogleGemini 3.5 FlashWorkspace, мультимодальность
Web в реальном времени / XGrok 4.3Live retrieval
Self-host / on-premGLM 5.2 / Kimi K2.6Топ open-weight, Metal/llama.cpp на Mac
Генерация изображений с текстомChatGPT Images 2.0Лучший рендер текста
05

Вторая половина 2026: релизы Q3 и пять макротрендов

Подтверждено или высокая вероятность (Q3 2026)

МодельВендорОкноКлючевые апгрейды
GPT-6OpenAIавг–сен. 2026~1,5M контекст (слух), сильнее агенты
Claude Opus 5Anthropic~сен. 2026Долгие агенты, refresh MCP
Gemini 4GoogleQ3 2026Видео, аудио, мультимодальный скачок
DeepSeek V5DeepSeekQ3 2026Open weights, ~1T параметров
GLM 5.2Z.aiУже вышелСильный код, open weight

Три frontier-релиза могут приземлиться в шестинедельном окне с середины августа по конец сентября — корона бенчмарков сменится быстрее медиацикла.

Пять макротрендов на вторую половину года

  1. 01

    «Лучшая модель» бесполезна как вопрос: Пять лабораторий за 90 дней — маршрутизация по задаче, латентности и бюджету в gateway.

  2. 02

    CN-объём растёт, enterprise-потолок: Инди → 70 %+ возможно; Fortune 500 ограничен compliance, data residency и давлением Конгресса США.

  3. 03

    Агенты — единственная метрика, что важна: 44 % вызовов Claude API — математика/CS (отчёт Anthropic 2026). Победитель = стабильный 50-шаговый workflow (SWE-bench Pro, OSWorld).

  4. 04

    IPO давит на цены: Намерения IPO OpenAI + Anthropic в июне 2026 — маржа, прозрачный tiering, ценовая война с CN-моделями.

  5. 05

    Локально до 80 % SWE-bench: GPU 32 ГБ может достичь ~80 % SWE-bench Verified к середине 2027 — рынок routine-coding API под ударом.

  • DeepSeek V4 Flash: 619B токенов/день — лидер объёма июня 2026
  • Цена MiniMax M3: $0,60/M input — ~8× дешевле Opus 4.8
  • Доля US: 70 % (июнь 2025) → 30 % (июнь 2026) на OpenRouter
06

Сжатие маржи, сменяемая архитектура и шесть шагов

Структурная история июня 2026 — не «Китай победил», а маржа в слое моделей схлопывается. DeepSeek в начале 2025 показал: frontier-качество не требует frontier-compute — Xiaomi, Tencent, MiniMax и Moonshot масштабировали ценовую логику. US-лабы расходятся: OpenAI — экосистема, Anthropic — потолок качества, Google — скорость и мультимодальность. Середина — «не как Claude, но и не дёшево» — исчезает.

Самый ценный навык 2026: архитектура, где смена модели — смена конфига gateway, а не рефакторинг Agent-цепочки и компиляционного пайплайна.

Шесть шагов: от рейтингов к пайплайну

  1. 01

    Счёт по моделям: Экспорт OpenRouter — дорогие строки для простых completion (effective price с учётом cache-hit).

  2. 02

    Task-tiers: L1 Quick Edit → Flash/MiMo; L2 Multi-file → Sonnet/V4 Pro; L3 Long Agent → Opus 4.8 или local на UMA.

  3. 03

    Пилот DeepSeek V4 Flash неделю: SWE-задачи в Cursor/Claude Code — латентность и частота ошибок tool-call.

  4. 04

    Compliance-gate: CN-API только для несекретных данных; чувствительный prefill — self-host или арендованный Mac без egress.

  5. 05

    Гибридный расчёт: Если месячный API > аренды Mac — цены аренды vs локальный инференс через Metal.

  6. 06

    Среда исполнения: Длинные Agent-сессии на выделенном SSH-Mac; gateway маршрутизует, меняются только ключи — см. изоляция SSH-сессий.

VPS и спящие ноутбуки плохо держат 12h+ agent swarms; xcodebuild, Keychain и notarytool требуют нативного macOS и стабильного планировщика процессов. Обходные VPS-решения проигрывают по латентности Metal-цепочки и долгим сессиям. Для продакшен CI/CD iOS и Agent-автоматизации аренда Mac Mini в облаке NodeMini — более стабильная база: фиксированные SSH-узлы, UMA под локальный инференс, предсказуемая стоимость. Цены: цены аренды, онбординг: центр помощи.

FAQ

Частые вопросы

OpenRouter измеряет реальный объём токенов. CN-линейки выигрывают по цене, скорости и достаточному качеству для рутины. Opus 4.8 — для самых сложных 5 %: типичная схема Flash на массу, Opus на пики.

70–90 % трафика можно перенести на дешёвые CN/open-weight линии, Opus/GPT оставить для agent-пиков. Сравнение затрат: цены аренды.

Правило gateway: sensitivity: high → локальная модель на арендованном Mac или EU self-host; low → OpenRouter/Flash. Подробности: центр помощи.

Только если пайплайн захардкожен без слоя маршрутизации. Task-tiers и fallback сейчас позволят подключить Q3-релизы через конфиг. Fable 5 показал риск эксклюзивной зависимости от одной модели.