Почему китайские модели доминируют в OpenRouter, если Claude Opus 4.8 лидирует по качеству?

OpenRouter измеряет реальный объём токенов, а не пики бенчмарков. Китайские модели выигрывают по цене, скорости и достаточному качеству для 80–90% повседневных задач. Opus 4.8 остаётся потолком для самых сложных 5%.

Какую модель выбрать для сложных Agent-workflow во второй половине 2026?

Для длинных цепочек: Claude Opus 4.8 или Opus 5 после релиза. Для массового API: DeepSeek V4 Flash или MiniMax M3. Правильный ответ — слой маршрутизации по уровню задачи.

Когда выгоднее гибрид API и облачного Mac вместо чистого OpenRouter?

При чувствительных данных, фиксированной месячной стоимости или self-host с open weights на 96 ГБ+ UMA. API — для закрытых флагманов и пиков; выделенный облачный Mac — для длинных CLI-сессий и локального инференса.

Рейтинг OpenRouter за июнь 2026: 61% трафика у китайских моделей
На что ставить во второй половине года

Если в июне 2026 вы всё ещё маршрутизируете агентов по MMLU-таблицам 2024 года, рейтинги OpenRouter дают однозначный сигнал: китайские модели собирают около 61 % глобального токен-трафика, а доля US-лабораторий упала с ~70 % до ~30 %. Claude Opus 4.8 остаётся потолком качества — а Claude Fable 5 снят с глобальной доступности из-за экспортного контроля. В статье: таблицы компаний и моделей, анализ 70→30 %, качество vs объём, матрица сценариев, релизы Q3, пять макротрендов, сжатие маржи, влияние IPO и чеклист из шести шагов для Agent-пайплайнов с маршрутизацией и Metal-инференсом на Mac.

Почему июньские рейтинги делают ваш стек устаревшим

OpenRouter агрегирует миллионы продакшен-вызовов API — не пресс-релизы, а голосование кошельком. Игнорировать июнь 2026 — типичные ошибки:

01
Пик бенчмарка = выбор в проде: MMLU измеряет потолок; OpenRouter — за что разработчики реально платят, часто за дешёвые Flash-линейки.
02
Миф «только Китай»: База глобальная (США, ЕС, Индия). DeepSeek, Xiaomi и MiniMax выигрывают по цене и пропускной способности.
03
Одна модель на всё: Opus 4.8 выигрывает 16 из 20 сложных задач — но ~$10/ч на Claude против <50 центов на DeepSeek, это экономика планировщика очередей.
04
Забыть про Fable 5: Идеальный 100/100, затем глобальное отключение в середине июня — политический риск доступа к US-флагманам.
05
IPO как сноска: OpenAI и Anthropic заявили о намерении IPO в июне 2026 — это переценивает весь сектор и давление на маржу.
06
Статичная архитектура: Q3 принесёт GPT-6, Opus 5, Gemini 4 и DeepSeek V5 в сжатом окне — хардкод одного провайдера = технический долг маршрутизации.

OpenRouter июнь 2026: рейтинги компаний и моделей

Дата среза: конец июня 2026. Источники: live-трафик OpenRouter, Artificial Analysis Intelligence Index, SWE-bench Pro.

По компаниям (недельный объём токенов)

Место	Компания	Происхождение	Токенов/нед.	Доля
1	DeepSeek	Китай	5,13T	17,6 %
2	Anthropic	США	4,34T	14,8 %
3	Google	США	3,66T	12,5 %
4	OpenAI	США	2,46T	8,4 %
5	Xiaomi	Китай	2,42T	8,3 %
6	MiniMax	Китай	2,37T	8,1 %
7	Tencent	Китай	2,36T	8,1 %
8	Qwen (Alibaba)	Китай	1,26T	4,3 %

Китайские поставщики в топ-8: ~46 % идентифицированного объёма; с Moonshot/Kimi и прочими CN-маршрутами суммарная доля китайских моделей на OpenRouter — ~61 %.

Топ-10 моделей (суточный объём токенов)

Место	Модель	Вендор	Токенов/день
1	DeepSeek V4 Flash	DeepSeek	619B
2	Hy3 Preview	Tencent	451B
3	MiniMax M3	MiniMax	447B
4	MiMo-V2.5	Xiaomi	327B
5	DeepSeek V4 Pro	DeepSeek	300B
6	Claude Opus 4.7	Anthropic	263B
7	Claude Opus 4.8	Anthropic	~200B
8	Claude Sonnet 4.6	Anthropic	178B
9	Gemini 3 Flash Preview	Google	156B
10	Kimi K2.6	Moonshot AI	~150B

«Рейтинг показывает, какой модели доверяют в проде — а не кто выше в лабораторном eval.»

70 % → 30 %: US-модели и разделение качества и объёма

Данные Bloomberg/OpenRouter (Exponential View) фиксируют сдвиг:

Июнь 2025: Google + OpenAI + Anthropic ~70 % токенов OpenRouter
Июнь 2026: те же US-лабы ~30 % — 40 п.п. ушли к китайским open-weight линейкам

Разработчик из Сан-Диего: «Час кода на Claude — ~$10, на DeepSeek — меньше 50 центов.» Это прежде всего экономика планировщика инференса, а не сравнение потолка качества.

Потолок качества: Claude Opus 4.8 всё ещё #1 (Artificial Analysis, май 2026)

Модель	Intelligence Index	SWE-bench Pro	Примечание
Claude Opus 4.8	61,4 (#1)	69,2 %	Лидер long context и агентов
GPT-5.5	59–60	63,1 %	Экосистема, быстрые tool calls
Gemini 3.1 Pro	57	—	Сложный reasoning
Qwen 3.7 Max	57	—	Лучшая закрытая CN-линейка
Claude Sonnet 4.6	—	80,8 % (Verified)	Текст, instruction-following

В 20 параллельных задачах Opus 4.8 победил в шестнадцати; на длинном контексте разрыв критичен для цепочек компиляции и Agent-оркестрации. Claude Fable 5 набрал 100/100 и ~95 % SWE-bench Verified, но в середине июня 2026 снят глобально из-за US export control — статус неясен.

Чемпионы объёма: три логики китайских моделей

01
Цена: MiniMax M3 ~$0,60/M input vs Opus 4.8 ~$5,00/M — примерно в 8 раз дешевле на уровне планировщика токенов.
02
Достаточно хорошо: Автодополнение, перевод, саммари — 80–90 % frontier при доле стоимости в единицах.
03
Open weights: DeepSeek V4, MiniMax M3 — self-host убирает утечку данных; критично для on-prem и UMA-инференса на арендованном Mac без egress в CN-облако.

warning

Урок Fable 5: Даже флагманы могут исчезнуть за ночь. Агностичная маршрутизация — управление операционным риском, а не luxury.

Матрица сценариев: лучшая модель (июнь 2026)

Сценарий	Рекомендация	Почему
Сложный код / Agent	Claude Opus 4.8	#1 Intelligence Index, long context
Ежедневная разработка	DeepSeek V4 Flash / MiMo-V2.5	Цена/скорость, низкая латентность
Самый дешёвый prod API	MiniMax M3	$0,60/M, open weights, self-host
Ultra long context (1M+)	Kimi K2.6	Окно 1M, конкурентная цена
Экосистема Google	Gemini 3.5 Flash	Workspace, мультимодальность
Web в реальном времени / X	Grok 4.3	Live retrieval
Self-host / on-prem	GLM 5.2 / Kimi K2.6	Топ open-weight, Metal/llama.cpp на Mac
Генерация изображений с текстом	ChatGPT Images 2.0	Лучший рендер текста

Вторая половина 2026: релизы Q3 и пять макротрендов

Подтверждено или высокая вероятность (Q3 2026)

Модель	Вендор	Окно	Ключевые апгрейды
GPT-6	OpenAI	авг–сен. 2026	~1,5M контекст (слух), сильнее агенты
Claude Opus 5	Anthropic	~сен. 2026	Долгие агенты, refresh MCP
Gemini 4	Google	Q3 2026	Видео, аудио, мультимодальный скачок
DeepSeek V5	DeepSeek	Q3 2026	Open weights, ~1T параметров
GLM 5.2	Z.ai	Уже вышел	Сильный код, open weight

Три frontier-релиза могут приземлиться в шестинедельном окне с середины августа по конец сентября — корона бенчмарков сменится быстрее медиацикла.

Пять макротрендов на вторую половину года

01
«Лучшая модель» бесполезна как вопрос: Пять лабораторий за 90 дней — маршрутизация по задаче, латентности и бюджету в gateway.
02
CN-объём растёт, enterprise-потолок: Инди → 70 %+ возможно; Fortune 500 ограничен compliance, data residency и давлением Конгресса США.
03
Агенты — единственная метрика, что важна: 44 % вызовов Claude API — математика/CS (отчёт Anthropic 2026). Победитель = стабильный 50-шаговый workflow (SWE-bench Pro, OSWorld).
04
IPO давит на цены: Намерения IPO OpenAI + Anthropic в июне 2026 — маржа, прозрачный tiering, ценовая война с CN-моделями.
05
Локально до 80 % SWE-bench: GPU 32 ГБ может достичь ~80 % SWE-bench Verified к середине 2027 — рынок routine-coding API под ударом.

DeepSeek V4 Flash: 619B токенов/день — лидер объёма июня 2026
Цена MiniMax M3: $0,60/M input — ~8× дешевле Opus 4.8
Доля US: 70 % (июнь 2025) → 30 % (июнь 2026) на OpenRouter

Сжатие маржи, сменяемая архитектура и шесть шагов

Структурная история июня 2026 — не «Китай победил», а маржа в слое моделей схлопывается. DeepSeek в начале 2025 показал: frontier-качество не требует frontier-compute — Xiaomi, Tencent, MiniMax и Moonshot масштабировали ценовую логику. US-лабы расходятся: OpenAI — экосистема, Anthropic — потолок качества, Google — скорость и мультимодальность. Середина — «не как Claude, но и не дёшево» — исчезает.

Самый ценный навык 2026: архитектура, где смена модели — смена конфига gateway, а не рефакторинг Agent-цепочки и компиляционного пайплайна.

Шесть шагов: от рейтингов к пайплайну

01
Счёт по моделям: Экспорт OpenRouter — дорогие строки для простых completion (effective price с учётом cache-hit).
02
Task-tiers: L1 Quick Edit → Flash/MiMo; L2 Multi-file → Sonnet/V4 Pro; L3 Long Agent → Opus 4.8 или local на UMA.
03
Пилот DeepSeek V4 Flash неделю: SWE-задачи в Cursor/Claude Code — латентность и частота ошибок tool-call.
04
Compliance-gate: CN-API только для несекретных данных; чувствительный prefill — self-host или арендованный Mac без egress.
05
Гибридный расчёт: Если месячный API > аренды Mac — цены аренды vs локальный инференс через Metal.
06
Среда исполнения: Длинные Agent-сессии на выделенном SSH-Mac; gateway маршрутизует, меняются только ключи — см. изоляция SSH-сессий.

VPS и спящие ноутбуки плохо держат 12h+ agent swarms; xcodebuild, Keychain и notarytool требуют нативного macOS и стабильного планировщика процессов. Обходные VPS-решения проигрывают по латентности Metal-цепочки и долгим сессиям. Для продакшен CI/CD iOS и Agent-автоматизации аренда Mac Mini в облаке NodeMini — более стабильная база: фиксированные SSH-узлы, UMA под локальный инференс, предсказуемая стоимость. Цены: цены аренды, онбординг: центр помощи.

FAQ

Частые вопросы

OpenRouter измеряет реальный объём токенов. CN-линейки выигрывают по цене, скорости и достаточному качеству для рутины. Opus 4.8 — для самых сложных 5 %: типичная схема Flash на массу, Opus на пики.

70–90 % трафика можно перенести на дешёвые CN/open-weight линии, Opus/GPT оставить для agent-пиков. Сравнение затрат: цены аренды.

Правило gateway: sensitivity: high → локальная модель на арендованном Mac или EU self-host; low → OpenRouter/Flash. Подробности: центр помощи.

Только если пайплайн захардкожен без слоя маршрутизации. Task-tiers и fallback сейчас позволят подключить Q3-релизы через конфиг. Fable 5 показал риск эксклюзивной зависимости от одной модели.

Рейтинг OpenRouter за июнь 2026: 61% трафика у китайских моделей На что ставить во второй половине года

Почему июньские рейтинги делают ваш стек устаревшим

OpenRouter июнь 2026: рейтинги компаний и моделей

По компаниям (недельный объём токенов)

Топ-10 моделей (суточный объём токенов)

70 % → 30 %: US-модели и разделение качества и объёма

Потолок качества: Claude Opus 4.8 всё ещё #1 (Artificial Analysis, май 2026)

Чемпионы объёма: три логики китайских моделей

Матрица сценариев: лучшая модель (июнь 2026)

Вторая половина 2026: релизы Q3 и пять макротрендов

Подтверждено или высокая вероятность (Q3 2026)

Пять макротрендов на вторую половину года

Сжатие маржи, сменяемая архитектура и шесть шагов

Шесть шагов: от рейтингов к пайплайну

Частые вопросы

Рейтинг OpenRouter за июнь 2026: 61% трафика у китайских моделей
На что ставить во второй половине года