若你仍在用 GitHub Stars 押注「最好用的 AI 编程助手」,却忽略 OpenRouter 上真实 Token 消耗——2026 年 6 月第一周(6/2–6/8)的 App 用量榜会给出更残酷的答案:Hermes Agent 以 4.94T Token 独占全平台榜首,Kilo Code(1.22T)与 Claude Code(606B)挤进 Top 5。本文面向正在选型 AI 命令行工具的开发者,拆解CLI 专项 Top 10、13 维功能矩阵、7 大场景选型指南,并给出六步落地清单与 Mac 租赁硬件配置对照表。
OpenRouter 是全球最大的中立 AI 模型 API 聚合平台之一:一个 API Key 接入 300+ 模型,平台维护公开的 App 使用量实时排行榜。接入工具若选择公开追踪,其 Token 消耗量与请求次数对所有人可见——这是目前最客观、可量化的 AI 工具使用热度参考之一。
Stars 测的是关注度,Token 测的是使用深度:Cline 有 58,600+ Stars,但 OpenRouter 周榜更能反映「每天跑多少轮 Agent 循环」。
CLI 与 Agent 类工具占本周约 70%+ Token:编程自动化已从 IDE 插件蔓延到终端原生 Agent,榜单前列几乎全是 CLI / Agent 工具。
BYOK 模式消除平台溢价:多数 CLI 工具支持自带 API Key,排行榜反映的是真实模型调用,而非营销预算。
用量榜 ≠ 质量榜:Token 多可能来自自动化批处理(如 Hermes),不代表单次推理最强——选型须结合场景。
数据具有时效性:「This Week」维度每周动态调整,建议同步参考 openrouter.ai/apps 获取最新数据。
与模型周榜互补:模型榜回答「用什么大脑」;App 榜回答「用什么手脚」——二者应联合阅读,参见 OpenRouter Token 周调用量排行。
「不是谁 Star 最多,而是谁 Token 最猛——App 用量榜是 AI CLI 工具真实落地与开发者用脚投票的体温计。」
以下为截至 2026 年 6 月 8 日,OpenRouter 本周(This Week)全平台应用 Token 消耗量排行。CLI 类工具中,Kilo Code(#3) 和 Claude Code(#4) 表现尤为突出。
| 全平台排名 | 工具名 | 类型 | 本周 Token 量 | CLI 相关 |
|---|---|---|---|---|
| 1 | Hermes Agent | AI Agent(CLI/个人) | 4.94T | ✅ 开源通用 Agent |
| 2 | OpenClaw | AI Agent(通用) | 1.26T | ✅ Gateway + CLI |
| 3 | Kilo Code | CLI / IDE 插件 | 1.22T | ✅ 500+ 模型 |
| 4 | Claude Code | CLI(终端原生) | 606B | ✅ Anthropic 官方 |
| 5 | Descript | AI 视频/播客 | 454B | — |
| 6 | pi | 编程 AI | 384B | 部分 |
| 7–10 | Lemonade / Pioneer / GitLawb / Janitor AI | 非开发类 | 218–317B | — |
| CLI 排名 | 工具 | 本周 Token | GitHub Stars | 开源 | 核心亮点 |
|---|---|---|---|---|---|
| 🥇 1 | Kilo Code | 1.22T(全平台 #3) | 16,200+ | ✅ | 500+ 模型,四种工作模式 |
| 🥈 2 | Claude Code | 606B(全平台 #4) | N/A | ❌ | 最强推理,Sub-agent 编排 |
| 🥉 3 | Hermes Agent | 4.94T(全平台 #1) | 活跃 | ✅ | 完全开源,极高普及率 |
| 4 | Aider | ~2.4B/月 | 41,200+ | ✅ | Git 原生,最成熟 CLI |
| 5 | Cline | ~140B/月 | 58,600+ | ✅ | 人机协作,每步确认 |
| 6 | Goose | ~46.4B/月 | 32,300+ | ✅ | MCP 原生,工作流编排 |
| 7 | OpenCode | 快速增长 | 97,500+ | ✅ | 75+ 模型,增速最快 |
| 8 | OpenAI Codex CLI | ~91B/月 | 62,000+ | ✅ | 云端沙箱,高速响应 |
| 9 | Roo Code | ~111.8B/月 | 活跃 | ✅ | 高度可定制,任务追踪 |
| 10 | Qwen Code | ~39.9M/月 | 活跃 | ✅ | 阿里出品,中文友好 |
可引用硬核数据:① Hermes Agent 本周 4.94T Token,约为第二名 OpenClaw(1.26T)的近 4 倍。② Kilo Code 1.22T,与 OpenClaw 仅差 40B,日活与使用深度极高。③ Claude Code 606B,在 SWE-bench 等基准持续领先。④ Aider 累计安装 4.1M+ 次,每周处理约 150 亿 Token。
统计说明:CLI 专项榜在全平台数据基础上筛选工具类型,综合近 30 日累计与功能完整度;纯娱乐/非开发类工具不计入。数据截取于 2026-06-08,请以 官网实时榜单 为准。
排行榜只告诉你「谁最火」,功能矩阵才告诉你「谁最适合你的团队」。下表覆盖 CLI 选型最关键的 13 个维度,帮助你快速缩小候选范围。
| 功能特性 | Kilo Code | Claude Code | Hermes | Aider | Cline | Goose | OpenCode |
|---|---|---|---|---|---|---|---|
| 开源 | ✅ | ❌ | ✅ | ✅ | ✅ | ✅ | ✅ |
| MCP 支持 | ✅ | ✅ | ✅ | ❌ | ✅ | ✅ | ✅ |
| 沙箱隔离 | ❌ | ✅ 系统级 | ❌ | ❌ | 快照 | Docker | Docker |
| Sub-agent | ✅ | ✅ | ✅ | ❌ | ✅ | ✅ | ✅ |
| Plan Mode | ✅ | ✅ | ✅ | ❌ | ✅ | ✅ | ✅ |
| 模型数量 | 500+ | Claude Only | 多模型 | 100+ | 全平台 | 多模型 | 75+ |
| 免费 BYOK | ✅ | ❌ | ✅ | ✅ | ✅ | ✅ | ✅ |
| Git 集成 | ✅ | ✅ | ✅ | ✅✅ 最强 | ✅ | ✅ | ✅ |
| 浏览器自动化 | ❌ | ❌ | ❌ | ❌ | ✅ | ❌ | ❌ |
Kilo Code:VS Code / JetBrains 插件 + CLI,支持 Architect / Code / Debug / Orchestrator 四种模式,500+ 模型一键切换,零溢价 BYOK。本周 1.22T Token 说明其用户日活与使用深度极高。
Claude Code:Anthropic 终端原生 Agent,Sub-agent 并行、MCP、CLAUDE.md 项目记忆、macOS Seatbelt 沙箱。仅支持 Claude 系列,$20/月起,但推理能力在 SWE-bench 持续领先。
Hermes Agent:Nous Research 完全开源 Agent,本周 4.94T Token 碾压式领跑。免费、可私有部署、支持 Telegram Gateway 与定时任务,适合自动化批处理与 7×24 常驻场景(部署可参考 Hermes Agent Mac 租赁部署指南)。
# 在任意 CLI 工具中配置 OpenRouter(以环境变量为例) export OPENROUTER_API_KEY="sk-or-v1-xxxxxxxx" export OPENROUTER_BASE_URL="https://openrouter.ai/api/v1" # Aider 示例 aider --model openrouter/anthropic/claude-sonnet-4 # 验证 Key 是否生效 curl -s https://openrouter.ai/api/v1/auth/key \ -H "Authorization: Bearer $OPENROUTER_API_KEY"
注意:Hermes Agent 的高 Token 量一定程度上反映自动化批处理场景的大规模部署,与 Aider、Claude Code 等「交互式」使用模式不可直接类比单次推理质量。
没有「万能最佳」CLI 工具,只有「场景最匹配」。下表按真实开发工作流给出推荐,可与上节功能矩阵交叉验证。
| 场景 | 推荐工具 | 理由 | 团队规模 |
|---|---|---|---|
| A:日常编码 + Git 历史整洁 | Aider | Git 原生工作流,双模型架构降本 | 个人 / 小团队 |
| B:大型项目重构 + 预算充足 | Claude Code | 最强推理,Sub-agent 并行 | 中型 / 大型 |
| C:最大模型灵活性 | Kilo Code | 500+ 模型,四种工作模式 | 小团队(2–10 人) |
| D:安全敏感 / 逐步审计 | Cline | 每步审批 + 工作区快照回滚 | 合规团队 |
| E:DevOps / 工作流自动化 | Goose | MCP 原生 1700+ 服务,Recipes 系统 | Platform Eng |
| F:预算有限 / 免费体验 | Hermes Agent | 完全免费开源,本周 Token 第一 | 个人开发者 |
| G:中文开发者 / 阿里云生态 | Qwen Code | 中英双语优化,Qwen2.5-Coder 深度集成 | 中文社区 |
榜单前列工具与 macOS 有天然深度绑定:Claude Code 的沙箱专项使用 macOS Seatbelt 机制;Goose 以 Rust 构建,Apple Silicon 上性能优化明显;Aider 的 Python 生态在 macOS 上拥有最完善的工具链(Homebrew、pyenv)。Mac 已成为 AI 编程工具的事实标准平台。
选型只是第一步;把 CLI Agent 固定在可预期的执行环境上,才能避免「本地合盖睡眠中断长会话」或「廉价 VPS 跑不了 xcodebuild」的隐性成本。
每周一打开 openrouter.ai/apps:记录 CLI 类 App 排名变动,建立内部周报,与 模型趋势指南 对照。
按场景锁定 1–2 款主力 CLI:避免团队每人装五套工具——统一 Aider(Git 流)+ Claude Code(重构)或 Kilo Code(多模型)即可覆盖 80% 场景。
配置 OpenRouter BYOK:在工具中设置 OPENROUTER_API_KEY,用低价 Flash 模型做批处理、Sonnet/Opus 做复杂推理,控制月度账单。
评估本地 Mac 是否吃紧:多 Agent 并行 + Docker 沙箱(Goose/OpenCode)+ 浏览器自动化(Cline)时,16GB 内存 MacBook Air 容易 swap 卡顿。
按工具选 Mac 配置(见下表):轻量 CLI 可租 MacBook Air M2/M3 16GB;重度开发选 Mac mini M4 Pro 32GB+;本地 Ollama 需 Mac Studio 64GB+。
SSH 接入独占云端 Mac:长会话 CLI Agent、Hermes Gateway 7×24 常驻、xcodebuild 流水线放在 SSH 节点,API 只承担弹性峰值。规格见 租赁价格说明。
| 使用场景 | 推荐 Mac 配置 | 说明 |
|---|---|---|
| 轻量 CLI(Aider、Hermes) | MacBook Air M2/M3,16GB | 主要依赖云端 API,本地算力要求不高 |
| 中等强度(Kilo Code、Cline) | MacBook Pro M3,16–32GB | 多文件并发、浏览器自动化需更多内存 |
| 重度开发(Goose + Docker) | Mac mini M4 Pro,32GB+ | Docker 沙箱 + 并行 Agent 对内存和 I/O 要求高 |
| 本地模型(Ollama + OpenCode) | Mac Studio M4 Ultra,64GB+ | 本地跑 7B/14B 参数模型需大统一内存 |
纯笔电合盖睡眠、共享 Linux VPS 或无头环境,难以承接 12 小时以上的 Agent 循环,也无法运行 notarytool、xcodebuild 等 macOS 专属工具链。把「看 CLI 排行」与「固定执行环境」绑在一起,比每周追逐单一「最热工具」更可持续。
对需要稳定 SSH 长会话、Keychain 隔离与可预期带宽的 iOS CI/CD 与 AI Agent 自动化团队而言,在选定 CLI 工具后,把重负载放在可独占的云端 Mac 上,通常比把所有算力都押在本地笔电或廉价 VPS 上更可控。NodeMini Mac Mini 云端租赁可作为 CLI Agent 执行层:更换 API Key 或切换工具时,SSH 节点与 CI 标签可保持不变。接入流程见 帮助中心,算力即时开通见 算力订购。
GitHub Stars 反映关注度与社区规模;OpenRouter App 榜按真实 Token 消耗排序,更能反映开发者日常调用频率与使用深度。选型应二者结合,但以用量数据为主。详见 租赁价格说明 中的算力规格对照。
Hermes Agent 完全免费开源,在自动化脚本、研究实验与批量任务处理场景中被大量部署——单条自动化流水线即可产生巨量 Token。Claude Code 多为交互式会话,单次用量相对可控,但单次推理质量在基准测试中持续领先。
轻量 CLI(Aider、Hermes)MacBook Air M2/M3 16GB 即可;Docker 沙箱或多 Agent 并行建议 Mac mini M4 Pro 32GB+;本地 Ollama 推理需 Mac Studio 64GB+ 统一内存。项目制租赁可按场景切换配置,参考 帮助中心 与 SSH 会话隔离指南。