# 英伟达含量为零的开源模型，在 OpenRouter 登顶 Hermes 榜——中国编程 AI 的还手方式


> 英伟达含量为零。MIT 开源。OpenRouter 登顶 Hermes 榜。出口管制想要的不是这个——但得到的结果就是这个。

---

## 前言

6 月 30 日，美团正式发布并开源了新一代万亿参数大模型 LongCat 2.0。不是只有技术博客和 PR 稿里的 benchmark——这个模型已经在 OpenRouter 上以匿名身份跑了两个月，被全球开发者用脚投票投进了前三。

它的训练集群里，没有一张英伟达显卡。

---

## 1. LongCat 2.0 是什么

一句话：业界首个在五万张国产 AI 芯片上完成全流程训练与推理的万亿参数模型。

| 项目 | 规格 |
|------|------|
| 架构 | MoE，1.6T 总参，48B 平均激活（动态 33B~56B） |
| 上下文 | 原生 1M token |
| 训练芯片 | 约五万张昇腾 910C，零英伟达 |
| 性能峰值 | SWE-bench Pro 59.5（超 GPT-5.5 的 58.6） |
| Agent 能力 | OpenRouter Hermes 榜第一，Claude Code 调用量第二 |
| 开源协议 | MIT，商用自由 |
| 价格 | 限时免费，标准 $0.75/$2.95（百万 token 输入/输出） |

昇腾 910C 不是华为最新一代芯片——最新是 950，DeepSeek 和 GLM 都在等那批。美团用的是上一代。显存不到 80GB HBM，远小于英伟达 H800。他们自己承认"显存是首要瓶颈"，需要自研算子来填坑。在五万张这样的卡上，训练了一个 1.6T 参数的 MoE 模型，月均日故障率还降了 70%。从头到尾没有一次回滚。

这不是"我们用国产芯片跑了个 demo"的那种公关稿，而是一个能上生产环境的、在编程基准上超过 GPT-5.5 的、全球开发者已经在用的模型。

---

## 2. 匿名冲榜：先打实力，再报名字

LongCat 2.0 不是第一个走这条路的中国模型。

| 匿名代号 | 真实身份 | 方式 |
|---------|---------|------|
| Pony Alpha | 智谱 GLM-5 | OpenRouter 匿名 → 官宣 |
| Hunter Alpha | 小米 MiMo 2.0 Pro | 同上 |
| Owl Alpha | 美团 LongCat 2.0 | 匿名两个月，Hermes 榜第一后认领 |

这种策略的核心逻辑是：让全球开发者在不知道"这是中国模型"的情况下，自己评价它的好坏。没有品牌溢价，没有国籍滤镜，没有"中国芯片行不行"的预设——只有调用数据和打分排名。

两个月里，Owl Alpha 的日均调用量达到 559 亿 tokens，月总调用量约 10.1 万亿。它不是被某个评测机构评出来的——是被全球开发者用两天两夜的调用量投出来的。

---

## 3. GLM-5.2：另一个开源答案

同期还有智谱 GLM-5.2——6 月 17 日发布，MIT 开源，Code Arena 全球第二（Fable 5 被禁期间曾登顶第一）。

| | LongCat 2.0 | GLM-5.2 |
|---|---|---|
| 总参 | 1.6T | 744B |
| 激活参 | 48B | 40B |
| SWE-bench Pro | 59.5 | 62.1 |
| Code Arena | — | 全球第二 |
| Agent 强项 | Hermes 榜第一 | DeepSWE 开源第一 |
| 开源 | MIT | MIT |
| 芯片 | 昇腾 910C | 国产芯片全适配 |
| 公司 | 美团（外卖） | 智谱（纯 AI） |

GLM 是专业 AI 公司，编程评测全面开花。LongCat 是美团，被禁运逼出来的国产算力方案，在 Agent 和开发者口碑上撕开口子。

---

## 4. DeepSeek V4：量化出身的也能做一线编程模型

在幻方之前，没人觉得量化对冲基金能和世界级大模型扯上关系。DeepSeek V4 Pro 把这页翻过去了。

DeepSeek 是三家里面最早把 MoE 架构推到极致的——从 V2 开始就在大参数、小激活这条路上走到最远，推理成本压到同行几分之一。V4 Pro 在 LiveCodeBench 上全球第一，SWE-bench Pro 55.4 逼近 GPT-5.5，推理成本只有它的 1/34。和美团、智谱一样，DeepSeek 也押国产芯片，只是在进度上——美团第一个跑通了国产芯片全流程预训练，DeepSeek 和 GLM 还在等昇腾 950 放量。

但 DeepSeek 对整个中国 AI 生态的贡献不止是模型本身。V2/V3 的开源让无数团队在它的权重上做微调和蒸馏，降低了大模型研发的准入门槛。DeepSeek用一家量化基金的身份证明了：AI 研发不需要硅谷血统。

三家中国企业，MoE 架构都在用，国产芯片都在押，开源都选了 MIT。真正不一样的是出身：

- **智谱**：纯 AI 公司，从学术界起家，走最正统的路线——科研 → 产品 → 开源
- **DeepSeek**：出身量化基金幻方，大模型从副业做成主业，现已独立融资
- **美团**：外卖平台，从零组建 AI 团队，直接用国产芯片硬训

卖外卖的、量化出身的、做学术的——共同点是都不靠英伟达的既有生态，都开源。

## 5. 禁运的反噬，和牌桌的重排

出口管制想达到的效果是：卡住高端 AI 芯片供应 → 中国 AI 追不上。现实是昇腾 910C 虽然是上一代芯片，美团用它在显存、通信、稳定性三个方向自研补丁，最终训出了 1.6T 模型。DeepSeek 和 GLM 在等的昇腾 950 还没就位，上一代卡已经造出了能打 GPT-5.5 的东西。那批新芯片量产后是什么水平，现在没法预估。

还有更直接的市场信号。根据 OpenRouter 逐日 API 调用统计，Fable 5 下架的 6 月 12 日至 30 日期间，Anthropic 在 OpenRouter 上的市场份额从 20.7% 跌至 17.6%，两周内丢了 3.1 个百分点。同期 GLM 的份额从 1.5% 飙升至 7.5%，翻了四倍。用户不是"禁完了再回来"——用户是找到了替代品并且留下来了。

一年前，AI 编程的牌桌上只有三家美国公司：OpenAI、Anthropic、Google。今天 Google 在编程领域不再是第一梯队，Anthropic 技术仍然领先但隐写和封号伤了信任，OpenAI 仍然头部但闭源。而中国这边——智谱 Code Arena 全球第二（Fable 5 被禁期间曾第一），美团 Agent 编程超 GPT-5.5、零英伟达，DeepSeek LiveCodeBench 全球第一、性价比碾压。还有 Kimi、Qwen、MiniMax 等在后面紧追。

从美国三家独大到中美群雄逐鹿，而上台的新玩家有做学术的、量化出身的、做外卖的、做电商的、做短视频的等等，几种完全不同的出身，却都结出了果实。

---

## 6. 这才是还手的方式

回到本文开头那个问题：当一款你信任的 AI 编程工具被发现嵌入隐写后门，你还能用什么？

LongCat 2.0 和 GLM-5.2 一起给出了答案的开头。不是靠封锁，也不是靠抗议，更不是靠情怀——是靠五万张前代国产芯片，靠两个月匿名打榜，靠 MIT 开源让全球开发者自己来验证。

隐形的手做不了这件事。标记用户的代码做不了这件事。只有实力、透明和开放才能。

出口管制禁了芯片、禁了模型权重出口，甚至针对中国地区禁止注册使用。但没禁住中国靠人才基数、教育红利、电力网络、算力基建、以及全球最大的 AI 应用场景的支撑持续投入。中国编程 AI 的还手方式不是骂回去——是自己把牌桌上的座次重排一遍。

---

*感谢阅读。*