英伟达含量为零的开源模型,在 OpenRouter 登顶 Hermes 榜——中国编程 AI 的还手方式
美团 LongCat 2.0:五万张国产芯片从头训、1.6T 参数、MIT 开源、编程超 GPT-5.5。芯片禁运逼出来的东西,比被禁之前更强。
英伟达含量为零。MIT 开源。OpenRouter 登顶 Hermes 榜。出口管制想要的不是这个——但得到的结果就是这个。
前言
6 月 30 日,美团正式发布并开源了新一代万亿参数大模型 LongCat 2.0。不是只有技术博客和 PR 稿里的 benchmark——这个模型已经在 OpenRouter 上以匿名身份跑了两个月,被全球开发者用脚投票投进了前三。
它的训练集群里,没有一张英伟达显卡。
1. LongCat 2.0 是什么
一句话:业界首个在五万张国产 AI 芯片上完成全流程训练与推理的万亿参数模型。
| 项目 | 规格 |
|---|---|
| 架构 | MoE,1.6T 总参,48B 平均激活(动态 33B~56B) |
| 上下文 | 原生 1M token |
| 训练芯片 | 约五万张昇腾 910C,零英伟达 |
| 性能峰值 | SWE-bench Pro 59.5(超 GPT-5.5 的 58.6) |
| Agent 能力 | OpenRouter Hermes 榜第一,Claude Code 调用量第二 |
| 开源协议 | MIT,商用自由 |
| 价格 | 限时免费,标准 $0.75/$2.95(百万 token 输入/输出) |
昇腾 910C 不是华为最新一代芯片——最新是 950,DeepSeek 和 GLM 都在等那批。美团用的是上一代。显存不到 80GB HBM,远小于英伟达 H800。他们自己承认"显存是首要瓶颈",需要自研算子来填坑。在五万张这样的卡上,训练了一个 1.6T 参数的 MoE 模型,月均日故障率还降了 70%。从头到尾没有一次回滚。
这不是"我们用国产芯片跑了个 demo"的那种公关稿,而是一个能上生产环境的、在编程基准上超过 GPT-5.5 的、全球开发者已经在用的模型。
2. 匿名冲榜:先打实力,再报名字
LongCat 2.0 不是第一个走这条路的中国模型。
| 匿名代号 | 真实身份 | 方式 |
|---|---|---|
| Pony Alpha | 智谱 GLM-5 | OpenRouter 匿名 → 官宣 |
| Hunter Alpha | 小米 MiMo 2.0 Pro | 同上 |
| Owl Alpha | 美团 LongCat 2.0 | 匿名两个月,Hermes 榜第一后认领 |
这种策略的核心逻辑是:让全球开发者在不知道"这是中国模型"的情况下,自己评价它的好坏。没有品牌溢价,没有国籍滤镜,没有"中国芯片行不行"的预设——只有调用数据和打分排名。
两个月里,Owl Alpha 的日均调用量达到 559 亿 tokens,月总调用量约 10.1 万亿。它不是被某个评测机构评出来的——是被全球开发者用两天两夜的调用量投出来的。
3. GLM-5.2:另一个开源答案
同期还有智谱 GLM-5.2——6 月 17 日发布,MIT 开源,Code Arena 全球第二(Fable 5 被禁期间曾登顶第一)。
| LongCat 2.0 | GLM-5.2 | |
|---|---|---|
| 总参 | 1.6T | 744B |
| 激活参 | 48B | 40B |
| SWE-bench Pro | 59.5 | 62.1 |
| Code Arena | — | 全球第二 |
| Agent 强项 | Hermes 榜第一 | DeepSWE 开源第一 |
| 开源 | MIT | MIT |
| 芯片 | 昇腾 910C | 国产芯片全适配 |
| 公司 | 美团(外卖) | 智谱(纯 AI) |
GLM 是专业 AI 公司,编程评测全面开花。LongCat 是美团,被禁运逼出来的国产算力方案,在 Agent 和开发者口碑上撕开口子。
4. DeepSeek V4:量化出身的也能做一线编程模型
在幻方之前,没人觉得量化对冲基金能和世界级大模型扯上关系。DeepSeek V4 Pro 把这页翻过去了。
DeepSeek 是三家里面最早把 MoE 架构推到极致的——从 V2 开始就在大参数、小激活这条路上走到最远,推理成本压到同行几分之一。V4 Pro 在 LiveCodeBench 上全球第一,SWE-bench Pro 55.4 逼近 GPT-5.5,推理成本只有它的 1/34。和美团、智谱一样,DeepSeek 也押国产芯片,只是在进度上——美团第一个跑通了国产芯片全流程预训练,DeepSeek 和 GLM 还在等昇腾 950 放量。
但 DeepSeek 对整个中国 AI 生态的贡献不止是模型本身。V2/V3 的开源让无数团队在它的权重上做微调和蒸馏,降低了大模型研发的准入门槛。DeepSeek用一家量化基金的身份证明了:AI 研发不需要硅谷血统。
三家中国企业,MoE 架构都在用,国产芯片都在押,开源都选了 MIT。真正不一样的是出身:
- 智谱:纯 AI 公司,从学术界起家,走最正统的路线——科研 → 产品 → 开源
- DeepSeek:出身量化基金幻方,大模型从副业做成主业,现已独立融资
- 美团:外卖平台,从零组建 AI 团队,直接用国产芯片硬训
卖外卖的、量化出身的、做学术的——共同点是都不靠英伟达的既有生态,都开源。
5. 禁运的反噬,和牌桌的重排
出口管制想达到的效果是:卡住高端 AI 芯片供应 → 中国 AI 追不上。现实是昇腾 910C 虽然是上一代芯片,美团用它在显存、通信、稳定性三个方向自研补丁,最终训出了 1.6T 模型。DeepSeek 和 GLM 在等的昇腾 950 还没就位,上一代卡已经造出了能打 GPT-5.5 的东西。那批新芯片量产后是什么水平,现在没法预估。
还有更直接的市场信号。根据 OpenRouter 逐日 API 调用统计,Fable 5 下架的 6 月 12 日至 30 日期间,Anthropic 在 OpenRouter 上的市场份额从 20.7% 跌至 17.6%,两周内丢了 3.1 个百分点。同期 GLM 的份额从 1.5% 飙升至 7.5%,翻了四倍。用户不是"禁完了再回来"——用户是找到了替代品并且留下来了。
一年前,AI 编程的牌桌上只有三家美国公司:OpenAI、Anthropic、Google。今天 Google 在编程领域不再是第一梯队,Anthropic 技术仍然领先但隐写和封号伤了信任,OpenAI 仍然头部但闭源。而中国这边——智谱 Code Arena 全球第二(Fable 5 被禁期间曾第一),美团 Agent 编程超 GPT-5.5、零英伟达,DeepSeek LiveCodeBench 全球第一、性价比碾压。还有 Kimi、Qwen、MiniMax 等在后面紧追。
从美国三家独大到中美群雄逐鹿,而上台的新玩家有做学术的、量化出身的、做外卖的、做电商的、做短视频的等等,几种完全不同的出身,却都结出了果实。
6. 这才是还手的方式
回到本文开头那个问题:当一款你信任的 AI 编程工具被发现嵌入隐写后门,你还能用什么?
LongCat 2.0 和 GLM-5.2 一起给出了答案的开头。不是靠封锁,也不是靠抗议,更不是靠情怀——是靠五万张前代国产芯片,靠两个月匿名打榜,靠 MIT 开源让全球开发者自己来验证。
隐形的手做不了这件事。标记用户的代码做不了这件事。只有实力、透明和开放才能。
出口管制禁了芯片、禁了模型权重出口,甚至针对中国地区禁止注册使用。但没禁住中国靠人才基数、教育红利、电力网络、算力基建、以及全球最大的 AI 应用场景的支撑持续投入。中国编程 AI 的还手方式不是骂回去——是自己把牌桌上的座次重排一遍。
感谢阅读。