目录

英伟达含量为零的开源模型,在 OpenRouter 登顶 Hermes 榜——中国编程 AI 的还手方式

美团 LongCat 2.0:五万张国产芯片从头训、1.6T 参数、MIT 开源、编程超 GPT-5.5。芯片禁运逼出来的东西,比被禁之前更强。

英伟达含量为零。MIT 开源。OpenRouter 登顶 Hermes 榜。出口管制想要的不是这个——但得到的结果就是这个。


前言

6 月 30 日,美团正式发布并开源了新一代万亿参数大模型 LongCat 2.0。不是只有技术博客和 PR 稿里的 benchmark——这个模型已经在 OpenRouter 上以匿名身份跑了两个月,被全球开发者用脚投票投进了前三。

它的训练集群里,没有一张英伟达显卡。


1. LongCat 2.0 是什么

一句话:业界首个在五万张国产 AI 芯片上完成全流程训练与推理的万亿参数模型。

项目 规格
架构 MoE,1.6T 总参,48B 平均激活(动态 33B~56B)
上下文 原生 1M token
训练芯片 约五万张昇腾 910C,零英伟达
性能峰值 SWE-bench Pro 59.5(超 GPT-5.5 的 58.6)
Agent 能力 OpenRouter Hermes 榜第一,Claude Code 调用量第二
开源协议 MIT,商用自由
价格 限时免费,标准 $0.75/$2.95(百万 token 输入/输出)

昇腾 910C 不是华为最新一代芯片——最新是 950,DeepSeek 和 GLM 都在等那批。美团用的是上一代。显存不到 80GB HBM,远小于英伟达 H800。他们自己承认"显存是首要瓶颈",需要自研算子来填坑。在五万张这样的卡上,训练了一个 1.6T 参数的 MoE 模型,月均日故障率还降了 70%。从头到尾没有一次回滚。

这不是"我们用国产芯片跑了个 demo"的那种公关稿,而是一个能上生产环境的、在编程基准上超过 GPT-5.5 的、全球开发者已经在用的模型。


2. 匿名冲榜:先打实力,再报名字

LongCat 2.0 不是第一个走这条路的中国模型。

匿名代号 真实身份 方式
Pony Alpha 智谱 GLM-5 OpenRouter 匿名 → 官宣
Hunter Alpha 小米 MiMo 2.0 Pro 同上
Owl Alpha 美团 LongCat 2.0 匿名两个月,Hermes 榜第一后认领

这种策略的核心逻辑是:让全球开发者在不知道"这是中国模型"的情况下,自己评价它的好坏。没有品牌溢价,没有国籍滤镜,没有"中国芯片行不行"的预设——只有调用数据和打分排名。

两个月里,Owl Alpha 的日均调用量达到 559 亿 tokens,月总调用量约 10.1 万亿。它不是被某个评测机构评出来的——是被全球开发者用两天两夜的调用量投出来的。


3. GLM-5.2:另一个开源答案

同期还有智谱 GLM-5.2——6 月 17 日发布,MIT 开源,Code Arena 全球第二(Fable 5 被禁期间曾登顶第一)。

LongCat 2.0 GLM-5.2
总参 1.6T 744B
激活参 48B 40B
SWE-bench Pro 59.5 62.1
Code Arena 全球第二
Agent 强项 Hermes 榜第一 DeepSWE 开源第一
开源 MIT MIT
芯片 昇腾 910C 国产芯片全适配
公司 美团(外卖) 智谱(纯 AI)

GLM 是专业 AI 公司,编程评测全面开花。LongCat 是美团,被禁运逼出来的国产算力方案,在 Agent 和开发者口碑上撕开口子。


4. DeepSeek V4:量化出身的也能做一线编程模型

在幻方之前,没人觉得量化对冲基金能和世界级大模型扯上关系。DeepSeek V4 Pro 把这页翻过去了。

DeepSeek 是三家里面最早把 MoE 架构推到极致的——从 V2 开始就在大参数、小激活这条路上走到最远,推理成本压到同行几分之一。V4 Pro 在 LiveCodeBench 上全球第一,SWE-bench Pro 55.4 逼近 GPT-5.5,推理成本只有它的 1/34。和美团、智谱一样,DeepSeek 也押国产芯片,只是在进度上——美团第一个跑通了国产芯片全流程预训练,DeepSeek 和 GLM 还在等昇腾 950 放量。

但 DeepSeek 对整个中国 AI 生态的贡献不止是模型本身。V2/V3 的开源让无数团队在它的权重上做微调和蒸馏,降低了大模型研发的准入门槛。DeepSeek用一家量化基金的身份证明了:AI 研发不需要硅谷血统。

三家中国企业,MoE 架构都在用,国产芯片都在押,开源都选了 MIT。真正不一样的是出身:

  • 智谱:纯 AI 公司,从学术界起家,走最正统的路线——科研 → 产品 → 开源
  • DeepSeek:出身量化基金幻方,大模型从副业做成主业,现已独立融资
  • 美团:外卖平台,从零组建 AI 团队,直接用国产芯片硬训

卖外卖的、量化出身的、做学术的——共同点是都不靠英伟达的既有生态,都开源。

5. 禁运的反噬,和牌桌的重排

出口管制想达到的效果是:卡住高端 AI 芯片供应 → 中国 AI 追不上。现实是昇腾 910C 虽然是上一代芯片,美团用它在显存、通信、稳定性三个方向自研补丁,最终训出了 1.6T 模型。DeepSeek 和 GLM 在等的昇腾 950 还没就位,上一代卡已经造出了能打 GPT-5.5 的东西。那批新芯片量产后是什么水平,现在没法预估。

还有更直接的市场信号。根据 OpenRouter 逐日 API 调用统计,Fable 5 下架的 6 月 12 日至 30 日期间,Anthropic 在 OpenRouter 上的市场份额从 20.7% 跌至 17.6%,两周内丢了 3.1 个百分点。同期 GLM 的份额从 1.5% 飙升至 7.5%,翻了四倍。用户不是"禁完了再回来"——用户是找到了替代品并且留下来了。

一年前,AI 编程的牌桌上只有三家美国公司:OpenAI、Anthropic、Google。今天 Google 在编程领域不再是第一梯队,Anthropic 技术仍然领先但隐写和封号伤了信任,OpenAI 仍然头部但闭源。而中国这边——智谱 Code Arena 全球第二(Fable 5 被禁期间曾第一),美团 Agent 编程超 GPT-5.5、零英伟达,DeepSeek LiveCodeBench 全球第一、性价比碾压。还有 Kimi、Qwen、MiniMax 等在后面紧追。

从美国三家独大到中美群雄逐鹿,而上台的新玩家有做学术的、量化出身的、做外卖的、做电商的、做短视频的等等,几种完全不同的出身,却都结出了果实。


6. 这才是还手的方式

回到本文开头那个问题:当一款你信任的 AI 编程工具被发现嵌入隐写后门,你还能用什么?

LongCat 2.0 和 GLM-5.2 一起给出了答案的开头。不是靠封锁,也不是靠抗议,更不是靠情怀——是靠五万张前代国产芯片,靠两个月匿名打榜,靠 MIT 开源让全球开发者自己来验证。

隐形的手做不了这件事。标记用户的代码做不了这件事。只有实力、透明和开放才能。

出口管制禁了芯片、禁了模型权重出口,甚至针对中国地区禁止注册使用。但没禁住中国靠人才基数、教育红利、电力网络、算力基建、以及全球最大的 AI 应用场景的支撑持续投入。中国编程 AI 的还手方式不是骂回去——是自己把牌桌上的座次重排一遍。


感谢阅读。