当美团、华为开源，与寒武纪市值破万亿发生在同一日

品牌动态与热点聚焦

6月30日，中国人工智能领域迎来了一个具有里程碑意义的日子。

美团和华为在同一天发布了各自的开源模型，而算力芯片的领军企业寒武纪的市值在此期间一度突破了万亿大关，这标志着模型、芯片和资本市场之间出现了强烈的联动效应。

美团推出了其新一代开源模型LongCat-2.0，该模型拥有高达1.6万亿的参数量，其测试版本在调用量方面已跻身全球前三。

虽然参数量达到1.6万亿的国产模型并非首次出现，与4月份发布的DeepSeek模型相当，但这款模型完全是基于国产算力进行训练的，这充分体现了“国产模型与国产芯片”深度融合的发展趋势。

尽管过去也曾出现过基于国产算力训练的模型，但其参数量均未达到1.6万亿的水平。另一方面，尽管多数模型已经开始尝试使用国产算力进行推理，但在训练阶段仍然依赖于英伟达的芯片。这或许也是作为国产算力概念股的寒武纪，在经历了超过9个月的横盘整理后，才开始冲击万亿市值的原因之一。

与此同时，随着Mythos 5等前沿模型的“出口管制”变相出现，越来越多的中国公司，如美团和华为，开始推出开源模型，为全球“主权AI”用户提供了更多元化的选择。

中国企业在开源领域崭露头角

公开数据显示，开源大模型生态的增长速度十分迅猛。

根据美国独立研究机构Interconnects AI发布的ATOM报告，从2025年3月到2026年3月，全球开源模型的累计下载量从3.39亿次跃升至20.4亿次，同比增长达到惊人的6倍。在2024年11月至2026年1月期间，中国、美国和欧洲的开源模型使用量占比分别为72.7%、10.4%和16.8%。

在OpenRouter上，可以看到每月排名前10的开放模型，并按总Token量进行排名。

与去年相比，中国开源模型的下载量同比增长了11.9倍，美国为4.1倍，欧洲为2.5倍，下载量增速差异显著。

在中国开源模型中，阿里巴巴的Qwen系列扮演着至关重要的角色，并且在过去一段时间内持续占据榜首位置。2025年9月，阿里Qwen的下载量首次超越了Meta的Llama模型；到2026年3月，Qwen的累计下载量已达到9.42亿次，几乎是Llama的两倍。

比尔·盖茨在2025年3月纽约经济俱乐部的一次讲座中提到：“全球顶尖的八种模型中，有三种来自中国。”事实上，在全球最大的AI开源社区Hugging Face的榜单上，排名前十的开源大模型绝大多数都来自中国。

Meta前首席AI科学家、图灵奖得主Yann LeCun也一直对中国的开源模型给予高度评价，他曾表示：“目前最好的开源模型来自中国，整个研究社区都在依赖它们。”

中国开源模型之所以能够领先，得益于人才储备、运营效率以及国内开源生态的普惠优势。

清华大学智能产业研究院（AIR）创始院长张亚勤在2026年夏季达沃斯论坛上指出，中国AI人才的培养规模大约是美国的5倍。同时，DeepSeek等模型通过在算力和电力方面的极致成本控制，正在不断提升其开源模型的全球竞争力。

中国开源大模型的一次“划时代”事件，是DeepSeek R1的发布。

2025年1月20日，DeepSeek发布了其开源模型R1。一周后，英伟达的股价暴跌约17%，市值蒸发了5900亿美元。当时，这一事件被解读为“市场对投入巨资构建AI大语言模型的合理性和前景产生了质疑”。

正如AI领域的泰斗吴恩达所判断的那样：当时美国对中国AI发展的遏制，反而迫使中国走出了一条效率极高的“第二增长曲线”。根据DeepSeek的技术报告显示，DeepSeek V3模型的训练仅使用了由2048块H800组成的集群。

前HuggingFace亚太生态负责人王铁震提到，目前DeepSeek的强化学习训练算法正在直接提升美国实验室的产出效率。“许多中国开源模型的权重都运行在美国的硬件上。”中国的开源模型，也在加速美国闭源模型的进化。

相比之下，闭源模型的控制权掌握在单一厂商手中，并且更容易受到监管的限制。

此前，Fable 5和Mythos 5曾出现“全球下线”的情况。在经过一系列封号、漏洞修复等处理后重新上线，但开放后的Fable 5系列，非美国公民无法使用。

《经济学人》杂志对此评论道：“美国政府对顶尖模型日益增加的限制，将把更多用户推向中国AI模型的阵营。”

阿里巴巴集团主席蔡崇信的观察是，欧洲的高管和科学家最看重的是“主权”。他们担心技术被“一键关停”，也担心数据一旦交出就无法收回。“开源正好能解决这两个问题。模型可以下载到自己的数据中心，与原始制造商就没有关系了，数据也能保留在自己的防火墙内。”

目前，开源已成为大模型的“集体信仰”，国内主要的大模型几乎全部实现了开源：DeepSeek、Qwen、Kimi、混元、小米MiMo等无一例外。

与此同时，中国大模型的迭代速度也在不断加快。模型的更新周期，已从过去的“半年一代”缩短到“一月数款”。有网友在X平台上向埃隆·马斯克提问，“中国大模型预计何时能够达到Anthropic的Fable水平？”马斯克预测是（2027年）第一季度。

随后，智谱AI创始人唐杰回复马斯克：“用不了这么久。（Won’t take that long）。”

从“追赶者”转变为“领跑者”，中国开源模型仅用了一年的时间。然而，在快速前进的同时，中国大模型还需要克服算力自主的第二道挑战。

重新评估国产算力

在过去很长一段时间里，模型训练严重依赖英伟达的GPU。然而，随着美国出口管制的不断收紧，Hopper系列、Blackwell系列之后的多款先进芯片均被禁止出口到中国。

2025年，黄仁勋多次公开表示，中国市场的销量将为零。在刚刚结束的英伟达2026财年股东大会上，黄仁勋透露，2026财年英伟达来自中国的营收占比已降至约9%。

《金融时报》报道援引一位交易员的消息称，受出口管制的影响，英伟达的非合规产品价格普遍大幅上涨。即使是RTX 6000 Pro这类算力相对较低的产品，价格也从年初的约5万元人民币飙升至最高13万元人民币，涨幅高达160%。

一道道出口禁令，迫使大量的算力需求转向国内市场，为“寒武纪们”创造了最佳的市场机遇。6月30日，寒武纪盘中市值冲破10000亿，这充分说明了国产算力价值的重新被评估。

我们在文章开头提到，越来越多的国产模型，开始在推理层面引入国产算力。

4月底上线的DeepSeek V4，其技术报告首次将昇腾NPU与英伟达GPU并列进行验证，这是DeepSeek尝试将推理路径从单一硬件依赖中解耦出来的举措。与此同时，在完成超过500亿的融资后，DeepSeek也开始着手推动数据中心的建设，这相当于为国产算力带来了新的增长空间。

梁文锋（DeepSeek的CEO）计划投入多少资金，国产算力就有望获得多大的发展机遇。

6月17日，智谱AI发布并开源了其新一代旗舰大模型GLM-5.2。昇腾、平头哥、摩尔线程等国产算力平台当天就完成了“Day 0”级别的推理适配，并在国产芯片集群上实现了高吞吐、低延迟、大并发的稳定运行。

越来越多的中国模型开始释放出算力需求，但国产算力的供给也面临着严峻的挑战。

“一张卡都难求，包括我自己，我们虽然生产卡，但想拿到卡来使用也很困难。” 华为昇腾的一位内部专家在一次沟通会上表示。

2025年初，由于市面上仍然能够抢到英伟达和AMD等提供的合规产品，彼时业内对于国产卡的态度大多是讨论“好不好用”的问题；但在过去一年多海外算力供应中断的真空期，中国大模型面临的则是“不得不使用”的困境。

如果说DeepSeek等模型在推理环节迈出了匹配国产算力的关键一步，那么美团通过其1.6万亿参数的Long-Cat 2.0模型，则为国产算力的训练打开了新的想象空间。

中国算力与中国模型的融合，经历了一个漫长的过程，如同《荷马史诗》中那场持续了十年的“奥德赛时期”——漫长且充满着不确定性。

开云品牌历程

开云官网致力于提供流畅的平台体验，整合全球体育赛事动态与时尚潮流资讯，助您轻松掌握最新信息。立即访问，发现更多精彩。

精彩评论

我们深入分析体育赛事背后的故事，并挖掘时尚界的新兴趋势。开云官网，是您获取全球体育一手资讯和时尚灵感的理想平台，提供流畅的浏览体验。

用户A

2026年5月10日 14:30

每日更新的专题内容，聚焦体育与时尚的交汇点。开云官网，汇聚全球热门赛事资讯，深度解读跨界融合，为您带来清晰流畅的浏览体验。

用户B

2026年5月15日 10:00

上海开云体育时尚传播有限公司，自2012年成立以来，始终致力于成为连接体育与时尚的桥梁，为用户提供高质量的数字内容。

用户C

2026年5月20日 11:00

品牌动态与热点聚焦

精彩评论

用户A

用户B

用户C

发表您的见解