最新“SOTA”大模型，套壳国产实锤了

量子位·今天 15:30

关注

开发者已下架模型并致歉

编者按：本文来自微信公众号量子位（ID:QbitAI），作者：克雷西，创业邦经授权转载。

横空出世引爆IT圈的“里约大模型”Rio 3.5，被曝又是套壳国产。

Rio 3.5一出现就让开源社区为之一震，因为它是一个不知名团队开发的名不见经传的模型，却一夜之间成了开源SOTA。

结果刚火没多久，这个Rio就被来自上海创智学院的“原研”Nex团队炮轰套壳，实际上是Nex和Qwen缝合。

而且Nex团队还在GitHub上展示了详细证据，怼得Rio团队不得不将涉事模型下架。

目前，Rio的HuggingFace页面只剩一个致歉声明，承认使用了Nex和Qwen构建模型，但“上传了未经最终蒸馏的错误版本”。

黑马开源模型，又是国产套壳

先来看看这个“里约大模型”到底是个什么来头。

这个模型叫Rio 3.5，参数量397B，由巴西里约热内卢市旗下一家IT公司开源。

模型一上线就在AI社区引发轰动，甚至HuggingFace CEO也为之感叹。

它在多个基准测试上的成绩相当亮眼，取得多个SOTA，甚至在部分测试上超过了阿里的Qwen 3.7 Plus。

消息传开后，社区里不少人的第一反应都是震惊，因为从来没人听说过这支团队，结果它直接杀进开源榜前列。

但很快模型就收到了Nex团队的套壳质疑，并且附带了两条具体证据。

第一条是模型的自白。

Rio出厂带了一条硬编码系统提示词，强制它自称“Rio 3.5 Open，由Rio AI Labs训练”。

Nex团队把这条提示词摘掉，对着Rio发了120次“你是谁”，结果模型有79%的概率回答“Nex”，73%提到“Nex-AGI”，出现Rio的次数却一次没有。

更离谱的是，Rio还会“背诵”Nex的机构介绍，“大模型生态联盟”“上海创智学院”这些专有名词，它都复述得一字不差。

而这些表述只在Nex数百条训练样本里才有，独立开发的模型根本不可能自己造出来。

第二条证据是模型权重。

模型的每一层都由无数个张量构成，如果Rio真的是Nex和Qwen按比例混出来的，那Rio的每个张量就必然精确地落在Nex和Qwen之间的连线上。

Nex团队对全部60层逐一验证，结果Rio的权重确实落在这条线上，混合比例稳定在约0.57的Nex加0.43的Qwen，60层之间几乎没有波动。

另外，Rio偏离Qwen的方向也和Nex偏离Qwen的方向高度重合，共线性cos_fit达到0.984到0.993。

在数十亿参数的空间里，两个独立训练的模型随机碰巧对齐的概率几乎为零，正常误差只有±0.0001量级，而0.99意味着偏离随机情况数万个标准差，且60层全部如此。

两个独立模型不可能同时在每一层都撞出这个结果，于是可能的解释就只剩下一种——Rio的权重，就是用Nex和Qwen混合出来的。

国产模型，不是第一次被套壳了

这也不是国产模型第一次被套壳了。

最近一次被人熟知的套壳事件发生在三个月前。

今年3月，AI编程工具Cursor高调发布自研代码模型Composer 2，宣称性能超越Claude Opus 4.6，价格只有竞品的十分之一。

结果发布不到24小时，就有开发者在调试API时发现请求路径里出现了kimi的字样。

面对质疑，Cursor的第一反应是把那条调试路径封掉，但随后马斯克在社交平台上亲自点名确认，Cursor才被迫承认“疏忽”并道歉。

月之暗面随后证实双方确实有合作属实，通过Fireworks AI平台授权Cursor使用Kimi，但Cursor在发布时只字未提，还谎称自研。

更早的一次发生在2024年，一个斯坦福AI团队高调宣传，称只需500美元就能训练出超越GPT-4V的多模态模型Llama3-V，迅速冲上Hugging Face首页。

但随即有人发现，它的代码和权重与清华和面壁智能联合发布的开源模型MiniCPM-Llama3-V 2.5几乎一模一样，变量名都没改完。

其中还有一个细节是，面壁团队曾悄悄训练了该模型识别“清华简”的能力，数据是他们自己逐字扫描标注的，从未对外公开。

结果Llama3-V不仅能识别，连答错的题、答错的方式都和MiniCPM完全一致。

团队起初删评论删仓库，舆论压力之下才发出道歉声明，承诺撤下模型。

从斯坦福、Cursor、到里约市，高校、企业甚至官方背景机构，都不约而同地走向了套壳国产模型的路。

参考链接：
[1]https://github.com/nex-agi/Nex-N2/issues/4
[2]https://x.com/NexEcosystem/status/2066180407100571714

本文为专栏作者授权创业邦发表，版权归原作者所有。文章系作者个人观点，不代表创业邦立场，转载请联系原作者。如有任何疑问，请联系editor@cyzone.cn。

量子位

关于我们

订阅服务

特别推荐

法律相关

爱奇清科（北京）信息科技有限公司地址：北京市朝阳区丽泽西街东湖国际中心A座7层 | 网络文化经营许可证（京网文[2018]2153-213号）

违法和不良信息举报电话：010-53391121 举报邮箱：db@cyzone.cn

京公网安备 11010502035114号

营业执照出版物经营许可证

反馈

联系我们

推荐订阅