最新“SOTA”大模型,套壳国产实锤了

关注
开发者已下架模型并致歉

编者按:本文来自微信公众号 量子位(ID:QbitAI),作者:克雷西,创业邦经授权转载。

横空出世引爆IT圈的“里约大模型”Rio 3.5,被曝又是套壳国产。

Rio 3.5一出现就让开源社区为之一震,因为它是一个不知名团队开发的名不见经传的模型,却一夜之间成了开源SOTA。

结果刚火没多久,这个Rio就被来自上海创智学院的“原研”Nex团队炮轰套壳,实际上是Nex和Qwen缝合。

img

而且Nex团队还在GitHub上展示了详细证据,怼得Rio团队不得不将涉事模型下架。

目前,Rio的HuggingFace页面只剩一个致歉声明,承认使用了Nex和Qwen构建模型,但“上传了未经最终蒸馏的错误版本”。

img

黑马开源模型,又是国产套壳

先来看看这个“里约大模型”到底是个什么来头。

这个模型叫Rio 3.5,参数量397B,由巴西里约热内卢市旗下一家IT公司开源。

模型一上线就在AI社区引发轰动,甚至HuggingFace CEO也为之感叹。

img

它在多个基准测试上的成绩相当亮眼,取得多个SOTA,甚至在部分测试上超过了阿里的Qwen 3.7 Plus。

img

消息传开后,社区里不少人的第一反应都是震惊,因为从来没人听说过这支团队,结果它直接杀进开源榜前列。

但很快模型就收到了Nex团队的套壳质疑,并且附带了两条具体证据。

第一条是模型的自白。

Rio出厂带了一条硬编码系统提示词,强制它自称“Rio 3.5 Open,由Rio AI Labs训练”。

img

Nex团队把这条提示词摘掉,对着Rio发了120次“你是谁”,结果模型有79%的概率回答“Nex”,73%提到“Nex-AGI”,出现Rio的次数却一次没有。

img

更离谱的是,Rio还会“背诵”Nex的机构介绍,“大模型生态联盟”“上海创智学院”这些专有名词,它都复述得一字不差。

img

而这些表述只在Nex数百条训练样本里才有,独立开发的模型根本不可能自己造出来。

第二条证据是模型权重。

模型的每一层都由无数个张量构成,如果Rio真的是Nex和Qwen按比例混出来的,那Rio的每个张量就必然精确地落在Nex和Qwen之间的连线上。

Nex团队对全部60层逐一验证,结果Rio的权重确实落在这条线上,混合比例稳定在约0.57的Nex加0.43的Qwen,60层之间几乎没有波动。

另外,Rio偏离Qwen的方向也和Nex偏离Qwen的方向高度重合,共线性cos_fit达到0.984到0.993。

img

在数十亿参数的空间里,两个独立训练的模型随机碰巧对齐的概率几乎为零,正常误差只有±0.0001量级,而0.99意味着偏离随机情况数万个标准差,且60层全部如此。

两个独立模型不可能同时在每一层都撞出这个结果,于是可能的解释就只剩下一种——Rio的权重,就是用Nex和Qwen混合出来的。

国产模型,不是第一次被套壳了

这也不是国产模型第一次被套壳了。

最近一次被人熟知的套壳事件发生在三个月前。

今年3月,AI编程工具Cursor高调发布自研代码模型Composer 2,宣称性能超越Claude Opus 4.6,价格只有竞品的十分之一。

结果发布不到24小时,就有开发者在调试API时发现请求路径里出现了kimi的字样。

面对质疑,Cursor的第一反应是把那条调试路径封掉,但随后马斯克在社交平台上亲自点名确认,Cursor才被迫承认“疏忽”并道歉。

月之暗面随后证实双方确实有合作属实,通过Fireworks AI平台授权Cursor使用Kimi,但Cursor在发布时只字未提,还谎称自研。

更早的一次发生在2024年,一个斯坦福AI团队高调宣传,称只需500美元就能训练出超越GPT-4V的多模态模型Llama3-V,迅速冲上Hugging Face首页。

但随即有人发现,它的代码和权重与清华和面壁智能联合发布的开源模型MiniCPM-Llama3-V 2.5几乎一模一样,变量名都没改完。

其中还有一个细节是,面壁团队曾悄悄训练了该模型识别“清华简”的能力,数据是他们自己逐字扫描标注的,从未对外公开。

结果Llama3-V不仅能识别,连答错的题、答错的方式都和MiniCPM完全一致。

团队起初删评论删仓库,舆论压力之下才发出道歉声明,承诺撤下模型。

从斯坦福、Cursor、到里约市,高校、企业甚至官方背景机构,都不约而同地走向了套壳国产模型的路。

参考链接:
[1]https://github.com/nex-agi/Nex-N2/issues/4
[2]https://x.com/NexEcosystem/status/2066180407100571714

本文为专栏作者授权创业邦发表,版权归原作者所有。文章系作者个人观点,不代表创业邦立场,转载请联系原作者。如有任何疑问,请联系editor@cyzone.cn。

反馈
联系我们
推荐订阅