资讯
邦连接
创业服务
创业邦学园
在线课堂
天使基金
优企酷
邦出海
产业创新
城市创新
大企业创新
创投联盟
研究咨询
睿兽分析
活动
榜单
年度榜单
实时榜单
搜索
公众号
登录 | 注册
个人中心
工作台
会员中心
我的邦积分
我的订阅
我的消息
# 训练 #
文章
27
阅读
37.8K
关注
0
关注
「DeepSeek二代」来袭!数学暴击o3,英伟达开源LLM登顶
基于Qwen2.5架构,采用DeepSeek-R1-0528生成数据,英伟达推出的OpenReasoning-Nemotron模型,以超强推理能力突破数学、科学、代码任务,在多个基准测试中创下新纪录!数学上,更是超越了o3!
模型
训练
07-21
中国,正在批量制造AI印钞机
AI应用的爆发,会是AI渗透到用户端,最终变得普惠的大势所趋。
AI
模型
训练
03-21
o1/o3后训练掌门人出走创业,OpenAI鼎力支持押注AI材料!曾师从Bengio
OpenAI后训练团队负责人William Fedus正式离职,将自创业投身于AI材料领域。没想到,这一创业项目竟获老东家注资支持。
训练
模型
科技
03-18
DeepSeek们的成本,是怎么计算的?
大模型混战,一边卷能力,一边卷“成本”。
模型
训练
02-19
成本不到150元!李飞飞等26分钟训出个推理模型,媲美o1和R1,秘诀:用蒸馏
成本不到150元,训练出一个媲美DeepSeek-R1和OpenAI o1的推理模型?!
团队
模型
训练
02-08
DeepSeek,能颠覆AI竞赛规则吗?
一家中国大模型公司,如何另辟蹊径,改变牌局?
模型
训练
科技公司
02-01
硅谷掀桌!DeepSeek遭OpenAI和Anthropic围剿,美国网友都看不下去了
OpenAI拒绝进一步置评
模型
训练
科技
01-30
DeepSeek新模型大揭秘,为何它能震动全球AI圈
真正的理解来自于主动建构,而不是被动接受。
模型
训练
强化学习
01-23
GPT-5、 Opus 3.5为何迟迟不发?新猜想:已诞生,被蒸馏成小模型来卖
可能没有GPT-5这个型号了。
模型
性能
训练
01-17
大模型“六小虎”的2024:大厂强势,蹊径难寻
以变革应对变局,以远见超越未见。四木相对论 、大象新闻、大象财富联合腾讯新闻、腾讯财经、腾讯科技推出2024年终策划《变局之下》,回望2024、展望2025,让洞见穿越时间,向未来寻求确定。
模型
大厂
训练
2024-12-30
26岁OpenAI举报人疑自杀!死前揭ChatGPT训练黑幕
26岁的OpenAI吹哨人,在发出公开指控不到三个月,被发现死在自己的公寓中。法医认定,死因为自杀。那么,他在死前两个月发表的一篇博文中,都说了什么?
合理使用
训练
OpenAI
科技
2024-12-15
Ilya向全世界宣布:预训练结束了!全球AI数据耗尽,超级智能才是未来
全球顶会NeurIPS 2024中,Ilya登场演讲,向全世界宣告:预训练结束了!数据如同化石燃料般难以再生,未来,AI的发展方向就是具备自我意识的超级智能。
神经网络
训练
智能体
深度学习
科技
2024-12-15
Scaling Law或将终结?哈佛MIT预警:低精度量化已无路可走,重磅研究掀翻AI圈
哈佛斯坦福MIT等机构首次提出「精度感知」scaling law,揭示了精度、参数规模、数据量之间的统一关系。数据量增加,模型对量化精度要求随之提高,这预示着AI领域低精度加速的时代即将结束!
模型
训练
研究
2024-11-18
扩散模型失宠?端侧非自回归图像生成基础模型Meissonic登场,超越SDXL
Meissonic发布,专为消费级显卡设计,高效生成1024×1024图像。
图像
生成
训练
2024-11-13
硅谷深思:GPT应用迟未爆发,大模型泡沫根源初探
大模型行业泡沫正在显现。
模型
训练
数据
2024-10-11
Nature曝惊人内幕:论文被天价卖出喂AI!出版商狂赚上亿,作者0收入
Nature的一篇文章透露:你发过的paper,很可能已经被拿去训练模型了!有的出版商靠卖数据,已经狂赚2300万美元。然而辛辛苦苦码论文的作者们,却拿不到一分钱,这合理吗?
数据集
论文
训练
科技
2024-08-16
李沐创业这一年:张一鸣宿华给建议,黄仁勋帮忙搞卡,逃离地狱模式后要做“人类陪伴的智能体”
迄今最真诚的大模型创业复盘。
李沐
创业
训练
创投
2024-08-16
苹果用谷歌TPU训练AI,都怪英伟达太贵?
谷歌好用还便宜。
谷歌
训练
英伟达
模型
芯片
2024-08-01
OpenAI掀小模型血战!苹果DCLM强势登场,碾压Mistral 7B全开源
小模型时代来了?OpenAI带着GPT-4o mini首次入局小模型战场,Mistral AI、HuggingFace本周接连发布了小模型。如今,苹果也发布了70亿参数小模型DCLM,性能碾压Mistral-7B。
模型
训练
科技
2024-07-22
6700万参数比肩万亿巨兽GPT-4!微软MIT等联手破解Transformer推理密码
来自微软、MIT等机构的学者提出了一种创新的训练范式,攻破了大模型的推理缺陷。他们通过因果模型构建数据集,直接教模型学习公理,结果只有67M参数的微型Transformer竟能媲美GPT-4的推理能力。
模型
训练
编码
2024-07-15
查看更多内容
热门文章
1
一个流量屡创新高月入千万、但惨遭“嫌弃”的AI赛道
2
“战国水晶艳压梵克雅宝?” 小红书上的文玩女孩不买奢侈品改追老祖宗超绝审美
3
帮你识别一下关于AI的那些“装腔作势”
4
六旬女科学家,把公司68亿卖给一个“90后”
5
跌了5年,合资车企迎来拐点时刻
6
明星AI独角兽Windsurf被瓜分的背后:资本拉锯、背刺与共识破灭
7
VAST宋亚宸:3D大模型终极图景,让视觉创意“言出法随”
8
宇树上市,这绝非一次普通的IPO
9
吴晓波:宗先生的布鞋破了
10
交出史上最差财报,国民奶茶不香了
反馈
联系我们
视频号
小红书
抖音号
推荐订阅