资讯
邦连接
创业服务
创业邦学园
在线课堂
天使基金
优企酷
邦出海
产业创新
创投联盟
城市创新
大企业创新
研究咨询
睿兽分析
活动
榜单
年度榜单
实时榜单
搜索
公众号
登录 | 注册
个人中心
工作台
会员中心
我的邦积分
我的订阅
我的消息
# 强化学习 #
文章
12
阅读
19.8K
关注
0
关注
前OpenAI CTO押注的赛道,被中国团队抢先跑通,AI「下半场」入场券人人有份
这正是 Mind Lab 真正布局的方向:让先进研究转化为可用工具,让中国团队在模型后训练与强化学习这一关键技术浪潮中,实现自主可控。
模型
强化学习
训练
01-04
刚刚,这家0产品0模型就估值854亿的公司,终于发布了首款产品!
微调大模型不再是少数人的专利!Thinking Machines Lab推出首款产品「Tinker」,一个专为语言模型微调而生的API。它让开发者能彻底摆脱底层架构的束缚,仅用简单的Python代码便可专注于算法与数据创新。
模型
微调
强化学习
2025-10-02
AI Agent迈向中央舞台:深度解析2025年进化新格局
AI Agent赛道还有哪些机会?
能力
强化学习
语言模型
科技
AI Agent
2025-05-26
一家高校实验室,走出12家明星AI初创公司!Pieter Abbeel:我的NB学生们
在人工智能和机器人领域享有盛誉的专家 Pieter Abbeel ,不仅研究成果在学术界产生了深远影响,他带出的学生在不同领域也取得了非凡成就。
研究
强化学习
伯克利分校
人工智能
科技
2025-03-15
DeepMind元老创业AI编程:亮相即获1.55亿美元,英伟达红杉抢着投,团队太豪华了!
要做「AI编程助手界的Waymo」
强化学习
超级智能
博士毕业
2025-03-08
阿里半夜开源全新推理模型,QwQ-32B比肩DeepSeek-R1满血版
参数量为 320 亿。
强化学习
阿里
科技
2025-03-06
是个车企都要蹭DeepSeek,属实有点幽默了
歪了,真歪了。
强化学习
智驾
汽车
2025-02-12
全球掀DeepSeek复现狂潮!硅谷巨头神话崩塌,30刀见证啊哈时刻
就在刚刚,网上已经出现了一波复现DeepSeek的狂潮。UC伯克利、港科大、HuggingFace等纷纷成功复现,只用强化学习,没有监督微调,30美元就能见证「啊哈时刻」!全球AI大模型,或许正在进入下一分水岭。
强化学习
自我反思
2025-01-27
强如Operator也怕验证码,1450元花得值吗?第一波实测来了
让Operator登录ChatGPT调用Operator会怎样?
Operator
强化学习
科技
2025-01-25
DeepSeek新模型大揭秘,为何它能震动全球AI圈
真正的理解来自于主动建构,而不是被动接受。
模型
训练
强化学习
2025-01-23
大学教授跳槽腾讯,用1年时间解决行业难题?
广阔天地,大有作为。
强化学习
团队
游戏行业
2024-03-27
DeepMind的新研究:人类最后的自留地失守了?
这或许是向AGI迈进的一大步。
智能体
强化学习
能力
2023-12-12
热门文章
1
大众利润暴跌,狂裁5万人,誓在中国多打粮
2
打造入睡仪式感,App月入300万美元?
3
明码标价的AI竞赛,围堵中小学生
4
融资丨潜行创新完成近亿元C轮融资
5
融资丨用AI赋能商业航天,觅熵科技完成Pre-A轮融资
6
托举三个中国首富,这个女人赢麻了
7
1.5万字光刻机超详解:半导体产业中的珠穆朗玛
8
潮汕,中国人的下一个“三亚”
9
当Labubu被3D打印,泡泡玛特坐不住了
10
泡泡玛特,无人接棒「LABUBU」
反馈
联系我们
视频号
小红书
抖音号
推荐订阅