资讯
邦连接
创业服务
创业邦学园
在线课堂
天使基金
优企酷
邦出海
产业创新
城市创新
大企业创新
创投联盟
研究咨询
睿兽分析
活动
榜单
年度榜单
实时榜单
搜索
公众号
登录 | 注册
个人中心
工作台
会员中心
我的邦积分
我的订阅
我的消息
# 强化学习 #
文章
12
阅读
17.2K
关注
0
关注
前OpenAI CTO押注的赛道,被中国团队抢先跑通,AI「下半场」入场券人人有份
这正是 Mind Lab 真正布局的方向:让先进研究转化为可用工具,让中国团队在模型后训练与强化学习这一关键技术浪潮中,实现自主可控。
模型
强化学习
训练
01-04
刚刚,这家0产品0模型就估值854亿的公司,终于发布了首款产品!
微调大模型不再是少数人的专利!Thinking Machines Lab推出首款产品「Tinker」,一个专为语言模型微调而生的API。它让开发者能彻底摆脱底层架构的束缚,仅用简单的Python代码便可专注于算法与数据创新。
模型
微调
强化学习
2025-10-02
AI Agent迈向中央舞台:深度解析2025年进化新格局
AI Agent赛道还有哪些机会?
能力
强化学习
语言模型
科技
AI Agent
2025-05-26
一家高校实验室,走出12家明星AI初创公司!Pieter Abbeel:我的NB学生们
在人工智能和机器人领域享有盛誉的专家 Pieter Abbeel ,不仅研究成果在学术界产生了深远影响,他带出的学生在不同领域也取得了非凡成就。
研究
强化学习
伯克利分校
人工智能
科技
2025-03-15
DeepMind元老创业AI编程:亮相即获1.55亿美元,英伟达红杉抢着投,团队太豪华了!
要做「AI编程助手界的Waymo」
强化学习
超级智能
博士毕业
2025-03-08
阿里半夜开源全新推理模型,QwQ-32B比肩DeepSeek-R1满血版
参数量为 320 亿。
强化学习
阿里
科技
2025-03-06
是个车企都要蹭DeepSeek,属实有点幽默了
歪了,真歪了。
强化学习
智驾
汽车
2025-02-12
全球掀DeepSeek复现狂潮!硅谷巨头神话崩塌,30刀见证啊哈时刻
就在刚刚,网上已经出现了一波复现DeepSeek的狂潮。UC伯克利、港科大、HuggingFace等纷纷成功复现,只用强化学习,没有监督微调,30美元就能见证「啊哈时刻」!全球AI大模型,或许正在进入下一分水岭。
强化学习
自我反思
2025-01-27
强如Operator也怕验证码,1450元花得值吗?第一波实测来了
让Operator登录ChatGPT调用Operator会怎样?
Operator
强化学习
科技
2025-01-25
DeepSeek新模型大揭秘,为何它能震动全球AI圈
真正的理解来自于主动建构,而不是被动接受。
模型
训练
强化学习
2025-01-23
大学教授跳槽腾讯,用1年时间解决行业难题?
广阔天地,大有作为。
强化学习
团队
游戏行业
2024-03-27
DeepMind的新研究:人类最后的自留地失守了?
这或许是向AGI迈进的一大步。
智能体
强化学习
能力
2023-12-12
热门文章
1
游戏赚来的钱,米哈游投出3家IPO
2
沉迷拼豆的年轻人,让谁赚到了?
3
lululemon在中国真正的竞争者,出现了
4
卖9块9的AI文游,最近在小红书火爆了?
5
争夺太空,中国放大招了
6
不爱去教堂的年轻人,把宗教小组件推上美国总榜
7
沐曦天使投资人、和利资本孔令国:没有生态,再好的芯片也不过是昂贵的沙子
8
胖东来的第一批学徒,已经挂科了
9
带货1亿,李亚鹏真反转了吗?
10
2025年,中国汽车行业打脸报告
反馈
联系我们
视频号
小红书
抖音号
推荐订阅