#强化学习# - 标签聚合 - 创业邦

# 强化学习 #

文章11阅读13.3K关注0

关注

刚刚，这家0产品0模型就估值854亿的公司，终于发布了首款产品！

微调大模型不再是少数人的专利！Thinking Machines Lab推出首款产品「Tinker」，一个专为语言模型微调而生的API。它让开发者能彻底摆脱底层架构的束缚，仅用简单的Python代码便可专注于算法与数据创新。

模型微调强化学习

10-02

AI Agent迈向中央舞台：深度解析2025年进化新格局

AI Agent赛道还有哪些机会？

能力强化学习语言模型科技 AI Agent

05-26

一家高校实验室，走出12家明星AI初创公司！Pieter Abbeel：我的NB学生们

在人工智能和机器人领域享有盛誉的专家 Pieter Abbeel ，不仅研究成果在学术界产生了深远影响，他带出的学生在不同领域也取得了非凡成就。

研究强化学习伯克利分校人工智能科技

03-15

DeepMind元老创业AI编程：亮相即获1.55亿美元，英伟达红杉抢着投，团队太豪华了！

要做「AI编程助手界的Waymo」

强化学习超级智能博士毕业

03-08

阿里半夜开源全新推理模型，QwQ-32B比肩DeepSeek-R1满血版

参数量为 320 亿。

强化学习阿里科技

03-06

是个车企都要蹭DeepSeek，属实有点幽默了

歪了，真歪了。

强化学习智驾汽车

02-12

全球掀DeepSeek复现狂潮！硅谷巨头神话崩塌，30刀见证啊哈时刻

就在刚刚，网上已经出现了一波复现DeepSeek的狂潮。UC伯克利、港科大、HuggingFace等纷纷成功复现，只用强化学习，没有监督微调，30美元就能见证「啊哈时刻」！全球AI大模型，或许正在进入下一分水岭。

强化学习自我反思

01-27

强如Operator也怕验证码，1450元花得值吗？第一波实测来了

让Operator登录ChatGPT调用Operator会怎样？

Operator 强化学习科技

01-25

DeepSeek新模型大揭秘，为何它能震动全球AI圈

真正的理解来自于主动建构，而不是被动接受。

模型训练强化学习

01-23

大学教授跳槽腾讯，用1年时间解决行业难题？

广阔天地，大有作为。

强化学习团队游戏行业

2024-03-27

DeepMind的新研究：人类最后的自留地失守了？

这或许是向AGI迈进的一大步。

智能体强化学习能力

2023-12-12

关于我们

订阅服务

特别推荐

法律相关

Copyright 2007-2023 cyzone.cn All rights reserved 京ICP证070362号京ICP备08103950-1号京ICP备08103950-9号京ICP备08103950-10号新出发京零字第朝140005号

爱奇清科（北京）信息科技有限公司地址：北京市朝阳区丽泽西街东湖国际中心A座7层 | 网络文化经营许可证（京网文[2018]2153-213号）

违法和不良信息举报电话：010-53391121 举报邮箱：db@cyzone.cn

京公网安备 11010502035114号

营业执照出版物经营许可证

反馈

联系我们

推荐订阅