搞事情的DriveGPT,谁有数据谁无敌

2023-04-19
到处都在说“iPhone时刻”,这次轮到自动驾驶。

ChatGPT被认为是AI的“iPhone时刻”,作为一种“平权”工具正在“进化”内容生产、工业设计等多个领域。

现在的问题是,如果和同样用AI驱动的自动驾驶技术结合,会产生什么样的化学反应?

实际上,事情已经发生了。

自动驾驶技术公司“毫末智行”,正在用驾驶场景数据训练与自动驾驶有关的大模型。

这家初创公司在4月11日的“HAOMO AI DAY”上,正式发布了业内首个自动驾驶生成式大模型DriveGPT,并将其命名为“雪湖·海若”。

官方说法是,DriveGPT“雪湖·海若”是大模型技术落地自动驾驶的新范式。

这引发了人们的广泛兴趣,或许将是一场变革的开端——比如加速把人类带入自动驾驶时代。

图片

DriveGPT“雪湖·海若”

自动驾驶的天才小帮手

和ChatGPT类似,DriveGPT“雪湖·海若”采用 Transformer 模型,训练自动驾驶的认知决策模型。

不同的一点在于,ChatGPT是通过自然语言进行训练,“雪湖·海若”则用驾驶场景数据推进模型训练。

类似之处是,DriveGPT“雪湖·海若”和ChatGPT均有持续自我学习、不断优化的能力,最终目的是实现“拟人化”驾驶。

这让其看上去像是自动驾驶技术的天才小帮手。

因为自动驾驶的一大难点在于无法预测潜在的“Corner case”(边缘场景)——比如高速路上突然掉落的轮胎、路边冲出的野猪等无法提前预测的情况。

这种“Corner case”具备随机属性,而以往的自动驾驶必须进行海量数据标注,即搞到尽可能多的实际路况,才能训练认知决策模型。

这是一个几乎不可能完成的任务——在类似于中国这样的基建狂魔国家,每时每刻道路都在发生变化。

但生成式大模型通过AIGC,能够为自动驾驶系统提供“合成数据”,提供任何人类能够想象到的驾驶场景,而且还不涉及用户隐私问题。

这让其收集数据的效率和成本,远超真实驾驶环境。

不能说大模型一定能够解决所有“Corner case”,但却能够有效应对这个痛点,模型算法的质量大幅提升。

某种程度上,这甚至重塑了汽车智能化技术路线。

图片

DriveGPT“雪湖·海若”

首次搭载车型是新摩卡DHT-PHEV


当AI突然能“理解”自动驾驶

毫末能在这个时间点推出DriveGPT“雪湖·海若”,显然不是简单“蹭热度”就能搞定的事情。

早在2021年,这家公司就开始研究Transformer大模型技术,现在显然受益于这种前瞻性判断。

毫末智行CEO顾维灏说,将把多个大模型的能力整合到DriveGPT。

DriveGPT有意思的一点在于,其通过引入人类驾驶数据建立RLHF(人类反馈强化学习)技术,对自动驾驶的认知和决策模型进行持续优化。

这些术语看上去晦涩难懂,但大意就是,用人类在实际驾驶中应对问题的思路去训练自动驾驶算法。

再通俗一些,就是用一个老司机的驾驶经验,去对自动驾驶算法进行调优。

毫末DriveGPT雪湖·海若的另一个看点,就是人们期待看到类似ChatGPT那样的“突现”能力——就像一个人练功十年,突然打通了任督二脉一样。

官方资料显示,其参数规模达到1200亿,预训练阶段引入4000万公里量产车驾驶数据。

这是一种堪称庞大的参数规模,也为大模型潜在的“突现”能力提供了可能性。

“突现”能力最让人着迷的是,其过程有点像机器人突然拥有了理解能力——实际上是大模型达到了一定规模后,突然出现的能够归纳上下文的能力。

这个过程会涌现大量“思维链”,让大模型拥有推理能力——这种推理能力能够帮助大模型自主学习,并获得正确结果。

事实上,ChatGPT也是通过不断迭代,完成了从量变到质变的“突现”,并让人类大吃一惊。

毫末的参数规模目前是1200亿,是不是达到了“突现”能力的阈值尚无定论,也没法准确预测,但多肯定要好于少。

而且不要忘了一点——之所以能够搞到这么多数据,最大原因在于,毫末差不多是自动驾驶技术公司中商业化最为成功的玩家之一。

手里有钱,才能走的更远

在自动驾驶技术公司普遍面临商业化难题的背景下,毫末智行却不发愁赚钱。

根据官方说法,毫末是中国量产自动驾驶第一名。

毫末智行董事长张凯表示,搭载行泊一体功能的智驾产品将迎来前装量产潮,而毫末已经推出中国首款可大规模量产落地、重感知城市NOH(城市领航辅助驾驶),并将首批落地北京、上海、保定等城市。

2024年,毫末准备把这种产品落地100个城市。

值得一提的是,毫末的客户不仅来自与其有渊源的长城汽车,据称已经有3家主机厂签署定点合同。

在主机厂客户之外,其他商业模式也实现了落地。

比如随着DriveGPT雪湖·海若的对外开放,相当于为一些自动驾驶研究机构提供了一个基础设施,也因此又增加了一个赚钱路径。

包括北京交通大学计算机与信息技术学院、高通、英特尔等在内,已经成为这个大模型的第一批客户。

技术变现的另一个案例则是DriveGPT雪湖·海若的场景识别服务——标注1张图片的市场价是5块,但DriveGPT雪湖·海若只收5毛。

这也为其他自动驾驶技术公司开辟了新的商业化路径——L4级或更高级别的自动驾驶目前看起来还无法立即实现,但解决当前痛点可以让自己手中始终有钱可花。

【我们关注大出行、投融资,以及自动驾驶、动力电池等,欢迎交流,可添加微信A10010A123】

本文(含图片)为合作媒体授权创业邦转载,不代表创业邦立场,转载请联系原作者。如有任何疑问,请联系editor@cyzone.cn。