松应科技张小波:为具身智能打造一个“虚拟训练场”

关注
具身智能为何比自动驾驶更难?

松应科技是物理 AI 仿真领域领军企业,自研国内首个全栈式 ORCA 物理 AI 仿真平台,深度适配沐曦等国产 GPU。面向具身智能、智能制造等,提供高精度仿真、万机并发训练、多模态数据合成解决方案,助力 AI 实现仿真到现实高效落地。以下来自松应科技联合创始人、科学事务负责人张小波在2026智算基础设施创新大会上的分享,由创业邦整理。

image.gif

具身智能为何比自动驾驶更难?

大家好,我是松应科技的张小波。今天很高兴在这里分享我们在物理AI仿真领域的一些实践和思考。

当前,AI已经广为人知,并且在写代码、写文档、辅助生成视频等虚拟世界任务中展现出巨大能力。但AI这个词其实很早就出现了,最近几年,AI正在逐步进入物理世界,并与物理世界进行真实交互。

从发展维度来看,AI所接触的数据维度与交互空间越来越丰富,数据量也在不断增长。这一变化催生了一个重要的载体——具身智能,也就是大家日常生活中看到的机器人。机器人并不是新鲜事物,但为什么最近几年热度这么高?因为过去的机器人主要依赖传统控制,任务泛化能力和操作能力都非常有限。而AI特别是大模型的出现,让人们看到了将机器人的操作技能向物理世界延伸的希望。在这一背景下,具身智能模型的演进非常迅速——从去年还很热门的VLA模型,到最近的WAM模型,变化极快。

具身智能走向物理世界,对数据、跨本体能力以及任务泛化性都提出了更高要求,这些也是当前亟需解决的问题。值得注意的是,具身智能的难度甚至超过了当年的自动驾驶。自动驾驶更侧重于感知与规避:汽车看到前方物体,判断是否需要左转、右转或停车。而机器人面对的是强交互环境——遇到前方的物体,你需要操作它,把它拿起来、移动到另一个地方。这种交互需求使得机器人所需的维度数据更高,不仅依赖视觉信息,还要融合深度信息、激光雷达、触觉传感器等多种物理感知信息。因此,具身智能所需的数据量级和维度,都比自动驾驶更高。

在这样的背景下,要训练具身智能模型并实现有效的模型交互,场景、机器人、算法三者缺一不可。基于这一理解,我们提供的正是一个虚拟训练场——在这里,我们可以为具身智能机器人提供高保真的环境模拟、精确的物理与动力学仿真,并在此基础上完成模型训练与验证。

国内首个实时多物理场仿真平台,已交付超500万条数据

下面简单介绍一下松应科技。公司成立数年来,一直对标英伟达的Omniverse,致力于打造物理AI仿真平台。我们构建了一套从多物理场仿真、高保真渲染到端到端具身智能数据合成的完整管线。在软件平台的功能架构上,我们涵盖了多物理场仿真、高保真渲染、数据合成以及开放套件。今年3月26日,我们在上海GDPS大会上发布了基于AI Agent的物理场环境构建和任务自动化能力。从去年到今年,我们已与多家国内芯片公司完成了平台性验证。

我们的核心模块和能力包括:集群感知(支持多传感器感知)、多物理场仿真、并行的机器人训练技术(支持无人机、人形机器人、机器狗等多种智能体),以及海量数据仿真合成。迄今为止,我们已向客户交付了超过500万条数据。

今年,我们还发布了国内首个实时多物理场仿真平台,支持刚体、流体等多种形态。这使得我们能够仿真以前许多开源平台无法处理的复杂场景,例如叠衣服、倒咖啡,以及汽车线缆装配等。通过实时多物理场仿真,这些场景都能得到支持。

我们还构建了国内工业数据平台,目前已支持汽车零部件、仓储、物流等大量工业场景的高保真资产,并提供精确的物理信息与物理配置。基于基础场景,可以衍生出不同行业的数据资产,实现预随机化,覆盖大量复杂行业场景。平台提供数据采集、模型训练以及最终的模型反向验证。我们平台的渲染画面涵盖了大量的不同交互场景。

在仿真平台中,我们可以提供20多个维度的合成数据。合成数据的轨迹不仅包含视觉信息,还包括深度、激光雷达、触觉传感器,同时提供机器人在运动过程中的轨迹数据和力学数据,以及对操作过程的任务信息标注。这些多维度数据能够为机器人训练提供更全面的相关信息。

从去年到今年,具身智能数据采集的新方法层出不穷。但需要强调的是,对具身智能而言,仅仅“看到”数据是不够的——它更需要亲临其境地感知与环境的交互,包括异构数据。打个比方:一个人看别人学车,看一两个月甚至更久,自己不上手,最终还是不会开。同理,机器人也需要一个环境,在其中真实地感知物理世界的交互,每一次运动、操作、任务动作,都能获得来自物理世界的反馈。因此,从去年到今年,强化学习以及VLA+RL等策略正在成为主流——让机器人在环境中不断交互,从交互过程中采集大量数据,再反馈修正模型。基于这一需求,我们的仿真平台可以构建大量符合高精度物理要求的数据。

目标发展20万用户,共建开放硬件生态

今年3月26日,我们在上海GTPS大会上联合国内主要机器人伙伴,面向开发者和用户发布了免费版本。用户可下载、安装、体验,平台预置了大量高精度资产。通过这个平台,用户可以了解智能机器人的数据采集方式、所需数据类型、模型训练过程以及模型验证方法。

当前,具身智能仿真面临一个现实问题:场景构建和任务仿真的流程对广大开发者来说挑战很大。为此,我们将平台上的场景、资产和能力封装成SGeAr能力,用户只需在开发平台中通过自然语言输入——例如描述你想做一个什么样的仿真、使用什么机器人——平台就能自动构建场景、加载资产和机器人,并通过预置任务让机器人在其中完成任务。相比以往通过重建、拖拽、拉拽来更改场景和加载机器人的方式,这大大降低了使用门槛。

今年发布这一平台后,我们预置了包括3D资产生成、物理配置自动化、任务与场景自动化以及机器人仿真训练框架等AI能力。用户可以在平台上完成常见机器人任务的模拟。我们希望,今年通过该平台发展超过20万用户。顺便预告一下,5月15日至16日,在杭州云栖小镇将举办一场具身智能仿真大赛,这也是由我们平台主办的,欢迎大家关注。

最后说一下我们的差异化。从去年到今年,我们与国内主要的芯片公司保持了合作,包括摩尔线程、沐曦等,还有几家正在进行兼容性认证,希望构建一个相对开放的硬件生态平台。在松应科技的官网首页也提供了用户注册、申请、下载和使用软件的入口,欢迎大家关注。谢谢!

反馈
联系我们
推荐订阅