20210609-04
当前位置: 首页 > 热点资讯 >

跨维智能:以“大小脑+感知”驱动多形态机器人商业化落地

来源: 盖世汽车   浏览量:8934次   
2025-03-20 17:42:33

跨维智能数字科技有限公司成立于2021年6月,是一家以Sim2Real为核心,研发高通用性具身智能技术的国家高新技术企业。公司凭借在3D生成式AI、多模态大模型及三维成像方面的长期技术积累,打造了软硬一体的产品矩阵,包含 DexVerse?具身智能引擎、基于3D Vision Language Action) 大模型的成像感知套件等产品,率先实现了具身智能核心技术的规模化商业落地。

2025年3月13日,在第三届具身智能机器人产业发展论坛上,跨维智能市场副总裁林嘉伟提到,要实现高通用具身智能的核心技术,关键在于突破基于多模态大模型的三维感知、任务决策与运动控制等方面的瓶颈,数据已成为行业内最为关键的瓶颈所在。

为了高效推进这一领域的发展,采用高质量合成数据作为具身智能大模型训练的“燃料”成为了一条切实可行的路径。跨维智能构建了一个高质量数据到模型的高效工具链,即Sim2Real具身智能引擎DexVerse?,将极大地促进这一进程。

跨维智能市场副总裁

以下为演讲内容整理:

具身智能的概念并不仅限于人形机器人领域,它指的是一种配备智慧大脑的物理智能实体。这一实体可以是工业机器人、协作机器人,甚至是自动驾驶等。当这些实体拥有了具身的大脑时,它们便能以更智能、更通用的方式执行具体任务,并能胜任更多样化的工作。我们将其视为具身智能的一种范式。

图源:演讲嘉宾素材

要实现高度通用的具身智能,除了大脑和小脑之外,感知系统同样至关重要。人类的行为并非高度精确的重复性操作,例如,当我拿起麦克风时,下次再放下时,位置偏差可能达到至少一厘米,人类的操作并非总是准确无误且可重复。

正因为拥有了高度发达的视觉系统,我们能够感知周围环境,明确自身、环境以及操作对象之间的相互关系,包括力觉和触觉等相关属性。基于这些信息,我们能够判断如何进行交互,并基于大脑做出智能决策和任务规划。

目前,具身智能在结构化、半结构化环境,以及在某些特定场景下的非结构化环境中,已取得了一定的进展。然而,要达到产品化和商业化的水平,还需要业界的共同努力。

去年业界对于数据的讨论相对较少,但今年已明显看行业家对数据重要性的广泛关注。我们始终倡导以合成数据为主导的方法来构建具身智能大模型的能力。通过这种方法,我们已经验证了其在商业上的可行性。

关于如何实现商业化落地,关键在于获取高质量的核心数据。在更为开放的环境中,我们所处的物理环境以及所操作的对象会存在诸多变化。如果采用真实机器数据,将需要采集大量数据。当面对新的场景和新的操作对象时,这种方法的成功率会显著下降。这正是我们坚持采用Sim2Real作为核心方法的原因。

同时,我们自主研发了一套Sim2Real的工具链,以实现持续学习。在模型训练过程中,借助传感器、视觉系统以及力觉反馈,我们能够将这些信息重新输入至我们的深度引擎中,用于模型的优化,从而不断提升模型对未知物体或特定任务的精准度。

目前,我们已自研了一款底层可控的具身智能引擎。鉴于我们在30多个行业中的商业应用需求,为了实现99.99%以上的高成功率,我们进行了底层可微仿真技术的研发,并基于科研成果,深入到底层进行细致工作。

我们会生成大量带有精确物理属性标注的核心数据,这些数据随后会自动进入模型开发与训练的流程,并最终部署到真实机器上。在此过程中,并不局限于特定的物体或环境,所有资产均可进行替换。

下图是我们基于自研底层引擎及整个科研团队技术所孵化出的三大产品系列,其中包括空间智能大脑,其核心在于大模型及现场应用软件,还包括传感器部分。在传感器领域,我们与多家机器人本体厂商展开了深入合作。

图源:演讲嘉宾素材

我们有一款传感器是应用于机器人上的仿人级别的纯视觉解决方案。此纯视觉系列已在多个领域得到广泛应用,包括卡车换电等,并成功突破了原有场景中的一些技术瓶颈。例如,传统的视觉方案在强光环境、透明物体以及高反光物体的成像上存在不足,这对于具身智能在实际应用中的精准操作而言,是一个极为关键的问题。若无法准确识别,则无法实现精确的操作。我们不应忽视这一具体操作过程,因为它涉及到与操作对象的直接接触。如果仅对场景和环境进行仿真,而忽略实际操作中的接触部分,那么最终将无法实现技术的落地应用。

基于对当前商业化落地具身智能趋势的观察,在智能制造领域,双臂机器人更有可能成为主流形态。这主要归因于企业对ROI及稳定性的高度重视。如果双臂协同技术能够在装备制造或柔性生产中发挥出色作用,那么其市场前景将极为广阔。

在一次演示中,我们为双臂机器人设定了一个任务,即拼接一个小鹿形状的积木。机器人通过与大语言模型的交互,询问如何编排任务流程。这是一个相对复杂的任务,大约包含十几到二十个步骤。通过仿真,我们首先对模型进行训练,并在训练过程中不断改变环境资产、对象资产以及机器人本体。

我们可以更换不同的系列进行训练,训练完成后,会得到模型的运行轨迹。SDK文件将被部署到实际场景中,包括我们的商业项目中。实际上,这些项目都遵循着相同的一套底层逻辑。

今年1月,我们发布了首款Sim2Real引擎定义的具身智能人形机器人DexForce W1。其底部配备了一个移动底盘。针对不同的任务,我们能够通过优化得到不同的最佳构型。在以往的实践中,当使用多种机械臂或机器人执行具体操作任务时,常因构型限制而难以达成目标。例如,尽管视觉系统已识别目标且大脑已发出指令,但可能因手臂过长而无法触及,或双臂处于极为不便的角度。而W1采用高度仿人结构,具备34个动力单元,可做到高度灵活与多场景通用,再搭配跨维纯视觉空间智能传感器,实时感知,精准控制。

图源:演讲嘉宾素材

我们当前的机器人本体构型支持毫米级精度操作,这在目前市面上属于罕见的设计原型。底部搭载的是移动底盘,因为我们主要聚焦于半结构化环境,如智能制造和商业服务领域。在这些场景中,采用轮式底盘相较于其他类型更为合适,能避免在当前阶段遇到过多阻碍。

跨维智能以100%的合成数据,结合空间与具身智能大脑和传感器,落地了汽车零配件、金属加工、工业物流、家电、光伏等三十多个行业。对于Sim2Real的真实性,我们已在多个场景中进行探索,如无人充电站、卡车换电服务以及按摩机器人等商业服务类应用,与合作伙伴共同迈向技术前沿。

声明:以上内容为本网站转自其它媒体,相关信息仅为传递更多企业信息之目的,不代表本网观点,亦不代表本网站赞同其观点或证实其内容的真实性。投资有风险,需谨慎。

  • 精彩推荐
  • 东北虎豹等极度濒危物种在吉林实现种群恢复性增长东北虎豹等极度濒危物种在吉林实现种
  • 全球最大锂资源一体化利用项目开工 ​全球最大锂资源一体化利用项目开工
  • 华新环保:网上定价发行中签率为0.0285734496%华新环保:网上定价发行中签率为0.
  • 治水“下半场”:不鼓励各地追求过高的优良水体比例治水“下半场”:不鼓励各地追求过高
  • 清华大学施汉昌:水中微量污染物与生物传感技术的发展清华大学施汉昌:水中微量污染物与生
  • 福州:河湖长治久清 海绵全域铺开福州:河湖长治久清 海绵全域铺开
  • 要闻推荐
  • 图片新闻
  • 友情链接