(相关资料图)
RT-2 发布,机器人执行任务的准确性提高,有望推动产业进展。近期,Google 以PaLI-X 和PaLM-E 为支柱推出了全新的机器人应用模型RT-2,该模型具有几大创新点:1)将动作(action)模态加入到模型中,与语言、视觉一样具有通用的数据;2)泛化性能较之前的RT-1 等模型提高了3 倍以上;3)在非可见场景中执行任务的准确率从RT-1 的32%提升到了62%;4)将机器人控制与思维链推理结合,具有学习长期规划和低级技能的能力。
RT-2 不仅是对现有VLM 模型简单而有效的修改,也展示了构建通用物理机器人的前景。
RT-2 是新颖的视觉-语言-动作(VLA)模型,核心增量是动作(action)。
要控制机器人,就必须训练它输出动作,RT-2 相比RT-1 新增了动作(action)模态,是一种新颖的视觉-语言-动作(VLA)模型,该模型在输出中将操作表示为token(类似于语言token)来解决动作模态问题,并将动作描述为自然语言标记生成器可处理的字符串,机器人执行将会更加准确和简单,该模型突破了机器人执行层面硬件驱动的AI 化。RT-2 还表现出了强涌现能力,有惊人的理解能力和泛化能力,与思想导链结合时还可以执行多阶段语义推理。
执行器驱动是运动控制核心,重点关注驱动芯片和驱动器本体。RT-2 应用模型相当于机器人的“大脑”,电机等硬件设施相当于机器人的“肌肉”,驱动器和控制器相当于机器人的“小脑”和“神经中枢”,RT-2 将机器人动作执行位置计算的非常精准,执行器驱动是运动控制的核心,重点在人形机器人驱动器,决定驱动器性能核心的是驱控芯片,随着机器人应用模型的迭代加速,有望为驱动芯片和驱动器企业打开广阔市场空间。
投资建议:VLA 应用模型的出现,有望全面推动机器人全产业链进展,建议关注以下细分赛道:1)执行器:三花智控、拓普集团、鸣志电器、绿的谐波、双环传动、金力永磁、鼎智科技、步科股份、五洲新春;2)传感器:
柯力传感、汉威科技、奥比中光;3)驱动控制:峰岹科技、麦格米特、拓邦股份、英威腾;4)本体:博实股份、优必选(港股)。
风险提示:制造业扩产不及预期的风险,行业竞争格局加剧的风险,机器人应用模型开发不及预期的风险。