A new data augmentation algorithm that could facilitate the transfer of skills across robots
给定机器人图像,RoVi-Aug 使用最先进的扩散模型来增强数据并生成具有不同机器人和视点的合成图像。在增强数据集上训练的策略可以零射击或进一步微调部署在目标机器人上,从而表现出对相机姿势变化的鲁棒性。图片来源:陈等人。

近年来,机器人专家开发了一系列旨在解决各种现实世界任务的系统,从完成家务到运送包裹或在指定环境中寻找目标物体。

该领域的一个关键目标是开发算法,允许在具有不同身体和特征的机器人之间可靠地转移特定技能,这将有助于快速训练机器人执行新任务,扩大其能力。

加州大学伯克利分校的研究人员开发了 RoVi-Aug,这是一种新的计算框架,旨在增强机器人数据并促进不同机器人之间的技能转移。他们提出的方法概述于预先发布于arXiv并将在 2024 年机器人学习会议上发表(钴酸锂),利用最先进的生成模型来增强并为不同的机器人创建具有不同摄像机视图的合成视觉任务演示。

“现代机器学习系统,特别是生成模型的成功,展示了令人印象深刻的概括性,并激励机器人研究人员探索如何在机器人领域实现类似的概括性,”Lawrence Chen(博士候选人,AUTOLab、EECS & IEOR、BAIR、加州大学伯克利分校))和 Chenfeng Xu(博士生,Pallas 实验室和 MSC 实验室,EECS 和 ME,BAIR,加州大学伯克利分校)告诉 Tech Xplore。

“自今年年初以来,我们一直在研究跨观点和跨机器人泛化的问题。”

在进行之前的研究时,陈、徐和他们的同事发现了不同机器人之间的学习泛化所面临的一些挑战。具体来说,他们发现,当机器人数据集中包含的场景分布不均匀时,例如,特定机器人视觉效果和摄像机角度占主导地位,这使得它们在教授不同机器人相同技能方面效果较差。

有趣的是,研究人员发现许多现有的机器人训练数据集是不平衡的,包括一些最完善的数据集。例如,甚至 Open-X 实施例 (OXE)数据集“数据集中的这种偏差使得机器人政策

模型“为了缓解这个问题,2024 年 2 月,我们提出了一种测试时适应算法,

海市蜃楼,它使用“交叉绘画”将看不见的目标机器人转换为训练期间看到的源机器人,从而产生源机器人在测试时正在执行任务的错觉。”研究人员在之前的论文中介绍的 Mirage 算法被发现可以实现向看不见的目标机器人零次转移技能。

尽管如此,人们发现该模型存在各种局限性。

首先,为了顺利运行,Mirage 需要精确的机器人模型和相机矩阵。此外,该算法不支持机器人策略的微调,并且仅限于处理相机位姿变化较小的图像,因为在图像深度的重投影中容易出现错误。

“在我们最新的工作中,我们提出了一种名为 RoVi-Aug 的替代算法,”Chen 和 Xu 说。“该算法的目的是通过增强训练过程中策略的鲁棒性和泛化性来克服 Mirage 的局限性,重点处理不同的机器人视觉效果和相机姿势,而不是依赖于严格假设的测试时交叉绘制方法。已知的相机姿势和机器人 URDF(统一机器人描述格式)。”

RoVi-Aug 是研究人员推出的新型机器人数据增强框架,基于最先进的扩散模型。这些计算模型可以增强机器人轨迹的图像,生成从不同角度观看的不同机器人完成任务的合成图像。

A new data augmentation algorithm that could facilitate the transfer of skills across robots
RoVi-Aug 管道概述。给定输入机器人图像,我们首先使用微调的 SAM 模型将机器人分割出来,然后使用 ControlNet 将机器人转换为另一个机器人。将合成机器人粘贴回背景后,我们使用 ZeroNVS 生成新颖的视图。图片来源:陈等人。

研究人员使用他们的框架编译了一个包含各种合成机器人演示的数据集,然后在此数据集上训练了机器人策略。这反过来又允许将技能转移到以前没有接触过演示中包含的任务的新机器人,这被称为零样本学习。

值得注意的是,机器人策略还可以进行微调,以在给定任务中获得越来越好的性能。此外,与团队之前论文中介绍的 Mirage 模型相反,他们的新算法可以支持摄像机角度的剧烈变化。

“与 Mirage 等测试时适应方法不同,RoVi-Aug 在部署过程中不需要任何额外的处理,不依赖于提前了解摄像机角度,并且支持策略微调,”Chen 和 Xu 解释道。“它还超越了传统的多机器人、多任务数据集协同训练,积极鼓励模型学习跨数据集的全方位机器人和技能。”

RoVi-Aug 模型有两个不同的组件,即机器人增强 (Ro-Aug) 和视点增强 (Vi-Aug) 模块。第一个组件旨在合成具有不同机器人系统的演示数据,而第二个组件可以生成从不同角度观看的演示。

“Ro-Aug 有两个关键功能:用于分割机器人的微调 SAM 模型和用于用不同的机器人替换原始机器人的微调 ControlNet,”Chen 和 Xu 说。“同时,Vi-Aug 利用 ZeroNVS(一种最先进的新颖视图合成模型)来生成场景的新视角,使模型能够适应各种摄像机视角。”

作为研究的一部分,研究人员使用他们的模型生成增强的机器人数据集,然后测试该数据集在训练策略和在不同机器人之间转移技能的有效性。他们的初步发现凸显了 Rovi-Aug 的潜力,因为该算法被发现能够训练能够在不同机器人和相机设置之间很好地推广的策略。

“它的关键创新在于应用生成模型(例如图像到图像生成和新颖的视图合成)来应对跨实体机器人学习的挑战,”陈和徐解释道。

“虽然之前的工作已经使用生成增强来提高面对分散注意力的物体和背景时策略的稳健性,但 RoVi-Aug 首次展示了这种方法如何促进不同机器人之间的技能转移。”

Chen 和 Xu 最近的这项工作可以帮助机器人研究人员轻松扩展其系统的技能组合,从而为机器人的进步做出贡献。未来,其他团队可以使用它在不同机器人之间转移技能或开发更有效的通用机器人策略。

“例如,想象一个场景,研究人员花费了大量精力收集数据并训练 Franka 机器人执行任务的策略,但你只有 UR5 机器人,”Chen 和 Xu 说。

“RoVi-Aug 允许您重新利用 Franka 数据并在 UR5 机器人上部署策略,而无需额外培训。这特别有用,因为机器人策略通常对摄像机视角变化敏感,并且在不同机器人上设置相同的摄像机角度具有挑战性。RoVi-Aug 消除了对如此精确设置的需要。”

由于在现实世界中收集大量机器人演示可能非常昂贵且耗时,RoVi-Aug 可能是一种经济高效的替代方案,可以轻松编译可靠的机器人训练数据集。

虽然这些数据集中的图像是合成的(即由人工智能生成),但它们仍然可以证明对于生成可靠的机器人策略有用。研究人员目前正在与丰田研究实验室和其他研究所的同事合作,将他们的方法应用和扩展到其他机器人数据集。

“我们现在的目标是通过结合生成建模技术的最新发展,例如用视频生成代替图像生成,进一步完善 RoVi-Aug,”Chen 和 Xu 补充道。

“我们还计划将 RoVi-Aug 应用于现有数据集,例如 Open-X Examples (OXE) 数据集,我们对增强通才性能的潜力感到兴奋根据这些数据训练政策。扩展 RoVi-Aug 的功能可以显着提高这些策略在更广泛的机器人和任务中的灵活性和稳健性。”

更多信息:Lawrence Yunliang Chen 等人,RoVi-Aug:跨实体机器人学习的机器人和视角增强,arXiv(2024)。DOI:10.48550/arxiv.2409.03403

期刊信息: arXiv

© 2024 Science X 网络

引文:新的数据增强算法可以促进机器人之间的技能转移(2024 年,10 月 10 日)检索日期:2024 年 10 月 10 日来自 https://techxplore.com/news/2024-10-augmentation-algorithm-skills-robots.html

本文档受版权保护。除了出于私人学习或研究目的的任何公平交易外,不得未经书面许可,不得复制部分内容。所提供的内容仅供参考。