A new data augmentation algorithm that could facilitate the transfer of skills across robots
로봇 이미지가 주어지면 RoVi-Aug는 최첨단 확산 모델을 사용하여 데이터를 늘리고 다양한 로봇과 시점으로 합성 이미지를 생성합니다.증강된 데이터 세트에 대해 훈련된 정책은 대상 로봇에 제로 샷으로 배포되거나 추가로 미세 조정되어 카메라 포즈 변경에 대한 견고성을 나타낼 수 있습니다.신용: Chen et al.

최근 몇 년 동안 로봇 공학자들은 집안일 완료부터 패키지 배달 또는 묘사된 환경에서 대상 물체 찾기에 이르기까지 다양한 실제 작업을 처리하도록 설계된 광범위한 시스템을 개발했습니다.

이 분야의 주요 목표는 다양한 신체와 특성을 가진 로봇 간에 특정 기술을 안정적으로 전달할 수 있는 알고리즘을 개발하는 것이었습니다. 이를 통해 로봇을 새로운 작업에 대해 신속하게 훈련시키고 기능을 확장하는 데 도움이 됩니다.

UC Berkeley 연구원들은 로봇 데이터를 강화하고 다양한 로봇 간의 기술 이전을 촉진하도록 설계된 새로운 계산 프레임워크인 RoVi-Aug를 개발했습니다.그들이 제안한 접근 방식은종이에 사전 게시됨arXiv2024년 로봇 학습 컨퍼런스에서 발표될 예정입니다(CoRL), 최첨단 생성 모델을 활용하여그리고 개별 로봇에 ​​대한 다양한 카메라 뷰를 사용하여 합성된 시각적 작업 데모를 만듭니다.

"현대 기계 학습 시스템, 특히 생성 모델의 성공은 인상적인 일반화 가능성을 보여주며, 로봇 공학에서 유사한 일반화 가능성을 달성하는 방법을 탐구하려는 로봇 공학 연구자들의 동기를 보여줍니다."라고 Lawrence Chen(Ph.D. Candidate, AUTOLab, EECS & IEOR, BAIR, UC Berkeley) 및 Chenfeng Xu(박사 후보, Pallas Lab & MSC Lab, EECS & ME, BAIR, UC Berkeley)가 Tech Xplore에 말했습니다.

"우리는 올해 초부터 교차 관점과 교차 로봇 일반화 문제를 조사해 왔습니다."

이전 연구를 수행하면서 Chen, Xu 및 동료들은 다양한 로봇에 대한 학습 일반화에 대한 몇 가지 과제를 확인했습니다.구체적으로 그들은 로봇 공학 데이터 세트에 포함된 장면이 고르지 않게 분포되어 있는 경우(예: 특정 로봇 시각 및 카메라 각도가 다른 장면보다 우세함), 이는 다른 로봇에게 동일한 기술을 가르치는 데 덜 효과적이라는 것을 발견했습니다.

흥미롭게도 연구원들은 가장 잘 확립된 일부 데이터 세트를 포함하여 기존의 많은 로봇 훈련 데이터 세트가 불균형하다는 사실을 발견했습니다.예를 들어, Open-X Implementh(OXE)도 마찬가지입니다.데이터 세트"데이터 세트의 이러한 편견은 로봇 정책을 만듭니다.

모델"이 문제를 완화하기 위해 2024년 2월에 테스트 시간 적응 알고리즘을 제안했습니다.

신기루, 이는 보이지 않는 대상 로봇을 훈련 중에 보이는 소스 로봇으로 변환하기 위해 '크로스 페인팅'을 사용하여 소스 로봇이 테스트 시간에 작업을 수행하고 있다는 착각을 불러일으키는 것입니다."연구진이 이전 논문에서 소개한 알고리즘인 Mirage는 보이지 않는 대상 로봇에 제로샷 기술 전달을 달성하는 것으로 밝혀졌습니다.

그럼에도 불구하고 이 모델에는 다양한 한계가 있는 것으로 나타났습니다.

첫째, Mirage가 제대로 작동하려면 정밀한 로봇 모델과 카메라 매트릭스가 필요합니다.또한, 알고리즘은 로봇 정책의 미세 조정을 지원하지 않으며, 이미지 깊이 재투영 시 오류가 발생하기 쉽기 때문에 카메라 자세의 변화가 거의 없는 이미지 처리에만 국한됩니다.

Chen과 Xu는 "최근 연구에서 RoVi-Aug라는 대체 알고리즘을 제시했습니다."라고 말했습니다."이 알고리즘의 목적은 엄격한 가정을 통해 테스트 시간 크로스 페인팅 접근 방식에 의존하기보다는 훈련 중 정책의 견고성과 일반화 가능성을 강화하고 다양한 로봇 시각 및 카메라 포즈를 처리하는 데 중점을 두어 Mirage의 한계를 극복하는 것입니다.알려진 카메라 포즈와 로봇 URDF(통합 로봇 설명 형식)입니다."

연구진이 도입한 새로운 로봇 데이터 증강 프레임워크인 RoVi-Aug는 최첨단 확산 모델을 기반으로 합니다.이는 로봇의 궤적 이미지를 확대하여 다양한 관점에서 본 다양한 로봇이 작업을 완료하는 모습을 보여주는 합성 이미지를 생성할 수 있는 계산 모델입니다.

A new data augmentation algorithm that could facilitate the transfer of skills across robots
RoVi-Aug 파이프라인 개요입력 로봇 이미지가 주어지면 먼저 미세 조정된 SAM 모델을 사용하여 로봇을 분할한 다음 ControlNet을 사용하여 로봇을 다른 로봇으로 변환합니다.합성 로봇을 다시 배경에 붙여넣은 후 ZeroNVS를 사용하여 새로운 뷰를 생성합니다.신용: Chen et al.

연구원들은 프레임워크를 사용하여 광범위한 합성 로봇 시연이 포함된 데이터 세트를 컴파일한 다음 이 데이터 세트에 대한 로봇 정책을 교육했습니다.이를 통해 이전에 데모에 포함된 작업에 노출되지 않은 새로운 로봇에 기술을 이전할 수 있으며, 이를 제로샷 학습이라고 합니다.

특히 로봇 정책은 특정 작업에서 점점 더 나은 성능을 달성하기 위해 미세 조정될 수도 있습니다.또한 팀의 이전 논문에서 소개된 Mirage 모델과 달리 새로운 알고리즘은 카메라 각도의 급격한 변화를 지원할 수 있습니다.

Chen과 Xu는 "Mirage와 같은 테스트 시간 적응 방법과 달리 RoVi-Aug는 배포 중에 추가 처리가 필요하지 않고 카메라 각도를 미리 아는 데 의존하지 않으며 정책 미세 조정을 지원합니다"라고 설명했습니다."또한 모델이 데이터 세트 전반에 걸쳐 모든 범위의 로봇과 기술을 학습하도록 적극적으로 장려함으로써 다중 로봇, 다중 작업 데이터 세트에 대한 전통적인 공동 훈련을 뛰어넘습니다."

RoVi-Aug 모델에는 로봇 증강(Ro-Aug) 모듈과 시점 증강(Vi-Aug) 모듈이라는 두 가지 개별 구성 요소가 있습니다.이러한 구성 요소 중 첫 번째는 다양한 로봇 시스템을 특징으로 하는 데모 데이터를 합성하도록 설계되었으며, 두 번째 구성 요소는 다양한 각도에서 본 데모를 생성할 수 있습니다.

"Ro-Aug에는 로봇을 분할하기 위한 미세 조정된 SAM 모델과 원래 로봇을 다른 로봇으로 교체하기 위한 미세 조정된 ControlNet이라는 두 가지 주요 기능이 있습니다"라고 Chen과 Xu는 말했습니다."한편 Vi-Aug는 최첨단의 새로운 뷰 합성 모델인 ZeroNVS를 활용하여 장면에 대한 새로운 관점을 생성하고 모델을 다양한 카메라 시점에 적용할 수 있도록 합니다."

연구의 일환으로 연구원들은 모델을 사용하여 증강 로봇 데이터 세트를 생성한 다음 교육 정책 및 다양한 로봇 간의 기술 이전에 대한 이 데이터 세트의 효율성을 테스트했습니다.그들의 초기 연구 결과는 Rovi-Aug의 잠재력을 강조합니다. 알고리즘이 다양한 로봇과 카메라 설정에 걸쳐 일반화되는 정책 훈련을 가능하게 한다는 것이 밝혀졌기 때문입니다.

Chen과 Xu는 "핵심 혁신은 이미지 간 생성 및 새로운 뷰 합성과 같은 생성 모델을 교차 구현 로봇 학습 과제에 적용하는 데 있습니다."라고 설명했습니다.

"이전 연구에서는 산만한 물체와 배경에 직면하여 정책 견고성을 개선하기 위해 생성적 증강을 사용했지만 RoVi-Aug는 이 접근 방식이 어떻게 서로 다른 로봇 간의 기술 이전을 촉진할 수 있는지 보여주는 최초의 사례입니다."

Chen과 Xu의 최근 연구는 로봇 공학 연구자들이 시스템 기술 세트를 쉽게 확장할 수 있도록 도움으로써 로봇의 발전에 기여할 수 있습니다.앞으로는 다른 팀에서 다른 로봇 간에 기술을 이전하거나 보다 효과적인 범용 로봇 정책을 개발하는 데 사용할 수 있습니다.

Chen과 Xu는 "예를 들어 연구원이 작업을 수행하기 위해 데이터를 수집하고 Franka 로봇에 대한 정책을 교육하는 데 상당한 노력을 기울였으나 UR5 로봇만 있는 시나리오를 상상해 보십시오."라고 말했습니다.

"RoVi-Aug를 사용하면 Franka 데이터의 용도를 변경하고 추가 교육 없이 UR5 로봇에 정책을 배포할 수 있습니다. 이는 로봇 정책이 카메라 시점 변경에 민감한 경우가 많고 여러 로봇에 걸쳐 동일한 카메라 각도를 설정하는 것이 어렵기 때문에 특히 유용합니다.RoVi-Aug를 사용하면 이렇게 정밀한 설정이 필요하지 않습니다."

현실 세계에서 대량의 로봇 데모를 수집하는 것은 매우 비용과 시간이 많이 소요될 수 있으므로 RoVi-Aug는 신뢰할 수 있는 로봇 교육 데이터 세트를 쉽게 컴파일할 수 있는 비용 효율적인 대안이 될 수 있습니다.

이러한 데이터 세트의 이미지는 합성(예: AI에 의해 생성)되지만 신뢰할 수 있는 로봇 정책을 생성하는 데 여전히 유용할 수 있습니다.연구원들은 현재 Toyota Research Labs 및 기타 연구소의 동료들과 협력하여 다른 로봇 데이터 세트에 접근 방식을 적용하고 확장하고 있습니다.

Chen과 Xu는 "우리는 이제 이미지 생성 대신 비디오 생성과 같은 생성 모델링 기술의 최근 개발을 통합하여 RoVi-Aug를 더욱 개선하는 것을 목표로 하고 있습니다."라고 덧붙였습니다.

"우리는 또한 OXE(Open-X Implementing) 데이터세트와 같은 기존 데이터세트에 RoVi-Aug를 적용할 계획이며, Generalist의 성능을 향상시킬 수 있는 잠재력에 기대하고 있습니다.이 데이터에 대해 훈련된 정책.RoVi-Aug의 기능을 확장하면 더 넓은 범위의 로봇과 작업에 걸쳐 이러한 정책의 유연성과 견고성이 크게 향상될 수 있습니다."

추가 정보:Lawrence Yunliang Chen 외, RoVi-Aug: 교차 구현 로봇 학습을 위한 로봇 및 관점 확대,arXiv(2024).DOI: 10.48550/arxiv.2409.03403

저널 정보: arXiv

© 2024 사이언스 X 네트워크

소환:새로운 데이터 증강 알고리즘은 로봇 간 기술 이전을 촉진할 수 있습니다(2024년 10월 10일)2024년 10월 10일에 확인함https://techxplore.com/news/2024-10-augmentation-algorithm-skills-robots.html에서

이 문서는 저작권의 보호를 받습니다.사적인 학습이나 조사를 목적으로 하는 공정한 거래를 제외하고는 어떠한 행위도 허용되지 않습니다.서면 허가 없이 일부를 복제할 수 있습니다.콘텐츠는 정보 제공 목적으로만 제공됩니다.