Adding audio data when training robots helps them do a better job
닦아 평가.위: 다양한 테스트 시나리오.하단: 일반적인 실패 사례 및 작업 성공률.[시각 전용] 정책은 적절한 접촉을 유지하지 못하는 경우가 많습니다(예: 너무 세게 눌러 광범위하게 누르거나 떠다니는 경우).[MLP 융합] 정책은 도면을 완전히 지우지 못하고 조기 종료되는 경우가 많습니다.신용 거래:arXiv(2024).DOI: 10.48550/arxiv.2406.19464

스탠포드 대학과 도요타 연구소의 로봇공학자들로 구성된 팀은 로봇을 훈련할 때 시각적 데이터에 오디오 데이터를 추가하는 것이 학습 기술을 향상시키는 데 도움이 된다는 사실을 발견했습니다.팀은 자신의 게시물을 게시했습니다.연구arXiv사전 인쇄 서버.

연구원들은 AI 기반 로봇으로 수행되는 거의 모든 훈련에는 관련 오디오를 무시하면서 많은 양의 시각적 정보에 노출시키는 것이 포함되어 있다고 지적했습니다.그들은 로봇에 마이크를 추가하고 작업이 수행될 때 어떤 소리가 나야 하는지에 대한 데이터를 수집하도록 허용하면 작업을 더 잘 배우는 데 도움이 될 수 있는지 궁금해했습니다.

예를 들어,시리얼 상자를 열고 그릇에 시리얼을 채우는 방법을 배우도록 되어 있으므로, 상자가 열리는 소리와 시리얼이 그릇에 떨어지는 소리를 듣는 것이 도움이 될 수 있습니다.이를 알아보기 위해 팀은 4가지 로봇 학습 실험을 설계하고 수행했습니다.

첫 번째 실험은 주걱을 사용하여 프라이팬에서 베이글을 뒤집는 로봇을 가르치는 것이었습니다.두 번째는 지우개를 사용하여 화이트보드의 이미지를 지우는 방법을 로봇에게 가르치는 것이었습니다.세 번째는 컵에 담긴 주사위를 다른 컵에 붓는 것이었고, 네 번째는 사용 가능한 세 가지 샘플 중에서 올바른 크기의 테이프를 선택하고 이를 사용하여 플라스틱 스트립에 와이어를 테이프로 붙이는 것이었습니다.

쥐는 발톱이 장착된 동일한 로봇을 사용하여 관련된 모든 실험.모든 작업은 비디오만 사용하는 방법과 비디오와 오디오를 사용하는 두 가지 방법으로도 수행되었습니다.연구팀은 테이블 높이, 테이프 종류, 화이트보드 이미지 종류 등 교육 및 수행 요소도 다양하게 적용했다.

모든 실험을 마친 후, 연구진은 로봇이 작업을 얼마나 빠르고 쉽게 학습하고 수행할 수 있는지, 그리고 정확성을 판단하여 결과를 비교했습니다.그들은 오디오를 추가하면 일부 작업에서는 속도와 정확성이 크게 향상되지만 다른 작업에서는 그렇지 않다는 사실을 발견했습니다.

예를 들어, 주사위를 붓는 작업에 오디오를 추가하면 주사위가 있는지 알아내는 로봇의 능력이 극적으로 향상되었습니다.주사위또한 독특한 소리가 나기 때문에 로봇이 지우개에 적절한 양의 압력을 가하고 있는지 이해하는 데 도움이 되었습니다.반면에 소리를 추가하는 것은 베이글이 성공적으로 회전되었는지 또는 화이트보드에서 모든 이미지가 성공적으로 제거되었는지 확인하는 데 큰 도움이 되지 않았습니다.

팀은 자신들의 연구 결과에 오디오를 추가하는 것이 보여진다고 제안하며 결론을 내렸습니다.AI 로봇용 소재는 일부 응용 분야에서 더 나은 결과를 제공할 수 있습니다.

추가 정보:Zeyi Liu 외, ManiWAV: 야생 오디오-비주얼 데이터에서 로봇 조작 학습,arXiv(2024).DOI: 10.48550/arxiv.2406.19464

프로젝트 페이지:mani-wav.github.io/

저널 정보: arXiv

© 2024 사이언스 X 네트워크

소환:로봇을 훈련할 때 오디오 데이터를 추가하면 더 나은 작업을 수행하는 데 도움이 됩니다(2024년 7월 5일)2024년 7월 5일에 확인함https://techxplore.com/news/2024-07-adding-audio-robots-job.html에서

이 문서는 저작권의 보호를 받습니다.사적인 학습이나 조사를 목적으로 하는 공정한 거래를 제외하고는 어떠한 행위도 허용되지 않습니다.서면 허가 없이 일부를 복제할 수 있습니다.콘텐츠는 정보 제공 목적으로만 제공됩니다.