A new data augmentation algorithm that could facilitate the transfer of skills across robots
給定機器人影像,RoVi-Aug 使用最先進的擴散模型來增強數據並產生具有不同機器人和視點的合成影像。在增強資料集上訓練的策略可以零射擊或進一步微調部署在目標機器人上,從而表現出對相機姿勢變化的穩健性。圖片來源:陳等人。

近年來,機器人專家開發了一系列旨在解決各種現實世界任務的系統,從完成家務到運送包裹或在指定環境中尋找目標物。

該領域的一個關鍵目標是開發演算法,允許在具有不同身體和特徵的機器人之間可靠地轉移特定技能,這將有助於快速訓練機器人執行新任務,擴大其能力。

加州大學柏克萊分校的研究人員開發了 RoVi-Aug,這是一個新的計算框架,旨在增強機器人數據並促進不同機器人之間的技能轉移。他們提出的方法概述於預先發佈於arXiv並將在 2024 年機器人學習會議上發表(鈷酸鋰),利用最先進的生成模型來增強並為不同的機器人創建具有不同攝影機視圖的合成視覺任務演示。

「現代機器學習系統,特別是生成模型的成功,展示了令人印象深刻的概括性,並激勵機器人研究人員探索如何在機器人領域實現類似的概括性,」Lawrence Chen(博士候選人,AUTOLab、EECS & IEOR、BAIR、加州大學柏克萊分校) )和 Chenfeng Xu(博士生,Pallas 實驗室和 MSC 實驗室,EECS 和 ME,BAIR,加州大學柏克萊分校)告訴 Tech Xplore。

“自今年年初以來,我們一直在研究跨觀點和跨機器人泛化的問題。”

在進行先前的研究時,陳、徐和他們的同事發現了不同機器人之間的學習泛化所面臨的一些挑戰。具體來說,他們發現,當機器人資料集中包含的場景分佈不均勻時,例如,特定機器人視覺效果和攝影機角度占主導地位,這使得它們在教導不同機器人相同技能方面效果較差。

有趣的是,研究人員發現許多現有的機器人訓練資料集是不平衡的,包括一些最完善的資料集。例如,甚至 Open-X 實施例 (OXE)數據集「數據集中的這種偏差使得機器人政策

模型「為了緩解這個問題,2024 年 2 月,我們提出了一種測試時適應演算法,

海市蜃樓,它使用“交叉繪畫”將看不見的目標機器人轉換為訓練期間看到的源機器人,從而產生源機器人在測試時正在執行任務的錯覺。研究人員在先前的論文中介紹的 Mirage 演算法被發現可以實現向看不見的目標機器人零次轉移技能。

儘管如此,人們發現該模型有各種限制。

首先,為了順利運行,Mirage 需要精確的機器人模型和相機矩陣。此外,此演算法不支援機器人策略的微調,並且僅限於處理相機位姿變化較小的影像,因為在影像深度的重投影中容易出現錯誤。

「在我們最新的工作中,我們提出了一種名為 RoVi-Aug 的替代演算法,」Chen 和 Xu 說。「這個演算法的目的是透過增強訓練過程中策略的穩健性和泛化性來克服Mirage 的局限性,重點是處理不同的機器人視覺效果和相機姿勢,而不是依賴於嚴格假設的測試時交叉繪製方法。

RoVi-Aug 是研究人員推出的新型機器人資料增強框架,基於最先進的擴散模型。這些計算模型可以增強機器人軌跡的影像,產生從不同角度觀看的不同機器人完成任務的合成影像。

A new data augmentation algorithm that could facilitate the transfer of skills across robots
RoVi-Aug 管道概述。給定輸入機器人影像,我們首先使用微調的 SAM 模型將機器人分割出來,然後使用 ControlNet 將機器人轉換為另一個機器人。將合成機器人貼回背景後,我們使用 ZeroNVS 產生新穎的視圖。圖片來源:陳等人。

研究人員使用他們的框架編譯了一個包含各種合成機器人演示的資料集,然後在此資料集上訓練了機器人策略。這反過來又允許將技能轉移到以前沒有接觸過演示中包含的任務的新機器人,這被稱為零樣本學習。

值得注意的是,機器人策略還可以進行微調,以在給定任務中獲得越來越好的性能。此外,與團隊先前論文中介紹的 Mirage 模型相反,他們的新演算法可以支援攝影機角度的劇烈變化。

「與 Mirage 等測試時適應方法不同,RoVi-Aug 在部署過程中不需要任何額外的處理,不依賴提前了解攝影機角度,並且支援策略微調,」Chen 和 Xu 解釋道。“它還超越了傳統的多機器人、多任務數據集協同訓練,積極鼓勵模型學習跨數據集的全方位機器人和技能。”

RoVi-Aug 模型有兩個不同的組件,即機器人增強 (Ro-Aug) 和視點增強 (Vi-Aug) 模組。第一個組件旨在合成具有不同機器人系統的演示數據,而第二個組件可以產生從不同角度觀看的演示。

「Ro-Aug 有兩個關鍵功能:用於分割機器人的微調 SAM 模型和用於用不同的機器人替換原始機器人的微調 ControlNet,」Chen 和 Xu 說。“同時,Vi-Aug 利用 ZeroNVS(一種最先進的新穎視圖合成模型)來生成場景的新視角,使模型能夠適應各種攝影機視角。”

作為研究的一部分,研究人員使用他們的模型產生增強的機器人資料集,然後測試該資料集在訓練策略和在不同機器人之間轉移技能的有效性。他們的初步發現凸顯了 Rovi-Aug 的潛力,因為演算法被發現能夠訓練能夠在不同機器人和相機設定之間很好地推廣的策略。

「它的關鍵創新在於應用生成模型(例如圖像到圖像生成和新穎的視圖合成)來應對跨實體機器人學習的挑戰,」陳和徐解釋道。

「雖然先前的工作已經使用生成增強來提高面對分散注意力的物體和背景時策略的穩健性,但 RoVi-Aug 首次展示了這種方法如何促進不同機器人之間的技能轉移。”

Chen 和 Xu 最近的工作可以幫助機器人研究人員輕鬆擴展其係統的技能組合,從而為機器人的進步做出貢獻。未來,其他團隊可以使用它在不同機器人之間轉移技能或開發更有效的通用機器人策略。

「例如,想像一個場景,研究人員花費了大量精力收集資料並訓練 Franka 機器人執行任務的策略,但你只有 UR5 機器人,」Chen 和 Xu 說。

「RoVi-Aug 讓您可以重新利用Franka 數據並在UR5 機器人上部署策略,而無需額外培訓。這特別有用,因為機器人策略通常對攝影機視角變化敏感,並且在不同機器人上設置相同的攝影機角度具有挑戰性。

由於在現實世界中收集大量機器人演示可能非常昂貴且耗時,RoVi-Aug 可能是一種經濟高效的替代方案,可以輕鬆編譯可靠的機器人訓練資料集。

雖然這些資料集中的影像是合成的(即由人工智慧生成),但它們仍然可以證明對於產生可靠的機器人策略有用。研究人員目前正在與豐田研究實驗室和其他研究所的同事合作,將他們的方法應用和擴展到其他機器人資料集。

「我們現在的目標是透過結合生成建模技術的最新發展,例如用視訊生成代替圖像生成,進一步完善 RoVi-Aug,」Chen 和 Xu 補充道。

「我們還計劃將 RoVi-Aug 應用於現有資料集,例如 Open-X Examples (OXE) 資料集,我們對增強通才效能的潛力感到興奮根據這些資料訓練政策。擴展 RoVi-Aug 的功能可以顯著提高這些策略在更廣泛的機器人和任務中的靈活性和穩健性。

更多資訊:Lawrence Yunliang Chen 等人,RoVi-Aug:跨實體機器人學習的機器人和視角增強,arXiv(2024)。DOI:10.48550/arxiv.2409.03403

期刊資訊: arXiv

© 2024 Science X 網絡

引文:新的資料增強演算法可以促進機器人之間的技能轉移(2024 年,10 月 10 日)檢索日期:2024 年 10 月 10 日來自 https://techxplore.com/news/2024-10-augmentation-algorithm-skills-robots.html

本文檔受版權保護。除了出於私人學習或研究目的的任何公平交易外,不得未經書面許可,不得複製部分內容。所提供的內容僅供參考。