A task planning framework to support human-robot collaborative furniture assembly
實現協作家具組裝的完整流程示意圖。這項工作重點關注以紅色突出顯示的組件。信用:arXiv(2024)。DOI:10.48550/arxiv.2408.16125

確保機器人能夠在現實環境中與人類順利協作是其大規模部署的關鍵一步。雖然一些機器人系統已經每天與人類代理人互動,例如在部分自動化的工業和製造設施中,但在日常任務上的人機協作仍然很少。

帕多瓦大學和劍橋三菱電機研究實驗室 (MERL) 的研究人員開發了一個框架,有助於規劃涉及人機協作的任務。此框架介紹於預先發佈於arXiv伺服器,特別關注需要將複雜系統與各種底層組件(例如家具)進行協作組裝的任務。

研究人員將他們的框架稱為 DECAF,它代表基於離散事件的家具協作人機機器人組裝框架。DECAF 具有各種底層組件,包括離散事件馬可夫決策過程 (DE-MDP) 模型、組裝過程的 HTM 描述和貝葉斯幹擾模組。

朱利奧·賈科穆佐(Giulio Giacomuzzo)、馬泰奧·泰雷蘭(Matteo Terreran) 和他們的同事在他們的論文中寫道:「人類被描述為一個無法控制的智能體,這意味著該智能體不受預先設定的一系列行為的約束,而是根據自己的喜好行事。「與此同時,規劃器反應性地計算協作機器人的最佳動作,以在盡可能短的時間內高效地完成整個裝配任務。

利用新開發的框架,協作組裝過程跨越各個步驟。首先,機器人透過攝影機或其他感測器觀察人類代理執行的動作。

根據這些觀察結果,DECAF 模型為機器人規劃行動,以最大限度地提高機器人-人類團隊完成手頭組裝任務的效率,同時在發生不可預測的事件後調整這些行動。該團隊利用通常用於建立特定決策過程的數學框架(稱為 DE-MDP)對家具或其他物體的組裝進行建模。

Giacomuzzo、Terreran 和他們的同事寫道:“我們將問題形式化為 DE-MDP,這是一個綜合框架,將各種異步行為、人類想法的改變和故障恢復作為隨機事件結合起來。”

「雖然理論上可以透過建立所有可能動作的圖表來解決這個問題,但這種方法會受到計算限制的限制。所提出的公式提供了一種替代解決方案,利用強化學習來導出機器人的最佳策略。

本質上,DE-MDP 模型用於分解組裝任務並確定最佳動作,使機器人能夠與人類代理人協作有效地完成任務。DECAF 架構的第二個組成部分,即 HTM 模型,對各個子任務之間的相互依賴關係進行編碼,從而促進規劃過程。

最後,該團隊整合了一個基於稱為貝葉斯幹擾的統計方法的模組,該模組通常用於隨著更多資訊的可用性而不斷更新給定假設為真的機率。該模組允許框架監視人類代理的行為並使用它們來預測人類代理的意圖。

研究人員透過一系列測試評估了 DECAF,並在模擬和現實環境中運行。在真實實驗中,10 名成年參與者被要求與 7 自由度機器人操縱器(即 Franka Emika Panda 手臂)合作組裝一把從宜家購買的椅子。

該團隊進行的初步測試結果非常有希望。在模擬中,DECAF人們發現它優於標準規劃策略,而在現實世界的實驗中,它似乎提高了人機協作的效率和品質。

研究人員寫道:“未來,我們計劃納入執行時間之外的其他最佳指標,例如人體安全、動作相關性和人體工學。”

更多資訊:Giulio Giacomuzzo 等人,DECAF:基於離散事件的家具組裝協作人機機器人框架,arXiv(2024)。DOI:10.48550/arxiv.2408.16125

期刊資訊: arXiv

© 2024 Science X 網絡

引文:任務規劃架構支援人機協作家具組裝(2024 年 9 月 17 日)檢索日期:2024 年 9 月 17 日來自 https://techxplore.com/news/2024-09-task-framework- human-robot-collaborative.html

本文檔受版權保護。除了出於私人學習或研究目的的任何公平交易外,不得未經書面許可,不得複製部分內容。所提供的內容僅供參考。