A new data augmentation algorithm that could facilitate the transfer of skills across robots
रोबोट छवियों को देखते हुए, RoVi-Aug डेटा को बढ़ाने और विभिन्न रोबोटों और दृष्टिकोणों के साथ सिंथेटिक छवियां उत्पन्न करने के लिए अत्याधुनिक प्रसार मॉडल का उपयोग करता है।संवर्धित डेटासेट पर प्रशिक्षित नीति को लक्ष्य रोबोटों पर शून्य-शॉट या आगे परिष्कृत किया जा सकता है, जो कैमरा पोज़ परिवर्तनों में मजबूती प्रदर्शित करता है।श्रेय: चेन एट अल.

हाल के वर्षों में, रोबोटिस्टों ने विभिन्न वास्तविक दुनिया के कार्यों से निपटने के लिए डिज़ाइन की गई प्रणालियों की एक विस्तृत श्रृंखला विकसित की है, जिसमें घरेलू काम पूरा करने से लेकर पैकेज वितरित करना या चित्रित वातावरण में लक्षित वस्तुओं को ढूंढना शामिल है।

क्षेत्र में एक मुख्य उद्देश्य एल्गोरिदम विकसित करना है जो विभिन्न निकायों और विशेषताओं वाले रोबोटों में विशिष्ट कौशल के विश्वसनीय हस्तांतरण की अनुमति देता है, जो रोबोटों को उनकी क्षमताओं को व्यापक बनाने, नए कार्यों पर तेजी से प्रशिक्षित करने में मदद करेगा।

यूसी बर्कले के शोधकर्ताओं ने RoVi-Aug विकसित किया है, जो रोबोटिक डेटा को बढ़ाने और विभिन्न रोबोटों में कौशल के हस्तांतरण की सुविधा के लिए डिज़ाइन किया गया एक नया कम्प्यूटेशनल ढांचा है।उनका प्रस्तावित दृष्टिकोण, ए में उल्लिखित हैकागज़पर पूर्व प्रकाशितarXivऔर रोबोट लर्निंग पर 2024 सम्मेलन में प्रस्तुत किया जाएगा (सीओआरएल), संवर्द्धन के लिए अत्याधुनिक जेनरेटिव मॉडल का उपयोग करता हैऔर अलग-अलग रोबोटों के लिए अलग-अलग कैमरा दृश्यों के साथ संश्लेषित दृश्य कार्य प्रदर्शन बनाएं।

लॉरेंस चेन (पीएचडी कैंडिडेट, ऑटोलैब, ईईसीएस और आईईओआर, बीएआईआर, यूसी बर्कले) "आधुनिक मशीन लर्निंग सिस्टम, विशेष रूप से जेनरेटिव मॉडल की सफलता, प्रभावशाली सामान्यीकरण को प्रदर्शित करती है और रोबोटिक्स शोधकर्ताओं को यह पता लगाने के लिए प्रेरित करती है कि रोबोटिक्स में समान सामान्यीकरण कैसे प्राप्त किया जाए।") और चेनफेंग जू (पीएचडी कैंडिडेट, पलास लैब और एमएससी लैब, ईईसीएस और एमई, बीएआईआर, यूसी बर्कले) ने टेक एक्सप्लोर को बताया।

"हम इस वर्ष की शुरुआत से क्रॉस-व्यूप्वाइंट और क्रॉस-रोबोट सामान्यीकरण की समस्या की जांच कर रहे हैं।"

अपने पिछले शोध का संचालन करते समय, चेन, जू और उनके सहयोगियों ने विभिन्न रोबोटों में सीखने के सामान्यीकरण के लिए कुछ चुनौतियों की पहचान की।विशेष रूप से, उन्होंने पाया कि जब रोबोटिक्स डेटासेट में शामिल दृश्य असमान रूप से वितरित होते हैं, उदाहरण के लिए, दूसरों पर विशिष्ट रोबोट दृश्यों और कैमरा कोणों की प्रबलता होती है, तो यह उन्हें विभिन्न रोबोटों को समान कौशल सिखाने के लिए कम प्रभावी बनाता है।

दिलचस्प बात यह है कि शोधकर्ताओं ने पाया कि कई मौजूदा रोबोट प्रशिक्षण डेटासेट असंतुलित हैं, जिनमें कुछ सबसे अच्छी तरह से स्थापित भी शामिल हैं।उदाहरण के लिए, यहां तक ​​कि ओपन-एक्स अवतार (OXE)डाटासेट"डेटासेट में ऐसे पूर्वाग्रह रोबोट नीति बनाते हैं

नमूना"इस समस्या को कम करने के लिए, फरवरी 2024 में, हमने एक परीक्षण-समय अनुकूलन एल्गोरिदम प्रस्तावित किया,

मृगतृष्णा, जो एक अदृश्य लक्ष्य रोबोट को प्रशिक्षण के दौरान देखे गए स्रोत रोबोट में बदलने के लिए 'क्रॉस-पेंटिंग' का उपयोग करता है, जिससे यह भ्रम पैदा होता है कि स्रोत रोबोट परीक्षण के समय कार्य कर रहा है।"मिराज, एल्गोरिदम जिसे शोधकर्ताओं ने अपने पिछले पेपर में पेश किया था, अदृश्य लक्ष्य रोबोटों के लिए कौशल के शून्य-शॉट हस्तांतरण को प्राप्त करने के लिए पाया गया था।

बहरहाल, मॉडल को विभिन्न सीमाओं के साथ पाया गया।

सबसे पहले, अच्छी तरह से काम करने के लिए, मिराज को सटीक रोबोट मॉडल और कैमरा मैट्रिसेस की आवश्यकता होती है।इसके अलावा, एल्गोरिदम रोबोट नीतियों की फ़ाइन-ट्यूनिंग का समर्थन नहीं करता है और कैमरा पोज़ में कुछ बदलावों के साथ छवियों को संसाधित करने तक ही सीमित है, क्योंकि इसमें छवि की गहराई के पुन: प्रक्षेपण में त्रुटियां होने की संभावना है।

चेन और जू ने कहा, "हमारे नवीनतम काम में हम RoVi-Aug नामक एक वैकल्पिक एल्गोरिदम प्रस्तुत करते हैं।""इस एल्गोरिदम का उद्देश्य प्रशिक्षण के दौरान नीतियों की मजबूती और सामान्यीकरण को बढ़ाकर मिराज की सीमाओं को पार करना है, कठोर धारणाओं के साथ परीक्षण-समय क्रॉस-पेंटिंग दृष्टिकोण पर भरोसा करने के बजाय विविध रोबोट दृश्यों और कैमरा पोज़ को संभालने पर ध्यान केंद्रित करना है।"ज्ञात कैमरा पोज़ और रोबोट यूआरडीएफ (एकीकृत रोबोट विवरण प्रारूप)।"

रोवी-अगस्त, शोधकर्ताओं द्वारा पेश किया गया नया रोबोट डेटा संवर्द्धन ढांचा, अत्याधुनिक प्रसार मॉडल पर आधारित है।ये कम्प्यूटेशनल मॉडल हैं जो रोबोट के प्रक्षेप पथ की छवियों को बढ़ा सकते हैं, विभिन्न दृष्टिकोणों से देखे गए विभिन्न रोबोटों को कार्य पूरा करते हुए दिखाने वाली सिंथेटिक छवियां उत्पन्न कर सकते हैं।

A new data augmentation algorithm that could facilitate the transfer of skills across robots
रोवी-अगस्त पाइपलाइन का अवलोकन।एक इनपुट रोबोट छवि को देखते हुए, हम पहले रोबोट को एक परिष्कृत एसएएम मॉडल का उपयोग करके खंडित करते हैं, फिर रोबोट को दूसरे रोबोट में बदलने के लिए कंट्रोलनेट का उपयोग करते हैं।सिंथेटिक रोबोट को पृष्ठभूमि में वापस चिपकाने के बाद, हम नए दृश्य उत्पन्न करने के लिए ZeroNVS का उपयोग करते हैं।श्रेय: चेन एट अल.

शोधकर्ताओं ने सिंथेटिक रोबोट प्रदर्शनों की एक विस्तृत श्रृंखला वाले डेटासेट को संकलित करने के लिए अपने ढांचे का उपयोग किया और फिर इस डेटासेट पर रोबोट नीतियों को प्रशिक्षित किया।यह बदले में कौशल को नए रोबोटों में स्थानांतरित करने की अनुमति देता है जो पहले प्रदर्शन में शामिल कार्य के संपर्क में नहीं आए हैं, जिसे शून्य-शॉट लर्निंग के रूप में जाना जाता है।

विशेष रूप से, किसी दिए गए कार्य में बेहतर प्रदर्शन प्राप्त करने के लिए रोबोट नीतियों को भी ठीक किया जा सकता है।इसके अलावा, टीम के पिछले पेपर में पेश किए गए मिराज मॉडल के विपरीत, उनका नया एल्गोरिदम कैमरा कोणों में भारी बदलाव का समर्थन कर सकता है।

चेन और जू ने समझाया, "मिराज जैसी परीक्षण-समय अनुकूलन विधियों के विपरीत, RoVi-Aug को तैनाती के दौरान किसी भी अतिरिक्त प्रसंस्करण की आवश्यकता नहीं होती है, यह पहले से कैमरा कोण जानने पर निर्भर नहीं होता है, और नीति को ठीक करने का समर्थन करता है।""यह डेटासेट में रोबोट और कौशल की पूरी श्रृंखला सीखने के लिए मॉडल को सक्रिय रूप से प्रोत्साहित करके मल्टी-रोबोट, मल्टी-टास्क डेटासेट पर पारंपरिक सह-प्रशिक्षण से भी आगे जाता है।"

RoVi-Aug मॉडल में दो अलग-अलग घटक हैं, अर्थात् रोबोट वृद्धि (Ro-Aug) और दृष्टिकोण वृद्धि (Vi-Aug) मॉड्यूल।इनमें से पहला घटक विभिन्न रोबोटिक प्रणालियों की विशेषता वाले प्रदर्शन डेटा को संश्लेषित करने के लिए डिज़ाइन किया गया है, जबकि दूसरा विभिन्न कोणों से देखे गए प्रदर्शनों का उत्पादन कर सकता है।

चेन और जू ने कहा, "रो-अग में दो प्रमुख विशेषताएं हैं: रोबोट को विभाजित करने के लिए एक बढ़िया ट्यून किया गया एसएएम मॉडल और मूल रोबोट को एक अलग रोबोट से बदलने के लिए एक बढ़िया ट्यून किया गया कंट्रोलनेट।""इस बीच, वीआई-ऑग दृश्य के नए परिप्रेक्ष्य उत्पन्न करने के लिए एक अत्याधुनिक उपन्यास दृश्य संश्लेषण मॉडल जीरोएनवीएस का लाभ उठाता है, जिससे मॉडल विभिन्न कैमरा दृष्टिकोणों के अनुकूल बन जाता है।"

अपने अध्ययन के हिस्से के रूप में, शोधकर्ताओं ने एक संवर्धित रोबोट डेटासेट तैयार करने के लिए अपने मॉडल का उपयोग किया और फिर प्रशिक्षण नीतियों और विभिन्न रोबोटों में कौशल स्थानांतरित करने के लिए इस डेटासेट की प्रभावशीलता का परीक्षण किया।उनके प्रारंभिक निष्कर्ष रोवी-अगस्त की क्षमता को उजागर करते हैं, क्योंकि एल्गोरिदम को उन नीतियों के प्रशिक्षण को सक्षम करने के लिए पाया गया था जो विभिन्न रोबोट और कैमरा सेट-अप में अच्छी तरह से सामान्यीकरण करते हैं।

चेन और जू ने समझाया, "इसका मुख्य नवाचार क्रॉस-अवतार रोबोट सीखने की चुनौती के लिए छवि-से-छवि पीढ़ी और उपन्यास दृश्य संश्लेषण जैसे जेनरेटिव मॉडल लागू करने में निहित है।"

"जबकि पिछले काम ने ध्यान भटकाने वाली वस्तुओं और पृष्ठभूमि के सामने नीति की मजबूती में सुधार के लिए जेनेरिक वृद्धि का उपयोग किया है, रोवी-अग यह दिखाने वाला पहला है कि यह दृष्टिकोण विभिन्न रोबोटों के बीच कौशल हस्तांतरण की सुविधा कैसे प्रदान कर सकता है।"

चेन और जू का यह हालिया काम रोबोटिक्स शोधकर्ताओं को अपने सिस्टम के कौशल सेट को आसानी से विस्तारित करने में मदद करके रोबोट की उन्नति में योगदान दे सकता है।भविष्य में, इसका उपयोग अन्य टीमों द्वारा विभिन्न रोबोटों के बीच कौशल स्थानांतरित करने या अधिक प्रभावी सामान्य-उद्देश्य वाली रोबोटिक नीतियां विकसित करने के लिए किया जा सकता है।

"उदाहरण के लिए, एक ऐसे परिदृश्य की कल्पना करें जहां एक शोधकर्ता ने डेटा एकत्र करने और किसी कार्य को करने के लिए फ्रैंका रोबोट पर एक नीति का प्रशिक्षण देने में महत्वपूर्ण प्रयास किया है, लेकिन आपके पास केवल यूआर5 रोबोट है," चेन और जू ने कहा।

"रोवी-अगस्त आपको अतिरिक्त प्रशिक्षण के बिना फ़्रैंका डेटा को पुन: उपयोग करने और यूआर5 रोबोट पर नीति को तैनात करने की अनुमति देता है। यह विशेष रूप से उपयोगी है क्योंकि रोबोट नीतियां अक्सर कैमरे के दृष्टिकोण में बदलाव के प्रति संवेदनशील होती हैं, और विभिन्न रोबोटों में समान कैमरा कोण स्थापित करना चुनौतीपूर्ण होता है।RoVi-Aug ऐसे सटीक सेटअप की आवश्यकता को समाप्त कर देता है।"

चूंकि वास्तविक दुनिया में बड़ी मात्रा में रोबोट प्रदर्शन एकत्र करना बहुत महंगा और समय लेने वाला हो सकता है, विश्वसनीय रोबोट प्रशिक्षण डेटासेट को आसानी से संकलित करने के लिए RoVi-Aug एक लागत प्रभावी विकल्प हो सकता है।

हालाँकि इन डेटासेट में छवियां सिंथेटिक होंगी (यानी, एआई द्वारा उत्पन्न), फिर भी वे विश्वसनीय रोबोट नीतियों के निर्माण के लिए उपयोगी साबित हो सकती हैं।शोधकर्ता वर्तमान में टोयोटा रिसर्च लैब्स और अन्य संस्थानों में सहयोगियों के साथ अन्य रोबोट डेटासेट के लिए अपने दृष्टिकोण को लागू करने और विस्तारित करने पर काम कर रहे हैं।

चेन और जू ने कहा, "अब हमारा लक्ष्य जेनेरिक मॉडलिंग तकनीकों में हाल के विकासों को शामिल करके RoVi-Aug को और परिष्कृत करना है, जैसे छवि निर्माण के स्थान पर वीडियो निर्माण।"

"हम ओपन-एक्स एम्बोडिमेंट (ओएक्सई) डेटासेट जैसे मौजूदा डेटासेट पर RoVi-Aug को लागू करने की भी योजना बना रहे हैं, और हम जनरलिस्ट के प्रदर्शन को बढ़ाने की क्षमता से उत्साहित हैं।इस डेटा पर प्रशिक्षित नीतियां।RoVi-Aug की क्षमताओं का विस्तार करने से रोबोट और कार्यों की व्यापक श्रृंखला में इन नीतियों के लचीलेपन और मजबूती में काफी सुधार हो सकता है।"

अधिक जानकारी:लॉरेंस यूनलियांग चेन एट अल, रोवी-अगस्त: क्रॉस-एम्बोडिमेंट रोबोट लर्निंग के लिए रोबोट और व्यूप्वाइंट ऑग्मेंटेशन,arXiv(2024)।डीओआई: 10.48550/arxiv.2409.03403

जर्नल जानकारी: arXiv

© 2024 साइंस एक्स नेटवर्क

उद्धरण:नया डेटा संवर्द्धन एल्गोरिदम रोबोटों में कौशल के हस्तांतरण की सुविधा प्रदान कर सकता है (2024, 10 अक्टूबर)10 अक्टूबर 2024 को पुनः प्राप्तhttps://techxplore.com/news/2024-10-augmentation-algorithm-skills-robots.html से

यह दस्तावेज कॉपीराइट के अधीन है।निजी अध्ययन या अनुसंधान के उद्देश्य से किसी भी निष्पक्ष व्यवहार के अलावा, नहींलिखित अनुमति के बिना भाग को पुन: प्रस्तुत किया जा सकता है।सामग्री केवल सूचना के प्रयोजनों के लिए प्रदान की गई है।