Precision home robots learn with real-to-sim-to-real
एमआईटी के शोधकर्ता मार्सेल टॉर्ने विलासेविल (बाएं) और पुलकित अग्रवाल द्वारा विकसित 'डिजिटल ट्विन्स' रियाल्टो की मदद से, रोबोट को सिम्युलेटेड वातावरण में अभ्यास करने के लिए बहुत तेजी से मार्गदर्शन किया जा सकता है, अगर वह अपने कौशल को निखारता।असली दुनिया.श्रेय: माइक ग्रिमेट/एमआईटी सीसेल

कई स्वचालन इच्छा सूचियों के शीर्ष पर एक विशेष रूप से समय लेने वाला कार्य है: काम।

कई रोबोटिस्टों का लक्ष्य उचित हार्डवेयर और सॉफ्टवेयर संयोजन तैयार करना है ताकि एक मशीन "सामान्यवादी" नीतियों (रोबोट व्यवहार को निर्देशित करने वाले नियम और रणनीतियाँ) सीख सके जो हर जगह, सभी परिस्थितियों में काम करती हैं।

हालाँकि, वास्तविक रूप से, यदि आपके पास घरेलू रोबोट है, तो संभवतः आपको इसकी अधिक परवाह नहीं होगी कि यह आपके पड़ोसियों के लिए काम करेगा।एमआईटी कंप्यूटर साइंस और आर्टिफिशियल इंटेलिजेंस लेबोरेटरी (CSAIL) के शोधकर्ताओं ने इसे ध्यान में रखते हुए, बहुत विशिष्ट वातावरणों के लिए मजबूत रोबोट नीतियों को आसानी से प्रशिक्षित करने के लिए एक समाधान खोजने का प्रयास करने का निर्णय लिया।

"हमारा लक्ष्य है कि रोबोट एक ही वातावरण में गड़बड़ी, ध्यान भटकाने, अलग-अलग रोशनी की स्थिति और वस्तु की स्थिति में बदलाव के तहत असाधारण रूप से अच्छा प्रदर्शन करें," इम्प्रोबेबल एआई लैब में एमआईटी सीएसएआईएल के शोध सहायक और प्रमुख लेखक मार्सेल टॉर्न विलासेविल कहते हैं।कागज़कार्य के बारे में, जो प्रीप्रिंट सर्वर पर दिखाई देता हैarXiv.

"हम कंप्यूटर विज़न में नवीनतम प्रगति का उपयोग करके तुरंत डिजिटल जुड़वाँ बनाने की एक विधि का प्रस्ताव करते हैं। केवल अपने फोन के साथ, कोई भी वास्तविक दुनिया की डिजिटल प्रतिकृति को कैप्चर कर सकता है, और रोबोट वास्तविक की तुलना में बहुत तेजी से सिम्युलेटेड वातावरण में प्रशिक्षण ले सकते हैं।दुनिया, जीपीयू समानांतरीकरण के लिए धन्यवाद। हमारा दृष्टिकोण प्रशिक्षण प्रक्रिया को तुरंत शुरू करने के लिए कुछ वास्तविक दुनिया के प्रदर्शनों का लाभ उठाकर व्यापक इनाम इंजीनियरिंग की आवश्यकता को समाप्त करता है।"

अपना रोबोट घर ले जा रहे हैं

निःसंदेह, रियालटो आपकी सेवा में एक फोन की एक साधारण तरंग और (बूम!) होम बॉट की तुलना में थोड़ा अधिक जटिल है।यह आपके डिवाइस का उपयोग करके NeRFStudio, ARCode, या Polycam जैसे टूल का उपयोग करके लक्ष्य वातावरण को स्कैन करने से शुरू होता है।एक बार जब दृश्य का पुनर्निर्माण हो जाता है, तो उपयोगकर्ता विस्तृत समायोजन करने, रोबोट में आवश्यक जोड़ जोड़ने और बहुत कुछ करने के लिए इसे रियालटो के इंटरफ़ेस पर अपलोड कर सकते हैं।

परिष्कृत दृश्य निर्यात किया जाता है और सिम्युलेटर में लाया जाता है।यहां, उद्देश्य वास्तविक दुनिया की कार्रवाइयों और टिप्पणियों के आधार पर एक नीति विकसित करना है, जैसे काउंटर पर एक कप हथियाने के लिए नीति।इन वास्तविक दुनिया के प्रदर्शनों को सिमुलेशन में दोहराया गया है, जो सुदृढीकरण सीखने के लिए कुछ मूल्यवान डेटा प्रदान करते हैं।

टॉर्न कहते हैं, "यह एक मजबूत नीति बनाने में मदद करता है जो सिमुलेशन और वास्तविक दुनिया दोनों में अच्छी तरह से काम करती है। सुदृढीकरण सीखने का उपयोग करने वाला एक उन्नत एल्गोरिदम इस प्रक्रिया को निर्देशित करने में मदद करता है, ताकि यह सुनिश्चित किया जा सके कि सिम्युलेटर के बाहर लागू होने पर नीति प्रभावी हो।"

परीक्षण से पता चला कि रियालटो ने विभिन्न प्रकार के कार्यों के लिए मजबूत नीतियां बनाईं, चाहे वह नियंत्रित प्रयोगशाला सेटिंग्स में हो या अधिक अप्रत्याशित वास्तविक दुनिया के वातावरण में, प्रदर्शनों की समान संख्या के साथ नकल सीखने में 67% का सुधार हुआ।कार्यों में एक टोस्टर खोलना, एक किताब को शेल्फ पर रखना, एक प्लेट को एक रैक पर रखना, एक मग को एक शेल्फ पर रखना, एक दराज खोलना और एक कैबिनेट खोलना शामिल था।

प्रत्येक कार्य के लिए, शोधकर्ताओं ने कठिनाई के तीन बढ़ते स्तरों के तहत सिस्टम के प्रदर्शन का परीक्षण किया: ऑब्जेक्ट पोज़ को यादृच्छिक बनाना, दृश्य विकर्षणों को जोड़ना, और कार्य निष्पादन के दौरान शारीरिक गड़बड़ी को लागू करना।वास्तविक दुनिया के डेटा के साथ जोड़े जाने पर, सिस्टम ने पारंपरिक नकल-सीखने के तरीकों से बेहतर प्रदर्शन किया, विशेष रूप से बहुत सारी दृश्य विकर्षणों या शारीरिक व्यवधानों वाली स्थितियों में।

प्रिसिजन होम रोबोटिक्स w/रियल-टू-सिम-टू-रियल।श्रेय: एमआईटी सीसेल

इम्प्रोबेबल एआई के निदेशक पुलकित अग्रवाल कहते हैं, "इन प्रयोगों से पता चलता है कि अगर हम किसी विशेष वातावरण में बहुत मजबूत होने की परवाह करते हैं, तो सबसे अच्छा विचार विभिन्न वातावरणों में बड़े पैमाने पर डेटा संग्रह के साथ मजबूती प्राप्त करने की कोशिश करने के बजाय डिजिटल जुड़वाँ का लाभ उठाना है।"लैब, एमआईटी इलेक्ट्रिकल इंजीनियरिंग और कंप्यूटर साइंस (ईईसीएस) के एसोसिएट प्रोफेसर, एमआईटी सीएसएआईएल के प्रमुख अन्वेषक, और काम पर वरिष्ठ लेखक।

जहां तक ​​सीमाओं की बात है, रियालटो को पूरी तरह से प्रशिक्षित होने में फिलहाल तीन दिन लगते हैं।इसे गति देने के लिए, टीम अंतर्निहित एल्गोरिदम में सुधार करने और फाउंडेशन मॉडल का उपयोग करने का उल्लेख करती है।सिमुलेशन में प्रशिक्षण की भी अपनी सीमाएँ हैं, और वर्तमान में सहज सिम-टू-रियल ट्रांसफर करना और विकृत वस्तुओं या तरल पदार्थों का अनुकरण करना मुश्किल है।

अगला स्तर

तो रियाल्टो की यात्रा के लिए आगे क्या है?पिछले प्रयासों के आधार पर, वैज्ञानिक नए वातावरण में मॉडल की अनुकूलनशीलता में सुधार करते हुए विभिन्न गड़बड़ी के खिलाफ मजबूती को संरक्षित करने पर काम कर रहे हैं।

टॉर्न कहते हैं, "हमारा अगला प्रयास पूर्व-प्रशिक्षित मॉडलों का उपयोग करने, सीखने की प्रक्रिया में तेजी लाने, मानव इनपुट को कम करने और व्यापक सामान्यीकरण क्षमताओं को प्राप्त करने का यह दृष्टिकोण है।"

"हम अपनी 'ऑन-द-फ्लाई' रोबोट प्रोग्रामिंग अवधारणा के बारे में अविश्वसनीय रूप से उत्साहित हैं, जहां रोबोट स्वायत्त रूप से अपने पर्यावरण को स्कैन कर सकते हैं और सीख सकते हैं कि सिमुलेशन में विशिष्ट कार्यों को कैसे हल किया जाए। जबकि हमारी वर्तमान पद्धति में सीमाएं हैं - जैसे कि कुछ प्रारंभिक की आवश्यकता होती हैइन नीतियों के प्रशिक्षण के लिए एक मानव द्वारा प्रदर्शन और महत्वपूर्ण गणना समय (तीन दिन तक) - हम इसे 'ऑन-द-फ्लाई' रोबोट सीखने और तैनाती को प्राप्त करने की दिशा में एक महत्वपूर्ण कदम के रूप में देखते हैं," टोर्ने कहते हैं।

"यह दृष्टिकोण हमें ऐसे भविष्य के करीब ले जाता है जहां रोबोटों को हर परिदृश्य को कवर करने वाली पहले से मौजूद नीति की आवश्यकता नहीं होगी। इसके बजाय, वे व्यापक वास्तविक दुनिया की बातचीत के बिना तेजी से नए कार्य सीख सकते हैं। मेरे विचार में, यह प्रगति व्यावहारिक अनुप्रयोग में तेजी ला सकती हैरोबोटिक्स केवल एक सार्वभौमिक, सर्वव्यापी नीति पर निर्भर रहने की तुलना में कहीं अधिक तेज़ है।"

"वास्तविक दुनिया में रोबोटों को तैनात करने के लिए, शोधकर्ताओं ने पारंपरिक रूप से विशेषज्ञ डेटा से नकल सीखने जैसे तरीकों पर भरोसा किया है, जो महंगा हो सकता है, या, जो असुरक्षित हो सकता है," वाशिंगटन विश्वविद्यालय में कंप्यूटर विज्ञान के पीएचडी छात्र ज़ोए चेन कहते हैं, जो पेपर में शामिल नहीं थे।

"RialTo अपने नए रियल-टू-सिम-टू-रियल पाइपलाइन के साथ वास्तविक दुनिया आरएल [रोबोट लर्निंग] की सुरक्षा बाधाओं और डेटा-संचालित शिक्षण विधियों के लिए कुशल डेटा बाधाओं दोनों को सीधे संबोधित करता है।

"यह नवीन पाइपलाइन न केवल वास्तविक दुनिया में तैनाती से पहले सिमुलेशन में सुरक्षित और मजबूत प्रशिक्षण सुनिश्चित करती है, बल्कि डेटा संग्रह की दक्षता में भी काफी सुधार करती है। रियालटो में महत्वपूर्ण पैमाने पर बढ़ने की क्षमता हैसीखना और रोबोटों को जटिल वास्तविक दुनिया के परिदृश्यों को अधिक प्रभावी ढंग से अनुकूलित करने की अनुमति देता है।"

कंप्यूटर विज्ञान में पीएच.डी. मारियस मेमेल कहते हैं, "सिमुलेशन ने नीतिगत शिक्षा के लिए सस्ता, संभवतः अनंत डेटा प्रदान करके वास्तविक रोबोटों पर प्रभावशाली क्षमताएं दिखाई हैं।"वाशिंगटन विश्वविद्यालय का छात्र जो इस काम में शामिल नहीं था।

"हालांकि, ये विधियां कुछ विशिष्ट परिदृश्यों तक ही सीमित हैं, और संबंधित सिमुलेशन का निर्माण महंगा और श्रमसाध्य है। रियालटो वास्तविक दुनिया के वातावरण को घंटों के बजाय मिनटों में पुनर्निर्माण करने के लिए उपयोग में आसान उपकरण प्रदान करता है।

"इसके अलावा, यह नीति सीखने के दौरान एकत्रित प्रदर्शनों का व्यापक उपयोग करता है, ऑपरेटर पर बोझ को कम करता है और सिम2रियल अंतर को कम करता है। रियाल्टो व्यापक सिम्युलेटर निर्माण और डेटा संग्रह की आवश्यकता के बिना अविश्वसनीय वास्तविक दुनिया के प्रदर्शन को दिखाते हुए, ऑब्जेक्ट पोज़ और गड़बड़ी के लिए मजबूती प्रदर्शित करता है।"

अधिक जानकारी:मार्सेल टॉर्ने एट अल, सिमुलेशन के माध्यम से वास्तविकता को समेटना: मजबूत हेरफेर के लिए एक वास्तविक-से-सिम-से-वास्तविक दृष्टिकोण,arXiv(2024)।डीओआई: 10.48550/arxiv.2403.03949

जर्नल जानकारी: arXiv

यह कहानी एमआईटी न्यूज़ के सौजन्य से पुनः प्रकाशित की गई है (web.mit.edu/newsoffice/), एक लोकप्रिय साइट जो एमआईटी अनुसंधान, नवाचार और शिक्षण के बारे में समाचार कवर करती है।

उद्धरण:शोधकर्ताओं ने रोबोटों को स्कैन किए गए घरेलू वातावरण के सिमुलेशन में प्रशिक्षित करने की अनुमति देने वाला उपन्यास दृष्टिकोण पेश किया (2024, 1 अगस्त)1 अगस्त 2024 को पुनः प्राप्तhttps://techxplore.com/news/2024-08-approach-robots-simulations-scanned-home.html से

यह दस्तावेज कॉपीराइट के अधीन है।निजी अध्ययन या अनुसंधान के उद्देश्य से किसी भी निष्पक्ष व्यवहार के अलावा, नहींलिखित अनुमति के बिना भाग को पुन: प्रस्तुत किया जा सकता है।सामग्री केवल सूचना के प्रयोजनों के लिए प्रदान की गई है।