Herts researchers take a step closer to developing robots able to "act on intuition"
रोबोट विश्वविद्यालय के कर्मचारियों और छात्रों के खिलाफ शतरंज खेलते हैं।श्रेय: हर्टफोर्डशायर विश्वविद्यालय

हर्टफोर्डशायर विश्वविद्यालय के शोधकर्ताओं ने एक नया एल्गोरिदम विकसित किया है जो रोबोटों को अधिक सहजता से कार्य करने की अनुमति देगा - यानी, मार्गदर्शन के लिए अपने वातावरण का उपयोग करके निर्णय लेने की अनुमति देगा।

सिद्धांत यह है कि, एल्गोरिथम के माध्यम से,एजेंट अपने लक्ष्य स्वयं बनाता है।

पहली बार, एल्गोरिदम विभिन्न लक्ष्य-निर्धारण दृष्टिकोणों को एक अवधारणा के तहत एकीकृत करता है जो सीधे भौतिकी से जुड़ा होता है, और यह इस गणना को पारदर्शी भी बनाता है ताकि अन्य लोग इसका अध्ययन कर सकें और इसे अपना सकें।

एल्गोरिदम का सिद्धांत प्रसिद्ध अराजकता सिद्धांत से संबंधित है, क्योंकि विधि एजेंट को "सिस्टम की गतिशीलता की अराजकता का स्वामी" बनाती है।

अध्ययन किया गया हैप्रकाशितजर्नल मेंपीआरएक्स लाइफ.हर्ट्स शोधकर्ताओं ने रोबोट "प्रेरणा मॉडल" की खोज की जो स्पष्ट इनाम संकेतों के अभाव में भी मनुष्यों और जानवरों की निर्णय लेने की प्रक्रियाओं की नकल करते हैं।

अध्ययन परिचय देता है(एआई) सूत्र जो रोबोट के लिए प्रत्यक्ष निर्देशों या मानव इनपुट के बिना भविष्य की कार्रवाइयों को तय करने के तरीके की गणना करते हैं।

कंप्यूटर विज्ञान के प्रोफेसर और वरिष्ठ लेखक डैनियल पोलानी बताते हैं, "एक व्यावहारिक अर्थ में, इसका मतलब यह हो सकता है कि, उदाहरण के लिए, रोबोट को ऐसा करने के लिए कहे बिना वस्तुओं को अपने आप चलाने और हेरफेर करने के लिए कहा जाए।

"यह अधिक 'प्राकृतिक' व्यवहार और अंतःक्रियाओं को प्रोत्साहित करके रोबोटों के मनुष्यों और अन्य रोबोटों के साथ बातचीत करने के तरीके को बढ़ा सकता है।

"इसके और भी अनुप्रयोग हैं - जैसे कि उन स्थितियों में रखे गए अर्धस्वायत्त रोबोटों का उत्तरजीविता व्यवहार, जहां वे मानव ऑपरेटर द्वारा पहुंच योग्य नहीं हैं, जैसे कि भूमिगत या अंतरग्रहीय स्थानों में।"

मनुष्यों और जानवरों में, एक सिद्धांत "आंतरिक प्रेरणा" के अस्तित्व को मानता है, जहां व्यवहार भोजन जैसे विशिष्ट सीखे गए पुरस्कारों के बजाय केवल प्राणी और उसके पर्यावरण के बीच बातचीत से संचालित होते हैं।यह पेपर उस "आंतरिक प्रेरणा" सिद्धांत का सफलतापूर्वक अनुवाद करता है जिसका उपयोग रोबोटिक एजेंटों द्वारा किया जा सकता है।

प्रोफेसर पोलानी कहते हैं, "यह काम रोमांचक है क्योंकि अब हम एक तंत्र लागू कर सकते हैं, उसी तरह जैसे रोबोट में मनुष्यों और जानवरों को बिना पूर्व अनुभव के नई समस्याओं को हल करने में मदद मिलती है।

"हम उम्मीद करते हैं कि हम भविष्य में अधिक सहज प्रक्रियाओं के साथ अधिक मानव-जैसे रोबोट विकसित करने के लिए इस काम को आगे बढ़ा सकते हैं। यह हमारे लिए समान निर्णय प्रक्रियाओं के साथ अधिक परिष्कृत रोबोटों के लिए एक बड़ा अवसर खोलता है।"

इस पेपर में अंतर्निहित सिद्धांत, जिसे "सशक्तिकरण अधिकतमकरण" कहा जाता है, कई वर्षों से हर्ट्स में विकसित किया गया है।इससे पता चलता है कि भविष्य के परिणामों की सीमा बढ़ने से, रोबोट के पास लंबे भविष्य में भी बेहतर विकल्प होंगे।महत्वपूर्ण बात यह है कि यह विधि पारंपरिक इनाम प्रणालियों (उदाहरण के लिए खाद्य संकेत) को प्रतिस्थापित करती है और इस प्रकार संभवतः उन्हें समाप्त कर देती है।

हालाँकि सशक्तीकरण को अधिकतम करने का वादा किया गया है, लेकिन इसे अभी तक पूरी तरह से समझा नहीं गया है या व्यापक रूप से लागू नहीं किया गया है।अधिकांश अध्ययन सिमुलेशन पर भरोसा करते थे, जबकि सावधानीपूर्वक आवश्यक जानकारी की गणना करते थेऔर सिद्धांत चुनौतीपूर्ण बना हुआ है।

हालाँकि, इस नवीनतम नवोन्मेषी शोध का उद्देश्य यह समझाना है कि सशक्तिकरण-आधारित प्रेरणाएँ जीवित जीवों के समान व्यवहार क्यों बना सकती हैं, जो संभावित रूप से अधिक आंतरिक रूप से प्रेरित रोबोटों की ओर ले जाती हैं;और यह इन प्रेरणाओं की गणना करने के लिए एक महत्वपूर्ण रूप से बेहतर तरीका भी प्रदान करता है।

प्रोफ़ेसर पोलानी का कहना है कि अगला कदम रोबोटों को दुनिया के बारे में और अधिक खोज करने, प्रत्यक्ष सीखने और नए कौशल की पहचान करने और उन्हें निखारने की अनुमति देने के लिए इस सफल एल्गोरिदम का उपयोग करना है जो वास्तविक दुनिया के परिदृश्यों में उनके मूल्य को बढ़ाएगा।

अधिक जानकारी:स्टास टियोमकिन एट अल, डायनामिकल कंट्रोल सिस्टम में आंतरिक प्रेरणा,पीआरएक्स लाइफ(2024)।डीओआई: 10.1103/पीआरएक्सलाइफ.2.033009

उद्धरण:एल्गोरिदम रोबोटों को 'अंतर्ज्ञान पर कार्य करने' में सक्षम होने के एक कदम और करीब ले जाता है (2024, 11 सितंबर)11 सितंबर 2024 को पुनः प्राप्तhttps://techxplore.com/news/2024-09-algorithm-robots-closer-intuition.html से

यह दस्तावेज कॉपीराइट के अधीन है।निजी अध्ययन या अनुसंधान के उद्देश्य से किसी भी निष्पक्ष व्यवहार के अलावा, नहींलिखित अनुमति के बिना भाग को पुन: प्रस्तुत किया जा सकता है।सामग्री केवल सूचना के प्रयोजनों के लिए प्रदान की गई है।