Adding audio data when training robots helps them do a better job
पोंछते मूल्यांकन.ऊपर: विभिन्न परीक्षण परिदृश्य।नीचे: विशिष्ट विफलता के मामले और कार्य सफलता दर।[केवल विज़न] नीति अक्सर उचित संपर्क बनाए रखने में विफल रहती है (उदाहरण के लिए, या तो ब्रॉड में बहुत अधिक दबाव डालें या फ़्लोट करें)।[एमएलपी फ़्यूज़न] नीति अक्सर ड्राइंग को पूरी तरह से मिटाने और जल्दी समाप्त करने में विफल रहती है।श्रेय:arXiv(2024)।डीओआई: 10.48550/arxiv.2406.19464

स्टैनफोर्ड यूनिवर्सिटी और टोयोटा रिसर्च इंस्टीट्यूट के रोबोटिस्टों की एक संयुक्त टीम ने पाया है कि रोबोट को प्रशिक्षण देते समय दृश्य डेटा में ऑडियो डेटा जोड़ने से उनके सीखने के कौशल में सुधार करने में मदद मिलती है।टीम ने अपनी पोस्ट कर दी हैअनुसंधानपरarXivप्रीप्रिंट सर्वर.

शोधकर्ताओं ने नोट किया कि एआई-आधारित रोबोटों के साथ किए गए लगभग सभी प्रशिक्षणों में संबंधित ऑडियो को नजरअंदाज करते हुए उन्हें बड़ी मात्रा में दृश्य जानकारी से अवगत कराना शामिल है।उन्हें आश्चर्य हुआ कि क्या रोबोटों में माइक्रोफोन जोड़ने और उन्हें इस बारे में डेटा एकत्र करने की अनुमति देने से कि किसी चीज़ की ध्वनि कैसी होनी चाहिए, इससे उन्हें किसी कार्य को बेहतर ढंग से सीखने में मदद मिल सकती है।

उदाहरण के लिए, यदि एयह सीखना चाहिए कि अनाज का एक डिब्बा कैसे खोलें और उसमें एक कटोरा कैसे भरें, यह एक डिब्बे के खुलने की आवाज़ सुनने और अनाज के कटोरे में गिरने पर उसके सूखने की आवाज़ सुनने में मददगार हो सकता है।यह पता लगाने के लिए, टीम ने चार रोबोट-लर्निंग प्रयोगों को डिजाइन और संचालित किया।

पहले प्रयोग में एक रोबोट को एक स्पैटुला का उपयोग करके फ्राइंग पैन में एक बैगेल को पलटना सिखाया गया।दूसरे में एक रोबोट को सफेद बोर्ड पर एक छवि मिटाने के लिए इरेज़र का उपयोग करना सिखाना शामिल था।तीसरा था एक कप में रखे पासों को दूसरे कप में डालना और चौथा था तीन उपलब्ध नमूनों में से टेप का सही आकार चुनना और इसका उपयोग एक तार को प्लास्टिक की पट्टी पर टेप करने के लिए करना था।

सभी प्रयोगों में पकड़ने वाले पंजे से सुसज्जित एक ही रोबोट का उपयोग शामिल था।ये सभी भी दो तरह से किए गए, केवल वीडियो का उपयोग करके और वीडियो और ऑडियो का उपयोग करके।शोध दल ने शिक्षण और प्रदर्शन कारकों जैसे टेबल की ऊंचाई, टेप का प्रकार या सफेद बोर्ड पर छवि का प्रकार भी भिन्न-भिन्न किया।

अपने सभी प्रयोगों को चलाने के बाद, शोधकर्ताओं ने परिणामों की तुलना इस आधार पर की कि रोबोट कितनी जल्दी और आसानी से सीखने और कार्यों को पूरा करने में सक्षम थे और साथ ही उनकी सटीकता भी।उन्होंने पाया कि ऑडियो जोड़ने से कुछ कार्यों में गति और सटीकता में काफी सुधार हुआ, लेकिन अन्य में नहीं।

उदाहरण के लिए, पासा डालने के कार्य में ऑडियो जोड़ने से रोबोट की यह पता लगाने की क्षमता में नाटकीय रूप से सुधार हुआ कि क्या कोई पासा हैपासाइससे रोबोट को यह समझने में भी मदद मिली कि क्या वह इरेज़र पर सही मात्रा में दबाव डाल रहा था, क्योंकि इससे निकलने वाली अनोखी ध्वनि थी।दूसरी ओर, ध्वनि जोड़ने से यह निर्धारित करने में बहुत मदद नहीं मिली कि क्या बैगेल को सफलतापूर्वक घुमाया गया था या क्या एक सफेद बोर्ड से सभी छवि को सफलतापूर्वक हटा दिया गया था।

टीम यह सुझाव देकर निष्कर्ष निकालती है कि उनका काम दिखाता है कि ऑडियो जोड़नाएआई रोबोट के लिए सामग्री कुछ अनुप्रयोगों के लिए बेहतर परिणाम प्रदान कर सकती है।

अधिक जानकारी:ज़ेई लियू एट अल, मनिवाव: इन-द-वाइल्ड ऑडियो-विज़ुअल डेटा से रोबोट हेरफेर सीखना,arXiv(2024)।डीओआई: 10.48550/arxiv.2406.19464

प्रोजेक्ट पेज:mani-wav.github.io/

जर्नल जानकारी: arXiv

© 2024 साइंस एक्स नेटवर्क

उद्धरण:रोबोटों को प्रशिक्षण देते समय ऑडियो डेटा जोड़ने से उन्हें बेहतर काम करने में मदद मिलती है (2024, 5 जुलाई)5 जुलाई 2024 को पुनः प्राप्तhttps://techxplore.com/news/2024-07-adding-audio-robots-job.html से

यह दस्तावेज कॉपीराइट के अधीन है।निजी अध्ययन या अनुसंधान के उद्देश्य से किसी भी निष्पक्ष व्यवहार के अलावा, नहींलिखित अनुमति के बिना भाग को पुन: प्रस्तुत किया जा सकता है।सामग्री केवल सूचना के प्रयोजनों के लिए प्रदान की गई है।