Q&A: How to train AI when you don't have enough data
बायीं ओर एक बच्चे की 2डी "स्टिक आकृति" वाली छवि दिखाई गई है, जो खोजे गए मुख्य बिंदुओं के एक सेट का उपयोग करके बनाई गई है।दाईं ओर बच्चे की 3डी मुद्रा का स्टिक फिगर मॉडल है।लाल छड़ी की आकृति "जमीनी सच्चाई" को दर्शाती है और नीली छड़ी की आकृति शोधकर्ताओं के एल्गोरिदम के साथ अनुमानित 3डी मुद्रा है।श्रेय: से अनुकूलितarXiv(2023)।डीओआई: 10.48550/arxiv.2311.12043

आर्टिफिशियल इंटेलिजेंस सूचनाओं को छांटने और पैटर्न या रुझानों का पता लगाने में उत्कृष्टता प्राप्त करता है।लेकिन इन मशीन लर्निंग एल्गोरिदम को पहले बड़ी मात्रा में डेटा के साथ प्रशिक्षित करने की आवश्यकता है।

जैसा कि शोधकर्ताओं ने एआई के लिए संभावित अनुप्रयोगों का पता लगाया है, उन्हें ऐसे परिदृश्य मिले हैं जहां एआई वास्तव में उपयोगी हो सकता है - जैसे कि दुर्लभ स्थितियों के सबूत देखने के लिए एक्स-रे छवि डेटा का विश्लेषण करना याएक दुर्लभ मछली प्रजाति का पता लगानाएक वाणिज्यिक मछली पकड़ने वाली नाव पर पकड़ा गया-लेकिन एल्गोरिदम को सटीक रूप से प्रशिक्षित करने के लिए पर्याप्त डेटा नहीं है।

जेनक-नेंग ह्वांग, वाशिंगटन विश्वविद्यालय में इलेक्ट्रिकल और कंप्यूटर और इंजीनियरिंग के प्रोफेसर, इन मुद्दों में विशेषज्ञ हैं।उदाहरण के लिए, ह्वांग और उनकी टीम ने एक ऐसी विधि विकसित की जो एआई को यह निगरानी करना सिखाती है कि एक बच्चा पूरे दिन में कितने अलग-अलग पोज़ हासिल कर सकता है।शिशुओं के प्रशिक्षण डेटासेट सीमित हैं, जिसका मतलब है कि शोधकर्ताओं को अपने एल्गोरिदम को सटीक और उपयोगी बनाने के लिए एक अनूठी पाइपलाइन बनानी होगी।

टीम ने हाल ही में इस कार्य को प्रस्तुत कियाआईईईई/सीवीएफ शीतकालीन सम्मेलनकंप्यूटर विज़न 2024 के अनुप्रयोगों पर शोध हैउपलब्धपरarXivप्रीप्रिंट सर्वर.

यूडब्ल्यू न्यूज ने ह्वांग से परियोजना विवरण और टीम द्वारा संबोधित किए जा रहे अन्य समान चुनौतीपूर्ण क्षेत्रों के बारे में बात की।

शिशु की मुद्राओं को ट्रैक करने के लिए एक एल्गोरिदम विकसित करना क्यों महत्वपूर्ण है?

हमने यूडब्ल्यू स्कूल ऑफ मेडिसिन और कोरियाई इलेक्ट्रॉनिक्स और दूरसंचार अनुसंधान संस्थान की एआई लैब के साथ सहयोग शुरू किया।परियोजना का लक्ष्य ऑटिज्म के इतिहास वाले परिवारों को यह जानने में मदद करना था कि क्या उनके बच्चों को भी ऑटिज्म होने की संभावना है।9 महीने से पहले के शिशुओं में वास्तव में अभी तक भाषा कौशल नहीं होता है, इसलिए यह देखना मुश्किल है कि वे ऑटिस्टिक हैं या नहीं।

शोधकर्ताओं ने एक परीक्षण विकसित किया, जिसे कहा जाता हैअल्बर्टा शिशु मोटर स्केल, जो बच्चों द्वारा किए जाने वाले विभिन्न आसनों को वर्गीकृत करता है: यदि कोई बच्चा ऐसा कर सकता है, तो उन्हें दो अंक मिलते हैं;और यदि वे ऐसा कर सकते हैं, तो उन्हें तीन अंक मिलते हैं;और इसी तरह।फिर आप सभी बिंदुओं को जोड़ दें और यदि बच्चा कुछ सीमा से ऊपर है, तो संभवतः उसे ऑटिज़्म नहीं है।

लेकिन इस परीक्षण को करने के लिए, आपको सभी अलग-अलग मुद्राओं का निरीक्षण करने के लिए एक डॉक्टर की आवश्यकता होती है।यह एक बहुत ही कठिन प्रक्रिया बन जाती है क्योंकि कभी-कभी तीन या चार घंटों के बाद भी, हमने किसी बच्चे को कोई विशिष्ट मुद्रा करते हुए नहीं देखा है।शायद बच्चा ऐसा कर सकता था, लेकिन उस समय वे ऐसा नहीं करना चाहते थे।इसका एक समाधान एआई का उपयोग करना हो सकता है।माता-पिता अक्सर घर पर बेबी मॉनिटर रखते हैं।बेबी मॉनिटर एक दिन में बच्चे द्वारा की जाने वाली विभिन्न मुद्राओं को लगातार और लगातार ट्रैक करने के लिए एआई का उपयोग कर सकता है।

AI इस कार्य के लिए उपयुक्त क्यों है?

मेरी पृष्ठभूमि पारंपरिक छवि प्रसंस्करण और कंप्यूटर विज़न का अध्ययन कर रही है।हम कंप्यूटर को यह सिखाने की कोशिश कर रहे थे कि वह फोटो या वीडियो से इंसान की मुद्रा का पता लगा सके, लेकिन परेशानी यह है कि इसमें बहुत सारी विविधताएं हैं।उदाहरण के लिए, अलग-अलग पोशाक पहनने वाला एक ही व्यक्ति पारंपरिक छवि प्रसंस्करण के लिए प्रत्येक तस्वीर पर उस व्यक्ति की कोहनी की सही पहचान करना एक चुनौतीपूर्ण कार्य है।

लेकिन AI इसे बहुत आसान बना देता है।ये मॉडल सीख सकते हैं.उदाहरण के लिए, आप एक मशीन लर्निंग मॉडल को विभिन्न प्रकार के लोगों को दिखाते हुए विभिन्न प्रकार के गति कैप्चर किए गए अनुक्रमों के साथ प्रशिक्षित कर सकते हैं।इन अनुक्रमों को संबंधित 3डी पोज़ के साथ एनोटेट किया जा सकता है।फिर यह मॉडल किसी व्यक्ति की मुद्रा के 3डी मॉडल को ऐसे अनुक्रम में आउटपुट करना सीख सकता है जिसे उसने पहले कभी नहीं देखा है।

लेकिन इस मामले में, शिशुओं के बहुत सारे गति कैप्चर किए गए अनुक्रम नहीं हैं जिनमें 3डी पोज़ एनोटेशन भी हैं जिनका उपयोग आप अपने मशीन लर्निंग मॉडल को प्रशिक्षित करने के लिए कर सकते हैं।इसके बजाय आपने क्या किया?

गोपनीयता कारणों से मशीन लर्निंग मॉडल को प्रशिक्षित करने के लिए हमारे पास शिशु वीडियो के बहुत सारे 3डी पोज़ एनोटेशन नहीं हैं।ऐसा डेटासेट बनाना भी मुश्किल है जहां एक बच्चा उन सभी संभावित मुद्राओं का प्रदर्शन कर रहा हो जिनकी हमें आवश्यकता होगी।हमारे डेटासेट बहुत छोटे हैं, जिसका अर्थ है कि उनके साथ प्रशिक्षित मॉडल विश्वसनीय पोज़ का अनुमान नहीं लगा पाएगा।

लेकिन हमारे पास आम तौर पर लोगों के बहुत सारे एनोटेटेड 3डी गति अनुक्रम हैं।इसलिए, हमने यह पाइपलाइन विकसित की।

सबसे पहले हमने सामान्य 3डी मुद्रा को प्रशिक्षित करने के लिए बड़ी मात्रा में नियमित लोगों के 3डी गति अनुक्रमों का उपयोग कियाजनरेटिव एआईमॉडल, जो ChatGPT और अन्य GPT-4 प्रकार के बड़े भाषा मॉडल में प्रयुक्त मॉडल के समान है।

फिर हमने एनोटेटेड बेबी मोशन अनुक्रमों के हमारे बहुत ही सीमित डेटासेट के साथ अपने सामान्य मॉडल को परिष्कृत किया।फिर जेनेरिक मॉडल छोटे डेटासेट के अनुकूल हो सकता है और उच्च गुणवत्ता वाले परिणाम दे सकता है।

क्या इस तरह के अन्य कार्य हैं: एआई के लिए अच्छा है, लेकिन एल्गोरिदम को प्रशिक्षित करने के लिए बहुत अधिक डेटा नहीं है?

ऐसे कई प्रकार के परिदृश्य हैं जहां हमारे पास मॉडल को प्रशिक्षित करने के लिए पर्याप्त जानकारी नहीं है।एक उदाहरण है एजिसका निदान एक्स-रे द्वारा किया जाता है।यह बीमारी इतनी दुर्लभ है कि हमारे पास किसी मॉडल को प्रशिक्षित करने के लिए इस बीमारी से पीड़ित रोगियों की पर्याप्त एक्स-रे छवियां नहीं हैं।लेकिन हमारे पास स्वस्थ रोगियों के बहुत सारे एक्स-रे होते हैं।इसलिए, हम रोग के बिना संबंधित सिंथेटिक एक्स-रे छवि उत्पन्न करने के लिए फिर से जेनरेटिव एआई का उपयोग कर सकते हैं, जिसे आगे के निदान के लिए रोग क्षेत्रों की पहचान करने के लिए रोगग्रस्त छवि के साथ तुलना की जा सकती है।

स्वायत्त ड्राइविंग एक और उदाहरण है।ऐसी बहुत सी वास्तविक घटनाएँ हैं जिन्हें आप नहीं बना सकते।उदाहरण के लिए, मान लीजिए कि आप गाड़ी चला रहे हैं और कार के सामने कुछ पत्तियाँ उड़ रही हैं।यदि तुम प्रयोग करते हो, कार सोच सकती है कि कुछ गड़बड़ है और ब्रेक लगा देगी, क्योंकि कार ने यह परिदृश्य पहले कभी नहीं देखा है।इससे दुर्घटना हो सकती है.

हम इन्हें "लंबी-पूंछ वाली" घटनाएँ कहते हैं, जिसका अर्थ है कि इनके घटित होने की संभावना नहीं है।लेकिन रोजमर्रा की जिंदगी में हम हमेशा ऐसी बेतरतीब चीजें देखते हैं।जब तक हम यह पता नहीं लगा लेते कि इस प्रकार की घटनाओं से निपटने के लिए स्वायत्त ड्राइविंग सिस्टम को कैसे प्रशिक्षित किया जाए, स्वायत्त ड्राइविंग उपयोगी नहीं हो सकती।हमारी टीम एक नियमित कैमरे के डेटा को रडार जानकारी के साथ जोड़कर इस समस्या पर काम कर रही है।कैमरा और रडार लगातार एक-दूसरे के निर्णयों की जांच करते हैं, जो मशीन लर्निंग एल्गोरिदम को यह समझने में मदद कर सकता है कि क्या हो रहा है।

बेबी पोज़ पेपर पर अतिरिक्त सह-लेखक ज़ुओरन झोउ हैं, जो इलेक्ट्रिकल और कंप्यूटर इंजीनियरिंग विभाग में यूडब्ल्यू अनुसंधान सहायक हैं;झोंगयु जियांग और चेंग-येन यांग, इलेक्ट्रिकल और कंप्यूटर इंजीनियरिंग विभाग में यूडब्ल्यू डॉक्टरेट छात्र;वेनहाओ चाई, एक यूडब्ल्यू मास्टर के छात्र जो इलेक्ट्रिकल और कंप्यूटर इंजीनियरिंग का अध्ययन कर रहे हैं;और लेई ली, कोपेनहेगन विश्वविद्यालय में डॉक्टरेट फेलो।

अधिक जानकारी:ज़ुओरन झोउ एट अल, 3डी शिशु मुद्रा अनुमान के लिए जेनरेटिव प्रायर के माध्यम से कुशल डोमेन अनुकूलन,arXiv(2023)।डीओआई: 10.48550/arxiv.2311.12043

जर्नल जानकारी: arXiv

उद्धरण:प्रश्नोत्तर: जब आपके पास पर्याप्त डेटा नहीं है तो एआई को कैसे प्रशिक्षित करें (2024, 28 मार्च)28 मार्च 2024 को पुनः प्राप्तhttps://techxplore.com/news/2024-03-qa-ai-dont.html से

यह दस्तावेज कॉपीराइट के अधीन है।निजी अध्ययन या अनुसंधान के उद्देश्य से किसी भी निष्पक्ष व्यवहार के अलावा, नहींलिखित अनुमति के बिना भाग को पुन: प्रस्तुत किया जा सकता है।सामग्री केवल सूचना के प्रयोजनों के लिए प्रदान की गई है।