Scientists develop machine learning tool to accurately identify Arabic dialects  in 22 Arabic-speaking countries
इस परियोजना में दुनिया भर में लाखों अरबी बोलने वालों के लिए संचार और पहुंच बढ़ाने की क्षमता है।श्रेय: डॉ. हला जॉर्जेस, कॉलेज ऑफ फाइन आर्ट्स एंड डिज़ाइन, शारजाह विश्वविद्यालय।

शारजाह विश्वविद्यालय के वैज्ञानिकों का मानना ​​है कि उन्होंने एक कृत्रिम बुद्धिमत्ता प्रणाली बनाई है जो स्वचालित रूप से पहचान सकती है कि कोई कौन सी अरबी बोली बोल रहा है।काम हैप्रकाशितमेंआईईईई एक्सप्लोर.

वे कहते हैं कि उनकी प्रणाली अरबी बोलियों की समृद्ध और जटिल टेपेस्ट्री को उजागर करती है जो अब तक पारंपरिक भाषण प्रणालियों की सटीक व्याख्या और पहचान करने में विफल रहती है।

कंप्यूटर विज्ञान के प्रोफेसर अशरफ एलनगर ने कहा, "अरबी कई क्षेत्रीय बोलियों के साथ एक समृद्ध भाषा है, और प्रत्येक की अपनी अनूठी शब्दावली, अभिव्यक्ति और उच्चारण है। यह विविधता प्रौद्योगिकी के लिए उन्हें सटीक रूप से समझना और अंतर करना चुनौतीपूर्ण बनाती है।"ख़ुफ़िया प्रणाली.

"इसे संबोधित करने के लिए, हमने एक प्रणाली विकसित की है जो स्वचालित रूप से पहचान सकती है कि कोई कौन सी अरबी बोली बोल रहा है।"

मध्य पूर्व, उत्तरी अफ्रीका और अरब प्रायद्वीप तक फैले 22 देशों में आधिकारिक भाषा, अरबी विश्व स्तर पर सबसे अधिक बोली जाने वाली भाषाओं में से एक है।370 मिलियन से अधिक लोगइसे अपनी मातृभाषा के रूप में रखना।यह दुनिया की सबसे अधिक संस्कृति में डूबी हुई भाषाओं में से एक है और जो लोग इसे मातृभाषा के रूप में रखते हैं या इसे दूसरी या दूसरी भाषा के रूप में सीखते हैं।वे खुद को इस्लाम और इसकी संस्कृति के बारे में भी सीखते हैं।

Scientists develop machine learning tool to accurately identify Arabic dialects  in 22 Arabic-speaking countries
मध्य पूर्व, उत्तरी अफ्रीका और अरब प्रायद्वीप तक फैले 22 देशों में आधिकारिक भाषा, अरबी विश्व स्तर पर सबसे अधिक बोली जाने वाली भाषाओं में से एक है।श्रेय: डॉ. हला जॉर्जेस, कॉलेज ऑफ फाइन आर्ट्स एंड डिज़ाइन, शारजाह विश्वविद्यालय।

अंग्रेजी से बिल्कुल अलग वर्णमाला के साथ, इस भाषा में कई ध्वनियाँ हैं जो इसकी ध्वनिविज्ञान के लिए विशिष्ट हैं।इसकी ध्वनि और पात्रों का आकर्षण हतप्रभ कर देता हैअनगिनत विदेशी शिक्षार्थीजो इसे धाराप्रवाह बोलने की ख्वाहिश रखते हैं.यद्यपि अरबी भाषा की अधिकांश शिक्षा मानक औपचारिक विविधता में होती है, कई विदेशी शिक्षार्थी बोलचाल या दैनिक संस्करणों का चयन करते हैं, विशेष रूप से मिस्र और सीरिया में मुद्रा में बोले जाने वाले रूप।

लेखकों का कहना है कि कंप्यूटर को केवल बोले गए शब्दों को सुनकर विभिन्न अरबी बोलियों को पहचानना सिखाते समय उन्हें अपने प्रयास में एक आसान काम का सामना नहीं करना पड़ा।वे लिखते हैं, "प्राथमिक चुनौती एक मशीन लर्निंग मॉडल का विकास है जो अरबी बोलियों की एक विस्तृत श्रृंखला की सटीक पहचान करने में सक्षम है.

"यह कार्य अरबी बोलियों की अंतर्निहित विविधता और जटिलता के साथ-साथ ऑडियो प्रोसेसिंग और मशीन लर्निंग मॉडल अनुकूलन की तकनीकी चुनौतियों से जटिल है।"

लेखकों ने YouTube से एकत्र किए गए 3,000 घंटे से अधिक ऑडियो सेगमेंट वाले डेटासेट का उपयोग किया।डेटा में अल्जीरिया, मिस्र, इराक, जॉर्डन, सऊदी अरब, कुवैत, लेबनान, लीबिया, मॉरिटानिया, ट्यूनीशिया, मोरक्को, ओमान, फिलिस्तीन, कतर, सूडान, सीरिया, संयुक्त अरब अमीरात (यूएई), बहरीन में बोली जाने वाली 19 अलग-अलग बोलियाँ शामिल हैं।और यमन.

क्षेत्रीय और देश स्तर पर अरबी बोली की पहचान में मॉडल की उच्च सटीकता पर जोर देते हुए प्रो. एलनागर ने कहा, परिणाम प्रभावशाली थे।"हमारा मॉडल सही ढंग से पहचाना गया97.29% समय और विशिष्ट देश की बोलियाँ 94.92% समय।

Scientists develop machine learning tool to accurately identify Arabic dialects  in 22 Arabic-speaking countries
अरबी कई क्षेत्रीय बोलियों के साथ एक समृद्ध भाषा है, और प्रत्येक की अपनी अनूठी शब्दावली, अभिव्यक्ति और उच्चारण है।श्रेय: डॉ. हला जॉर्जेस, कॉलेज ऑफ फाइन आर्ट्स एंड डिज़ाइन, शारजाह विश्वविद्यालय।

"उल्लेखनीय बात यह है कि हमने केवल 29% का उपयोग करके इसे हासिल किया हैआम तौर पर अन्य शोधकर्ताओं द्वारा इसकी आवश्यकता होती है।हमने अपने मॉडलों को सार्वजनिक रूप से उपलब्ध कराया है ताकि अन्य शोधकर्ता और डेवलपर अरबी बोलने वालों के लिए बेहतर भाषण-संबंधी तकनीक बनाने के लिए उनका उपयोग कर सकें।"

इस परियोजना में दुनिया भर में लाखों अरबी बोलने वालों के लिए संचार और पहुंच बढ़ाने की क्षमता है।प्रोफेसर एलनगर ने कहा कि किसी बोली को सही ढंग से पहचानने की मॉडल की क्षमता "वर्चुअल असिस्टेंट, अनुवाद सेवाओं और स्वचालित ग्राहक सहायता प्रणालियों जैसी आवाज-सक्रिय प्रौद्योगिकियों में सुधार कर सकती है।

"यह न केवल विभिन्न अरबी भाषी क्षेत्रों के बीच संचार अंतराल को पाटता है बल्कि अरबी भाषियों के लिए प्रौद्योगिकी को अधिक समावेशी और उपयोगकर्ता के अनुकूल बनाने में भी योगदान देता है।"

आश्चर्यजनक परिणामों के बावजूद, प्रोफेसर एलनगर ने कहा, परियोजना में अभी भी सुधार किया जा सकता है।इस उद्देश्य के लिए, लेखकों ने अपने सिस्टम को सार्वजनिक रूप से "हगिंगफेस नामक मंच पर ऑनलाइन उपलब्ध कराया है, ताकि अन्य लोग अरबी भाषा प्रौद्योगिकियों को बेहतर बनाने के लिए हमारे काम तक पहुंच सकें और उसे आगे बढ़ा सकें।"

यह शोध प्रोफेसर एलनगर और उनके तीन साथियों के बीच सहयोग का परिणाम हैभाषण से अरबी बोली की पहचान के लिए एक गहन शिक्षण मॉडल बनाने की परियोजना के हिस्से के रूप में।प्रारंभिक शोध परिणाम पहली बार 2024 में एप्लाइड कंप्यूटिंग (यूआरसी) पर 15वें वार्षिक स्नातक अनुसंधान सम्मेलन में प्रस्तुत किए गए थे।

Scientists develop machine learning tool to accurately identify Arabic dialects  in 22 Arabic-speaking countries
अंग्रेजी से बिल्कुल अलग वर्णमाला के साथ, इस भाषा में कई ध्वनियाँ हैं जो इसकी ध्वनिविज्ञान के लिए विशिष्ट हैं।इसकी ध्वनि और चरित्र का आकर्षण अनगिनत विदेशी शिक्षार्थियों को हतप्रभ कर देता है जो इसे धाराप्रवाह बोलने की इच्छा रखते हैं।श्रेय: डॉ. हला जॉर्जेस, कॉलेज ऑफ फाइन आर्ट्स एंड डिज़ाइन, शारजाह विश्वविद्यालय

"हमारे समर्पित छात्रों द्वारा विकसित, हमारे सिस्टम के पीछे की तकनीक अत्याधुनिक पद्धतियों और गहन शिक्षण तकनीकों को एकीकृत करती है। पाठ से ऑडियो सिग्नल तक इसकी कार्यक्षमता का विस्तार इसे अलग करता है, अरबी भाषा को समझने और संसाधित करने के लिए एक बहु-मोडल दृष्टिकोण प्रदान करता है," प्रोफेसरएलनागर ने कहा.

छात्र शोधकर्ता अम्र बरकत के लिए, परियोजना "भाषा प्रौद्योगिकी में एक महत्वपूर्ण अंतर को पाटती है, जिससे दुनिया भर में अरबी बोलने वालों के लिए अधिक समावेशी और सटीक संचार सक्षम होता है। उन्नत मशीन लर्निंग का लाभ उठाकर, हमने एक मॉडल बनाया है जो न केवल प्रदर्शन में उत्कृष्टता प्राप्त करता है बल्कि मार्ग भी प्रशस्त करता हैवाक् पहचान में भविष्य के नवाचारों के लिए।"

एक अन्य छात्र शोधकर्ता, अब्दुल्ला अल्दाहेरी ने परियोजना में उद्योग से व्यापक रुचि की सूचना दी, क्योंकि यह "व्यापक रूप से अपनाने की क्षमता रखता है, विभिन्न एआई-संचालित भाषा अनुप्रयोगों और सेवाओं में कई लाभ और सुधार प्रदान करता है।"

इसकी उच्च सटीकता के अलावा, लेखकों ने जो उपकरण विकसित किया है, वह वर्तमान में उपलब्ध मॉडलों के विपरीत, कम डेटा और कम्प्यूटेशनल संसाधनों की आवश्यकता है, जो इसे व्यापक उपयोग के लिए सुलभ बनाता है।लेखकों के अनुसार, यह विशेषता, उनके काम में उद्योग की रुचि के पीछे थी।उन्होंने माइक्रोसॉफ्ट जैसे तकनीकी निगमों और संयुक्त अरब अमीरात में शारजाह में सरकारी निकायों का हवाला दिया।अपने काम के प्रति विशेष रूप से उत्साहित होने के नाते।

अधिक जानकारी:अम्र बरकत एट अल, भाषण से अरबी बोली की पहचान,2024 एप्लाइड कंप्यूटिंग (यूआरसी) पर 15वां वार्षिक स्नातक अनुसंधान सम्मेलन(2024)।डीओआई: 10.1109/यूआरसी62276.2024.10604557

उद्धरण:वैज्ञानिकों ने 22 अरबी भाषी देशों में अरबी बोलियों की सटीक पहचान करने के लिए मशीन लर्निंग टूल विकसित किया है (2024, 7 अक्टूबर)7 अक्टूबर 2024 को पुनः प्राप्तhttps://techxplore.com/news/2024-10-scientists-machine-tool-accurately-arabic.html से

यह दस्तावेज कॉपीराइट के अधीन है।निजी अध्ययन या अनुसंधान के उद्देश्य से किसी भी निष्पक्ष व्यवहार के अलावा, नहींलिखित अनुमति के बिना भाग को पुन: प्रस्तुत किया जा सकता है।सामग्री केवल सूचना के प्रयोजनों के लिए प्रदान की गई है।