Researchers improve method to discover anomalies in data
विसंगति का पता लगाने से कई चुनौतियाँ उत्पन्न होती हैं जो पारंपरिक AI समस्याओं में नहीं देखी जाती हैं।श्रेय: अनस्प्लैश पर ट्रेवर वेन्नॉय

वाशिंगटन स्टेट यूनिवर्सिटी के शोधकर्ताओं द्वारा विकसित एक एल्गोरिदम वर्तमान विसंगति-पहचान सॉफ़्टवेयर की तुलना में डेटा विसंगतियों को बेहतर ढंग से ढूंढ सकता है, जिसमें स्ट्रीमिंग डेटा भी शामिल है।

काम,सूचना दीमेंआर्टिफिशियल इंटेलिजेंस रिसर्च जर्नल, कृत्रिम बुद्धिमत्ता (एआई) विधियों में मौलिक योगदान देता है जिनके कई डोमेन में अनुप्रयोग हो सकते हैं जिन्हें बड़ी मात्रा में डेटा में विसंगतियों को तुरंत ढूंढने की आवश्यकता होती है, जैसे साइबर सुरक्षा, पावर ग्रिड प्रबंधन, गलत सूचना और चिकित्सा निदान।

विसंगतियों को बेहतर ढंग से ढूंढने में सक्षम होने का मतलब धोखाधड़ी, चिकित्सा सेटिंग में बीमारी, या महत्वपूर्ण असामान्य जानकारी, जैसे कि क्षुद्रग्रह, जिसके सिग्नल अन्य सितारों से प्रकाश के साथ ओवरलैप होते हैं, को अधिक आसानी से ढूंढने में सक्षम होना होगा।

"यह कार्य इस बात पर प्रगति प्रस्तुत करता है कि एआई और मनुष्य कैसे सहक्रियात्मक रूप से समाधान के लिए मिलकर काम कर सकते हैंखोज की समस्याएँ,'' जना डोप्पा, हुई-रोजर्स एंडॉएड चेयर एसोसिएट प्रोफेसर ऑफ कंप्यूटर साइंस ने कहा, जिन्होंने काम की निगरानी की।

"इस सभी जनरेटिव एआई तकनीक के साथ, बहुत सारा डेटा है जिसमें गलत सूचना शामिल है, और यदि आप चाहते हैं कि मनुष्य इस सब पर गौर करें, तो यह असंभव है क्योंकि यह बहुत बड़ा है। यदि आपके पास सीमित मानव संसाधन हैं, और आप गलत सूचना जैसी किसी चीज़ का पता लगाना चाहते हैंजल्दी से, आप ऐसे एल्गोरिदम चाहते हैं जो प्राथमिकता दें कि किन वस्तुओं को लेबल किया जाना चाहिए।"

विसंगति का पता लगाने से कई चुनौतियाँ उत्पन्न होती हैं जो पारंपरिक AI समस्याओं में नहीं देखी जाती हैं।सामान्य डेटा की तुलना में विसंगतियों की संख्या बहुत कम है - आमतौर पर 2% से कम।इसके अलावा, विसंगति और सामान्य डेटा के बीच कोई बड़ा अंतर नहीं हो सकता है।

डोप्पा ने कहा, "तो, यह भूसे के बड़े ढेर में सुई ढूंढने जैसी समस्या है।""और आप बहुत सारे डोमेन में यह भी नहीं जानते कि कौन सी सुई देखनी है।"

एक और समस्या यह है कि बड़ी मात्रा में डेटा के साथ, एआई को कई बार लोगों की जांच के लिए बहुत सारी उम्मीदवार विसंगतियां मिल जाएंगी।

"जब भी आपके पास ये होंपोस्टडॉक्टोरल शोधकर्ता और प्रमुख लेखक शुभोमोय दास ने कहा, आप इंसानों का बहुत सारा समय बर्बाद कर रहे हैं, जिसे हम कम करना चाहते हैं। हम विसंगति डिटेक्टर को अनुकूलित करने के लिए मानव से न्यूनतम प्रतिक्रिया का उपयोग कैसे कर सकते हैं ताकि झूठी सकारात्मकता खत्म हो जाए।समय, और हम अधिक से अधिक विविध विसंगतियों की खोज करते हैं?"

काम के हिस्से के रूप में, शोधकर्ताओं ने नए सैद्धांतिक और प्रदान किएक्यों कंप्यूटर मॉडलों के एक समूह ने विसंगति की खोज के लिए अच्छा काम किया।उन्होंने पाया कि चरण-दर-चरण प्रतिक्रिया की थोड़ी मात्रा के साथ, एआई एल्गोरिदम बहुत बेहतर सीख सकता है और उस प्रणाली की तुलना में कई विविध विसंगतियों की खोज कर सकता है जहां कोई प्रतिक्रिया नहीं थी।यह समझने के लिए कि एआई ने उन्हें लेबलिंग के लिए क्यों चुना, उम्मीदवार की विसंगतियों के संबंध में स्पष्टीकरण की आवश्यकता है।

"व्याख्यात्मकता या व्याख्यात्मकता की कुछ धारणा महत्वपूर्ण है," पीएच.डी. ने कहा।छात्र और सह-लेखक रकीबुल इस्लाम।"हमने पाया कि मौजूदा साहित्य में यह काफी हद तक गायब था।"

शोधकर्ताओं ने अपने नए निष्कर्षों का उपयोग एक एल्गोरिदम विकसित करने के लिए किया जो बैचों में विसंगतियों को देखता है, जिससे विभिन्न प्रकार की विसंगतियों की खोज करने की क्षमता में सुधार हुआ।इसलिए, असामान्य क्रेडिट कार्ड डेटा के मामले में, एल्गोरिदम विभिन्न प्रकार के असामान्य व्यवहार का पता लगाता है, जैसे कि किसी व्यक्ति की अजीब तरह से महंगी खरीदारी और/या अजीब स्थान पर की गई खरीदारी।

वर्तमान एआई मॉडल के विपरीत, शोधकर्ताओं द्वारा विकसित एल्गोरिदम स्ट्रीमिंग डेटा को संभालने में सक्षम था, जो कई वास्तविक दुनिया के अनुप्रयोगों में आम है।उनकाएल्गोरिदमडोप्पा ने कहा, "जब डेटा एक स्ट्रीम में आ रहा है तो विसंगतियों की खोज की समस्या का कम अध्ययन किया गया है।"

शोधकर्ताओं के कंप्यूटर कोड और डेटा सार्वजनिक रूप से उपलब्ध हैं, और अब वे अपनी सटीकता और प्रयोज्यता को मापने के लिए अपने एल्गोरिदम को वास्तविक दुनिया प्रणालियों में तैनात करने की योजना बना रहे हैं।

अधिक जानकारी:

शुभोमोय दास और अन्य, विसंगति खोज के लिए वृक्ष-आधारित संयोजनों की प्रभावशीलता: अंतर्दृष्टि, बैच और स्ट्रीमिंग सक्रिय शिक्षण,आर्टिफिशियल इंटेलिजेंस रिसर्च जर्नल(2024)।डीओआई: 10.1613/जेयर.1.14741उद्धरण:

डेटा में विसंगतियों की खोज के लिए नया एल्गोरिदम वर्तमान सॉफ़्टवेयर से बेहतर प्रदर्शन करता है (2024, 26 जुलाई)26 जुलाई 2024 को पुनः प्राप्तhttps://techxplore.com/news/2024-07-algorithm-anomalies-outperforms-current-software.html से

यह दस्तावेज कॉपीराइट के अधीन है।निजी अध्ययन या अनुसंधान के उद्देश्य से किसी भी निष्पक्ष व्यवहार के अलावा, नहींलिखित अनुमति के बिना भाग को पुन: प्रस्तुत किया जा सकता है।सामग्री केवल सूचना के प्रयोजनों के लिए प्रदान की गई है।