Distinguishing Real Sounds from Deepfakes
एमएलपी के नेटवर्क आर्किटेक्चर के प्रतिनिधित्व के साथ डीपफेक का पता लगाने के प्रयोगों में उपयोग की जाने वाली पाइपलाइन का अवलोकन।डिम का मान प्रयुक्त एंबेडिंग विधि पर निर्भर करता है।श्रेय:डीपफेक पर्यावरणीय ऑडियो का पता लगाना(2024)।

कृत्रिम बुद्धिमत्ता द्वारा उत्पन्न डीपफेक वीडियो को गलत के रूप में पहचानना कठिन होता जा रहा है, एक चुनौती जो आगामी राष्ट्रपति चुनाव के परिणामों को महत्वपूर्ण रूप से प्रभावित कर सकती है।

लॉरी हेलर, कार्नेगी मेलन विश्वविद्यालय के मनोविज्ञान के प्रोफेसर, ने पहले गहरे तंत्रिका नेटवर्क द्वारा की गई त्रुटियों का विश्लेषण करने के लिए इकोले सेंट्रल नैनटेस के हफ्सा ओउजदी, औसामा हैडर, मोदन टेलर और मैथ्यू लैग्रेंज के साथ सहयोग किया।शोध दल ने पर्यावरणीय ध्वनियों को स्वचालित रूप से वास्तविक या एआई-जनित के रूप में वर्गीकृत करने के लिए विकसित किया।

शोध दल ने अपने निष्कर्षों को पेपर में प्रकाशित किया "डीपफेक पर्यावरणीय ऑडियो का पता लगाना," जिसे उन्होंने 27 अगस्त को प्रस्तुत किया32वां यूरोपीय सिग्नल प्रोसेसिंग सम्मेलन(EUSIPCO 2024) ल्योन, फ्रांस में।

पर्यावरणीय ध्वनियों को रिकॉर्डिंग के पृष्ठभूमि शोर के रूप में परिभाषित किया गया है - भाषण और संगीत को छोड़कर कोई भी ध्वनि।इन आवाज़ों में कार के गुज़रने या दूसरे कमरे का दरवाज़ा बंद होने जैसी चीज़ें शामिल हो सकती हैं।

अनुसंधान दल ने जो डिटेक्टर विकसित किया है वह वर्तमान में पर्यावरणीय ध्वनियों की सात श्रेणियों की पहचान करने तक सीमित है।पर्यावरण ध्वनि डिटेक्टर के परीक्षण में, इकोले सेंट्रल नैनटेस टीम ने इसे अविश्वसनीय रूप से सटीक पाया, जिसके परिणामस्वरूप लगभग 6,000 ध्वनियों में से लगभग 100 त्रुटियां हुईं।

विश्लेषण से पता चला कि डिटेक्टर दो प्रकार की त्रुटियां कर सकता है।डिटेक्टर या तो एआई-जनित ध्वनि को वास्तविक के रूप में लेबल कर सकता है, या वास्तविक ध्वनि को एआई-जनित के रूप में लेबल कर सकता है।हेलर के अध्ययन का उद्देश्य यह निर्धारित करना था कि क्या कोई मानव उन श्रव्य सुरागों को ढूंढ सकता है जो डिटेक्टर से छूट गए हैं, जिससे वे कुछ छूटी हुई वास्तविक ध्वनियों को वास्तविक मान सकते हैं, या कुछ छूटी हुई एआई-जनित ध्वनियों को नकली मान सकते हैं।

हेलर के अध्ययन में 20 शामिल थे, जिन्होंने ध्वनियों के उन्हीं सेटों को सुना जिन्हें डिटेक्टर ने गलत तरीके से पहचाना।डिटेक्टर की तरह, प्रतिभागियों को यह पहचानने का काम सौंपा गया था कि उन्होंने जो ध्वनियाँ सुनीं वे वास्तविक थीं और कौन सी एआई-जनित थीं।

अध्ययन में उपयोग की गई वास्तविक पर्यावरणीय ध्वनियाँ सार्वजनिक रूप से उपलब्ध डेटाबेस से ली गई थीं।एआई-जनित पर्यावरणीय ध्वनियाँ एक प्रतियोगिता के विजेताओं से ली गई थीं, जिसमें आवेदकों ने एआई का उपयोग करके विकसित ध्वनियाँ प्रस्तुत की थीं, जिनमें जीतने वाली ध्वनियाँ सबसे सटीक या वास्तविक थीं।

डिटेक्टर द्वारा पहचाने गए नकली ध्वनियों के वास्तविक होने के लिए मानव अध्ययन के परिणाम अनिर्णायक थे।मनुष्य लगभग 50% समय सटीक थे, यह दर्शाता है कि वे ध्वनियों की नकलीपन के प्रति संवेदनशील नहीं थे जिसने डिटेक्टर को मूर्ख बना दिया।हो सकता है कि प्रतिभागी उन ध्वनियों को निश्चित रूप से वर्गीकृत करने में सक्षम न हों जो वे सुन रहे थे, जिसके परिणाम विश्वसनीय उत्तरों के बजाय आकस्मिक विकल्पों को दर्शाते हैं।

हालाँकि, डिटेक्टर द्वारा आंकी गई वास्तविक ध्वनियाँ नकली थीं, मनुष्य लगभग 71% समय सही थे और डिटेक्टर की तुलना में अधिक सटीक थे।इस आँकड़े से पता चलता है कि उत्तर संयोग का परिणाम नहीं थे, बल्कि प्रतिभागी द्वारा वास्तविक ध्वनियों का निश्चित और सही वर्गीकरण था।

हेलर ने निष्कर्ष निकाला कि इन परिणामों का अर्थ यह है कि इन वास्तविक पर्यावरणीय ध्वनियों में किसी प्रकार का संकेत हो सकता है जिसे मनुष्य पहचानने में सक्षम हैं, लेकिन डिटेक्टर पहचानने में विफल रहता है।यदि शोधकर्ता इस परिकल्पित संकेत की पहचान कर सकते हैं, तो उनकी सटीकता बढ़ाने के लिए एआई ध्वनि डिटेक्टरों में सुधार किया जा सकता है।

पर्यावरणीय ध्वनि डिटेक्टर और हेलर के परिणाम अधिक जटिल एआई डिटेक्शन टूल के विकास को जन्म दे सकते हैं।पहले एआई ध्वनि डिटेक्टर केवल भाषण की पहचान करने के लिए बनाए गए थे, लेकिन पर्यावरण के साथआवाज़एआई-संचालित डीपफेक प्रौद्योगिकियों को ध्यान में रखते हुए एआई डिटेक्शन टूल को बेहतर बनाने के लिए आगे का शोध महत्वपूर्ण है जो अपनी क्षमताओं में तेजी से आगे बढ़ रहे हैं।

हेलर ने कहा, "हम एक ऐसे बिंदु पर हैं जहां जनता उस क्षमता को कम आंकने जा रही है, और यह तेजी से बेहतर हो रही है।"

"सबसे बुरी स्थिति उस समाज में होगी जहां एआई इतना उन्नत है कि मनुष्य यह बताने में सक्षम नहीं हैं कि क्या वास्तविक है या क्या कृत्रिम है। हम ऐसा होने से पहले तैयार रहना चाहते हैं।"

हेलर ने उन नीतियों को लागू करने के महत्व का भी उल्लेख किया जो एआई-संचालित मीडिया घटकों को विनियमित कर सकती हैं।

उन्होंने सुझाव दिया, "एआई का उपयोग करके उत्पन्न हर चीज पर एक झंडा होना चाहिए।"

अधिक जानकारी:ओउजदी, एच. डीपफेक पर्यावरण ऑडियो का पता लगाना,eurasip.org/Proceedings/Eusipc ⦠024/pdfs/0000196.pdf

उद्धरण:डीपफेक से वास्तविक ध्वनियों को अलग करना (2024, 16 सितंबर)16 सितंबर 2024 को पुनः प्राप्तhttps://techxplore.com/news/2024-09-distinguishing-real-depfakes.html से

यह दस्तावेज कॉपीराइट के अधीन है।निजी अध्ययन या अनुसंधान के उद्देश्य से किसी भी निष्पक्ष व्यवहार के अलावा, नहींलिखित अनुमति के बिना भाग को पुन: प्रस्तुत किया जा सकता है।सामग्री केवल सूचना के प्रयोजनों के लिए प्रदान की गई है।