generative adversarial networks
श्रेय: पिक्साबे/सीसी0 पब्लिक डोमेन

हाल के वर्षों में, कृत्रिम बुद्धिमत्ता (एआई) और गहन शिक्षण मॉडल तेजी से आगे बढ़े हैं और आसानी से सुलभ हो गए हैं।इसने लोगों को, यहां तक ​​कि बिना विशेष विशेषज्ञता वाले लोगों को भी एआई के साथ विभिन्न कार्य करने में सक्षम बनाया है।इन मॉडलों में, जेनरेटिव एडवरसैरियल नेटवर्क (जीएएन) प्रशिक्षण डेटा के समान विशेषताओं के साथ नए डेटा इंस्टेंस उत्पन्न करने में अपने उत्कृष्ट प्रदर्शन के लिए खड़े हैं, जो उन्हें छवियों, संगीत और पाठ उत्पन्न करने के लिए विशेष रूप से प्रभावी बनाते हैं।

GAN दो से मिलकर बनता है, अर्थात्, एक जनरेटर जो यादृच्छिक शोर से शुरू करके नए डेटा वितरण बनाता है, और एक विभेदक जो जांचता है कि उत्पन्न डेटा वितरण "वास्तविक" (प्रशिक्षण डेटा से मेल खाता है) या "नकली" है।जैसे-जैसे प्रशिक्षण आगे बढ़ता है, जनरेटर यथार्थवादी वितरण उत्पन्न करने में सुधार करता है, और विवेचक उत्पन्न डेटा को नकली के रूप में पहचानने में सुधार करता है।

नकली और वास्तविक वितरण के बीच अंतर को मापने के लिए GAN एक हानि फ़ंक्शन का उपयोग करते हैं।हालाँकि, यह दृष्टिकोण धीरे-धीरे लुप्त होने और अस्थिर सीखने जैसे मुद्दों का कारण बन सकता है, जो सीधे स्थिरता और दक्षता को प्रभावित करता है।संरचनात्मक संशोधनों और हानि फ़ंक्शन समायोजन सहित जीएएन को बेहतर बनाने में काफी प्रगति के बावजूद, ग्रेडिएंट गायब होने और मोड पतन जैसी चुनौतियां, जहां जनरेटर सीमित विविधता का उत्पादन करता है, उनकी प्रयोज्यता को सीमित करना जारी रखता है।

इन मुद्दों को संबोधित करने के लिए, कोरिया गणराज्य के चुंग-आंग विश्वविद्यालय में इलेक्ट्रिकल और इलेक्ट्रॉनिक्स इंजीनियरिंग स्कूल के सहायक प्रोफेसर मिनह्योक ली के नेतृत्व में शोधकर्ताओं की एक टीम ने एक नई रणनीति विकसित की।"एक कलाकार को परिदृश्य चित्रित करना सिखाने की कल्पना करें। लगातार मार्गदर्शन उन्हें समान दृश्य उत्पन्न करने के लिए प्रेरित कर सकता है, एक घटना जिसे मशीन लर्निंग में मोड पतन कहा जाता है। इसे रोकने के लिए, हमारा पीएमएफ-जीएएन मॉडल विवेचक की क्षमताओं को परिष्कृत करता है, अत्यधिक समान आउटपुट उत्पन्न करने के लिए जनरेटर को दंडित करता है।, जिससे विविधता को बढ़ावा मिलता है," डॉ. ली बताते हैं।

उनके निष्कर्ष जर्नल में उपलब्ध कराए गए थेएप्लाइड सॉफ्ट कंप्यूटिंगअक्टूबर 2024 में.

पीएमएफ-जीएएन ढांचा दो प्रमुख संवर्द्धन प्रस्तुत करता है।सबसे पहले, यह विवेचक की क्षमता को परिष्कृत करने के लिए कर्नेल अनुकूलन को नियोजित करता है, जो मॉडल पतन और ग्रेडिएंट गायब होने के मुद्दों को संबोधित करने में एक महत्वपूर्ण लाभ प्रदान करता है।कर्नेल गणितीय कार्य हैं जो डेटा को उच्च आयामी स्थान में परिवर्तित करते हैं, जिससे जटिल डेटा में भी पैटर्न का पता लगाना आसान हो जाता है।विवेचक के आउटपुट को कर्नेल फ़ंक्शंस के माध्यम से संसाधित किया जाता है, जिससे कर्नेल घनत्व अनुमान (KDE) तैयार होता है।

दूसरा, पीएमएफ-जीएएन केडीई आउटपुट पर हिस्टोग्राम ट्रांसफॉर्मेशन नामक एक गणितीय तकनीक लागू करता है, जिससे परिणामों का अधिक सहज विश्लेषण संभव हो पाता है।प्रशिक्षण के दौरान, मॉडल कर्नेल-हिस्टोग्राम रूपांतरित नकली और वास्तविक वितरण के बीच अंतर को कम करता है, जिसे पीएमएफ दूरी कहा जाता है।

विशेष रूप से, यह दृष्टिकोण विभिन्न गणितीय दूरी फ़ंक्शंस और कर्नेल फ़ंक्शंस के उपयोग की अनुमति देता है।यह लचीलापन पीएमएफ-जीएएन को विभिन्न डेटा प्रकारों और सीखने के उद्देश्यों के लिए अनुकूलित करने की अनुमति देता है।इसके अतिरिक्त, बेहतर प्रदर्शन के लिए PMF-GAN को मौजूदा बेहतर GAN आर्किटेक्चर में एकीकृत किया जा सकता है।

प्रयोगों में, पीएमएफ-जीएएन ने कई डेटासेट में दृश्य-गुणवत्ता और मूल्यांकन मेट्रिक्स के मामले में कई बेसलाइन मॉडल से बेहतर प्रदर्शन किया।एनिमल फेसएचक्यू डेटासेट के लिए, इसने पारंपरिक WGAN-GP मॉडल की तुलना में इंसेप्शन स्कोर में 56.9% और फ़्रेचेट इंसेप्शन डिस्टेंस (FID) स्कोर में 61.5% का सुधार दिखाया।

"लचीलापन औरपीएमएफ-जीएएन द्वारा प्रस्तुत विभिन्न तकनीकी और डिजिटल क्षेत्रों में सिंथेटिक डेटा उत्पन्न करने की नई संभावनाएं खोलता है।में, इससे अधिक स्थिर और विविध छवि निर्माण को बढ़ावा मिलेगा।यह फिल्मों, वीडियो गेम और आभासी वास्तविकता अनुभवों के लिए अधिक यथार्थवादी और विविध कंप्यूटर-जनित दृश्यों को भी सक्षम बनाता है,'' डॉ. ली टिप्पणी करते हैं।

"जैसे-जैसे एआई-जनित सामग्री हमारे दैनिक जीवन में अधिक प्रचलित होती जा रही है, हमारी पद्धति सामग्री की गुणवत्ता और विविधता में सुधार करती है, और यह सुनिश्चित करेगी कि एआई मानव रचनात्मकता और समस्या-समाधान के लिए एक मूल्यवान उपकरण बना रहे।"

अधिक जानकारी:जांगवोन एसईओ एट अल, कर्नेल-हिस्टोग्राम परिवर्तन और संभाव्यता द्रव्यमान फ़ंक्शन दूरी के साथ स्थिर जीएएन मॉडल प्रशिक्षण,एप्लाइड सॉफ्ट कंप्यूटिंग(2024)।डीओआई: 10.1016/j.asoc.2024.112003

द्वारा उपलब्ध कराया गयाचुंग आंग विश्वविद्यालय

उद्धरण:शोधकर्ताओं ने एक नया जेनेरिक प्रतिकूल नेटवर्क मॉडल विकसित किया है जो प्रशिक्षण और प्रदर्शन को स्थिर करता है (2024, 16 अक्टूबर)16 अक्टूबर 2024 को पुनः प्राप्तhttps://techxplore.com/news/2024-10-generative-adversarial-networks-stability.html से

यह दस्तावेज कॉपीराइट के अधीन है।निजी अध्ययन या अनुसंधान के उद्देश्य से किसी भी निष्पक्ष व्यवहार के अलावा, नहींलिखित अनुमति के बिना भाग को पुन: प्रस्तुत किया जा सकता है।सामग्री केवल सूचना के प्रयोजनों के लिए प्रदान की गई है।