A way to maintain plasticity indefinitely in both supervised and reinforcement learning AI systems
कॉन्टिनुअल इमेजनेट में प्लास्टिसिटी का नुकसान।श्रेय:प्रकृति(2024)।डीओआई: 10.1038/एस41586-024-07711-7

अल्बर्टा विश्वविद्यालय के एआई शोधकर्ताओं और कंप्यूटर वैज्ञानिकों की एक टीम ने पाया है कि डीप-लर्निंग सिस्टम के साथ उपयोग किए जाने वाले वर्तमान कृत्रिम नेटवर्क नए डेटा पर विस्तारित प्रशिक्षण के दौरान सीखने की क्षमता खो देते हैं।उनके मेंअध्ययन, पत्रिका में बताया गयाप्रकृति, समूह ने पर्यवेक्षित और सुदृढीकरण सीखने वाले एआई सिस्टम दोनों में प्लास्टिसिटी के साथ इन समस्याओं को दूर करने का एक तरीका खोजा, जिससे उन्हें सीखना जारी रखने की अनुमति मिली।

पिछले कुछ वर्षों में, AI सिस्टम मुख्यधारा बन गए हैं।उनमें से बड़े भाषा मॉडल (एलएलएम) हैं, जो चैटबॉट्स से प्रतीत होता है कि बुद्धिमान प्रतिक्रियाएं उत्पन्न करते हैं।लेकिन एक चीज की उन सभी में कमी है, वह है उपयोग में आने पर सीखने को जारी रखने की क्षमता, एक कमी जो उन्हें अधिक उपयोग होने के कारण अधिक सटीकता से विकसित होने से रोकती है।वे और अधिक बुद्धिमान नहीं बन पा रहे हैंनए डेटासेट पर.

शोधकर्ताओं ने अपने मूल डेटासेट पर प्रशिक्षण के बाद सीखने को जारी रखने के लिए पारंपरिक तंत्रिका नेटवर्क की क्षमता का परीक्षण किया और पाया कि जिसे वे विनाशकारी भूल के रूप में वर्णित करते हैं, जिसमें एक प्रणाली एक कार्य को पूरा करने की क्षमता खो देती है जो नई सामग्री पर प्रशिक्षित होने के बाद करने में सक्षम थी।.

वे ध्यान देते हैं कि यह परिणाम तार्किक है, यह देखते हुए कि एलएलएम को अनुक्रमिक शिक्षण प्रणाली के रूप में डिजाइन किया गया था और निश्चित पर प्रशिक्षण द्वारा सीखा जाता है.परीक्षण के दौरान, अनुसंधान टीम ने पाया कि यदि सिस्टम को कई कार्यों पर क्रमिक रूप से प्रशिक्षित किया जाता है, तो वे पूरी तरह से सीखने की क्षमता खो देते हैं - एक विशेषता जिसे वे प्लास्टिसिटी के नुकसान के रूप में वर्णित करते हैं।लेकिन उन्होंने समस्या को ठीक करने का एक तरीका भी ढूंढ लिया - नेटवर्क पर नोड्स के साथ पहले से जुड़े वजन को रीसेट करके।

साथवजन का उपयोग नोड्स द्वारा उनकी ताकत के माप के रूप में किया जाता है - वजन उनके बीच भेजे गए संकेतों के माध्यम से ताकत प्राप्त या खो सकते हैं, जो बदले में गणितीय गणना के परिणामों से प्रभावित होते हैं।जैसे-जैसे वजन बढ़ता है, उसके द्वारा दी जाने वाली जानकारी का महत्व बढ़ जाता है।

शोधकर्ताओं का सुझाव है कि पुनः आरंभ करनाप्रशिक्षण सत्रों के बीच, उन्हीं तरीकों का उपयोग करना जो सिस्टम को आरंभ करने के लिए उपयोग किए गए थे, सिस्टम में प्लास्टिसिटी बनाए रखने और अतिरिक्त प्रशिक्षण डेटासेट पर सीखना जारी रखने की अनुमति देनी चाहिए।

अधिक जानकारी:शिभांश दोहरे, गहन निरंतर सीखने में प्लास्टिसिटी का नुकसान,प्रकृति(2024)।डीओआई: 10.1038/एस41586-024-07711-7.www.nature.com/articles/s41586-024-07711-7© 2024 साइंस एक्स नेटवर्क

उद्धरण

:नई विधि एआई को अनिश्चित काल तक सीखने की अनुमति देती है (2024, 22 अगस्त)22 अगस्त 2024 को पुनः प्राप्तhttps://techxplore.com/news/2024-08-method-ai-indefinitely.html से

यह दस्तावेज कॉपीराइट के अधीन है।निजी अध्ययन या अनुसंधान के उद्देश्य से किसी भी निष्पक्ष व्यवहार के अलावा, नहींलिखित अनुमति के बिना भाग को पुन: प्रस्तुत किया जा सकता है।सामग्री केवल सूचना के प्रयोजनों के लिए प्रदान की गई है।