Exploring the fundamental reasoning abilities of LLMs
तुलनात्मक प्रयोग जो विभिन्न संदर्भों में एक सुसंगत कार्य का उपयोग करते हैं, प्रत्येक या तो निगमनात्मक (यानी, विधियां (ए) और (बी)) या आगमनात्मक तर्क (यानी, विधियां (सी) और (डी)) पर जोर देते हैं।श्रेय: चेंग एट अल.

तर्क, वह प्रक्रिया जिसके माध्यम से मनुष्य विशिष्ट निष्कर्ष निकालने या समस्याओं को हल करने के लिए जानकारी को मानसिक रूप से संसाधित करता है, को दो मुख्य श्रेणियों में विभाजित किया जा सकता है।पहले प्रकार का तर्क, जिसे निगमनात्मक तर्क के रूप में जाना जाता है, में एक सामान्य नियम या आधार से शुरुआत करना और फिर विशिष्ट मामलों के बारे में निष्कर्ष निकालने के लिए इस नियम का उपयोग करना शामिल है।

उदाहरण के लिए, इसका मतलब यह हो सकता है कि इस आधार पर कि "सभी कुत्तों के कान होते हैं" और "चिहुआहुआ कुत्ते हैं," यह निष्कर्ष निकालना कि "चिहुआहुआ के कान होते हैं।"

तर्क का दूसरा व्यापक रूप से उपयोग किया जाने वाला रूप आगमनात्मक तर्क है, जिसमें विशिष्ट टिप्पणियों के आधार पर सामान्यीकरण (यानी, सामान्य नियम तैयार करना) शामिल होता है।उदाहरण के लिए, इसका मतलब यह हो सकता है कि सभी हंस सफेद हैं क्योंकि हमने अपने जीवनकाल में जितने हंसों का सामना किया वे सभी सफेद थे।

पिछले कई शोध अध्ययनों ने जांच की है कि मनुष्य अपने रोजमर्रा के जीवन में निगमनात्मक और आगमनात्मक तर्क का उपयोग कैसे करते हैं।फिर भी किस हद तक(एआई) सिस्टम इन विभिन्न तर्क रणनीतियों को नियोजित करते हैं, अब तक, शायद ही कभी खोजा गया हो।

अमेज़ॅन और कैलिफोर्निया विश्वविद्यालय लॉस एंजिल्स की एक शोध टीम ने हाल ही में बड़े भाषा मॉडल (एलएलएम), बड़े एआई सिस्टम की मौलिक तर्क क्षमताओं की खोज करते हुए एक अध्ययन किया, जो मानव भाषाओं में ग्रंथों को संसाधित, उत्पन्न और अनुकूलित कर सकता है।उनकानिष्कर्ष, पर पोस्ट किया गयाarXivप्रीप्रिंट सर्वर, सुझाव देता है कि इन मॉडलों में मजबूत आगमनात्मक तर्क क्षमताएं हैं, जबकि वे अक्सर खराब निगमनात्मक तर्क प्रदर्शित करते हैं।

पेपर का उद्देश्य एलएलएम रीजनिंग में कमियों को बेहतर ढंग से समझना और यह पहचानना था कि मानक से भटकने वाले "प्रतितथ्यात्मक" रीजनिंग कार्यों के लिए एलएलएम का प्रदर्शन कम क्यों है।

Exploring the fundamental reasoning abilities of LLMs
आगमनात्मक तर्क के लिए टीम के ढांचे सॉल्वर लर्नर का अवलोकन।सॉल्वरलर्नर अनुमान के लिए इनपुट-आउटपुट मैपिंग फ़ंक्शंस के सीखने को इन फ़ंक्शंस के अनुप्रयोग से अलग करने के लिए दो-चरणीय प्रक्रिया का पालन करता है।विशेष रूप से, एलएलएम-आधारित निगमनात्मक तर्क को शामिल करने से बचने के लिए, कार्यों को बाहरी कोड दुभाषियों के माध्यम से लागू किया जाता है।श्रेय: चेंग एट अल.

विभिन्न पिछले अध्ययनों ने बुनियादी तर्क कार्यों के हिस्से के रूप में निर्देशों का पालन करने की उनकी क्षमता का परीक्षण करके एलएलएम के निगमनात्मक तर्क कौशल का मूल्यांकन किया।फिर भी उनके आगमनात्मक तर्क (यानी, अतीत में संसाधित की गई जानकारी के आधार पर सामान्य भविष्यवाणियां करने की उनकी क्षमता) की बारीकी से जांच नहीं की गई थी।

आगमनात्मक तर्क को निगमनात्मक तर्क से स्पष्ट रूप से अलग करने के लिए, शोधकर्ताओं ने एक नया मॉडल पेश किया, जिसे सॉल्वर लर्नर कहा जाता है।मॉडल सीखने के नियमों की प्रक्रिया को विशिष्ट मामलों में लागू करने की प्रक्रिया को अलग करने के लिए दो-चरणीय दृष्टिकोण का उपयोग करता है।विशेष रूप से, अमेज़ॅन के प्रवक्ता के अनुसार, एलएलएम की निगमनात्मक तर्क क्षमता पर भरोसा करने से बचने के लिए, नियमों को कोड दुभाषियों जैसे बाहरी उपकरणों के माध्यम से लागू किया जाता है।

उनके द्वारा विकसित सॉल्वरलर्नर फ्रेमवर्क का उपयोग करते हुए, अमेज़ॅन की टीम ने विशिष्ट उदाहरणों का उपयोग करके इनपुट डेटा बिंदुओं को उनके संबंधित आउटपुट पर मैप करने वाले कार्यों को सीखने के लिए एलएलएम को प्रशिक्षित किया।इसके बदले में उन्हें यह जांचने की अनुमति मिली कि मॉडल उन्हें प्रदान किए गए उदाहरणों के आधार पर किस हद तक सामान्य नियम सीख सकते हैं।

शोधकर्ताओं ने पाया कि एलएलएम में निगमनात्मक की तुलना में आगमनात्मक तर्क क्षमता अधिक मजबूत होती है, विशेष रूप से "प्रतितथ्यात्मक" परिदृश्यों वाले कार्यों के लिए जो आदर्श से भटक जाते हैं।ये निष्कर्ष लोगों को यह बेहतर ढंग से समझने में मदद कर सकते हैं कि एलएलएम का उपयोग कब और कैसे करना है।उदाहरण के लिए, चैटबॉट्स जैसे एजेंट सिस्टम डिजाइन करते समय, एलएलएम की मजबूत आगमनात्मक क्षमताओं का लाभ उठाना बेहतर हो सकता है।

कुल मिलाकर, शोधकर्ताओं ने पाया कि एलएलएम ने आगमनात्मक तर्क कार्यों पर उल्लेखनीय रूप से अच्छा प्रदर्शन किया, फिर भी उनमें अक्सर निगमनात्मक तर्क क्षमताओं का अभाव था।उनका निगमनात्मक तर्क उन परिदृश्यों में विशेष रूप से खराब दिखाई दिया जो काल्पनिक मान्यताओं पर आधारित थे या आदर्श से भटक गए थे।

इस अध्ययन के हिस्से के रूप में एकत्र किए गए परिणाम एआई डेवलपर्स को विशिष्ट कार्यों से निपटने के लिए एलएलएम की मजबूत आगमनात्मक तर्क क्षमताओं का लाभ उठाने के लिए प्रेरित कर सकते हैं।इसके अलावा, वे एलएलएम तर्क प्रक्रियाओं को समझने के उद्देश्य से आगे के प्रयासों का मार्ग प्रशस्त कर सकते हैं।

अमेज़ॅन के प्रवक्ता के अनुसार, इस क्षेत्र में भविष्य का शोध यह पता लगाने पर केंद्रित हो सकता है कि जानकारी को संपीड़ित करने की एलएलएम की क्षमता इसकी मजबूत आगमनात्मक क्षमताओं से कैसे संबंधित है।यह परिप्रेक्ष्य एलएलएम की आगमनात्मक तर्क क्षमताओं में और सुधार कर सकता है।

अधिक जानकारी:केवेई चेंग एट अल, आगमनात्मक या निगमनात्मक?एलएलएम की मौलिक तर्क क्षमताओं पर पुनर्विचार,arXiv(2024)।डीओआई: 10.48550/arxiv.2408.00114

जर्नल जानकारी: arXiv

© 2024 साइंस एक्स नेटवर्क

उद्धरण:एलएलएम की मौलिक तर्क क्षमताओं की खोज (2024, 31 अगस्त)2 सितंबर 2024 को पुनः प्राप्तhttps://techxplore.com/news/2024-08-exploring-fundamental-ability-llms.html से

यह दस्तावेज कॉपीराइट के अधीन है।निजी अध्ययन या अनुसंधान के उद्देश्य से किसी भी निष्पक्ष व्यवहार के अलावा, नहींलिखित अनुमति के बिना भाग को पुन: प्रस्तुत किया जा सकता है।सामग्री केवल सूचना के प्रयोजनों के लिए प्रदान की गई है।