artificial intelligence
क्रेडिट: CC0 पब्लिक डोमेन

कृत्रिम बुद्धिमत्ता में सैन फ्रांसिस्को के दो अग्रणी खिलाड़ीचुनौती दी हैजनता Google जेमिनी और ओपनएआई के ओ1 जैसे बड़े भाषा मॉडल (एलएलएम) की क्षमताओं का परीक्षण करने में सक्षम प्रश्नों के साथ आएगी।स्केल एआई, जो डेटा के विशाल ट्रैक्ट तैयार करने में माहिर है, जिस पर एलएलएम को प्रशिक्षित किया जाता है, ने मानवता की अंतिम परीक्षा नामक पहल शुरू करने के लिए सेंटर फॉर एआई सेफ्टी (सीएआईएस) के साथ मिलकर काम किया है।

परीक्षण के लिए चुने गए शीर्ष 50 प्रश्नों के साथ आने वालों के लिए यूएस $ 5,000 (£ 3,800) के पुरस्कार की पेशकश करते हुए, स्केल और सीएआईएस का कहना है कि लक्ष्य यह परीक्षण करना है कि हम "विशेषज्ञ-स्तरीय एआई सिस्टम" प्राप्त करने के कितने करीब हैं।इतिहास में विशेषज्ञों का सबसे बड़ा, व्यापक गठबंधन।"

यह क्यों?अग्रणी एलएलएम पहले से ही बुद्धिमत्ता में कई स्थापित परीक्षणों में उत्तीर्ण हो रहे हैं,अंक शास्त्रऔरकानून, लेकिन यह निश्चित करना कठिन है कि यह कितना सार्थक है।कई मामलों में, डेटा की भारी मात्रा के कारण, जिस पर उन्हें प्रशिक्षित किया जाता है, उन्होंने उत्तर पहले ही सीख लिए होंगे, जिसमें इंटरनेट पर मौजूद हर चीज़ का एक महत्वपूर्ण प्रतिशत भी शामिल है।

डेटा इस पूरे क्षेत्र के लिए मौलिक है।इसके पीछे हैपारंपरिक कंप्यूटिंग से लेकर एआई तक, इन मशीनों को "बताने" से लेकर "दिखाने" तक कि क्या करना है।इसके लिए अच्छे प्रशिक्षण डेटासेट के साथ-साथ अच्छे परीक्षणों की भी आवश्यकता होती है।डेवलपर्स आम तौर पर उस डेटा का उपयोग करते हैं जो पहले से ही प्रशिक्षण के लिए उपयोग नहीं किया गया है, जिसे शब्दजाल में "परीक्षण डेटासेट" के रूप में जाना जाता है।

यदि एलएलएम पहले से ही बार परीक्षाओं जैसे स्थापित परीक्षणों के उत्तर पहले से सीखने में सक्षम नहीं हैं, तो वे शायद जल्द ही ऐसा करेंगे।एआई एनालिटिक्स साइटयुग का अनुमानवह 2028 उस बिंदु को चिह्नित करेगा जब एआई प्रभावी रूप से मनुष्यों द्वारा लिखी गई हर चीज़ को पढ़ लेगा।एक समान रूप से महत्वपूर्ण चुनौती यह है कि रूबिकॉन को पार करने के बाद एआई का आकलन कैसे जारी रखा जाए।

निःसंदेह, इंटरनेट का हर समय विस्तार हो रहा है, जिसमें प्रतिदिन लाखों नए आइटम जोड़े जा रहे हैं।क्या इससे इन समस्याओं का समाधान हो सकेगा?

शायद, लेकिन यह एक और घातक कठिनाई में बदल जाता है, जिसे "मॉडल पतनजैसा कि इंटरनेट पर एआई-जनित सामग्री की बाढ़ आ गई है जो भविष्य के एआई प्रशिक्षण सेटों में पुनः प्रसारित होती है, इससे एआई तेजी से खराब प्रदर्शन कर सकता है। इस समस्या को दूर करने के लिए, कई डेवलपर्स पहले से ही अपने एआई के मानव इंटरैक्शन से डेटा एकत्र कर रहे हैं, नए जोड़ रहे हैंप्रशिक्षण और परीक्षण के लिए डेटा.

कुछ विशेषज्ञों का तर्क है कि एआई को भी "अवतरित" होने की आवश्यकता है: वास्तविक दुनिया में घूमना और अपने स्वयं के अनुभव प्राप्त करना, जैसा कि मनुष्य करते हैं।यह तब तक दूर की बात लग सकती है जब तक आपको यह एहसास न हो जाए कि टेस्ला अपनी कारों के साथ वर्षों से ऐसा कर रहा है।एक अन्य अवसर मानव पहनने योग्य वस्तुएं हैं, जैसे रे-बैन द्वारा मेटा का लोकप्रिय स्मार्ट चश्मा।ये कैमरे और माइक्रोफोन से सुसज्जित हैं, औरइस्तेमाल किया जा सकता हैबड़ी मात्रा में मानव-केंद्रित वीडियो और ऑडियो डेटा एकत्र करने के लिए।

संकीर्ण परीक्षण

फिर भी भले ही ऐसे उत्पाद भविष्य में पर्याप्त प्रशिक्षण डेटा की गारंटी देते हों, फिर भी बुद्धिमत्ता को कैसे परिभाषित और मापा जाए, इसकी पहेली अभी भी बनी हुई है - विशेष रूप से(एजीआई), जिसका अर्थ है एक एआई जो बराबर या उससे आगे है.

पारंपरिक मानव बुद्धि परीक्षण लंबे समय से इसे पकड़ने में विफल रहने के कारण विवादास्पद रहे हैंबहुआयामी प्रकृतिबुद्धि का, जिसमें भाषा से लेकर गणित तक, सहानुभूति से लेकर दिशाबोध तक सब कुछ शामिल है।

एआई पर प्रयुक्त परीक्षणों के साथ भी ऐसी ही समस्या है।ऐसे कई सुस्थापित परीक्षण हैं जो पाठ को सारांशित करने, उसे समझने, चित्र बनाने जैसे कार्यों को कवर करते हैंसही अनुमानजानकारी से, मानवीय मुद्राओं और हावभावों को पहचानने और मशीन दृष्टि से।

कुछ परीक्षण सेवानिवृत्त हो रहे हैं,आमतौर पर क्योंकिएआई उनमें बहुत अच्छा कर रहे हैं, लेकिन वे इतने कार्य-विशिष्ट हैं कि बुद्धिमत्ता के बहुत ही संकीर्ण उपाय हैं।उदाहरण के लिए, शतरंज खेलने वाला AIसूखी हुई मछलीवह अब तक के सबसे ज्यादा स्कोर करने वाले मानव खिलाड़ी मैग्नस कार्लसन से काफी आगे हैंएलोरेटिंग प्रणाली.फिर भी स्टॉकफ़िश भाषा समझने जैसे अन्य कार्य करने में असमर्थ है।स्पष्ट रूप से इसकी शतरंज क्षमताओं को व्यापक बुद्धिमत्ता के साथ जोड़ना गलत होगा।

लेकिन एआई अब व्यापक बुद्धिमान व्यवहार का प्रदर्शन कर रहा है, चुनौती उनकी प्रगति की तुलना और मापने के लिए नए मानक तैयार करने की है।एक उल्लेखनीय दृष्टिकोण फ़्रांसीसी Google इंजीनियर फ़्राँस्वा चॉलेट की ओर से आया है।वह तर्क हैसच्ची बुद्धिमत्ता नई, अनदेखी स्थितियों में सीखने को अनुकूलित और सामान्यीकृत करने की क्षमता में निहित है।2019 में, वह "अमूर्त और तर्क कॉर्पस" (एआरसी) लेकर आए, जो सरल दृश्य ग्रिड के रूप में पहेलियों का एक संग्रह है, जो अमूर्त नियमों का अनुमान लगाने और लागू करने की एआई की क्षमता का परीक्षण करने के लिए डिज़ाइन किया गया है।

भिन्नपिछले बेंचमार्कजो लाखों छवियों पर एआई को प्रशिक्षित करके दृश्य वस्तु पहचान का परीक्षण करता है, प्रत्येक में निहित वस्तुओं के बारे में जानकारी होती है, एआरसी इसे पहले से न्यूनतम उदाहरण देता है।एआई को पहेली के तर्क का पता लगाना है और वह सभी संभावित उत्तरों को नहीं सीख सकता।

यद्यपि एआरसी परीक्षण करता हैविशेष रूप से कठिन नहीं हैंमनुष्यों द्वारा हल करने के लिए, 85% के स्कोर तक पहुंचने वाले पहले एआई सिस्टम को 600,000 अमेरिकी डॉलर का पुरस्कार दिया जाता है।लेखन के समय, हम उस बिंदु से बहुत दूर हैं।हाल के दो प्रमुख एलएलएम, ओपनएआई का ओ1 पूर्वावलोकन और एंथ्रोपिक का सॉनेट 3.5,दोनों स्कोरएआरसी सार्वजनिक लीडरबोर्ड पर 21% (के रूप में जाना जाता है)।एआरसी-एजीआई-पब).

एक औरहालिया प्रयासOpenAI के GPT-4o का उपयोग करना50% स्कोर किया, लेकिन कुछ हद तक विवादास्पद क्योंकि दृष्टिकोण ने परीक्षण के लिए सबसे अच्छा उत्तर देने वाले को चुनने से पहले हजारों संभावित समाधान उत्पन्न किए।फिर भी, यह अभी भी पुरस्कार को ट्रिगर करने या मानवीय प्रदर्शन से मेल खाने से बहुत दूर था90% से अधिक.

जबकि एआरसी आज एआई में वास्तविक बुद्धिमत्ता का परीक्षण करने के सबसे विश्वसनीय प्रयासों में से एक है, स्केल/सीएआईएस पहल से पता चलता है कि सम्मोहक विकल्पों की खोज जारी है।(आश्चर्यजनक रूप से, हम कुछ पुरस्कार-विजेता प्रश्नों को कभी नहीं देख पाएंगे। उन्हें इंटरनेट पर प्रकाशित नहीं किया जाएगा, यह सुनिश्चित करने के लिए कि एआई को परीक्षा पत्रों पर नज़र न पड़े।)

हमें यह जानने की जरूरत है कि मशीनें कब मानव-स्तर के तर्क के करीब पहुंच रही हैं, सभी सुरक्षा, नैतिक और नैतिक सवालों के साथ।उस समय, संभवतः हमारे सामने और भी कठिन परीक्षा प्रश्न रह जाएगा: सुपरइंटेलिजेंस के लिए परीक्षण कैसे करें।यह और भी अधिक दिमाग झुकाने वाला कार्य है जिसे हमें समझने की आवश्यकता है।

यह आलेख से पुनः प्रकाशित किया गया हैबातचीतक्रिएटिव कॉमन्स लाइसेंस के तहत।को पढ़िएमूल लेख.The Conversation

उद्धरण:एआई चुनौती मानव-स्तर की बुद्धिमत्ता का परीक्षण करने के लिए प्रश्न खोजती है (2024, 7 अक्टूबर)8 अक्टूबर 2024 को पुनः प्राप्तhttps://techxplore.com/news/2024-10-ai- human-intelligence.html से

यह दस्तावेज कॉपीराइट के अधीन है।निजी अध्ययन या अनुसंधान के उद्देश्य से किसी भी निष्पक्ष व्यवहार के अलावा, नहींलिखित अनुमति के बिना भाग को पुन: प्रस्तुत किया जा सकता है।सामग्री केवल सूचना के प्रयोजनों के लिए प्रदान की गई है।