Copilot
श्रेय: अनस्प्लैश/CC0 पब्लिक डोमेन

जब जर्मन पत्रकार मार्टिन बर्नक्लाउ ने यह देखने के लिए माइक्रोसॉफ्ट के कोपायलट में अपना नाम और स्थान टाइप किया कि उनके लेख चैटबॉट द्वारा कैसे उठाए जाएंगे, तो उत्तरउसे भयभीत कर दिया.

कोपायलट के परिणामों ने दावा किया था कि बर्नक्लाउ एक मनोरोग संस्थान से भागा हुआ, एक दोषी बाल शोषणकर्ता और विधुरों को शिकार बनाने वाला एक ठग था।वर्षों तक, बर्नक्लाउ ने एक कोर्ट रिपोर्टर और कृत्रिम बुद्धिमत्ता (एआई) चैटबॉट के रूप में काम किया थाउस पर झूठा आरोप लगायाउन अपराधों के लिए जिन्हें उसने कवर किया था।

बेशक, बर्नक्लाउ के खिलाफ आरोप सच नहीं हैं, और जेनेरिक एआई के उदाहरण हैं।दु: स्वप्न।" ये उपयोगकर्ता द्वारा दिए गए संकेत के प्रति ग़लत या निरर्थक प्रतिक्रियाएँ हैं और हैंचिंताजनक रूप से सामान्यइस तकनीक के साथ.एआई का उपयोग करने का प्रयास करने वाले किसी भी व्यक्ति को हमेशा बहुत सावधानी से आगे बढ़ना चाहिए, क्योंकि ऐसे सिस्टम की जानकारी पर भरोसा करने से पहले मनुष्यों द्वारा सत्यापन और सत्यापन की आवश्यकता होती है।

लेकिन कोपायलट को इन भयानक और झूठे आरोपों का आभास क्यों हुआ?

कोपायलट और अन्य जेनरेटिव एआई सिस्टम जैसे चैटजीपीटी और गूगल जेमिनी हैंबड़े भाषा मॉडल(एलएलएम)।एलएलएम में अंतर्निहित सूचना प्रसंस्करण प्रणाली को "के रूप में जाना जाता हैगहन शिक्षण तंत्रिका नेटवर्क," जो अपने एल्गोरिदम को "प्रशिक्षित" करने के लिए बड़ी मात्रा में मानव भाषा का उपयोग करता है।

प्रशिक्षण डेटा से, एल्गोरिदम विभिन्न शब्दों के बीच सांख्यिकीय संबंध सीखता है और किसी पाठ में कुछ शब्दों के एक साथ दिखाई देने की कितनी संभावना है।यह एलएलएम को गणना की गई संभावनाओं के आधार पर सबसे संभावित प्रतिक्रिया की भविष्यवाणी करने की अनुमति देता है।एलएलएम के पास वास्तविक ज्ञान नहीं होता है।

कोपायलट और अन्य एलएलएम को प्रशिक्षित करने के लिए उपयोग किया जाने वाला डेटा विशाल है।जबकि कोपायलट या चैटजीपीटी कॉर्पोरा के आकार और संरचना का सटीक विवरण सार्वजनिक रूप से प्रकट नहीं किया गया है, कोपायलट में संपूर्ण चैटजीपीटी कॉर्पस और माइक्रोसॉफ्ट के स्वयं के विशिष्ट अतिरिक्त लेख शामिल हैं।ChatGPT4âChatGPT3 और 3.5â के पूर्ववर्ती "का उपयोग करने के लिए जाने जाते हैं"सैकड़ों अरबों शब्द."

कोपायलट ChatGPT4 पर आधारित है जो ChatGPT3 या 3.5 की तुलना में "बड़े" कॉर्पस का उपयोग करता है।हालाँकि हम नहीं जानते कि यह वास्तव में कितने शब्द हैं, चैटजीपीटी के विभिन्न संस्करणों के बीच का अंतर अधिक परिमाण का होता है।हम यह भी जानते हैं कि कोष में किताबें, अकादमिक पत्रिकाएँ आदि शामिल हैं.और यहीं कारण है कि कोपायलट को भ्रम हो गया कि जघन्य अपराधों के लिए बर्नक्लाउ जिम्मेदार था।

बर्नक्लाउ ने दुर्व्यवहार, हिंसा और धोखाधड़ी के आपराधिक मुकदमों पर नियमित रूप से रिपोर्ट की थी, जो राष्ट्रीय और अंतर्राष्ट्रीय समाचार पत्रों में प्रकाशित हुई थीं।उनके लेखों को संभवतः भाषा संग्रह में शामिल किया गया होगा जो मामलों की प्रकृति से संबंधित विशिष्ट शब्दों का उपयोग करता है।

चूँकि बर्नक्लाउ ने अदालत में रिपोर्टिंग करते हुए वर्षों बिताए हैं, जब कोपायलट से उसके बारे में पूछा जाता है, तो उसके नाम के साथ जुड़े सबसे संभावित शब्द उन अपराधों से संबंधित होते हैं जिन्हें उन्होंने एक रिपोर्टर के रूप में कवर किया है।यह अपनी तरह का एकमात्र मामला नहीं है और आने वाले वर्षों में हमें शायद और भी मामले देखने को मिलेंगे।

2023 में, यूएस टॉक रेडियो होस्ट मार्क वाल्टर्सOpenAI पर सफलतापूर्वक मुकदमा दायर किया, वह कंपनी जो ChatGPT का मालिक है।वाल्टर्स आर्म्ड अमेरिकन रेडियो नामक एक शो की मेजबानी करते हैं, जो अमेरिका में बंदूक स्वामित्व अधिकारों की खोज और प्रचार करता है।

एलएलएम को भ्रम हो गया था कि वाल्टर्स पर द्वितीय संशोधन फाउंडेशन (एसएएफ), एक अमेरिकी संगठन जो बंदूक अधिकारों का समर्थन करता है, द्वारा धोखाधड़ी और धन के गबन के लिए मुकदमा दायर किया गया था।ऐसा तब हुआ जब एक पत्रकार ने चैटजीपीटी से एसएएफ और वाशिंगटन राज्य अटॉर्नी जनरल से संबंधित एक वास्तविक और चल रहे कानूनी मामले के बारे में पूछताछ की।

वाल्टर्स ने कभी भी एसएएफ के लिए काम नहीं किया था और वह किसी भी तरह से एसएएफ और वाशिंगटन राज्य के बीच मामले में शामिल नहीं थे।लेकिन क्योंकि फाउंडेशन के उद्देश्य वाल्टर्स के शो के समान हैं, कोई यह निष्कर्ष निकाल सकता है कि भाषा संग्रह में पाठ्य सामग्री ने वाल्टर्स और एसएएफ के बीच एक सांख्यिकीय सहसंबंध बनाया जो मतिभ्रम का कारण बना।

सुधार

संपूर्ण भाषा कोष में इन मुद्दों को ठीक करना लगभग असंभव है।पक्षपातपूर्ण भाषा को पहचानने और हटाने के लिए कोष में शामिल प्रत्येक लेख, वाक्य और शब्द की जांच करने की आवश्यकता होगी।डेटासेट के पैमाने को देखते हुए, यह अव्यावहारिक है।

वह मतिभ्रम जो गलत तरीके से लोगों को अपराधों से जोड़ता है, जैसे कि बर्नक्लाउ के मामले में, उनका पता लगाना और उनका समाधान करना और भी कठिन है।समस्या को स्थायी रूप से ठीक करने के लिए, कोपायलट को कनेक्शन तोड़ने के लिए लेख के लेखक के रूप में बर्नक्लाउ का नाम हटाना होगा।

समस्या का समाधान करने के लिए, माइक्रोसॉफ्ट ने एक स्वचालित प्रतिक्रिया तैयार की है जो तब दी जाती है जब कोई उपयोगकर्ता बर्नक्लाउ के मामले के बारे में कोपायलट को संकेत देता है।प्रतिक्रिया में मतिभ्रम का विवरण दिया गया है और स्पष्ट किया गया है कि बर्नक्लाउ किसी भी आरोप के लिए दोषी नहीं है।माइक्रोसॉफ्ट ने कहा है कि वह अपनी प्रतिक्रियाओं को बेहतर बनाने और सकारात्मक अनुभव प्रदान करने के लिए लगातार उपयोगकर्ताओं की प्रतिक्रिया को शामिल करता है और अपडेट जारी करता है।

संभवतः इसी तरह के और भी कई उदाहरण हैं जिनकी खोज अभी बाकी है।हर अकेले मुद्दे का प्रयास करना और उसका समाधान करना अव्यावहारिक हो जाता है।मतिभ्रम अंतर्निहित एलएलएम एल्गोरिदम कैसे काम करता है इसका एक अपरिहार्य उपोत्पाद है।

इन प्रणालियों के उपयोगकर्ताओं के रूप में, हमारे लिए यह जानने का एकमात्र तरीका है कि आउटपुट भरोसेमंद है, कुछ स्थापित तरीकों का उपयोग करके इसकी वैधता के बारे में पूछताछ करना है।इसमें तीन स्वतंत्र स्रोतों को ढूंढना शामिल हो सकता है जो आउटपुट को सही मानने से पहले एलएलएम द्वारा किए गए दावों से सहमत होंमेरा अपना शोधदिखाया है।

जिन कंपनियों के पास ये उपकरण हैं, जैसे कि Microsoft या OpenAI, उनके लिए ऐसी कोई वास्तविक सक्रिय रणनीति नहीं है जिसे इन मुद्दों से बचने के लिए अपनाया जा सके।वे वास्तव में बस इतना ही कर सकते हैं कि समान मतिभ्रम की खोज पर प्रतिक्रिया करें।

यह आलेख से पुनः प्रकाशित किया गया हैबातचीतक्रिएटिव कॉमन्स लाइसेंस के तहत।को पढ़िएमूल लेख.The Conversation

उद्धरण:माइक्रोसॉफ्ट के कोपायलट एआई ने अपने द्वारा कवर किए गए अपराधों के लिए कोर्ट रिपोर्टर पर झूठा आरोप क्यों लगाया (2024, 19 सितंबर)20 सितंबर 2024 को पुनः प्राप्तhttps://techxplore.com/news/2024-09-microsoft-copilot-ai-falsely-accused.html से

यह दस्तावेज कॉपीराइट के अधीन है।निजी अध्ययन या अनुसंधान के उद्देश्य से किसी भी निष्पक्ष व्यवहार के अलावा, नहींलिखित अनुमति के बिना भाग को पुन: प्रस्तुत किया जा सकता है।सामग्री केवल सूचना के प्रयोजनों के लिए प्रदान की गई है।