google
क्रेडिट: CC0 पब्लिक डोमेन

Google के डीपमाइंड में कृत्रिम बुद्धिमत्ता विशेषज्ञों की एक टीम ने SAFE नामक एक AI-आधारित प्रणाली विकसित की है जिसका उपयोग चैटजीपीटी जैसे एलएलएम के परिणामों की तथ्य जांच करने के लिए किया जा सकता है।समूह ने एक प्रकाशित किया हैकागज़नए एआई सिस्टम का वर्णन करते हुए और इसने कितना अच्छा प्रदर्शन कियाarXivप्रीप्रिंट सर्वर.

चैटजीपीटी जैसे बड़े भाषा मॉडल पिछले कुछ वर्षों में काफी चर्चा में रहे हैं - वे पेपर लिख सकते हैं, सवालों के जवाब दे सकते हैं और यहां तक ​​कि गणित की समस्याएं भी हल कर सकते हैं।लेकिन वे एक बड़ी समस्या से पीड़ित हैं: सटीकता।यह सुनिश्चित करने के लिए कि परिणाम सही हैं, एलएलएम द्वारा प्राप्त प्रत्येक परिणाम को मैन्युअल रूप से जांचा जाना चाहिए, एक विशेषता जो उनके मूल्य को बहुत कम कर देती है।

इस नए प्रयास में, डीपमाइंड के शोधकर्ताओं ने एक एआई एप्लिकेशन बनाया जो एलएलएम द्वारा दिए गए उत्तरों के परिणामों की जांच कर सकता है और त्रुटियों को स्वचालित रूप से इंगित कर सकता है।

एलएलएम के मानव उपयोगकर्ताओं द्वारा तथ्यों की जांच करने के मुख्य तरीकों में से एक एआई प्रतिक्रियाओं की जांच करना हैजैसे कि सत्यापन के लिए उचित स्रोत खोजने के लिए Google।डीपमाइंड की टीम ने भी यही दृष्टिकोण अपनाया।उन्होंने एक एलएलएम बनाया जो मूल एलएलएम द्वारा प्रदान किए गए उत्तर में दावों या तथ्यों को तोड़ता है और फिर उन साइटों को ढूंढने के लिए Google खोज का उपयोग करता है जिनका उपयोग सत्यापन के लिए किया जा सकता है और फिर सटीकता निर्धारित करने के लिए दोनों उत्तरों की तुलना की जाती है।वे अपनी नई प्रणाली को सर्च-ऑगमेंटेड फैक्टुअलिटी इवैल्यूएटर (SAFE) कहते हैं।

अपने सिस्टम का परीक्षण करने के लिए, अनुसंधान टीम ने इसका उपयोग कई एलएलएम द्वारा दिए गए उत्तरों में निहित लगभग 16,000 तथ्यों को सत्यापित करने के लिए किया।उन्होंने अपने परिणामों की तुलना मानव (क्राउडसोर्स्ड) तथ्य-जाँचकर्ताओं से की और पाया कि SAFE 72% बार मनुष्यों के निष्कर्षों से मेल खाता है।SAFE और मानव चेकर्स के बीच असहमति का परीक्षण करते समय, शोधकर्ताओं ने SAFE को 76% मामलों में सही पाया।

डीपमाइंड की टीम ने इसे बनाया हैसुरक्षित के लिए कोडयह किसी भी व्यक्ति द्वारा उपयोग के लिए उपलब्ध है जो ओपन-सोर्स साइट GitHub पर पोस्ट करके इसकी क्षमताओं का लाभ उठाना चाहता है।

अधिक जानकारी:जेरी वेई एट अल, बड़े भाषा मॉडल में दीर्घकालिक तथ्यात्मकता,arXiv(2024)।डीओआई: 10.48550/arxiv.2403.18802

कोड रिलीज़:github.com/google-depmind/long-form-factuality

जर्नल जानकारी: arXiv

© 2024 साइंस एक्स नेटवर्क

उद्धरण:डीपमाइंड ने SAFE विकसित किया है, एक एआई-आधारित ऐप जो एलएलएम की तथ्य-जांच कर सकता है (2024, 29 मार्च)29 मार्च 2024 को पुनः प्राप्तhttps://techxplore.com/news/2024-03-depmind-safe-ai-आधारित-app.html से

यह दस्तावेज कॉपीराइट के अधीन है।निजी अध्ययन या अनुसंधान के उद्देश्य से किसी भी निष्पक्ष व्यवहार के अलावा, नहींलिखित अनुमति के बिना भाग को पुन: प्रस्तुत किया जा सकता है।सामग्री केवल सूचना के प्रयोजनों के लिए प्रदान की गई है।