अनुसंधान से पता चलता है कि चैटजीपीटी के साथ स्वायत्त वाहन अपने यात्रियों को बेहतर ढंग से समझ सकते हैं

2024-09-16 21:41:03

कल्पना कीजिए कि आप बस अपने वाहन से कहें, "मैं जल्दी में हूं," और यह स्वचालित रूप से आपको सबसे कुशल मार्ग पर ले जाएगा जहां आपको होना चाहिए।

Autonomous vehicles could understand their passengers better with ChatGPT, research shows — पर्ड्यू विश्वविद्यालय के सहायक प्रोफेसर ज़िरन वांग एक परीक्षण स्वायत्त वाहन के बगल में खड़े हैं, जिसे उन्होंने और उनके छात्रों ने चैटजीपीटी या अन्य बड़े भाषा मॉडल का उपयोग करके यात्रियों के आदेशों की व्याख्या करने के लिए सुसज्जित किया है।श्रेय: पर्ड्यू विश्वविद्यालय/जॉन अंडरवुड

पर्ड्यू विश्वविद्यालय के इंजीनियरों ने पाया है कि एक स्वायत्त वाहन (एवी) चैटजीपीटी या बड़े भाषा मॉडल कहे जाने वाले कृत्रिम बुद्धिमत्ता एल्गोरिदम द्वारा संभव बनाए गए अन्य चैटबॉट्स की मदद से ऐसा कर सकता है।

द स्टडी, जो प्रीप्रिंट सर्वर पर दिखाई देता हैarXiv, 25 सितंबर को प्रस्तुत किया जाना हैइंटेलिजेंट ट्रांसपोर्टेशन सिस्टम पर 27वां आईईईई अंतर्राष्ट्रीय सम्मेलन.यह परीक्षण करने वाले पहले प्रयोगों में से एक हो सकता है कि एक वास्तविक एवी किसी यात्री के आदेशों की व्याख्या करने और उसके अनुसार गाड़ी चलाने के लिए बड़े भाषा मॉडल का कितनी अच्छी तरह उपयोग कर सकता है।

अध्ययन का नेतृत्व करने वाले पर्ड्यू के लाइल्स स्कूल ऑफ सिविल एंड कंस्ट्रक्शन इंजीनियरिंग में सहायक प्रोफेसर ज़िरन वांग का मानना है कि वाहनों को एक दिन पूरी तरह से स्वायत्त बनाने के लिए, उन्हें अपने यात्रियों द्वारा आदेशित हर बात को समझने की आवश्यकता होगी, भले ही आदेश निहित हो।उदाहरण के लिए, एक टैक्सी ड्राइवर को यह पता होगा कि आपको क्या चाहिए जब आप कहते हैं कि आप जल्दी में हैं, बिना यह बताए कि ड्राइवर को ट्रैफ़िक से बचने के लिए कौन सा मार्ग अपनाना चाहिए।

हालाँकि आज के एवी ऐसी सुविधाओं के साथ आते हैं जो आपको उनके साथ संवाद करने की अनुमति देती हैं, लेकिन यदि आप किसी इंसान से बात कर रहे हैं तो उन्हें आपकी तुलना में अधिक स्पष्ट होने की आवश्यकता है।इसके विपरीत, बड़े भाषा मॉडल अधिक मानवीय तरीके से व्याख्या कर सकते हैं और प्रतिक्रिया दे सकते हैं क्योंकि उन्हें बड़ी मात्रा में टेक्स्ट डेटा से संबंध बनाने और समय के साथ सीखते रहने के लिए प्रशिक्षित किया जाता है।

वांग ने कहा, "हमारे वाहनों में पारंपरिक प्रणालियों में एक उपयोगकर्ता इंटरफ़ेस डिज़ाइन होता है जहां आपको जो भी चाहिए उसे बताने के लिए बटन दबाना पड़ता है, या एक ऑडियो पहचान प्रणाली होती है जिसके लिए आपको बोलते समय बहुत स्पष्ट होना पड़ता है ताकि आपका वाहन आपको समझ सके।"."लेकिन बड़े भाषा मॉडल की शक्ति यह है कि वे आपके द्वारा कही गई सभी प्रकार की चीजों को अधिक स्वाभाविक रूप से समझ सकते हैं। मुझे नहीं लगता कि कोई अन्य मौजूदा प्रणाली ऐसा कर सकती है।"

एक नये प्रकार का अध्ययन संचालित करना

इस अध्ययन में, बड़े भाषा मॉडल ने एवी नहीं चलाया।इसके बजाय, वे एवी की मौजूदा सुविधाओं का उपयोग करके उसे चलाने में सहायता कर रहे थे।वांग और उनके छात्रों ने इन मॉडलों को एकीकृत करके पाया कि एक एवी न केवल अपने यात्री को बेहतर ढंग से समझ सकता है, बल्कि यात्री की संतुष्टि के लिए अपनी ड्राइविंग को वैयक्तिकृत भी कर सकता है।

अपने प्रयोग शुरू करने से पहले, शोधकर्ताओं ने चैटजीपीटी को ऐसे संकेतों के साथ प्रशिक्षित किया जो अधिक प्रत्यक्ष आदेशों (उदाहरण के लिए, "कृपया तेजी से गाड़ी चलाएं") से लेकर अधिक अप्रत्यक्ष आदेशों (उदाहरण के लिए, "मैं अभी थोड़ा मोशन-सिक महसूस कर रहा हूं") तक था।जैसे ही चैटजीपीटी ने सीखा कि इन आदेशों का जवाब कैसे देना है, शोधकर्ताओं ने इसके बड़े भाषा मॉडल मापदंडों का पालन करने के लिए इसे यातायात नियमों को ध्यान में रखने की आवश्यकता बताई,सड़क की स्थिति, मौसम और अन्य जानकारी वाहन के सेंसर, जैसे कैमरे और प्रकाश का पता लगाने और रेंजिंग द्वारा पता लगाया जाता है।

इसके बाद शोधकर्ताओं ने इन बड़े भाषा मॉडलों को क्लाउड पर एक प्रायोगिक वाहन के लिए सुलभ बनायाएसएई इंटरनेशनल द्वारा परिभाषित स्तर चार स्वायत्तता.स्तर चार उद्योग जिसे पूर्ण स्तर मानता है उससे एक स्तर दूर हैस्वायत्त वाहन.

जब वाहन की वाक् पहचान प्रणाली ने प्रयोगों के दौरान एक यात्री से एक कमांड का पता लगाया, तो क्लाउड में बड़े भाषा मॉडल ने शोधकर्ताओं द्वारा परिभाषित मापदंडों के साथ कमांड को तर्क दिया।फिर उन मॉडलों ने वाहन के ड्राइव-बाय-वायर सिस्टम के लिए निर्देश तैयार किए - जो थ्रॉटल, ब्रेक, गियर और स्टीयरिंग से जुड़ा है - उस कमांड के अनुसार कैसे ड्राइव किया जाए।

कुछ प्रयोगों के लिए, वांग की टीम ने सिस्टम में स्थापित एक मेमोरी मॉड्यूल का भी परीक्षण किया, जिसने बड़े भाषा मॉडल को यात्री की ऐतिहासिक प्राथमिकताओं के बारे में डेटा संग्रहीत करने और यह सीखने की अनुमति दी कि उन्हें एक कमांड की प्रतिक्रिया में कैसे शामिल किया जाए।

शोधकर्ताओं ने अधिकांश प्रयोग कोलंबस, इंडियाना में एक परीक्षण स्थल पर किए, जो पहले एक हवाईअड्डा रनवे था।इस वातावरण ने उन्हें रनवे पर राजमार्ग गति पर गाड़ी चलाते समय और दो-तरफ़ा चौराहों को संभालने के दौरान यात्री के आदेशों पर वाहन की प्रतिक्रियाओं का सुरक्षित रूप से परीक्षण करने की अनुमति दी।उन्होंने यह भी परीक्षण किया कि पर्ड्यू के रॉस-एड स्टेडियम में यात्री के आदेश के अनुसार वाहन कितनी अच्छी तरह पार्क किया गया है।

अध्ययन प्रतिभागियों ने उन दोनों आदेशों का उपयोग किया जो बड़े भाषा मॉडलों ने वाहन में सवारी करते समय सीखे थे और जो नए थे।अपनी सवारी के बाद सर्वेक्षण प्रतिक्रियाओं के आधार पर, प्रतिभागियों ने बड़े भाषा मॉडलों की सहायता के बिना लेवल चार एवी में सवारी करते समय लोगों को कैसा महसूस होता है, इस डेटा की तुलना में एवी द्वारा लिए गए निर्णयों के साथ असुविधा की कम दर व्यक्त की।

टीम ने एवी के प्रदर्शन की तुलना उस डेटा से बनाए गए आधारभूत मूल्यों से की, जिसे लोग औसतन सुरक्षित और आरामदायक सवारी मानते हैं, जैसे कि वाहन पीछे की टक्कर से बचने के लिए प्रतिक्रिया के लिए कितना समय देता है और कितनी जल्दी।वाहन तेज़ और धीमा हो जाता है।शोधकर्ताओं ने पाया कि इस अध्ययन में एवी ने ड्राइव करने के लिए बड़े भाषा मॉडल का उपयोग करते समय सभी आधारभूत मूल्यों से बेहतर प्रदर्शन किया, यहां तक कि आदेशों का जवाब देते समय भी मॉडल ने पहले से ही नहीं सीखा था।

भविष्य की दिशाएं

वांग ने कहा, इस अध्ययन में बड़े भाषा मॉडल ने एक यात्री के आदेश को संसाधित करने में औसतन 1.6 सेकंड का समय लिया, जिसे गैर-समय-महत्वपूर्ण परिदृश्यों में स्वीकार्य माना जाता है, लेकिन उन स्थितियों के लिए इसमें सुधार किया जाना चाहिए जब एवी को तेजी से प्रतिक्रिया देने की आवश्यकता होती है।यह एक ऐसी समस्या है जो सामान्य रूप से बड़े भाषा मॉडल को प्रभावित करती है और उद्योग के साथ-साथ विश्वविद्यालय के शोधकर्ताओं द्वारा भी इससे निपटा जा रहा है।

हालाँकि यह अध्ययन इस अध्ययन का केंद्र बिंदु नहीं है, लेकिन यह ज्ञात है कि चैटजीपीटी जैसे बड़े भाषा मॉडल "मतिभ्रम" से ग्रस्त हैं, जिसका अर्थ है कि वे सीखी गई किसी चीज़ की गलत व्याख्या कर सकते हैं और गलत तरीके से प्रतिक्रिया दे सकते हैं।वांग का अध्ययन एक असफल-सुरक्षित तंत्र के साथ एक सेटअप में आयोजित किया गया था, जो प्रतिभागियों को बड़े भाषा मॉडल के आदेशों को गलत समझने पर सुरक्षित रूप से सवारी करने की अनुमति देता था।एक प्रतिभागी की सवारी के दौरान मॉडलों की समझ में सुधार हुआ, लेकिन मतिभ्रम एक ऐसा मुद्दा बना हुआ है जिसे वाहन निर्माताओं द्वारा एवी में बड़े भाषा मॉडल को लागू करने पर विचार करने से पहले संबोधित किया जाना चाहिए।

विश्वविद्यालय के शोधकर्ताओं द्वारा किए गए अध्ययनों के अलावा वाहन निर्माताओं को भी बड़े भाषा मॉडल के साथ और अधिक परीक्षण करने की आवश्यकता होगी।वांग ने कहा, इन मॉडलों को एवी के नियंत्रणों के साथ एकीकृत करने के लिए नियामक अनुमोदन की अतिरिक्त आवश्यकता होगी ताकि वे वास्तव में वाहन चला सकें।

इस बीच, वांग और उनके छात्र ऐसे प्रयोग करना जारी रख रहे हैं जो उद्योग को एवी में बड़े भाषा मॉडल जोड़ने का पता लगाने में मदद कर सकते हैं।

अपने अध्ययन में चैटजीपीटी का परीक्षण करने के बाद से, शोधकर्ताओं ने बड़े भाषा मॉडलों के आधार पर अन्य सार्वजनिक और निजी चैटबॉट्स का मूल्यांकन किया है, जैसे कि Google की जेमिनी और मेटा की लामा एआई सहायकों की श्रृंखला।अब तक, उन्होंने एवी में सुरक्षित और समय-कुशल सवारी के लिए चैटजीपीटी को संकेतकों पर सर्वश्रेष्ठ प्रदर्शन करते देखा है।प्रकाशित परिणाम आने वाले हैं.

अगला कदम यह देखना है कि क्या प्रत्येक एवी के बड़े भाषा मॉडल के लिए एक-दूसरे से बात करना संभव होगा, जैसे कि एवी को यह निर्धारित करने में मदद करना कि चार-तरफा स्टॉप पर पहले कौन जाना चाहिए।वांग की लैब पूरे मिडवेस्ट में आम तौर पर अत्यधिक सर्दियों के मौसम में एवी को चलाने में मदद करने के लिए बड़े विज़न मॉडल के उपयोग का अध्ययन करने के लिए एक परियोजना भी शुरू कर रही है।ये मॉडल ऐसे हैंबड़े भाषा मॉडललेकिन पाठ के बजाय छवियों पर प्रशिक्षण दिया गया।अधिक जानकारी:

कैन कुई एट अल, बड़े भाषा मॉडल के साथ वैयक्तिकृत स्वायत्त ड्राइविंग: फ़ील्ड प्रयोग,arXiv(2023)।डीओआई: 10.48550/arxiv.2312.09397जर्नल जानकारी:

arXiv उद्धरण

:स्वायत्त वाहन चैटजीपीटी के साथ अपने यात्रियों को बेहतर ढंग से समझ सकते हैं, अनुसंधान से पता चलता है (2024, 16 सितंबर)16 सितंबर 2024 को पुनः प्राप्तhttps://techxplore.com/news/2024-09-autonomous-vehicles-passengers-chatgpt.html से

यह दस्तावेज कॉपीराइट के अधीन है।निजी अध्ययन या अनुसंधान के उद्देश्य से किसी भी निष्पक्ष व्यवहार के अलावा, नहींलिखित अनुमति के बिना भाग को पुन: प्रस्तुत किया जा सकता है।सामग्री केवल सूचना के प्रयोजनों के लिए प्रदान की गई है।

अन्य भाषा संस्करण भी देखें: English | 简中 | 正體 | 日本語 | 한국인 | हिंदी | Español