Computer scientists show the way: AI models need not be SO power hungry
इस चित्र में प्रत्येक बिंदु क्षैतिज अक्ष पर ऊर्जा खपत और ऊर्ध्वाधर अक्ष पर प्रदर्शन के साथ एक दृढ़ तंत्रिका नेटवर्क मॉडल है।परंपरागत रूप से, मॉडलों का चयन केवल उनके प्रदर्शन के आधार पर किया जाता है - उनकी ऊर्जा खपत को ध्यान में रखे बिना - जिसके परिणामस्वरूप मॉडल लाल दीर्घवृत्त में होते हैं।यह कार्य चिकित्सकों को हरे दीर्घवृत्त से मॉडल चुनने में सक्षम बनाता है जो प्रभावशीलता और दक्षता के बीच अच्छा तालमेल देता है।श्रेय: वैज्ञानिक लेख से प्राप्त चित्र (ieeexplore.ieee.org/document/10448303)

यह तथ्य कि Google से दूर जाने, Siri से बात करने, ChatGPT से कुछ करने के लिए कहने, या किसी भी अर्थ में AI का उपयोग करने के लिए भारी मात्रा में ऊर्जा की आवश्यकता होती है, धीरे-धीरे सामान्य ज्ञान बन गया है।

एक अध्ययनअनुमान है कि 2027 तक एआई सर्वर अर्जेंटीना या स्वीडन जितनी ऊर्जा की खपत करेंगे।दरअसल, एक चैटजीपीटी प्रॉम्प्ट में औसतन चालीस मोबाइल फोन चार्ज जितनी ऊर्जा की खपत होने का अनुमान है।लेकिनकोपेनहेगन विश्वविद्यालय के कंप्यूटर विज्ञान शोधकर्ताओं का कहना है कि उद्योग को अभी भी एआई मॉडल का विकास करना बाकी है जो ऊर्जा कुशल हो और इस प्रकार अधिक जलवायु अनुकूल हो।

"आज, डेवलपर्स एआई मॉडल बनाने पर ध्यान केंद्रित कर रहे हैं जो उनके परिणामों की सटीकता के मामले में प्रभावी हैं। यह कहने जैसा है कि एक कार प्रभावी है क्योंकि यह आपको ईंधन की मात्रा पर विचार किए बिना तुरंत आपके गंतव्य तक पहुंचाती है। जैसा किपरिणामस्वरूप, एआई मॉडल अक्सर ऊर्जा खपत के मामले में अक्षम होते हैं," कंप्यूटर विज्ञान विभाग के सहायक प्रोफेसर राघवेंद्र सेलवन कहते हैं, जिनका शोध एआई के कार्बन पदचिह्न को कम करने की संभावनाओं पर गौर करता है।

लेकिनएक नया अध्ययन, जिसके वे और कंप्यूटर विज्ञान के छात्र पेड्राम बख्तियारिफ़र्ड दो लेखक हैं, यह दर्शाता है कि बड़ी मात्रा में CO पर अंकुश लगाना आसान है2एआई मॉडल की सटीकता से समझौता किए बिना।ऐसा करने के लिए एआई मॉडल के डिजाइन और प्रशिक्षण चरणों से जलवायु लागत को ध्यान में रखना आवश्यक है।अध्ययन यहां प्रस्तुत किया जाएगाध्वनिकी, भाषण और सिग्नल प्रोसेसिंग पर अंतर्राष्ट्रीय सम्मेलन(आईसीएएसएसपी-2024)।

"यदि आप एक ऐसा मॉडल तैयार करते हैं जो शुरू से ही ऊर्जा कुशल है, तो आप मॉडल के 'जीवन चक्र' के प्रत्येक चरण में कार्बन पदचिह्न को कम करते हैं।सेलवन कहते हैं, "यह मॉडल के प्रशिक्षण, जो एक विशेष रूप से ऊर्जा-गहन प्रक्रिया है, जिसमें अक्सर सप्ताह या महीने लगते हैं, दोनों पर लागू होता है।"

एआई उद्योग के लिए रेसिपी बुक

अपने अध्ययन में, शोधकर्ताओं ने गणना की कि 400,000 से अधिक कन्वेन्शनल न्यूरल नेटवर्क प्रकार एआई मॉडल को प्रशिक्षित करने में कितनी ऊर्जा लगती है - यह वास्तव में इन सभी मॉडलों को प्रशिक्षित किए बिना किया गया था।अन्य बातों के अलावा, कन्वेन्शनल न्यूरल नेटवर्क का उपयोग मेडिकल इमेजरी का विश्लेषण करने, भाषा अनुवाद और ऑब्जेक्ट और चेहरे की पहचान के लिए किया जाता है - एक फ़ंक्शन जिसे आप अपने स्मार्टफोन पर कैमरा ऐप से जान सकते हैं।

गणनाओं के आधार पर, शोधकर्ता एआई मॉडल का एक बेंचमार्क संग्रह प्रस्तुत करते हैं जो किसी दिए गए कार्य को हल करने के लिए कम ऊर्जा का उपयोग करते हैं, लेकिन जो लगभग समान स्तर पर प्रदर्शन करते हैं।अध्ययन से पता चलता है कि अन्य प्रकार के मॉडलों को चुनने या मॉडलों को समायोजित करने से, 70-80%प्रशिक्षण और तैनाती चरण के दौरान प्रदर्शन में केवल 1% या उससे कम की कमी के साथ हासिल किया जा सकता है।और शोधकर्ताओं के अनुसार, यह एक रूढ़िवादी अनुमान है।

"एआई पेशेवरों के लिए हमारे परिणामों को एक नुस्खा पुस्तक के रूप में मानें। व्यंजन केवल विभिन्न एल्गोरिदम के प्रदर्शन का वर्णन नहीं करते हैं, बल्कि वे कितने ऊर्जा कुशल हैं। और यह कि एक मॉडल के डिजाइन में एक घटक को दूसरे के साथ स्वैप करके, कोई भी ऐसा कर सकता हैअक्सर एक ही परिणाम प्राप्त होता है, इसलिए अब, अभ्यासकर्ता प्रदर्शन और दोनों के आधार पर अपना इच्छित मॉडल चुन सकते हैं, और प्रत्येक मॉडल को पहले प्रशिक्षित करने की आवश्यकता के बिना," पेड्राम बख्तियारिफ़र्ड कहते हैं।

"अक्सर, कई मॉडलों को किसी विशेष कार्य को हल करने के लिए सबसे उपयुक्त होने का संदेह होने से पहले प्रशिक्षित किया जाता है। यह एआई के विकास को अत्यधिक ऊर्जा-गहन बनाता है। इसलिए, सही मॉडल चुनना अधिक जलवायु-अनुकूल होगाशुरुआत से ही, ऐसा विकल्प चुनना जो प्रशिक्षण चरण के दौरान बहुत अधिक बिजली की खपत न करता हो।"

शोधकर्ता इस बात पर जोर देते हैं कि कुछ क्षेत्रों में, जैसे स्व-चालित कारों या चिकित्सा के कुछ क्षेत्रों में, सुरक्षा के लिए मॉडल परिशुद्धता महत्वपूर्ण हो सकती है।यहां, यह महत्वपूर्ण है कि प्रदर्शन से समझौता न किया जाए।हालाँकि, यह अन्य क्षेत्रों में उच्च ऊर्जा दक्षता के प्रयास में बाधा नहीं होनी चाहिए।

"एआई में अद्भुत क्षमता है। लेकिन अगर हमें टिकाऊ और जिम्मेदार एआई विकास सुनिश्चित करना है, तो हमें एक अधिक समग्र दृष्टिकोण की आवश्यकता है जो न केवल मॉडल प्रदर्शन को ध्यान में रखे, बल्कि जलवायु प्रभाव को भी ध्यान में रखे। यहां, हम दिखाते हैं कि बेहतर खोजना संभव हैव्यापार-बंद। जब एआई मॉडल विभिन्न कार्यों के लिए विकसित किए जाते हैं, तो ऊर्जा दक्षता एक निश्चित मानदंड होना चाहिए - जैसे कि यह कई अन्य उद्योगों में मानक है, "राघवेंद्र सेलवन ने निष्कर्ष निकाला।

इस कार्य में एक साथ रखी गई "रेसिपी बुक" अन्य शोधकर्ताओं के प्रयोग के लिए एक ओपन-सोर्स डेटासेट के रूप में उपलब्ध है।इन सभी 400,000 से अधिक आर्किटेक्चर के बारे में जानकारी प्रकाशित की गई हैGithubजिसे एआई व्यवसायी सरल पायथन स्क्रिप्ट का उपयोग करके एक्सेस कर सकते हैं।

यूसीपीएच शोधकर्ताओं ने अनुमान लगाया कि 429,000 एआई उपप्रकार मॉडल को प्रशिक्षित करने में कितनी ऊर्जा लगती हैइस डेटासेट में.अन्य चीजों के अलावा, इनका उपयोग वस्तु का पता लगाने, भाषा अनुवाद और चिकित्सा छवि विश्लेषण के लिए किया जाता है।

यह अनुमान लगाया गया है कि अध्ययन में जिन 429,000 तंत्रिका नेटवर्कों को देखा गया, उनमें से अकेले प्रशिक्षण के लिए 263,000 kWh की आवश्यकता होगी।यह उस ऊर्जा की मात्रा के बराबर है जो एक औसत डेनिश नागरिक 46 वर्षों में उपभोग करता है।और एक कंप्यूटर को प्रशिक्षण देने में लगभग 100 साल लगेंगे।इस कार्य में लेखकों ने वास्तव में इन मॉडलों को स्वयं प्रशिक्षित नहीं किया, बल्कि एक अन्य एआई मॉडल का उपयोग करके इनका अनुमान लगाया, इस प्रकार इसमें लगने वाली 99% ऊर्जा की बचत हुई।

AI का कार्बन फ़ुटप्रिंट इतना बड़ा क्यों है?

एआई मॉडल के प्रशिक्षण में बहुत अधिक ऊर्जा की खपत होती है, और इस तरह बहुत अधिक CO उत्सर्जित होती है2ई.यह किसी मॉडल को प्रशिक्षित करते समय की जाने वाली गहन संगणनाओं के कारण होता है, जो आमतौर पर शक्तिशाली कंप्यूटरों पर चलती हैं।

यह विशेष रूप से बड़े मॉडलों के लिए सच है, जैसे चैटजीपीटी के पीछे का भाषा मॉडल।एआई कार्यों को अक्सर इसमें संसाधित किया जाता है, जो कंप्यूटर को चालू और ठंडा रखने के लिए महत्वपूर्ण मात्रा में बिजली की मांग करता है।इन केंद्रों के लिए ऊर्जा स्रोत, जो जीवाश्म ईंधन पर निर्भर हो सकते हैं, उनके कार्बन पदचिह्न को प्रभावित करते हैं।

अधिक जानकारी:पेड्राम बख्तियारिफर्ड एट अल, ईसी-एनएएस: तंत्रिका वास्तुकला खोज के लिए ऊर्जा खपत जागरूक सारणीबद्ध बेंचमार्क,आईसीएएसएसपी 2024 - 2024 ध्वनिकी, भाषण और सिग्नल प्रोसेसिंग पर आईईईई अंतर्राष्ट्रीय सम्मेलन (आईसीएएसएसपी)(2024)।डीओआई: 10.1109/आईसीएएसएसपी48485.2024.10448303

उद्धरण:कंप्यूटर वैज्ञानिक रास्ता दिखाते हैं: एआई मॉडल को बिजली की इतनी भूख नहीं होनी चाहिए (2024, 3 अप्रैल)3 अप्रैल 2024 को पुनः प्राप्तhttps://techxplore.com/news/2024-04-scientists-ai-power-hungry.html से

यह दस्तावेज कॉपीराइट के अधीन है।निजी अध्ययन या अनुसंधान के उद्देश्य से किसी भी निष्पक्ष व्यवहार के अलावा, नहींलिखित अनुमति के बिना भाग को पुन: प्रस्तुत किया जा सकता है।सामग्री केवल सूचना के प्रयोजनों के लिए प्रदान की गई है।