Computer engineers at ORNL pioneer approaches to energy-efficient supercomputing
बाएं से, स्केल समूह में ओआरएनएल के एनालिटिक्स और एआई मेथड्स के सेड्रिक बोकनाइट और मैथियास मैटर्थ फ्रंटियर डिजिटल ट्विन प्रोजेक्ट के एक्साडिजिट फ्रेमवर्क की वीआर क्षमताओं का प्रदर्शन करते हैं।वीआर का उपयोग फ्रंटियर के ऑपरेटरों को सिस्टम की टेलीमेट्री को अधिक इंटरैक्टिव और सहज तरीके से जांचने की अनुमति देता है।श्रेय: वेस ब्रूअर/ओआरएनएल, अमेरिकी ऊर्जा विभाग

जैसे-जैसे हाई-टेक कंपनियां कृत्रिम बुद्धिमत्ता में व्यापार उछाल को पूरा करने के लिए बड़े पैमाने पर डेटा केंद्रों का निर्माण कर रही हैं, एक घटक तेजी से दुर्लभ वस्तु बनता जा रहा है: बिजली।

अमेरिकी ऊर्जा सूचना प्रशासन के अनुसार, बिजली की वाणिज्यिक मांग हाल के वर्षों में तेजी से बढ़ रही है और अकेले 2024 में 3% बढ़ने का अनुमान है।लेकिन उसविकास को केवल कुछ राज्यों द्वारा संचालित किया गया हैâवे जो तेजी से बड़े पैमाने पर कंप्यूटिंग सुविधाओं के केंद्र बन रहे हैं, जैसे कि वर्जीनिया और टेक्सास।

रियल-एस्टेट सेवा फर्म सीबीआरई ने अपने "ग्लोबल डेटा सेंटर ट्रेंड्स 2024" अध्ययन में रिपोर्ट दी है कि 2024 की पहली तिमाही में उत्तरी अमेरिकी डेटा केंद्रों की सूची में साल दर साल 24.4% की वृद्धि हुई है।इलेक्ट्रिक पावर रिसर्च इंस्टीट्यूट ने एक रिपोर्ट में कहा है कि ये नए केंद्र 100 से 1,000 मेगावाट या लगभग उतने ही भार की क्षमता के साथ बनाए जा रहे हैं जो 80,000 से 800,000 घरों को बिजली दे सकते हैं।2024 श्वेत पत्र.

इस पेपर में, ईपीआरआई एआई और डेटा-सेंटर ऊर्जा खपत का विश्लेषण करता है और भविष्यवाणी करता है कि यदि प्रति वर्ष 10% की अनुमानित उच्च वृद्धि दर जारी रहती है, तो 2030 तक डेटा सेंटर सालाना कुल अमेरिकी बिजली उत्पादन का 6.8% तक उपभोग करेंगे - एक अनुमान के विपरीतआज 4%.

उस बढ़ती मांग को पूरा करने के लिए, गोल्डमैन सैक्स रिसर्च का अनुमान है कि अमेरिकी उपयोगिताओं को नई विद्युत उत्पादन क्षमता में लगभग 50 बिलियन डॉलर का निवेश करने की आवश्यकता होगी।इस बीच, कुछ क्षेत्रों में डेटा सेंटर निर्माण का सामुदायिक विरोध भी बढ़ रहा है, क्योंकि जमीनी स्तर के समूह अधिक से अधिक डेटा सेंटरों के संभावित स्थानीय प्रभावों और एआई के लिए बिजली और शीतलन के लिए पानी की बढ़ती मांगों का विरोध कर रहे हैं।

क्या देश के निजी उद्यम एआई "क्रांति" को सशक्त बनाने की कठिन चुनौती को पूरा कर सकते हैं, यह पैसे पर कम और सरलता पर अधिक निर्भर हो सकता है।सीबीआरई अध्ययन एक सहायक, या शायद आशावादी, सिफारिश के साथ समाप्त होता है: "उच्च-प्रदर्शन कंप्यूटिंग [या एचपीसी] को बढ़ती समस्याओं को प्रबंधित करने के लिए डेटा सेंटर डिजाइन और प्रौद्योगिकी में तेजी से नवाचार की आवश्यकता होगी।"जरूरत है।"

ओक रिज नेशनल लेबोरेटरी में स्थित ऊर्जा विभाग के विज्ञान उपयोगकर्ता सुविधा कार्यालय, ओक रिज लीडरशिप कंप्यूटिंग सुविधा में, ऊर्जा-कुशल सुपरकंप्यूटिंग के लिए नए दृष्टिकोण की जांच करना हमेशा इसके मिशन का हिस्सा रहा है।

2004 में अपने गठन के बाद से, ओएलसीएफ ने विश्व स्तरीय सुपरकंप्यूटिंग सिस्टम की पांच पीढ़ियों को मैदान में उतारा है, जिन्होंने प्रति सेकंड फ्लोटिंग पॉइंट ऑपरेशन या फ्लॉप ऊर्जा दक्षता में लगभग 2,000 गुना वृद्धि की है।फ्रंटियर, ओएलसीएफ का वर्तमान में नवीनतम सुपरकंप्यूटरTOP500 सूची में पहले स्थान पर हैदुनिया के सबसे ज्यादा, और 2022 में, इसकी शुरुआत हुईग्रीन500 सूची में शीर्ष परदुनिया के सबसे अधिक ऊर्जा कुशल कंप्यूटरों में से एक।

बिजली बिल को किफायती रखना सरकार द्वारा वित्त पोषित सुविधा होने के साथ-साथ चलता है।लेकिन लीडरशिप सुपर कंप्यूटर का निर्माण और रखरखाव अब केवल सरकार का क्षेत्र नहीं रह गया है।प्रमुख तकनीकी कंपनियों ने बड़े पैमाने पर एचपीसी में प्रवेश किया है, लेकिन अब उन्हें इस बात की चिंता होने लगी है कि ये मेगा सिस्टम कितनी बिजली की खपत करते हैं।

"हमारी मशीनें हमेशा ग्रह पर सबसे बड़ी थीं, लेकिन अब यह सच नहीं है। निजी कंपनियां अब ऐसी मशीनें तैनात कर रही हैं जो फ्रंटियर से कई गुना बड़ी हैं। आज, उनके पास अनिवार्य रूप से असीमित गहरी जेबें हैं, इसलिए उनके लिए खड़ा होना आसान हैदक्षता की चिंता किए बिना एक डेटा सेंटर, "ओआरएनएल में नेशनल सेंटर फॉर कम्प्यूटेशनल साइंसेज या एनसीसीएस के मुख्य प्रौद्योगिकी अधिकारी स्कॉट एचले ने कहा।"एक बार जब वे अधिक शक्ति बाधित हो जाएंगे तो यह बदल जाएगा, और वे अपने पैसे के लिए सबसे अधिक लाभ प्राप्त करना चाहेंगे।"

एचपीसी को अधिक ऊर्जा कुशल बनाने में दशकों के अनुभव के साथ, ओएलसीएफ अचानक बढ़ते उद्योग में सर्वोत्तम "पैसा वसूल" प्रथाओं के लिए एक संसाधन के रूप में काम कर सकता है।

ओएलसीएफ के कार्यक्रम निदेशक एशले बार्कर ने कहा, "हम एचपीसी के अनुप्रयोगों से लेकर हार्डवेयर और सुविधाओं तक के संपूर्ण ऊर्जा-दक्षता पारिस्थितिकी तंत्र को प्रभावित करने के लिए विशिष्ट रूप से तैनात हैं। और समस्या पर हमला करने के लिए आपको उन तीनों क्षेत्रों में दक्षता हासिल करने की आवश्यकता है।".

"ऊर्जा दक्षता में सुधार के लिए प्रयास करना हमारी सुविधा के हर पहलू में काम आता है। सबसे अधिक ऊर्जा-कुशल हार्डवेयर कौन सा है जिसे हम खरीद सकते हैं? हम उस हार्डवेयर को चलाने का सबसे अधिक ऊर्जा-कुशल तरीका क्या है? और सबसे अधिक ऊर्जा-कुशल हार्डवेयर कौन सा है?ऐसे कुशल तरीके जिनसे हम हार्डवेयर पर चलने वाले अनुप्रयोगों में बदलाव कर सकते हैं?"

चूंकि ओएलसीएफ फ्रंटियर के उत्तराधिकारी की योजना बना रहा है - जिसे डिस्कवरी कहा जाता है - ये प्रश्न प्रतिदिन पूछे जाते हैं क्योंकि विभिन्न टीमें 2028 तक एक नया सुपर कंप्यूटर देने के लिए मिलकर काम करती हैं जो एचपीसी में अगली पीढ़ी की ऊर्जा दक्षताओं को भी प्रदर्शित करेगा।

सिस्टम हार्डवेयर

पिछले 30 वर्षों की सबसे महत्वपूर्ण कम्प्यूटेशनल दक्षता प्रगति में से एक एक अप्रत्याशित स्रोत से उत्पन्न हुई: वीडियो गेम।

विशेष रूप से, यह नवाचार वीडियो गेम उद्योग की तेजी से परिष्कृत इन-गेम ग्राफिक्स की आवश्यकता को पूरा करने के लिए प्रतिस्पर्धा करने वाले चिप निर्माताओं से आया है।गेमर्स, पर्सनल कंप्यूटर और गेम कंसोल को आकर्षित करने वाले यथार्थवादी दृश्यों को प्राप्त करने के लिए विस्तृत चलती छवियों को प्रस्तुत करने के लिए समर्पित चिप्स - जिन्हें ग्राफिक्स प्रोसेसिंग यूनिट या जीपीयू के रूप में भी जाना जाता है - की आवश्यकता होती है।

आज, GPU अधिकांश सुपर कंप्यूटरों का एक अनिवार्य हिस्सा हैं, विशेष रूप से कृत्रिम बुद्धिमत्ता मॉडल के प्रशिक्षण के लिए उपयोग किए जाने वाले।2012 में, जब ओएलसीएफ ने अपने टाइटन सुपरकंप्यूटर के साथ लीडरशिप-स्केल एचपीसी में जीपीयू के उपयोग की शुरुआत की, तो डिजाइन को पारंपरिक प्रणालियों से एक साहसिक प्रस्थान माना गया जो केवल केंद्रीय प्रसंस्करण इकाइयों या सीपीयू पर निर्भर करते हैं।

सरल गणनाओं के माध्यम से मंथन करने और समाधान के समय को तेज करने के लिए GPU की क्षमता का पूरी तरह से दोहन करने के लिए कम्प्यूटेशनल वैज्ञानिकों को अपने कोड को अनुकूलित करने की आवश्यकता थी।किसी विशेष समस्या को हल करने में कंप्यूटर को जितना कम समय लगेगा, वह उतनी ही अधिक समस्याओं को एक निश्चित समय सीमा में हल कर सकता है।

"डिज़ाइन के अनुसार, एक जीपीयू एक सीपीयू की तुलना में अधिक ऊर्जा कुशल है। यह अधिक कुशल क्यों है? यदि आप एक कंप्यूटर में बिजली चलाने जा रहे हैं और आप चाहते हैं कि यह बहुत कुशलता से गणना करे, तो आप लगभग सभी बिजली की शक्ति चाहते हैंफ़्लोटिंग पॉइंट ऑपरेशंस। आप चाहते हैं कि अधिक से अधिक सिलिकॉन क्षेत्र केवल फ़्लोटिंग पॉइंट इकाइयाँ हों, न कि प्रत्येक सीपीयू चिप पर मौजूद अन्य सभी चीज़ें।

फ्रंटियर प्रोजेक्ट के निदेशक ओआरएनएल के अल गीस्ट ने कहा, "एक जीपीयू लगभग शुद्ध फ्लोटिंग पॉइंट इकाइयां है। जब आप जीपीयू के साथ एक मशीन में बिजली चलाते हैं, तो यह सिर्फ सीपीयू वाली मशीन की तुलना में लगभग दसवां हिस्सा ऊर्जा लेती है।"

2012 में जीपीयू पर ओएलसीएफ का जुआ अगले दशक में उत्तरोत्तर अधिक ऊर्जा-कुशल प्रणालियों के साथ सफल हुआ क्योंकि ओएलसीएफ सुपरकंप्यूटर की प्रत्येक पीढ़ी ने अपने तेज जीपीयू की संख्या में वृद्धि की।यह विकास फ्रंटियर की वास्तुकला में परिणत हुआ, जिसे 2022 में दुनिया के पहले एक्सास्केल सुपरकंप्यूटर के रूप में लॉन्च किया गया, जो प्रति सेकंड 1 क्विंटल से अधिक गणना करने में सक्षम है और इसमें 9,408 कंप्यूट नोड्स शामिल हैं।

हालाँकि, जब 2008 में एक्सास्केल चर्चाएँ शुरू हुईं, तो एक्सास्केल अध्ययन समूह ने इसकी रूपरेखा बताते हुए एक रिपोर्ट जारी कीचार सबसे बड़ी चुनौतियाँ, जिनमें सबसे प्रमुख था बिजली की खपत।इसने प्रति वर्ष संभावित रूप से $500 मिलियन का बिजली बिल आने का पूर्वानुमान लगाया।यहां तक ​​कि 2015 की अनुमानित तकनीकी प्रगति को ध्यान में रखते हुए, रिपोर्ट में भविष्यवाणी की गई है कि एक स्ट्रिप्ड-डाउन 1-एक्साफ्लॉप प्रणाली 150 मेगावाट बिजली का उपयोग करेगी।

"डीओई ने कहा, 'यह एक नॉन-स्टार्टर है।'खैर, हमने पूछा, क्या स्वीकार्य होगा? और जो जवाब आया वह था, 'हम नहीं चाहते कि आप मशीन की लागत से अधिक पैसा बिजली पर खर्च करें,'' गीस्ट ने कहा।"2009 की समय सीमा में, सुपर कंप्यूटर की लागत लगभग 100 मिलियन डॉलर थी। उनका जीवनकाल लगभग पाँच वर्ष है।

"आपके पास प्रति वर्ष लगभग $20 मिलियन है जिसे हम बिजली पर खर्च कर सकते हैं। मैं $20 मिलियन में से कितने मेगावाट प्राप्त कर सकता हूँ? यह पता चला है कि यहाँ पूर्वी टेनेसी में 1 मेगावाट प्रति वर्ष लगभग $1 मिलियन है। तो वहवह संख्या थी जिसे हमने अपने लक्ष्य के रूप में निर्धारित किया था: 20-मेगावाट प्रति एक्साफ्लॉप प्रणाली।"

उस ऊर्जा खपत लक्ष्य को प्राप्त करने का कोई स्पष्ट रास्ता नहीं था।इसलिए, 2012 में, डीओई विज्ञान कार्यालय ने नई प्रौद्योगिकियों को आगे बढ़ाने के लिए विक्रेताओं के साथ काम करने के लिए फास्टफॉरवर्ड और डिजाइनफॉरवर्ड कार्यक्रम लॉन्च किए।

फास्टफॉरवर्ड ने शुरुआत में प्रदर्शन, बिजली की खपत और लचीलेपन के मुद्दों को संबोधित करने के लिए प्रोसेसर, मेमोरी और स्टोरेज विक्रेताओं पर ध्यान केंद्रित किया।बाद में इसने अपना ध्यान नोड डिज़ाइन (यानी, व्यक्तिगत कंप्यूट सर्वर) पर केंद्रित कर दिया।डिज़ाइनफॉरवर्ड ने शुरुआत में नेटवर्क को अपेक्षित सिस्टम आकार में बढ़ाने पर ध्यान केंद्रित किया और बाद में पूरे सिस्टम पैकेजिंग, एकीकरण और इंजीनियरिंग पर ध्यान केंद्रित किया।

फास्टफॉरवर्ड निवेश के परिणामस्वरूप, सेमीकंडक्टर चिप विक्रेता एएमडी ने फ्रंटियर के लिए एक तेज, अधिक शक्तिशाली कंप्यूट नोड विकसित किया - जिसमें 64-कोर तीसरी पीढ़ी के ईपीवाईसी सीपीयू और चार इंस्टिंक्ट एमआई250एक्स जीपीयू शामिल हैं - और जीपीयू बनाने का एक तरीका निकालाचिप्स के जिन हिस्सों का उपयोग नहीं किया जा रहा है उन्हें बंद करके और फिर जरूरत पड़ने पर कुछ मिलीसेकंड में उन्हें वापस चालू करके अधिक कुशल बनाया जा सकता है।

"पुराने दिनों में, पूरा सिस्टम जल जाता था और निष्क्रिय पड़ा रहता था, फिर भी बिजली जलती रहती थी। अब हम उन सभी चीजों को बंद कर सकते हैं जिनका उपयोग नहीं किया जा रहा है - और न केवल संपूर्ण जीपीयू। फ्रंटियर पर, प्रत्येक जीपीयू पर लगभग 50 अलग-अलग क्षेत्र हैंयदि उनका उपयोग नहीं किया जा रहा है तो उन्हें व्यक्तिगत रूप से बंद किया जा सकता है, अब, न केवल सिलिकॉन क्षेत्र ज्यादातर फ़्लोटिंग पॉइंट संचालन के लिए समर्पित है, बल्कि वास्तव में मैं किसी भी चीज़ पर ऊर्जा बर्बाद नहीं कर रहा हूँ जिसका मैं उपयोग नहीं कर रहा हूँ," गीस्ट।कहा।

हालाँकि, सुपर कंप्यूटर की अगली पीढ़ी के साथ, प्रति वाट अधिक गणना प्राप्त करने के लिए अधिक जीपीयू जोड़ना जारी रखने से नए और अधिक उन्नत आर्किटेक्चर के साथ भी, कम रिटर्न के अपने बिंदु तक पहुंच सकता है।

"प्रोसेसर विक्रेताओं को वास्तव में ऐसी तकनीकों के साथ आने के लिए युक्तियों के अपने थैले में पहुंचना होगा जो उन्हें केवल छोटे, वृद्धिशील सुधार देंगे। और यह न केवल ऊर्जा दक्षता के लिए सच है, बल्कि यह प्रदर्शन के लिए भी सच है। वे इसके बारे में जान रहे हैंसिलिकॉन से जितना संभव हो उतना प्रदर्शन करें," एटचले ने कहा।

"हम मूर के नियम से लाभान्वित हो रहे हैं: ट्रांजिस्टर छोटे हो गए, वे सस्ते हो गए और वे तेज़ हो गए। हमारे अनुप्रयोग तेजी से चले, और मूल्य बिंदु समान या उससे कम था। वह दुनिया खत्म हो गई है। वहाँ कुछ संभावित प्रौद्योगिकियाँ हैं जोहमें कुछ छलांग मिल सकती है, लेकिन सबसे बड़ी चीज जो हमारी मदद करेगी वह ऊर्जा दक्षता के लिए अधिक एकीकृत, समग्र दृष्टिकोण है।"

सिस्टम संचालन

ओएलसीएफ के एनालिटिक्स और एआई मेथड्स एट स्केल या एएआईएमएस समूह के नेता फ़ेयी वांग अपना अधिकांश समय एक मायावी लक्ष्य पर विचार करने में बिता रहे हैं: एक सुपर कंप्यूटर को कैसे संचालित किया जाए ताकि यह कम ऊर्जा का उपयोग करे।इस समस्या से निपटने के लिए सबसे पहले भारी मात्रा में एचपीसी परिचालन डेटा के संयोजन की आवश्यकता थी।

फ्रंटियर के निर्माण से बहुत पहले, उन्होंने और एएआईएमएस समूह ने समिट से एक वर्ष से अधिक का पावर प्रोफाइलिंग डेटा एकत्र किया था, ओएलसीएफ का 200-पेटाफ्लॉप सुपरकंप्यूटर 2018 में लॉन्च किया गया था। समिट के 4,608 नोड्स में से प्रत्येक में 100 से अधिक सेंसर हैं जो 1 हर्ट्ज पर मेट्रिक्स की रिपोर्ट करते हैं, जिसका अर्थ है किप्रत्येक सेकंड के लिए, सिस्टम 460,000 से अधिक मेट्रिक्स की रिपोर्ट करता है।

इस 10-टेराबाइट डेटासेट का उपयोग करते हुए, वांग की टीम ने समिट के पूरे सिस्टम का शुरू से अंत तक विश्लेषण किया, जिसमें इसका केंद्रीय ऊर्जा संयंत्र भी शामिल है, जिसमें इसकी सभी शीतलन मशीनरी शामिल हैं।उन्होंने 840,000 से अधिक नौकरियों के लिए प्रति-नौकरी, बारीक बिजली-खपत प्रोफाइल बनाने के लिए टेलीमेट्री डेटा पर सिस्टम के नौकरी आवंटन इतिहास को शामिल किया।इस काम से उन्हें यह कमाई हुईसर्वश्रेष्ठ पेपर पुरस्कारउच्च प्रदर्शन कंप्यूटिंग, नेटवर्किंग, भंडारण और विश्लेषण, या SC21 के लिए 2021 अंतर्राष्ट्रीय सम्मेलन में।

इस प्रयास से वांग को कुछ विचार भी सामने आए कि बेहतर ऊर्जा दक्षता के लिए सूचित परिचालन निर्णय लेने के लिए इस तरह के डेटा का उपयोग कैसे किया जा सकता है।

शिखर सम्मेलन से ऊर्जा-प्रोफ़ाइल डेटासेट का उपयोग करते हुए, वांग और उनकी टीम ने एचपीसी सिस्टम में चल रहे उत्पादन अंतर्दृष्टि प्रदान करने और सिस्टम ऑपरेटरों को "डेटा-संचालित परिचालन खुफिया" देने के लिए विज्ञान परियोजना के लिए स्मार्ट सुविधा शुरू की, जैसा कि वांग कहते हैं।

"मैं इस निरंतर निगरानी को 'निरंतर एकीकरण' की ओर एक कदम आगे ले जाना चाहता हूं, जिसका अर्थ है कि हम कंप्यूटर के चल रहे मेट्रिक्स लेना चाहते हैं और उन्हें एक सिस्टम में एकीकृत करना चाहते हैं ताकि उपयोगकर्ता यह देख सके कि उनकी ऊर्जा का उपयोग उनके विशेष के लिए कैसा होने वाला हैनौकरी के लिए आवेदन। इसे आगे बढ़ाते हुए, हम 'निरंतर अनुकूलन' को भी लागू करना चाहते हैं, जो केवल निगरानी और एकीकरण से लेकर वास्तव में काम को अनुकूलित करने तक है,'' वांग ने कहा।

वांग के विचारों में से एक अन्य उस लक्ष्य में सहायता कर सकता है।एससी23 में, वांग और मुख्य लेखक वेस ब्रेवर, जो एएआईएमएस समूह के एक वरिष्ठ शोध वैज्ञानिक हैं, ने एक प्रस्तुति दी, "एक एक्सास्केल सुपरकंप्यूटर के व्यापक डिजिटल ट्विन के विकास की ओर।"उन्होंने ExaDIGIT नामक एक ढाँचे का प्रस्ताव रखा जो संवर्धित वास्तविकता, या AG, और आभासी वास्तविकता, या VR का उपयोग करता है, ताकि एक सुविधा अपनी समग्र ऊर्जा दक्षता में सुधार करने के लिए कैसे संचालित होती है, इसकी समग्र जानकारी प्रदान की जा सके।

अब, ExaDIGIT 10 अंतरराष्ट्रीय और उद्योग भागीदारों की एक सहयोगी परियोजना के रूप में विकसित हो गया है, और ब्रूअर टीम की प्रस्तुति प्रस्तुत करेंगेनवीनतम पेपरपरएससी24अटलांटा, जॉर्जिया में।

ओआरएनएल में, एएआईएमएस समूह ने फ्रंटियर सुपरकंप्यूटर का अनुकरण बनाने के लिए फ्रंटियर परियोजना के लिए डिजिटल ट्विन लॉन्च किया।यह वर्चुअल फ्रंटियर ऑपरेटरों को "क्या होगा अगर हमने इसे आज़माया?" के साथ प्रयोग करने में सक्षम बनाएगा।ऊर्जा-बचत परिदृश्यों को वास्तविक फ्रंटियर मशीन पर आज़माने से पहले।यदि आपने फ्रंटियर के शीतलन प्रणाली के आने वाले पानी का तापमान बढ़ा दिया तो क्या होगा - क्या इससे इसकी दक्षता बढ़ जाएगी?या क्या आप इसे सिस्टम को पर्याप्त रूप से ठंडा न करने के जोखिम में डाल देंगे, जिससे इसकी विफलता दर बढ़ जाएगी?

वांग ने कहा, "फ्रंटियर एक प्रणाली इतनी मूल्यवान है कि आप बस यह नहीं कह सकते, 'चलो इसे आज़माएं। आइए सिस्टम पर प्रयोग करें,' क्योंकि अगर आप इसे गलत मानते हैं तो परिणाम विनाशकारी हो सकते हैं।""लेकिन इस डिजिटल ट्विन विचार के साथ, हम उस सभी टेलीमेट्री डेटा को एक सिस्टम में ले जा सकते हैं, जहां, अगर हमारे पास सिस्टम की शक्ति और शीतलन पहलुओं के लिए पर्याप्त निष्ठा है, तो हम प्रयोग कर सकते हैं। अगर मैं इस सेटिंग को बदल दूं तो क्या होगा?सिस्टम पर सकारात्मक प्रभाव पड़ेगा या नहीं?"

फ्रंटियर के डिजिटल ट्विन को डेस्कटॉप कंप्यूटर पर चलाया जा सकता है, और वीआर और एआर का उपयोग करने से ऑपरेटरों को मापदंडों को समायोजित करते समय अधिक इंटरैक्टिव और सहज तरीके से सिस्टम टेलीमेट्री की जांच करने की अनुमति मिलती है।एएआईएमएस समूह ने डिजिटल ट्विन की बिजली खपत की जांच करने के लिए एक वर्चुअल शेड्यूलिंग सिस्टम भी बनाया और यह समय के साथ नौकरियों को चलाने के साथ कैसे प्रगति करता है।

यद्यपि वर्चुअल फ्रंटियर अभी भी विकसित किया जा रहा है, यह पहले से ही अंतर्दृष्टि प्रदान कर रहा है कि वर्कलोड इसकी शीतलन प्रणाली को कैसे प्रभावित कर सकता है और सुधार के दौरान होने वाली बिजली हानि के साथ क्या होता है, जो प्रत्यावर्ती धारा को प्रत्यक्ष धारा में परिवर्तित करने की प्रक्रिया है।इस प्रणाली का उपयोग डिस्कवरी की भविष्य की बिजली और शीतलन आवश्यकताओं की भविष्यवाणी करने के लिए भी किया जा रहा है।

वांग ने कहा, "हम ओएलसीएफ के सामने आने वाली किसी भी मौजूदा और भविष्य की चुनौतियों से निपटने के लिए अपने विकास के साथ-साथ सिस्टम को तैयार कर सकते हैं और करेंगे।"

सुविधा अवसंरचना

सुपरकंप्यूटर को पावर देने का मतलब सिर्फ इसे चालू करना नहीं है, इसका मतलब इसे सपोर्ट करने वाली पूरी सुविधा को पावर देना भी है।सबसे महत्वपूर्ण शीतलन प्रणाली है जिसे कंप्यूटर के डेटा सेंटर में सभी कैबिनेटों द्वारा उत्पन्न गर्मी को दूर करना होगा।

"10,000 फुट के दृष्टिकोण से, एक सुपर कंप्यूटर वास्तव में सिर्फ एक विशाल हीटर है - मैं ग्रिड से बिजली लेता हूं, मैं इसे इस बड़े बॉक्स में चलाता हूं, और यह गर्म हो जाता है क्योंकि यह बिजली का उपयोग कर रहा है। अब मुझे इसमें और अधिक बिजली चलानी होगीइसे फिर से ठंडा करने के लिए एक एयर कंडीशनर, ताकि मैं इसे चालू रख सकूं और यह पिघले नहीं," गीस्ट ने कहा।

"डेटा सेंटर के अंदर इन बड़ी मशीनों को अधिक कुशलता से ठंडा करने के लिए बहुत काम किया जाता है। 2009 से 2022 तक, हमने शीतलन के लिए आवश्यक ऊर्जा को 10 गुना कम कर दिया है, और हमारी टीम आगे भी शीतलन अनुकूलन करना जारी रखेगी।"

उन कूलिंग अनुकूलनों की अधिकांश योजना का नेतृत्व ओआरएनएल के प्रयोगशाला आधुनिकीकरण प्रभाग के प्रमुख एचपीसी मैकेनिकल इंजीनियर डेविड ग्रांट ने किया है।ग्रांट नई यांत्रिक सुविधाओं के डिजाइन और निर्माण की देखरेख करता है और मुख्य रूप से यह सुनिश्चित करने के लिए जिम्मेदार है कि ओएलसीएफ में स्थापित प्रत्येक नए सुपरकंप्यूटर सिस्टम में 24-7 विश्वसनीय रूप से संचालित करने के लिए आवश्यक कूलिंग है।

उन्होंने 2009 में ओआरएनएल में शुरुआत की और जगुआर सुपरकंप्यूटर के संचालन पर काम किया।फिर, वह 2012 में टाइटन में इसके संक्रमण में शामिल हो गए, 2018 में इसके लॉन्च के लिए समिट के बुनियादी ढांचे के डिजाइन का नेतृत्व किया, और हाल ही में फ्रंटियर का समर्थन करने के लिए सभी इंजीनियरिंग का निरीक्षण किया।

उस समयावधि में, ओएलसीएफ की शीतलन प्रणाली चिप प्रौद्योगिकी के साथ-साथ काफी हद तक विकसित हुई है, जगुआर में तेज़ पंखे और चिलर-आधारित एयर कंडीशनिंग से लेकर फ्रंटियर में पंखे-मुक्त तरल शीतलन तक।

इसके अलावा, कंप्यूट नोड्स को ठंडा करने के लिए आवश्यक पानी का तापमान टाइटन के लिए 42°F से बढ़कर फास्टफॉरवर्ड प्रोग्राम द्वारा निर्धारित फ्रंटियर के 90°Fâa लक्ष्य तक पहुंच गया है।वह अतिरिक्त गर्मी भारी ऊर्जा बचत को बढ़ावा देती है क्योंकि परिसंचारी पानी को अब प्रशीतित करने की आवश्यकता नहीं होती है और इसके बजाय बाष्पीकरणीय टावरों द्वारा इसे पर्याप्त रूप से ठंडा किया जा सकता है।

ग्रांट ने कहा, "हम अलमारियों से जितना संभव हो उतना गर्म पानी वापस लाने की कोशिश कर रहे हैं, जबकि उन्हें सबसे गर्म पानी की आपूर्ति तापमान प्रदान कर रहे हैं - आपूर्ति तापमान जितना अधिक होगा, उतना बेहतर होगा।"

"हमारे पास वापस आने वाला गर्म पानी हमें उस प्रवाह को कम करने की अनुमति देता है जिसे हमें सिस्टम के सुविधा पक्ष पर प्रसारित करना होता है, जिससे पंपिंग ऊर्जा की बचत होती है। और फिर गर्म तापमान हमें अपने कूलिंग टावरों के साथ अधिक कुशल होने की अनुमति देता है।हमारे पर्यावरण के लिए उस गर्मी को अस्वीकार करें।"

फ्रंटियर की बिजली उपयोग प्रभावशीलता, या PUE - कंप्यूटर डेटा-सेंटर सुविधा द्वारा उपयोग की जाने वाली कुल बिजली बनाम कंप्यूटिंग उपकरण को दी गई बिजली का अनुपात - चरम उपयोग पर 1.03 प्रदान कर रहा है।इसका अनिवार्य रूप से मतलब यह है कि प्रत्येक 1,000 वाट गर्मी के लिए, सिस्टम के उपयुक्त थर्मल आवरण को बनाए रखने के लिए केवल 30 वाट अतिरिक्त विद्युत शक्ति लगती है।

डेटा केंद्रों के लिए वैश्विक, उद्योग-व्यापी औसत लगभग 1.47 PUE है,अपटाइम इंस्टीट्यूट के अनुसार.

डिस्कवरी जैसी तेज़ प्रणाली के लिए बिजली के उपयोग में और कटौती करने के लिए और भी अधिक नवीन दृष्टिकोण की आवश्यकता होगी, जिसकी ग्रांट जांच कर रही है।

सबसे पहले, डिस्कवरी की कुछ अतिरिक्त गर्मी को पुनर्प्राप्त करने (या उपयोग करने) की अवधारणा कुछ आशाजनक हो सकती है।यदि अपशिष्ट ऊष्मा को शीतलन प्रणाली से हीटिंग प्रणाली में ले जाया जा सकता है तो यह सुविधा अपशिष्ट ऊष्मा का पुन: उपयोग करने के लिए अच्छी तरह से स्थित है।लेकिन हीटिंग सिस्टम के ऊंचे तापमान, शीतलन प्रणाली से निम्न-श्रेणी की गर्मी और एचपीसी सिस्टम द्वारा उत्पन्न गर्मी की अत्यधिक गतिशील प्रकृति के कारण यह कार्य चुनौतीपूर्ण है।

दूसरा, आने वाली डिस्कवरी प्रणाली फ्रंटियर की शीतलन प्रणाली को साझा करेगी।इस संयुक्त-उपयोग कॉन्फ़िगरेशन से अतिरिक्त परिचालन क्षमताएं अपेक्षित हैं।

"फिलहाल, फ्रंटियर अपने स्वयं के शीतलन प्रणाली पर बैठता है, और हमने इसे उस प्रकार के ऑपरेशन के लिए अनुकूलित किया है। लेकिन यदि आपके पास फ्रंटियर 30 मेगावाट तक की मांग कर रहा है और उसके बाद एक और प्रणाली शायद इतनी ही मांग कर रही है, तो वह क्या करता हैहमारे शीतलन प्रणाली के लिए?

"यह ऐसा करने में सक्षम होने के लिए डिज़ाइन किया गया है, लेकिन हम इसके परिचालन लिफाफे में एक अलग जगह पर काम करने जा रहे हैं जिसे हमने पहले नहीं देखा है। इसलिए, नए अवसर होंगे जो वहां पहुंचने के बाद खुद को पेश करेंगे, “ग्रांट ने कहा।

तीसरा, ग्रांट इस बात की जांच कर रहा है कि निर्माण और उपकरण विकल्पों से सुविधा की समग्र ऊर्जा दक्षता को कैसे लाभ हो सकता है।उदाहरण के लिए, फ्रंटियर के कूलिंग सिस्टम में 20 अलग-अलग कूलिंग टावर हैं जिन्हें अपनी आंतरिक धातु सतहों की सुरक्षा में मदद के लिए शांतिकरण नामक प्रक्रिया की आवश्यकता होती है, और इस प्रक्रिया में समय के साथ बहुत अधिक पंपिंग शामिल होती है।उस कदम को नए टावरों के साथ समाप्त किया जा सकता है जिन्हें अब शांति प्रक्रिया की आवश्यकता नहीं है।

चौथा, सुपर कंप्यूटर पर निष्क्रिय समय बहुत अधिक बिजली का उपयोग कर सकता है - फ्रंटियर का निष्क्रिय भार 7 से 8 मेगावाट है।क्या होगा यदि उस निष्क्रिय भार को बहुत कम या समाप्त किया जा सके?

ग्रांट ने कहा, "जब हम सॉफ्टवेयर पक्ष पर प्रभाव रखने वाले ग्राहकों के साथ बातचीत करते हैं, तो हम उनसे यह संवाद करने का प्रयास करते हैं कि उनके निर्णय शीतलन प्रणाली और सुविधा ऊर्जा उपयोग के माध्यम से कैसे अनुवादित होंगे।"

"मुझे लगता है कि निष्क्रिय लोड आवश्यकता को कम करने और अपने मॉडलों को यथासंभव कुशलतापूर्वक चलाने और सिस्टम के उपयोग को बढ़ाने के लिए सॉफ़्टवेयर पक्ष में बहुत अधिक संभावनाएं हैं। बदले में, उन्हें अपनी ओर से उच्च उत्पादन प्राप्त होगाडेटा जिसे वे उत्पादित करने का प्रयास कर रहे हैं।"

अनुप्रयोग

ओएलसीएफ के सुपर कंप्यूटरों पर अधिक कुशलता से चलाने के लिए विज्ञान अनुप्रयोगों को अनुकूलित करना एनसीसीएस के साइंस एंगेजमेंट अनुभाग के प्रमुख टॉम बेक और एनसीसीएस के एल्गोरिदम और प्रदर्शन विश्लेषण समूह के एक प्रतिष्ठित अनुसंधान वैज्ञानिक ट्रे व्हाइट का डोमेन है।अपने परिणाम तेजी से लौटाने के लिए कोड प्राप्त करना वास्तव में कोई नई अवधारणा नहीं है, लेकिन लक्ष्य अब केवल शुद्ध गति से दूर जा रहा है।

व्हाइट ने कहा, "लंबे समय से, लोग अपने कोड को तेजी से चलाना चाहते थे, और हमने इसी पर ध्यान केंद्रित किया है - तेजी से एप्लिकेशन चलाने का एकमात्र लक्ष्य, जो ऊर्जा के उपयोग को कम करने के लिए भी हुआ।"

"हार्डवेयर की गति अभी भी बढ़ रही है, उतनी तेज़ नहीं जितनी पहले हुआ करती थी, और इसलिए अब हमें अनुप्रयोगों को समय और ऊर्जा दक्षता दोनों के संदर्भ में देखना चाहिए। अधिकांश भाग के लिए, तेज़ चलने का मतलब कम ऊर्जा है, लेकिन यह सही नहीं हैसहसंबंध। इसलिए, अब हम दोनों के बीच व्यापार-संबंध पर विचार करना शुरू कर रहे हैं।"

टीम जिस क्षेत्र की जांच कर रही है वह यह है कि जीपीयू की ऑपरेटिंग आवृत्ति उनकी ऊर्जा खपत को कैसे प्रभावित कर सकती है।किसी GPU के लिए सबसे तेज़ थ्रूपुट प्राप्त करने के लिए अधिकतम आवृत्ति आवश्यक रूप से सबसे अधिक ऊर्जा-कुशल आवृत्ति नहीं हो सकती है।

"लेकिन यदि आप अधिकतम आवृत्ति पर शुरू करते हैं और 5% से 10% तक पीछे खींचते हैं, तो कुछ संकेत हैं कि आपको 20% या 25% ऊर्जा बचत मिल सकती है। तो, फिर यह एक मध्यस्थता है, क्या आप थोड़ा सा त्याग करने को तैयार हैंबड़ी ऊर्जा बचत पाने के लिए आपके प्रदर्शन का थोड़ा सा हिस्सा?"बेक ने कहा.

व्हाइट ने कहा, "पहले, कंप्यूटर द्वारा उपयोग की जाने वाली अधिकतम क्लॉक फ्रीक्वेंसी सभी परियोजनाओं के लिए एक ही नंबर पर सेट की जाती थी। लेकिन अब हम इसे प्रति एप्लिकेशन और शायद एक ही बार में भी अनुकूलित करने पर विचार कर रहे हैं।""वह 'फ़्रीक्वेंसी नॉब' उस चीज़ का एक उदाहरण है जहां समय और ऊर्जा दक्षता के बीच एक व्यापार-बंद है, और हम जांच कर रहे हैं कि उपयोगकर्ताओं को वह विकल्प कैसे दिया जाए।"

टीम जिस अन्य क्षेत्र की खोज कर रही है वह मिश्रित-परिशुद्धता अंकगणित का उपयोग है।ऐतिहासिक रूप से, 64 बिट्स पर पूर्ण-परिशुद्धता फ़्लोटिंग पॉइंट अंकगणित को विज्ञान अनुप्रयोगों में कम्प्यूटेशनल सटीकता के लिए मानक माना जाता था।2000 के दशक की शुरुआत से अधिक शक्तिशाली सुपर कंप्यूटरों ने पूर्ण परिशुद्धता को लगभग 32 बिट्स पर एकल-सटीक अंकगणित के रूप में उपयोग करने में तेज़ बना दिया।

अब, एआई बाजार के उदय के साथ, कम परिशुद्धता अंकगणित - 16 बिट्स या उससे कम - ने प्रदर्शित किया है कि यह तंत्रिका नेटवर्क और अन्य डेटा-विज्ञान अनुप्रयोगों को प्रशिक्षित करने के लिए पर्याप्त सटीक है।जीपीयू द्वारा संचालित, कम-सटीक गणनाएं पर्याप्त स्पीडअप और ऊर्जा बचत प्रदान कर सकती हैं।

बेक ने कहा, "कम परिशुद्धता का उपयोग करना उपयोगकर्ताओं के लिए एक डरावना परिदृश्य है क्योंकि हर कोई पूर्ण परिशुद्धता के 64 बिट्स को मानने का आदी है और आंशिक रूप से सिर्फ इसलिए कि यह पहले से ही मौजूद है और पहुंच योग्य है।"

"और यदि आप 64 बिट्स से विचलन करना शुरू करते हैं, तो यह आपके पूरे कोड में चीजों को गैर-रेखीय तरीकों से प्रभावित कर सकता है, जहां क्या हो रहा है उसे ट्रैक करना वाकई मुश्किल है। इसलिए यह हमारी शोध रणनीति का हिस्सा है - प्रभावों का व्यापक अध्ययन करनाकुछ अनुप्रयोगों में मिश्रित-परिशुद्धता अंकगणित की ओर जा रहा हूँ।"

एक अन्य क्षेत्र जिससे ऊर्जा दक्षता में वृद्धि हो सकती है, वह है डेटा ट्रांसफर - डेटा की जितनी कम आवाजाही होगी, उतनी ही कम बिजली की आवश्यकता होगी।यह कार्य डेटा संचलन को कम करने वाले सॉफ़्टवेयर एल्गोरिदम का निर्माण करके पूरा किया जा सकता है।बेक उपयोगकर्ताओं को पाई चार्ट प्रदान करना चाहता है जो एल्गोरिदम के प्रत्येक अलग-अलग ऑपरेशन द्वारा उपयोग की जाने वाली शक्ति का प्रतिशत दिखाता है, जिससे उन्हें संभावित कटौती को लक्षित करने की अनुमति मिलती है।

"आमूलचूल हार्डवेयर परिवर्तन या वास्तुकला में क्रांति के बिना, एप्लिकेशन वास्तव में वह स्थान है जिसे लोग अब बढ़ाना चाहते हैं," बेक ने कहा। "संभवतः, यह कोडिंग के माध्यम से 300% सुधार प्राप्त करने का खेल नहीं है।

"निश्चित रूप से ऐसी जगहें हैं जहां हम सुधार कर सकते हैं, लेकिन यह संभवतः यहां 3%, वहां 5% की अधिक वृद्धिशील प्रक्रिया होने जा रही है। लेकिन अगर आप इसे कई बदलावों के साथ जमा कर सकते हैं और 20% तक पहुंच सकते हैं, तो यह एक बड़ी बात हैसिद्धि।"

उद्धरण:कंप्यूटर इंजीनियर ऊर्जा-कुशल सुपरकंप्यूटिंग के लिए अग्रणी दृष्टिकोण (2024, 11 सितंबर)11 सितंबर 2024 को पुनः प्राप्तhttps://techxplore.com/news/2024-09-approaches-energy-efficient-supercomputing.html से

यह दस्तावेज कॉपीराइट के अधीन है।निजी अध्ययन या अनुसंधान के उद्देश्य से किसी भी निष्पक्ष व्यवहार के अलावा, नहींलिखित अनुमति के बिना भाग को पुन: प्रस्तुत किया जा सकता है।सामग्री केवल सूचना के प्रयोजनों के लिए प्रदान की गई है।