Artificial intelligence boosts super-resolution microscopy
खुले बायोएसआर सुपर-रिज़ॉल्यूशन माइक्रोस्कोपी डेटासेट (ऊपर और बाएं) से लिए गए एक प्रतिदीप्ति माइक्रोग्राफ की तुलना उसी तस्वीर से की जाती है जिसे सीवीडीएम-पुनर्निर्मित (नीचे और दाएं) किया गया है।छवि में फ्लोरोसेंट रूप से लेबल किए गए एफ-एक्टिन साइटोस्केलेटल प्रोटीन को दर्शाया गया है।श्रेय: ए. याकिमोविच/कैसस, चांग किआओ और डि ली द्वारा बायोएसआर डेटासेट से संशोधित छवि (CC BY 4.0 के तहत लाइसेंस प्राप्त)

जनरेटिव आर्टिफिशियल इंटेलिजेंस (एआई) को चैटजीपीटी या स्टेबल डिफ्यूजन जैसे टेक्स्ट या छवि-निर्माण अनुप्रयोगों से सबसे अच्छी तरह से जाना जा सकता है।लेकिन उससे भी आगे इसकी उपयोगिता विभिन्न वैज्ञानिक क्षेत्रों में दिखाई जा रही है।

उनके मेंहाल ही का काम, पर पोस्ट किया गयाarXivप्रीप्रिंट सर्वर और लर्निंग रिप्रेजेंटेशन (ICLR) पर आगामी अंतर्राष्ट्रीय सम्मेलन में प्रस्तुत किया जाना तय है, इंपीरियल कॉलेज लंदन के सहयोगियों के सहयोग से हेल्महोल्ट्ज़-ज़ेंट्रम ड्रेसडेन-रॉसेंडोर्फ (HZDR) में सेंटर फॉर एडवांस्ड सिस्टम्स अंडरस्टैंडिंग (CASUS) के शोधकर्ता औरयूनिवर्सिटी कॉलेज लंदन ने एक नया ओपन-सोर्स एल्गोरिदम प्रदान किया है जिसे कंडीशनल वेरिएशनल डिफ्यूजन मॉडल (सीवीडीएम) कहा जाता है।

जेनरेटिव एआई पर आधारित, यह मॉडल यादृच्छिकता से छवियों का पुनर्निर्माण करके उनकी गुणवत्ता में सुधार करता है।इसके अलावा, सीवीडीएम स्थापित की तुलना में कम्प्यूटेशनल रूप से कम महंगा हैमॉडल - और इसे विभिन्न प्रकार के अनुप्रयोगों के लिए आसानी से अनुकूलित किया जा सकता है।

बड़े डेटा और नई गणितीय और डेटा विज्ञान विधियों के आगमन के साथ, शोधकर्ताओं का लक्ष्य व्युत्क्रम समस्या दृष्टिकोण का उपयोग करके जीव विज्ञान, चिकित्सा, या पर्यावरण विज्ञान में अभी तक अस्पष्टीकृत घटनाओं को समझना है।व्युत्क्रम समस्याएँ कुछ निश्चित अवलोकनों की ओर ले जाने वाले कारण कारकों को पुनर्प्राप्त करने से संबंधित हैं।आपके पास एक छवि का ग्रेस्केल संस्करण है और आप रंगों को पुनर्प्राप्त करना चाहते हैं।यहां आमतौर पर कई वैध समाधान हैं, उदाहरण के लिए, हल्के नीले और हल्के लाल ग्रेस्केल छवि में समान दिखते हैं।इसलिए इस विपरीत समस्या का समाधान हल्के नीले रंग वाली छवि या हल्के लाल शर्ट वाली छवि हो सकती है।

सूक्ष्म छवियों का विश्लेषण करना भी एक विशिष्ट विपरीत समस्या हो सकती है।"आपके पास एक अवलोकन है: आपकी सूक्ष्म छवि। कुछ गणनाओं को लागू करने पर, आप अपने नमूने के बारे में पहले से अधिक जान सकते हैं," गेब्रियल डेला मैगीओरा, पीएच.डी. कहते हैं।CASUS के छात्र और ICLR पेपर के प्रमुख लेखक।

परिणाम उच्च-रिज़ॉल्यूशन या बेहतर-गुणवत्ता वाली छवियां हो सकते हैं।हालाँकि, अवलोकनों, यानी, सूक्ष्म छवियों से "सुपर छवियों" तक का मार्ग आमतौर पर स्पष्ट नहीं होता है।इसके अतिरिक्त, अवलोकन संबंधी डेटा अक्सर शोर-शराबा, अधूरा या अनिश्चित होता है।यह सब व्युत्क्रम समस्याओं को हल करने की जटिलता को बढ़ाता है और उन्हें रोमांचक गणितीय चुनौतियाँ बनाता है।

सोरा जैसे जेनेरिक एआई मॉडल की शक्ति

विपरीत समस्याओं से निपटने के लिए जेनरेटिव एआई एक शक्तिशाली उपकरण है।जेनरेटिव एआई मॉडल सामान्य तौर पर किसी दिए गए प्रशिक्षण डेटासेट में डेटा के अंतर्निहित वितरण को सीखते हैं।एक विशिष्ट उदाहरण छवि निर्माण है।प्रशिक्षण चरण के बाद, जेनरेटिव एआई मॉडल पूरी तरह से नई छवियां उत्पन्न करते हैं जो प्रशिक्षण डेटा के अनुरूप होती हैं।

विभिन्न जनरेटिव एआई विविधताओं के बीच, डिफ्यूजन मॉडल नामक एक विशेष परिवार ने हाल ही में शोधकर्ताओं के बीच लोकप्रियता हासिल की है।प्रसार मॉडल के साथ, एक पुनरावृत्त डेटा उत्पादन प्रक्रिया बुनियादी शोर से शुरू होती है, प्रकृति में होने वाली कई यादृच्छिक प्रक्रियाओं के प्रभाव की नकल करने के लिए सूचना सिद्धांत में उपयोग की जाने वाली एक अवधारणा।

छवि निर्माण के संबंध में, प्रसार मॉडल ने सीखा है कि प्रशिक्षण डेटासेट छवियों में कौन सी पिक्सेल व्यवस्था सामान्य और असामान्य है।वे नई वांछित छवि को थोड़ा-थोड़ा करके उत्पन्न करते हैं जब तक कि एक पिक्सेल व्यवस्था प्रशिक्षण डेटा की अंतर्निहित संरचना के साथ सबसे अच्छी तरह मेल नहीं खाती।

प्रसार मॉडल की शक्ति का एक अच्छा उदाहरण अमेरिकी सॉफ्टवेयर कंपनी ओपनएआई का टेक्स्ट-टू-वीडियो मॉडल सोरा है।एक कार्यान्वित प्रसार घटक सोरा को ऐसे वीडियो उत्पन्न करने की क्षमता देता है जो पहले बनाए गए एआई मॉडल की तुलना में अधिक यथार्थवादी दिखाई देते हैं।

लेकिन एक कमी है.कैसस यंग इन्वेस्टिगेटर ग्रुप के नेता और आईसीएलआर पेपर के संबंधित लेखक डॉ. अर्तुर याकिमोविच कहते हैं, "डिफ्यूजन मॉडल को लंबे समय से प्रशिक्षण के लिए कम्प्यूटेशनल रूप से महंगा माना जाता है। कुछ शोधकर्ता हाल ही में इसी कारण से उन्हें छोड़ रहे थे।"

"लेकिन हमारे कंडीशनल वेरिएशनल डिफ्यूजन मॉडल जैसे नए विकास 'अनुत्पादक रन' को कम करने की अनुमति देते हैं, जो अंतिम मॉडल तक नहीं पहुंचते हैं। कम्प्यूटेशनल प्रयास और इसलिए बिजली की खपत को कम करके, यह दृष्टिकोण प्रसार मॉडल को प्रशिक्षित करने के लिए अधिक पर्यावरण-अनुकूल भी बना सकता है।"

चतुर प्रशिक्षण ही काम आता है, न कि केवल खेल में

"अनुत्पादक रन" प्रसार मॉडल का एक महत्वपूर्ण दोष है।कारणों में से एक यह है कि मॉडल प्रसार प्रक्रिया की गतिशीलता को नियंत्रित करने वाले पूर्वनिर्धारित शेड्यूल की पसंद के प्रति संवेदनशील है: यह शेड्यूल नियंत्रित करता है कि शोर कैसे जोड़ा जाता है, बहुत कम या बहुत अधिक, गलत जगह या गलत समय - कई हैंसंभावित परिदृश्य जो असफल प्रशिक्षण के साथ समाप्त होते हैं।

अब तक, यह शेड्यूल एक हाइपरपैरामीटर के रूप में सेट किया गया है जिसे प्रत्येक नए एप्लिकेशन के लिए ट्यून करना होगा।दूसरे शब्दों में, मॉडल को डिज़ाइन करते समय, शोधकर्ता आमतौर पर परीक्षण-और-त्रुटि तरीके से चुने गए शेड्यूल का अनुमान लगाते हैं।

नए पेपर में, लेखकों ने प्रशिक्षण चरण में पहले से ही शेड्यूल को शामिल कर लिया है ताकि उनका सीवीडीएम अपने आप में इष्टतम प्रशिक्षण खोजने में सक्षम हो सके।तब मॉडल ने पूर्वनिर्धारित कार्यक्रम पर भरोसा करते हुए अन्य मॉडलों की तुलना में बेहतर परिणाम दिए।

अन्य बातों के अलावा, लेखकों ने एक वैज्ञानिक समस्या के लिए सीवीडीएम की प्रयोज्यता का प्रदर्शन किया:, एक विशिष्ट उलटा समस्या।सुपर-रिज़ॉल्यूशन माइक्रोस्कोपी का लक्ष्य इस पर काबू पाना है, एक सीमा जो सूक्ष्म प्रणाली की ऑप्टिकल विशेषताओं के कारण रिज़ॉल्यूशन को प्रतिबंधित करती है।

इस सीमा को एल्गोरिदमिक रूप से पार करने के लिए, डेटा वैज्ञानिक रिकॉर्ड की गई, सीमित-रिज़ॉल्यूशन छवियों से धुंधलापन और शोर दोनों को समाप्त करके उच्च-रिज़ॉल्यूशन वाली छवियों का पुनर्निर्माण करते हैं।इस परिदृश्य में, सीवीडीएम ने आमतौर पर इस्तेमाल की जाने वाली विधियों की तुलना में तुलनीय या बेहतर परिणाम दिए।

याकिमोविच कहते हैं, "बेशक, सूक्ष्म छवियों की सार्थकता बढ़ाने के लिए कई तरीके हैं - उनमें से कुछ जेनरेटिव एआई मॉडल पर निर्भर हैं।""लेकिन हमारा मानना ​​है कि हमारे दृष्टिकोण में कुछ नए अद्वितीय गुण हैं जो इमेजिंग समुदाय में प्रभाव छोड़ेंगे, अर्थात् अन्य प्रसार मॉडल दृष्टिकोण की तुलना में तुलनीय या यहां तक ​​कि बेहतर गुणवत्ता पर उच्च लचीलापन और गति।

"इसके अलावा, हमारा सीवीडीएम सीधे संकेत प्रदान करता है जहां यह पुनर्निर्माण के बारे में बहुत निश्चित नहीं है - एक बहुत ही उपयोगी संपत्ति जो नए प्रयोगों और सिमुलेशन में इन अनिश्चितताओं को दूर करने के लिए आगे का रास्ता तय करती है।"

गेब्रियल डेला मैगीओरा लर्निंग रिप्रेजेंटेशन पर वार्षिक अंतर्राष्ट्रीय सम्मेलन में एक पोस्टर के रूप में काम प्रस्तुत करेंगे (आईसीएलआर) 8 मई को पोस्टर सत्र 3 में 10:45 बजे।पेपर पर पहले से रिकॉर्ड की गई एक संक्षिप्त बातचीत वेबसाइट पर उपलब्ध है।यह सम्मेलन इस वर्ष 2017 के बाद पहली बार यूरोप में अर्थात् वियना (ऑस्ट्रिया) में आयोजित किया गया है।चाहे साइट पर उपस्थित हों या वीडियो कॉन्फ्रेंस के माध्यम से, सामग्री तक पहुंचने के लिए एक भुगतान पास की आवश्यकता होती है।

याकिमोविच बताते हैं, "ICLR OpenReview पोर्टल के माध्यम से डबल-ब्लाइंड सहकर्मी समीक्षा प्रक्रिया का उपयोग करता है।""समीक्षाओं के साथ साथियों द्वारा सुझाए गए अंक भी शामिल होते हैं; केवल अत्यधिक स्कोरिंग पेपर ही स्वीकार किए जाते हैं। इसलिए, हमारे पेपर की स्वीकृति समुदाय द्वारा उच्च सम्मान के समान है।"

अधिक जानकारी:गेब्रियल डेला मैगीओरा एट अल, कंडीशनल वेरिएशनल डिफ्यूजन मॉडल,arXiv(2023)।डीओआई: 10.48550/arxiv.2312.02246

जर्नल जानकारी: arXiv

उद्धरण:आर्टिफिशियल इंटेलिजेंस सुपर-रिज़ॉल्यूशन माइक्रोस्कोपी को बढ़ावा देता है (2024, 28 मार्च)28 मार्च 2024 को पुनः प्राप्तhttps://techxplore.com/news/2024-03-artificial-intelligence-boosts-super-resolution.html से

यह दस्तावेज कॉपीराइट के अधीन है।निजी अध्ययन या अनुसंधान के उद्देश्य से किसी भी निष्पक्ष व्यवहार के अलावा, नहींलिखित अनुमति के बिना भाग को पुन: प्रस्तुत किया जा सकता है।सामग्री केवल सूचना के प्रयोजनों के लिए प्रदान की गई है।