Deep learning drives dynamic autofocus in grayscale images
मॉडल की संरचना और रैखिक आत्म-ध्यान।श्रेय:सेंसर(2024)।डीओआई: 10.3390/एस24134336

चाइनीज एकेडमी ऑफ साइंसेज के चांगचुन इंस्टीट्यूट ऑफ ऑप्टिक्स, फाइन मैकेनिक्स और फिजिक्स के शोधकर्ताओं ने एक उपन्यास ऑटोफोकस विधि विकसित की है जो ग्रेस्केल छवियों में रुचि के क्षेत्रों को गतिशील रूप से चुनने के लिए गहरी सीखने की शक्ति का उपयोग करती है।अध्ययनजर्नल में प्रकाशित किया गया थासेंसर.

पारंपरिक ऑटोफोकस विधियों को सक्रिय और निष्क्रिय श्रेणियों में विभाजित किया जा सकता है।सक्रिय फोकस बाहरी सेंसर, बढ़ती लागत और जटिलता पर निर्भर करता है।इसके विपरीत, निष्क्रिय फोकस आकलन करता हैफोकस को नियंत्रित करने के लिए, लेकिन निश्चित फोकसिंग विंडो और मूल्यांकन फ़ंक्शन अक्सर फोकस विफलताओं का कारण बनते हैं, खासकर जटिल दृश्यों में।

इसके अलावा, व्यापक डेटासेट की कमी ने ऑटोफोकस में गहन शिक्षण विधियों को व्यापक रूप से अपनाने में बाधा उत्पन्न की है।पारंपरिक छवि-आधारित ऑटोफोकस समाधान प्रकाश धब्बे और फोकल श्वास को गलत तरीके से पहचानने जैसे मुद्दों से ग्रस्त हैं जहां कैमरा ज़ूम में परिवर्तन होता है औरफोकस करने के दौरान छवि तीक्ष्णता मूल्यांकन प्रभावित हो सकता है।

इस अध्ययन में, शोधकर्ताओं ने इन समस्याओं को हल करने के लिए तीन-चरणीय विधि अपनाई।सबसे पहले, उन्होंने निरंतर फोकसिंग समायोजन के साथ ग्रेस्केल छवि अनुक्रमों का एक व्यापक डेटासेट बनाया, जिसमें सरल से जटिल और अलग-अलग फोकल लंबाई पर विविध दृश्यों को कैप्चर किया गया।यह डेटासेट ऑटोफोकस एल्गोरिदम के प्रशिक्षण और मूल्यांकन के लिए एक मूल्यवान संसाधन के रूप में कार्य करता है।

इसके बाद, शोधकर्ताओं ने दो फोकसिंग रणनीतियों का प्रस्ताव करते हुए ऑटोफोकस समस्या को एक क्रमिक प्रतिगमन कार्य में बदल दिया: पूर्ण-स्टैक खोज और एकल-फ्रेम भविष्यवाणी।ये रणनीतियाँ नेटवर्क को फ्रेम के भीतर प्रमुख क्षेत्रों पर अनुकूल रूप से ध्यान केंद्रित करने में सक्षम बनाती हैं, जिससे पूर्व-चयनित फोकसिंग विंडो की आवश्यकता समाप्त हो जाती है।

अंत में, शोधकर्ताओं ने एक रैखिक आत्म-ध्यान तंत्र से सुसज्जित एक MobileViT नेटवर्क डिजाइन किया।यह हल्का लेकिन शक्तिशाली नेटवर्क न्यूनतम कम्प्यूटेशनल लागत के साथ गतिशील ऑटोफोकस प्राप्त करता है, जिससे तेज और सटीक फोकसिंग सुनिश्चित होती है।

प्रयोगों से पता चला कि पूर्ण-स्टैक खोज रणनीति ने 27.8 मिलीसेकंड के फोकस समय के साथ 0.094 की औसत निरपेक्ष त्रुटि (एमएई) हासिल की, जबकि एकल-फ्रेम भविष्यवाणी रणनीति ने केवल 27.5 मिलीसेकंड में 0.142 का एमएई हासिल किया।ये परिणाम गहन शिक्षण-आधारित ऑटोफोकस पद्धति के बेहतर प्रदर्शन को रेखांकित करते हैं।

यह गहन शिक्षण-आधारित ऑटोफोकस पद्धति पारंपरिक इमेजिंग प्रौद्योगिकियों को बढ़ाने में एआई की क्षमता को रेखांकित करती है।भविष्य के शोध छवियों और वीडियो अनुक्रमों को रंगीन करने के लिए इस पद्धति के अनुप्रयोग का पता लगा सकते हैं।इसके अलावा, नेटवर्क आर्किटेक्चर और फोकसिंग रणनीतियों को अनुकूलित करने से फोकस और भी तेज और अधिक सटीक हो सकता है।

अधिक जानकारी:याओ वांग एट अल, ग्रेस्केल इमेज के लिए डीप लर्निंग-आधारित डायनेमिक रीजन ऑफ इंटरेस्ट ऑटोफोकस मेथड,सेंसर(2024)।डीओआई: 10.3390/एस24134336

उद्धरण:गहन शिक्षण ग्रेस्केल छवियों में गतिशील ऑटोफोकस को संचालित करता है (2024, 16 सितंबर)16 सितंबर 2024 को पुनः प्राप्तhttps://techxplore.com/news/2024-09- Deep-dynamic-autofocus-grayscale-images.html से

यह दस्तावेज कॉपीराइट के अधीन है।निजी अध्ययन या अनुसंधान के उद्देश्य से किसी भी निष्पक्ष व्यवहार के अलावा, नहींलिखित अनुमति के बिना भाग को पुन: प्रस्तुत किया जा सकता है।सामग्री केवल सूचना के प्रयोजनों के लिए प्रदान की गई है।