Deep learning drives dynamic autofocus in grayscale images
模型的結構和線性自註意力。信用:感應器(2024)。DOI:10.3390/s24134336

中國科學院長春季光學精密機械與物理研究所的研究人員開發了一種新穎的自動對焦方法,利用深度學習的力量動態選擇灰階影像中的興趣區域。這學習發表在雜誌上感應器

傳統的自動對焦方法可分為主動式和被動式兩類。主動對焦依賴外部感測器,從而增加了成本和複雜性。相較之下,被動聚焦評估控制對焦,但固定的對焦視窗和評估功能常常會導致對焦失敗,尤其是在複雜場景中。

此外,缺乏全面的資料集阻礙了深度學習方法在自動對焦中的廣泛採用。傳統的基於影像的自動對焦解決方案存在諸如誤判光點和焦點呼吸等問題,其中相機變焦和對焦過程中會影響影像清晰度評價。

在這項研究中,研究人員採取了三步驟法來解決這些問題。首先,他們建立了一個全面的灰階影像序列資料集,具有連續的對焦調整功能,以不同的焦距捕捉從簡單到複雜的不同場景。該資料集是訓練和評估自動對焦演算法的寶貴資源。

接下來,研究人員將自動對焦問題轉換為序數迴歸任務,提出了兩種對焦策略:全端搜尋和單幀預測。這些策略使網路能夠自適應地聚焦於幀內的顯著區域,從而無需預先選擇聚焦視窗。

最後,研究人員設計了一個配備線性自註意力機制的 MobileViT 網路。這種輕量而強大的網路以最小的運算成本實現動態自動對焦,確保快速且準確的對焦。

實驗表明,全端搜尋策略在聚焦時間為27.8毫秒的情況下實現了0.094的平均絕對誤差(MAE),而單幀預測策略在短短27.5毫秒內實現了0.142的MAE。這些結果強調了基於深度學習的自動對焦方法的優越性能。

這種基於深度學習的自動對焦方法凸顯了人工智慧在增強傳統成像技術方面的潛力。未來的研究可以探索這種方法在彩色影像和視訊序列中的應用。此外,優化網路架構和聚焦策略可以實現更快、更準確的聚焦。

更多資訊:Yao Wang等人,基於深度學習的灰階影像動態感興趣區域自動對焦方法,感應器(2024)。DOI:10.3390/s24134336

引文:深度學習驅動灰階影像的動態自動對焦(2024 年 9 月 16 日)檢索日期:2024 年 9 月 16 日來自 https://techxplore.com/news/2024-09-deep-dynamic-autofocus-grayscale-images.html

本文檔受版權保護。除了出於私人學習或研究目的的任何公平交易外,不得未經書面許可,不得複製部分內容。所提供的內容僅供參考。