Deep learning drives dynamic autofocus in grayscale images
모델의 구조와 선형 self-attention.신용 거래:센서(2024).DOI: 10.3390/s24134336

중국과학원 장춘 광학, 정밀 기계 및 물리학 연구소의 연구원들은 그레이스케일 이미지에서 관심 영역을 동적으로 선택하기 위해 딥 러닝의 힘을 활용하는 새로운 자동 초점 방법을 개발했습니다.그만큼공부하다저널에 게재되었습니다센서.

전통적인 자동 초점 방법은 능동형 범주와 수동형 범주로 나눌 수 있습니다.능동 포커싱은 외부 센서에 의존하므로 비용과 복잡성이 증가합니다.대조적으로, 패시브 포커싱은 평가합니다.초점을 제어할 수 있지만 고정 초점 창과 평가 기능은 특히 복잡한 장면에서 초점 맞추기 실패로 이어지는 경우가 많습니다.

더욱이, 포괄적인 데이터 세트가 부족하여 자동 초점에 딥 러닝 방법을 널리 채택하는 데 방해가 되었습니다.기존의 이미지 기반 자동 초점 솔루션은 카메라 줌 및 카메라 줌 및초점을 맞추는 동안 이미지 선명도 평가에 영향을 줄 수 있습니다.

본 연구에서 연구자들은 이러한 문제를 해결하기 위해 3단계 방법에 착수했습니다.첫째, 그들은 지속적인 초점 조정을 통해 단순한 것부터 복잡한 것까지, 그리고 다양한 초점 거리에서 다양한 장면을 캡처하는 그레이스케일 이미지 시퀀스의 포괄적인 데이터세트를 구축했습니다.이 데이터 세트는 자동 초점 알고리즘을 교육하고 평가하는 데 유용한 리소스로 사용됩니다.

다음으로, 연구자들은 자동 초점 문제를 순서형 회귀 작업으로 변환하여 전체 스택 검색과 단일 프레임 예측이라는 두 가지 초점 전략을 제안했습니다.이러한 전략을 통해 네트워크는 프레임 내의 주요 영역에 적응적으로 초점을 맞출 수 있으므로 미리 선택된 포커싱 창이 필요하지 않습니다.

마지막으로 연구원들은 선형 자기 주의 메커니즘을 갖춘 MobileViT 네트워크를 설계했습니다.이 가볍지만 강력한 네트워크는 최소한의 계산 비용으로 동적 자동 초점을 달성하여 빠르고 정확한 초점을 보장합니다.

실험에 따르면 전체 스택 검색 전략은 27.8밀리초의 초점 시간으로 0.094의 평균 절대 오차(MAE)를 달성한 반면, 단일 프레임 예측 전략은 단 27.5밀리초 만에 0.142의 MAE를 달성했습니다.이러한 결과는 딥러닝 기반 자동 초점 방법의 탁월한 성능을 강조합니다.

이 딥 러닝 기반 자동 초점 방법은 기존 이미징 기술을 향상시키는 AI의 잠재력을 강조합니다.향후 연구에서는 이 방법을 컬러 이미지와 비디오 시퀀스에 적용하는 방법을 탐구할 수 있습니다.또한 네트워크 아키텍처와 포커싱 전략을 최적화하면 더욱 빠르고 정확한 포커싱이 가능해집니다.

추가 정보:Yao Wang 외, 그레이스케일 이미지에 대한 딥러닝 기반 동적 관심 영역 자동 초점 방법,센서(2024).DOI: 10.3390/s24134336

소환:딥 러닝은 회색조 이미지에서 동적 자동 초점을 구동합니다(2024년 9월 16일)2024년 9월 16일에 확인함https://techxplore.com/news/2024-09-deep-dynamic-autofocus-grayscale-images.html에서

이 문서는 저작권의 보호를 받습니다.사적인 학습이나 조사를 목적으로 하는 공정한 거래를 제외하고는 어떠한 행위도 허용되지 않습니다.서면 허가 없이 일부를 복제할 수 있습니다.콘텐츠는 정보 제공 목적으로만 제공됩니다.