Deep learning drives dynamic autofocus in grayscale images
La estructura del modelo y la autoatención lineal.Crédito:Sensores(2024).DOI: 10.3390/s24134336

Investigadores del Instituto de Óptica, Mecánica Fina y Física de Changchun de la Academia de Ciencias de China han desarrollado un novedoso método de enfoque automático que aprovecha el poder del aprendizaje profundo para seleccionar dinámicamente regiones de interés en imágenes en escala de grises.Elestudiarfue publicado en la revistaSensores.

Los métodos tradicionales de enfoque automático se pueden dividir en categorías activas y pasivas.El enfoque activo depende de sensores externos, lo que aumenta los costes y la complejidad.Por el contrario, el enfoque pasivo evalúacontrolar el enfoque, pero las ventanas de enfoque fijas y las funciones de evaluación a menudo provocan fallos de enfoque, especialmente en escenas complejas.

Además, la falta de conjuntos de datos completos ha obstaculizado la adopción generalizada de métodos de aprendizaje profundo en el enfoque automático.Las soluciones tradicionales de enfoque automático basadas en imágenes sufren problemas como juzgar mal los puntos de luz y la respiración focal, donde los cambios en el zoom de la cámara ydurante el enfoque puede afectar la evaluación de la nitidez de la imagen.

En este estudio, los investigadores se embarcaron en un método de tres pasos para resolver estos problemas.En primer lugar, construyeron un conjunto de datos completo de secuencias de imágenes en escala de grises con ajustes de enfoque continuos, capturando diversas escenas, desde simples hasta complejas y con diferentes distancias focales.Este conjunto de datos sirve como un recurso valioso para entrenar y evaluar algoritmos de enfoque automático.

A continuación, los investigadores transformaron el problema del enfoque automático en una tarea de regresión ordinal, proponiendo dos estrategias de enfoque: búsqueda completa y predicción de cuadro único.Estas estrategias permiten que la red se centre de forma adaptativa en regiones destacadas dentro del marco, eliminando la necesidad de ventanas de enfoque preseleccionadas.

Finalmente, los investigadores diseñaron una red MobileViT equipada con un mecanismo lineal de autoatención.Esta red liviana pero poderosa logra un enfoque automático dinámico con un costo computacional mínimo, lo que garantiza un enfoque rápido y preciso.

Los experimentos demostraron que la estrategia de búsqueda de pila completa logró un error absoluto medio (MAE) de 0,094 con un tiempo de enfoque de 27,8 milisegundos, mientras que la estrategia de predicción de cuadro único logró un MAE de 0,142 en sólo 27,5 milisegundos.Estos resultados subrayan el rendimiento superior del método de enfoque automático basado en aprendizaje profundo.

Este método de enfoque automático basado en aprendizaje profundo subraya el potencial de la IA para mejorar las tecnologías de imágenes tradicionales.Investigaciones futuras podrían explorar la aplicación de este método a imágenes en color y secuencias de vídeo.Además, optimizar la arquitectura de la red y las estrategias de enfoque podrían conducir a un enfoque aún más rápido y preciso.

Más información:Yao Wang et al, Método de enfoque automático de región de interés dinámico basado en aprendizaje profundo para imágenes en escala de grises,Sensores(2024).DOI: 10.3390/s24134336

Citación:El aprendizaje profundo impulsa el enfoque automático dinámico en imágenes en escala de grises (16 de septiembre de 2024)recuperado el 16 de septiembre de 2024de https://techxplore.com/news/2024-09-deep-dynamic-autofocus-grayscale-images.html

Este documento está sujeto a derechos de autor.Aparte de cualquier trato justo con fines de estudio o investigación privados, noparte puede ser reproducida sin el permiso por escrito.El contenido se proporciona únicamente con fines informativos.