Deep learning drives dynamic autofocus in grayscale images
模型的结构和线性自注意力。信用:传感器(2024)。DOI:10.3390/s24134336

中国科学院长春光学精密机械与物理研究所的研究人员开发了一种新颖的自动对焦方法,利用深度学习的力量动态选择灰度图像中的感兴趣区域。这学习发表在杂志上传感器

传统的自动对焦方法可分为主动式和被动式两类。主动对焦依赖于外部传感器,从而增加了成本和复杂性。相比之下,被动聚焦评估控制对焦,但固定的对焦窗口和评估功能常常会导致对焦失败,尤其是在复杂场景中。

此外,缺乏全面的数据集阻碍了深度学习方法在自动对焦中的广泛采用。传统的基于图像的自动对焦解决方案存在诸如误判光点和焦点呼吸等问题,其中相机变焦和对焦过程中会影响图像清晰度评价。

在这项研究中,研究人员采取了三步法来解决这些问题。首先,他们构建了一个全面的灰度图像序列数据集,具有连续的对焦调整功能,以不同的焦距捕捉从简单到复杂的不同场景。该数据集是训练和评估自动对焦算法的宝贵资源。

接下来,研究人员将自动对焦问题转化为序数回归任务,提出了两种对焦策略:全栈搜索和单帧预测。这些策略使网络能够自适应地聚焦于帧内的显着区域,从而无需预先选择聚焦窗口。

最后,研究人员设计了一个配备线性自注意力机制的 MobileViT 网络。这种轻量而强大的网络以最小的计算成本实现动态自动对焦,确保快速准确的对焦。

实验表明,全栈搜索策略在聚焦时间为27.8毫秒的情况下实现了0.094的平均绝对误差(MAE),而单帧预测策略在短短27.5毫秒内实现了0.142的MAE。这些结果强调了基于深度学习的自动对焦方法的优越性能。

这种基于深度学习的自动对焦方法凸显了人工智能在增强传统成像技术方面的潜力。未来的研究可以探索这种方法在彩色图像和视频序列中的应用。此外,优化网络架构和聚焦策略可以实现更快、更准确的聚焦。

更多信息:Yao Wang等人,基于深度学习的灰度图像动态感兴趣区域自动对焦方法,传感器(2024)。DOI:10.3390/s24134336

引文:深度学习驱动灰度图像的动态自动对焦(2024 年 9 月 16 日)检索日期:2024 年 9 月 16 日来自 https://techxplore.com/news/2024-09-deep-dynamic-autofocus-grayscale-images.html

本文档受版权保护。除了出于私人学习或研究目的的任何公平交易外,不得未经书面许可,不得复制部分内容。所提供的内容仅供参考。