Apple unveils Depth Pro, an AI app that can map the depth of a 2D image
图片来源:Apple Depth Pro

Apple 的工程师团队开发了一种名为 Depth Pro 的基于人工智能的模型,可以绘制 2D 图像的深度。该团队写了一个描述该应用程序及其功能并将其发布在arXiv预印本服务器。他们还在公司的网站上发布了有关该应用程序的公告机器学习研究页面

人类和其他动物之所以能够感知深度,是因为大脑能够拍摄两幅图像,每只眼睛拍摄一幅图像,并利用它们之间的差异来找出图像的哪些部分较近,哪些部分较远。一些已经做了类似的事情来创建 3D 视频。

智能手机仅依靠一个摄像头进行拍照和视频创作,因此具有各种硬件和软件附加功能,可以增加一定程度的深度。在这项新的工作中,Apple 的工程师使用以下方法创建了完整的深度图:从原始图像中提取数据,而无需使用相机内部参数等元数据。

深度图是使用原始图像中的所有像素创建的图。地图上的每个数据点代表一个像素,并且对应于该像素代表的图片部分与被成像对象的相应部分之间的距离。

这样的地图可以为平面图片添加另一个维度,从而赋予其 3D 效果。该团队表示,创建深度图可以生成比使用标准智能手机技术制作的更清晰的 3D 效果。

Apple unveils Depth Pro, an AI app that can map the depth of a 2D image
网络架构概述。信用:arXiv(2024)。DOI:10.48550/arxiv.2410.02073

苹果团队在声明中声称,使用在配备标准 GPU 的计算机上运行时,只需 0.3 秒即可生成深度图,而且不需要生成 3D 效果通常所需的相机数据类型。

通过创建运行速度如此之快的模型,Apple 开启了从单镜头相机实时创建 3D 图像的大门。研究小组指出,这可能会对机器人和其他领域产生重大影响。地图应用,例如自动驾驶汽车上使用的应用。

更多信息:Aleksei Bochkovskii 等人,Depth Pro:不到一秒的锐利单目公制深度,arXiv(2024)。DOI:10.48550/arxiv.2410.02073

深度专业:github.com/apple/ml-深度-pro

machinelearning.apple.com/research/deep-pro

期刊信息: arXiv

© 2024 Science X 网络

引文:Apple 推出 Depth Pro,一款可以绘制 2D 图像深度的 AI 应用(2024 年 10 月 10 日)检索日期:2024 年 10 月 10 日来自 https://techxplore.com/news/2024-10-apple-unveils-depth-pro-ai.html

本文档受版权保护。除了出于私人学习或研究目的的任何公平交易外,不得未经书面许可,不得复制部分内容。所提供的内容仅供参考。