Apple unveils Depth Pro, an AI app that can map the depth of a 2D image
Crédito: Profundidad de Apple Pro

Un equipo de ingenieros de Apple ha desarrollado un modelo basado en inteligencia artificial llamado Depth Pro que puede mapear la profundidad de una imagen 2D.El equipo ha escrito unpapeldescribiendo la aplicación y sus capacidades y la ha publicado en elarXivservidor de preimpresión.También publicaron un anuncio sobre la aplicación en la página de la compañía.Página de investigación de aprendizaje automático.

Los humanos y otros animales son capaces de percibir la profundidad porque el cerebro es capaz de tomar dos imágenes, una de cada ojo, y utilizar las diferencias entre ellas para determinar qué partes de las imágenes están más cerca y cuáles más distantes.AlgunoHan hecho algo similar para crear vídeos en 3D.

Los teléfonos inteligentes, debido a que dependen de una sola cámara para tomar fotografías y crear videos, tienen varias adiciones de hardware y software que permiten agregar cierto grado de profundidad.En este nuevo esfuerzo, los ingenieros de Apple han creado un mapa de profundidad completo utilizandode la imagen original sin recurrir al uso de metadatos como los intrínsecos de la cámara.

Un mapa de profundidad es un mapa que se crea utilizando todos los píxeles de una imagen original.Cada punto de datos en el mapa representa un solo píxel y corresponde a la distancia entre la parte de la imagen representada por el píxel y la parte correspondiente del objeto del que se tomó la imagen.

Un mapa de este tipo permite añadir otra dimensión a una imagen plana, dándole efectos 3D.El equipo sugiere que la creación de un mapa de profundidad puede generar efectos 3D que son más nítidos que los creados con técnicas estándar de teléfonos inteligentes.

Apple unveils Depth Pro, an AI app that can map the depth of a 2D image
Descripción general de la arquitectura de la red.Crédito:arXiv(2024).DOI: 10.48550/arxiv.2410.02073

En su anuncio, el equipo de Apple afirma que las aplicaciones que utilizan elson capaces de producir un mapa de profundidad en sólo 0,3 segundos cuando se ejecutan en una computadora con una GPU estándar, y pueden hacerlo sin los tipos de datos de la cámara que normalmente se necesitan para generar efectos 3D.

Al crear un modelo que funciona tan rápidamente, Apple ha abierto la puerta a la creación de imágenes 3D a partir de una cámara de una sola lente en tiempo real.Y esto, señala el equipo, podría tener implicaciones importantes para los robots y otrosAplicaciones de mapeo, como las utilizadas en vehículos autónomos.

Más información:Aleksei Bochkovskii et al, Depth Pro: profundidad métrica monocular nítida en menos de un segundo,arXiv(2024).DOI: 10.48550/arxiv.2410.02073

Profundidad profesional:github.com/apple/ml-profundidad-pro

machinelearning.apple.com/research/profundidad-pro

Información de la revista: arXiv

© 2024 Red Ciencia X

Citación:Apple presenta Depth Pro, una aplicación de inteligencia artificial que puede mapear la profundidad de una imagen 2D (2024, 10 de octubre)recuperado el 10 de octubre de 2024de https://techxplore.com/news/2024-10-apple-unveils- Depth-pro-ai.html

Este documento está sujeto a derechos de autor.Aparte de cualquier trato justo con fines de estudio o investigación privados, noparte puede ser reproducida sin el permiso por escrito.El contenido se proporciona únicamente con fines informativos.