Apple unveils Depth Pro, an AI app that can map the depth of a 2D image
圖片來源:Apple Depth Pro

Apple 的工程師團隊開發了一種名為 Depth Pro 的基於人工智慧的模型,可以繪製 2D 影像的深度。該團隊寫了一個描述該應用程式及其功能並將其發佈在arXiv預印本伺服器。他們還在該公司的網站上發布了有關該應用程式的公告機器學習研究頁面

人類和其他動物之所以能夠感知深度,是因為大腦能夠拍攝兩張影像,每隻眼睛拍攝一幅影像,並利用它們之間的差異來找出影像的哪些部分較近,哪些部分較遠。一些已經做了類似的事情來創建 3D 視訊。

智慧型手機僅依靠一個相機進行拍照和影片創作,因此具有各種硬體和軟體附加功能,可以增加一定程度的深度。在這項新的工作中,Apple 的工程師使用以下方法創建了完整的深度圖:從原始影像中提取數據,而無需使用相機內部參數等元數據。

深度圖是使用原始影像中的所有像素建立的圖。地圖上的每個資料點代表一個像素,並對應於該像素所代表的圖片部分與被成像物件的相應部分之間的距離。

這樣的地圖可以為平面圖片添加另一個維度,從而賦予其 3D 效果。團隊表示,創建深度圖可以產生比使用標準智慧型手機技術製作的更清晰的 3D 效果。

Apple unveils Depth Pro, an AI app that can map the depth of a 2D image
網路架構概述。信用:arXiv(2024)。DOI:10.48550/arxiv.2410.02073

蘋果團隊在聲明中聲稱,使用在配備標準 GPU 的電腦上執行時,只需 0.3 秒即可產生深度圖,而且不需要產生 3D 效果通常所需的相機資料類型。

透過創建運行速度如此之快的模型,Apple 開啟了從單鏡頭相機即時創建 3D 影像的大門。研究小組指出,這可能會對機器人和其他領域產生重大影響。地圖應用,例如自動駕駛汽車上使用的應用。

更多資訊:Aleksei Bochkovskii 等人,Depth Pro:不到一秒的銳利單目公制深度,arXiv(2024)。DOI:10.48550/arxiv.2410.02073

深度專業:github.com/apple/ml-深度-pro

machinelearning.apple.com/research/deep-pro

期刊資訊: arXiv

© 2024 Science X 網絡

引文:Apple 推出 Depth Pro,一款可以繪製 2D 影像深度的 AI 應用程式(2024 年 10 月 10 日)檢索日期:2024 年 10 月 10 日取自 https://techxplore.com/news/2024-10-apple-unveils-depth-pro-ai.html

本文檔受版權保護。除了出於私人學習或研究目的的任何公平交易外,不得未經書面許可,不得複製部分內容。所提供的內容僅供參考。