magazine
2024.10.08

Apple的AI『Depth Pro』改變的新3D深度感知世界 | Release #335

2024-10-apple-depth-pro-3d-cover-image

Cover photo by テル

〈Apple〉發表了最新AI模型『Depth Pro』。這是一項能在僅0.3秒內從單一2D圖像生成高精細3D深度圖的驚人技術。

雖然是否會搭載於最新的iPhone上備受關注,但此技術在照片編輯、AR、VR,甚至自動駕駛方面的應用備受期待。這次,我們將介紹『Depth Pro』的運作機制及其應用範例。

高速且精密的3D地圖生成機制

『Depth Pro』採用了高效的「多尺度視覺變換器」,設計上能同時掌握圖像整體結構和細節。通常,深度估算需要多張圖像或相機設置信息,但『Depth Pro』不需要這些,能瞬間從單一2D圖像計算出精密的3D數據。

2024-10-apple-depth-pro-3d-image-4
2024-10-apple-depth-pro-3d-image-5

使用公開的模型在編輯部生成

此外,通過準確追蹤物體輪廓,能忠實再現髮絲或草木等細微結構。這使得AI能提供真實的3D體驗,並在AR和自動駕駛領域中期待新的應用。

更精密的模糊和主體分離

利用『Depth Pro』生成的高精細深度圖,背景模糊和主體選擇變得更快速且準確,甚至在智慧型手機上也能實現高品質的模糊效果。AI能逐像素掌握深度信息,實現突顯細微毛髮或葉片的效果。

2024-10-apple-depth-pro-3d-image-9

Photo by littlekiss photography

AR和VR中的現實感提升

『Depth Pro』也對AR和VR的品質提升有重大貢獻。與傳統的深度感知模型不同,無需相機的元數據即可即時估算深度,能準確地在現實空間中放置虛擬物體。

這增強了家具擺放的視覺化和遊戲中的真實互動。

自動駕駛的應用與未來展望

『Depth Pro』的速度和精度非常適合用於車載相機的自動駕駛深度檢測。AI能即時掌握周圍情況,識別道路上的障礙物,提高安全性。

2024-10-apple-depth-pro-3d-image-14

Photo by Yuzurigima

〈Apple〉已經將這項技術開源,預期未來會在更多領域中廣泛使用。