magazine
2024.10.08

Apple的AI『Depth Pro』革新3D深度感知世界 | Release #335

2024-10-apple-depth-pro-3d-cover-image

Cover photo by テル

〈Apple〉发布了最新的AI模型『Depth Pro』。这是一项能够在0.3秒内从单个2D图像生成高精细3D深度图的惊人技术。

虽然是否会搭载在最新的iPhone上备受关注,但这项技术在照片编辑、AR、VR甚至自动驾驶领域的应用前景广阔。这次,我们将介绍『Depth Pro』的工作原理及其应用实例。

高速且精确的3D地图生成机制

『Depth Pro』采用高效的“多尺度视觉变换器”,能够同时掌握图像整体结构和细节。通常,深度估计需要多张图像或相机设置信息,但『Depth Pro』无需这些,仅凭单个2D图像即可瞬间计算出精确的3D数据。

2024-10-apple-depth-pro-3d-image-4
2024-10-apple-depth-pro-3d-image-5

使用公开的模型在编辑部生成

此外,通过精确追踪物体轮廓,能够忠实再现如头发和草木等细微结构。这使得AI能够实现逼真的3D体验,并在AR和自动驾驶领域有新的应用前景。

更精细的虚化和主体分离

利用『Depth Pro』生成的高精细深度图,背景虚化和主体选择变得更加快速准确,智能手机也能实现高质量的虚化效果。由于AI能够逐像素把握深度信息,细微的毛发和叶片效果也能突出表现。

2024-10-apple-depth-pro-3d-image-9

Photo by littlekiss photography

AR/VR中的现实感提升

『Depth Pro』也为AR和VR的质量提升做出了巨大贡献。与传统深度感知模型不同,它无需相机元数据即可即时估算深度,并能准确地在现实空间中放置虚拟物体。

这增强了家具布置的可视化效果,并在游戏中实现更真实的互动体验。

自动驾驶的应用与未来展望

『Depth Pro』的速度和精度非常适合用于车载摄像头的自动驾驶深度检测。AI能够实时把握周围环境,识别道路上的障碍物,从而提高安全性。

2024-10-apple-depth-pro-3d-image-14

Photo by Yuzurigima

〈Apple〉已经将这项技术开源,未来在更多领域的应用值得期待。