magazine
2024.10.08

El mundo nuevo del reconocimiento de profundidad 3D transformado por el AI 'Depth Pro' de Apple | Release #335

2024-10-apple-depth-pro-3d-cover-image

Foto de portada por テル

Apple ha anunciado su último modelo de AI, 'Depth Pro'. Esta tecnología increíble puede generar un mapa de profundidad 3D de alta definición a partir de una sola imagen 2D en solo 0.3 segundos.

Se espera que esta tecnología se incluya en los últimos iPhones, y se anticipa su aplicación en edición de fotos, AR, VR e incluso en conducción autónoma. En este artículo, presentamos el funcionamiento de 'Depth Pro' y sus ejemplos de uso.

Mecanismo de generación rápida y precisa de mapas 3D

'Depth Pro' adopta un eficiente 'transformador de visión multiescala', diseñado para captar simultáneamente la estructura general y los detalles de una imagen. Normalmente, la estimación de profundidad requiere múltiples imágenes o información de configuración de la cámara, pero 'Depth Pro' elimina esta necesidad y calcula instantáneamente datos 3D precisos a partir de una sola imagen 2D.

2024-10-apple-depth-pro-3d-image-4
2024-10-apple-depth-pro-3d-image-5

Generado por el equipo editorial usando el modelo publicado

Además, destaca por su capacidad para trazar con precisión los contornos de los objetos, reproduciendo fielmente estructuras finas como cabello y vegetación. Esto permite experiencias 3D realistas impulsadas por AI, con nuevas aplicaciones esperadas en los campos de AR y conducción autónoma.

Desenfoque más preciso y separación de sujetos

Al aprovechar los mapas de profundidad de alta definición generados por 'Depth Pro', el desenfoque de fondo y la selección de sujetos se vuelven más rápidos y precisos, permitiendo un desenfoque de alta calidad incluso en smartphones. La AI capta la información de profundidad a nivel de píxel, lo que permite efectos destacados en cabellos y hojas finas.

2024-10-apple-depth-pro-3d-image-9

Foto por littlekiss photography

Mejora de la realidad en AR y VR

'Depth Pro' también contribuye significativamente a mejorar la calidad de AR y VR. A diferencia de los modelos de reconocimiento de profundidad convencionales, puede estimar la profundidad instantáneamente sin metadatos de cámara, permitiendo colocar objetos virtuales con precisión en el espacio real.

Esto mejora la visualización de la disposición de muebles y fortalece el compromiso real en los juegos.

Aplicaciones en conducción autónoma y perspectivas futuras

La velocidad y precisión de 'Depth Pro' son ideales para la detección de profundidad en conducción autónoma utilizando cámaras a bordo. La AI capta en tiempo real el entorno, reconociendo obstáculos en la carretera para mejorar la seguridad.

2024-10-apple-depth-pro-3d-image-14

Foto por Yuzurigima

Apple ya ha hecho esta tecnología de código abierto, y se espera que su uso se expanda aún más en diversos campos.