![2024-01-difference-between-ai-and-photography-cover-image](https://images.microcms-assets.io/assets/602ef6e805c54eec922fbce6bcb26986/67f614a0ec7242e3b109a1b12300f370/2024-01-difference-between-ai-and-photography-cover.jpg?ar=1200%3A630&fit=crop&auto=format%2Ccompress&w=3840&q=75)
La sensación de extrañeza al ver imágenes generadas
La generación de imágenes por IA intenta reproducir fielmente el texto ingresado. La sinceridad de ejecutar lo que se le dice y el aprendizaje basado en una vasta base de datos es una 'habilidad divina' que supera el alcance cognitivo humano, algo imposible para nosotros. Sin embargo, a menudo los resultados de las imágenes generadas no logran atraer el corazón humano. En esta ocasión, exploramos las razones de la sensación de extrañeza entre las imágenes generadas por IA y la fotografía.
Desde la perspectiva del espacio vacío
Muchas de las imágenes generadas convierten correctamente el texto en imágenes. Muchas de ellas carecen de desperdicio, en otras palabras, no tienen 'espacio vacío'. El 'espacio vacío' se refiere a espacios o información dejados intencionada o no intencionadamente, y las imágenes creadas por IA a menudo carecen de este espacio, estando llenas de detalles. Transmiten fielmente la información, pero no incluyen contexto.
![2024-01-difference-between-ai-and-photography-image-5](https://images.microcms-assets.io/assets/602ef6e805c54eec922fbce6bcb26986/7e3fa2bb94114501b92115a5e64ad1f3/2024-01-difference-between-ai-and-photography-image-1.jpg?auto=format%2Ccompress&fit=max&w=3840&q=75)
Image by sora.KagiAke
Sin embargo, el 'espacio vacío' incorpora matices emocionales humanos y significados ocultos. Esta comprensión basada en emociones es un área donde la IA, que no tiene cuerpo, es más débil. La IA es hábil en procesar imágenes de manera literal, pero aún está en desarrollo en cuanto a crear espacios vacíos que incluyan profundidad emocional y significados ocultos.
La humanidad reflejada en el espacio vacío
Las fotografías tomadas por humanos incluyen significados más allá del simple registro de imágenes. Las fotos pueden contener elementos de imprevisibilidad, un espectro de emociones, y a veces elementos considerados 'errores' no intencionados. Todos estos productos del azar forman parte de la historia que la fotografía cuenta, ofreciendo al espectador espacio para la empatía y la imaginación.
![2024-01-difference-between-ai-and-photography-image-9](https://images.microcms-assets.io/assets/602ef6e805c54eec922fbce6bcb26986/a67241eaa2ac4d2999dc635a609e6d1e/2024-01-difference-between-ai-and-photography-image-2.jpg?auto=format%2Ccompress&fit=max&w=3840&q=75)
Image by ザワ
El proceso de generación de imágenes por IA
Hemos visto que la sensación de extrañeza entre las imágenes generadas por IA y la fotografía depende de la presencia o ausencia de 'espacio vacío' entre ambas. Ahora, profundicemos en el proceso de generación de imágenes por IA para comprenderlo mejor.
- Conversión de texto: La IA convierte las palabras ingresadas en conceptos fáciles de interpretar. Por ejemplo, al ingresar el texto 'pájaros volando en el cielo', la IA lo entiende como un elemento de imagen y lo convierte en instrucciones básicas para dibujar un paisaje costero o la figura de un perro.
- Generación de imágenes a partir de ruido: La IA comienza con ruido completamente aleatorio (un conjunto de píxeles aleatorios sin características) y gradualmente elimina este ruido mientras forma la imagen concreta.
- Decodificación de imagen: La decodificación de imagen es el proceso de convertir los datos de imagen generados por la IA en una forma comprensible para el ojo humano. Esto incluye convertir a formatos de imagen visibles como JPEG o PNG, y retocar la resolución, color y representación interna de la imagen.
![2024-01-difference-between-ai-and-photography-image-12](https://images.microcms-assets.io/assets/602ef6e805c54eec922fbce6bcb26986/e509f624be5e472ca5fc05968ed504f5/2024-01-difference-between-ai-and-photography-image-3.jpg?auto=format%2Ccompress&fit=max&w=3840&q=75)
Image by mars
La disonancia creada por las diferencias de percepción entre IA y humanos
El proceso de eliminación de 'ruido' al generar imágenes por IA se basa principalmente en cálculos matemáticos y algoritmos. Quitar el ruido significa acercar la imagen a la realidad, pero esto tiene límites. La espontaneidad y riqueza emocional, así como la imperfección natural en las fotos humanas, son elementos difíciles de capturar mediante cálculos. En este punto, ya existe una diferencia de percepción sobre el ruido entre la IA y los humanos.
En los procesos detallados de generación de imágenes, es difícil para la IA comprender y reproducir completamente la complejidad y los matices sutiles humanos con la tecnología actual. La IA es excelente en interpretaciones literales y salidas basadas en datos, pero aún no puede imitar completamente la profundidad de la experiencia y emoción humanas. Para mejorar la precisión, lo que la IA necesita ahora puede ser acercarse al 'espacio vacío' que parece insignificante en la vida cotidiana humana.