magazine
2024.09.04

AI與攝影之間的「差異」探索 | Knowledge #15

2024-01-difference-between-ai-and-photography-cover-image

觀看生成圖像時感受到的違和感

AI生成圖像試圖忠實再現輸入的文本。這種誠實地執行指令的特性,以及基於龐大數據庫進行學習的能力,是人類認知範圍之外的「神技」,是我們人類無法企及的。然而,生成的圖像結果往往無法吸引人心。這次,我們將探討AI生成的圖像與攝影之間存在的違和感的原因。

從餘白的觀點

生成的圖像多數能正確地將文本轉換為影像。這些圖像通常沒有多餘的部分,換句話說,就是缺乏「餘白」。「餘白」是指有意或無意留下的空間或信息,而AI生成的圖像往往充滿細節,缺乏這樣的餘白。雖然它能忠實地傳達信息,但其中不包含上下文。

2024-01-difference-between-ai-and-photography-image-5

Image by sora.KagiAke

然而,「餘白」包含了人類情感的細微差別和隱藏的意義。這種基於情感的上下文理解是沒有身體的AI最薄弱的領域。AI擅長於字面上處理圖像,但在創造包含情感深度和隱藏意義的餘白方面,仍然處於發展階段。

餘白中展現的人性

人類拍攝的照片中包含了超越影像記錄的意義。照片中可能包含不可預測性和情感的光譜,有時甚至是被視為「錯誤」的元素。這些偶然的產物成為照片所傳達故事的一部分,給觀賞者帶來共鳴和想像的空間。

2024-01-difference-between-ai-and-photography-image-9

Image by ザワ

AI生成圖像的過程

我們已經看到,AI生成的圖像與攝影之間確實存在的違和感,取決於兩者之間是否存在「餘白」。通過了解AI生成圖像的過程,可以加深理解。

  1. 文本轉換:AI將輸入的詞語轉換為易於解釋的概念。例如,輸入「飛翔的鳥」這樣的文本,AI將其理解為圖像的元素,並轉換為描繪海邊風景或狗的姿態的基本指示。
  2. 從噪音生成圖像:AI最初從完全隨機的噪音(無特徵的隨機像素集合)開始,逐漸去除這些噪音,形成具體的圖像。
  3. 圖像解碼:圖像解碼是將AI生成的圖像數據轉換為人類眼睛易於理解的形式的過程。例如,轉換為JPEG或PNG等人類可見的圖像格式,或進行圖像的分辨率、色彩、內部表現的修飾。


2024-01-difference-between-ai-and-photography-image-12

Image by mars

AI與人類觀點差異產生的不協和音

AI在生成圖像時消除「噪音」的過程基本上是遵循數學計算和算法。去除噪音意味著使圖像更接近現實,但這有其局限性。人類照片中自然存在的偶然性和情感的豐富性、不完美性,是計算難以捕捉的元素。在這一點上,AI和人類之間對噪音的看法已經產生了差異。

在生成圖像時進行的細微處理中,AI要完全理解和再現人類的複雜性和微妙的細節,目前的技術仍然困難。AI在字面解釋和基於數據的輸出方面表現出色,但尚未能完全模仿人類的經驗和情感深度。為了提高精度,AI現在需要的是能夠貼近人類生活中看似無意義的「餘白」。