
ความรู้สึกแปลกเมื่อมองภาพที่สร้างขึ้น
การสร้างภาพโดย AI พยายามที่จะสร้างภาพตามข้อความที่ป้อนอย่างซื่อสัตย์ ความซื่อสัตย์ในการทำตามที่บอกและการเรียนรู้จากฐานข้อมูลขนาดใหญ่เป็น 'เทคนิคของพระเจ้า' ที่เกินกว่าขอบเขตการรับรู้ของมนุษย์ ซึ่งมนุษย์ไม่สามารถทำได้ อย่างไรก็ตาม ผลลัพธ์ของภาพที่สร้างขึ้นมักจะไม่สามารถดึงดูดใจมนุษย์ได้ ในครั้งนี้ เราจะเจาะลึกถึงเหตุผลของความรู้สึกแปลกที่เกิดขึ้นระหว่างภาพที่สร้างโดย AI และการถ่ายภาพ
จากมุมมองของพื้นที่ว่าง
ภาพที่สร้างขึ้นส่วนใหญ่จะเปลี่ยนข้อความให้เป็นภาพได้อย่างถูกต้อง ส่วนใหญ่ไม่มีความฟุ่มเฟือย หรือที่เรียกว่า 'พื้นที่ว่าง' 'พื้นที่ว่าง' หมายถึงพื้นที่หรือข้อมูลที่ถูกทิ้งไว้โดยเจตนาหรือไม่เจตนา ภาพที่สร้างโดย AI มักจะเต็มไปด้วยรายละเอียดและขาดพื้นที่ว่างเหล่านี้ แม้ว่าจะถ่ายทอดข้อมูลอย่างซื่อสัตย์ แต่ก็ไม่มีบริบท

Image by sora.KagiAke
อย่างไรก็ตาม 'พื้นที่ว่าง' แฝงไปด้วยนัยทางอารมณ์ของมนุษย์และความหมายที่ซ่อนอยู่ ความเข้าใจเชิงบริบทตามอารมณ์เหล่านี้เป็นจุดอ่อนที่สุดของ AI ที่ไม่มีร่างกาย AI มีความสามารถในการประมวลผลภาพอย่างแท้จริง แต่ยังอยู่ในระหว่างการพัฒนาในการสร้างพื้นที่ว่างที่มีความลึกทางอารมณ์และความหมายที่ซ่อนอยู่
ความเป็นมนุษย์ที่ปรากฏในพื้นที่ว่าง
ภาพถ่ายที่มนุษย์ถ่ายมีความหมายมากกว่าการบันทึกภาพ ภาพถ่ายมีความคาดไม่ถึงและสเปกตรัมของอารมณ์ บางครั้งมีองค์ประกอบที่ถือว่าเป็น 'ความผิดพลาด' ที่ไม่ได้ตั้งใจ สิ่งเหล่านี้ทั้งหมดเป็นส่วนหนึ่งของเรื่องราวที่ภาพถ่ายทอดและให้พื้นที่สำหรับความเห็นอกเห็นใจหรือจินตนาการของผู้ชม

Image by ザワ
กระบวนการที่ AI สร้างภาพ
เราได้เห็นแล้วว่าความรู้สึกแปลกที่เกิดขึ้นระหว่างภาพที่สร้างโดย AI และการถ่ายภาพนั้นขึ้นอยู่กับว่ามี 'พื้นที่ว่าง' ระหว่างทั้งสองหรือไม่ มาทำความเข้าใจกระบวนการที่ AI สร้างภาพให้ลึกซึ้งยิ่งขึ้น
- การแปลงข้อความ: AI แปลงคำที่ป้อนให้เป็นแนวคิดที่เข้าใจง่าย เช่น เมื่อป้อนข้อความ 'นกบินบนท้องฟ้า' AI จะเข้าใจสิ่งนี้เป็นองค์ประกอบของภาพและแปลงเป็นคำสั่งพื้นฐานสำหรับการวาดภาพทิวทัศน์ชายทะเลหรือสุนัข
- การสร้างภาพจากเสียงรบกวน: AI เริ่มจากเสียงรบกวนที่สุ่มอย่างสมบูรณ์ (กลุ่มพิกเซลที่ไม่มีลักษณะเฉพาะ) และค่อยๆ กำจัดเสียงรบกวนนี้ออกไปเพื่อสร้างภาพที่ชัดเจน
- การถอดรหัสภาพ: การถอดรหัสภาพเป็นกระบวนการที่ AI แปลงข้อมูลภาพที่สร้างขึ้นให้อยู่ในรูปแบบที่เข้าใจง่ายสำหรับตามนุษย์ เช่น การแปลงเป็นรูปแบบภาพที่มองเห็นได้เช่น JPEG หรือ PNG หรือการปรับแต่งความละเอียดและสีของภาพ

Image by mars
ความไม่ลงรอยที่เกิดจากความแตกต่างในมุมมองของ AI และมนุษย์
กระบวนการที่ AI ลบ 'เสียงรบกวน' เมื่อสร้างภาพนั้นเป็นไปตามการคำนวณทางคณิตศาสตร์และอัลกอริทึม การลบเสียงรบกวนหมายถึงการทำให้ภาพใกล้เคียงกับความเป็นจริงมากขึ้น แต่ก็มีข้อจำกัด ความบังเอิญและความสมบูรณ์ของอารมณ์ที่มีอยู่ในภาพถ่ายของมนุษย์เป็นองค์ประกอบที่จับต้องได้ยากด้วยการคำนวณ ในจุดนี้เองที่ความแตกต่างในมุมมองเกี่ยวกับเสียงรบกวนเกิดขึ้นระหว่าง AI และมนุษย์
ในกระบวนการที่ซับซ้อนในการสร้างภาพ AI ยังไม่สามารถเข้าใจและสร้างความซับซ้อนและความละเอียดอ่อนของมนุษย์ได้อย่างสมบูรณ์ในเทคโนโลยีปัจจุบัน AI มีความสามารถในการตีความตามตัวอักษรและการสร้างผลลัพธ์ตามข้อมูล แต่ยังไม่สามารถเลียนแบบประสบการณ์และความลึกซึ้งของอารมณ์มนุษย์ได้อย่างเต็มที่ สิ่งที่ AI จำเป็นต้องทำในตอนนี้เพื่อเพิ่มความแม่นยำคือการเข้าใจ 'พื้นที่ว่าง' ที่ดูเหมือนไร้ความหมายในชีวิตประจำวันของมนุษย์