![2025-01-ai-photo-training-data-rights-cover-image](https://images.microcms-assets.io/assets/602ef6e805c54eec922fbce6bcb26986/66d7c58c1ed34954a119892c5142b3d8/2025-01-ai-photo-training-data-rights-cover-image.jpg?ar=1200%3A630&fit=crop&auto=format%2Ccompress&w=3840&q=75)
Cover photo takitokk
การพัฒนา AI จำเป็นต้องมีการจัดหาข้อมูลการเรียนรู้คุณภาพสูง อย่างไรก็ตาม ในช่วงไม่กี่ปีที่ผ่านมา มีการกล่าวว่าข้อมูลบนอินเทอร์เน็ตถูกใช้จนหมดสิ้น ทำให้หลายบริษัท AI กำลังค้นหาวิธีการจัดหาข้อมูลใหม่
ในครั้งนี้ เราจะนำเสนอพื้นฐานของเรื่องนี้ ความพยายามของบริษัท และประเด็นที่ผู้สร้างควรระวัง
การขาดแคลนข้อมูลการเรียนรู้และการใช้ข้อมูลสังเคราะห์
ในช่วงไม่กี่ปีที่ผ่านมา อีลอน มัสก์ ได้ชี้ให้เห็นว่า "การฝึก AI ได้ใช้ความรู้ของมนุษย์จนหมดสิ้น" เพื่อแก้ปัญหาการขาดแคลนข้อมูลนี้ หลายบริษัทได้เริ่มใช้ "ข้อมูลสังเคราะห์"
ข้อมูลสังเคราะห์คือวิธีการที่ AI สร้างข้อมูลขึ้นมาใหม่เพื่อใช้ในการฝึกซ้ำ แต่ก็มีความกังวลว่าคุณภาพของข้อมูลอาจลดลงและความแม่นยำของ AI อาจลดลง
![2025-01-ai-photo-training-data-rights-image-4](https://images.microcms-assets.io/assets/602ef6e805c54eec922fbce6bcb26986/9336862de4894cc1bf20f473830d73fa/2025-01-ai-photo-training-data-rights-image-1.jpg?auto=format%2Ccompress&fit=max&w=3840&q=75)
การสร้างข้อมูลสังเคราะห์และผลกระทบต่อผลงานภาพถ่าย
เพื่อรับมือกับการขาดแคลนข้อมูลนี้ บริษัทเช่น 〈โตชิบา〉 ได้พัฒนาเทคโนโลยีในการฝึก AI จากภาพจริงจำนวนน้อย ในขณะที่ 〈ไมโครซอฟท์〉 และ 〈Meta〉 กำลังใช้ข้อมูลสังเคราะห์และพยายามให้ AI เรียนรู้จากข้อมูลที่สร้างขึ้นเอง
![2025-01-ai-photo-training-data-rights-image-7](https://images.microcms-assets.io/assets/602ef6e805c54eec922fbce6bcb26986/149bf2256705410285bb47685cc8415a/2025-01-ai-photo-training-data-rights-image-2.jpg?auto=format%2Ccompress&fit=max&w=3840&q=75)
อย่างไรก็ตาม ในกรณีของข้อมูลภาพถ่าย การใช้ข้อมูลสังเคราะห์เพียงอย่างเดียวอาจจะไม่สามารถสร้างความสมจริงหรือองค์ประกอบได้อย่างดี ทำให้ยังคงมีการพึ่งพาข้อมูลภาพถ่ายจริงคุณภาพสูงอยู่มาก ซึ่งส่งผลให้มีการใช้ข้อมูลภาพถ่ายในอดีตจำนวนมาก
สิ่งที่ผู้สร้างควรระวังเกี่ยวกับการปกป้องสิทธิ์และมาตรการ
ผลงานของผู้สร้างมักถูกใช้เป็นข้อมูลการเรียนรู้ AI ซึ่งทำให้เกิดปัญหาด้านลิขสิทธิ์และจริยธรรม การทราบว่าผลงานของตนถูกใช้ในการเรียนรู้ AI หรือไม่ และดำเนินการปกป้องสิทธิ์เมื่อจำเป็นเป็นสิ่งสำคัญ
นอกจากนี้ การเพิ่มขึ้นของเนื้อหาที่สร้างโดย AI ทำให้มีการประเมินค่าใหม่ของความเป็นต้นฉบับ