L'épuisement des données d'apprentissage AI et les nouvelles initiatives des entreprises | Focus #387
Pour l'évolution de l'AI, il est indispensable de garantir des données d'apprentissage de haute qualité. Cependant, ces dernières années, il est dit que les données disponibles sur Internet ont été épuisées, poussant de nombreuses entreprises AI à rechercher de nouvelles méthodes d'approvisionnement en données.
Nous vous présentons ici le contexte, les initiatives des entreprises et les points d'attention pour les créateurs.
L'épuisement des données d'apprentissage et l'utilisation des données synthétiques
Récemment, Elon Musk a souligné que « l'humanité a épuisé l'accumulation de connaissances pour l'entraînement AI ». Pour résoudre ce problème d'épuisement des données, de nombreuses entreprises ont commencé à utiliser des « données synthétiques ».
Les données synthétiques sont une méthode où l'AI génère elle-même des données pour un nouvel entraînement, mais il existe des préoccupations concernant la dégradation de la qualité des données et la baisse de précision de l'AI.
La génération de données synthétiques et l'impact sur les œuvres photographiques
Pour faire face à cette pénurie de données, des entreprises comme Toshiba développent des technologies permettant d'entraîner des modèles AI à partir d'un petit nombre d'images réelles. D'autre part, Microsoft et Meta explorent l'utilisation de données synthétiques pour réentraîner l'AI avec des données générées par elle-même.
Cependant, dans le cas des données photographiques, il est souvent difficile de reproduire la texture et la composition réalistes uniquement avec des données synthétiques, ce qui maintient une forte dépendance aux données photographiques réelles de haute qualité. Cela entraîne une tendance à l'utilisation massive de données photographiques passées.
Les droits de protection et les mesures que les créateurs doivent prendre
Les œuvres des créateurs sont souvent utilisées comme données d'apprentissage AI, soulevant des questions de droits d'auteur et d'éthique. Il est important de savoir si votre œuvre est utilisée pour l'apprentissage AI et de prendre les mesures nécessaires pour protéger vos droits.
De plus, avec l'augmentation du contenu généré par AI, la valeur de l'originalité est également réévaluée.