La escasez de datos de aprendizaje de IA y las nuevas iniciativas empresariales | Focus #387
La evolución de la IA requiere asegurar datos de aprendizaje de alta calidad. Sin embargo, en los últimos años, se ha señalado que se ha agotado el uso de datos disponibles en Internet, y muchas empresas de IA están buscando nuevas formas de suministro de datos.
En esta ocasión, presentamos el contexto, las iniciativas empresariales y los puntos clave que los creadores deben tener en cuenta.
Escasez de datos de aprendizaje y uso de datos sintéticos
Recientemente, Elon Musk ha señalado que "se ha agotado el cúmulo de conocimiento humano para el entrenamiento de IA". Para resolver este problema de escasez de datos, muchas empresas han comenzado a utilizar "datos sintéticos".
Los datos sintéticos son un método en el que la IA genera datos que se utilizan nuevamente para el entrenamiento, pero existe la preocupación de que la calidad de los datos se deteriore y la precisión de la IA disminuya.
Generación de datos sintéticos y su impacto en las obras fotográficas
Para abordar esta escasez de datos, empresas como están desarrollando tecnologías para entrenar modelos de IA a partir de un número limitado de imágenes reales. Por otro lado, empresas como y están avanzando en el uso de datos sintéticos, permitiendo que la IA vuelva a aprender con los datos que ella misma genera.
Sin embargo, especialmente en el caso de datos fotográficos, se considera difícil reproducir la textura y composición realistas solo con datos sintéticos, por lo que la dependencia de datos fotográficos reales de alta calidad sigue siendo alta. Esto ha llevado a un uso masivo de datos fotográficos pasados.
Protección de derechos y medidas que los creadores deben considerar
Las obras de los creadores a menudo se utilizan como datos de aprendizaje de IA, lo que plantea problemas de derechos de autor y éticos. Es importante que los creadores sepan si sus obras están siendo utilizadas para el aprendizaje de IA y, si es necesario, tomen medidas para proteger sus derechos.
Además, con el aumento de contenido generado por IA, se está reevaluando el valor de la originalidad.