magazine
2025.01.14

Der Mangel an AI-Trainingsdaten und neue Unternehmensinitiativen | Focus #387

2025-01-ai-photo-training-data-rights-cover-image

Cover photo takitokk

Für den Fortschritt der KI ist die Sicherstellung hochwertiger Trainingsdaten unerlässlich. In den letzten Jahren wurde jedoch festgestellt, dass die im Internet verfügbaren Daten erschöpft sind, und viele KI-Unternehmen suchen nach neuen Wegen zur Datenbeschaffung.

In diesem Artikel stellen wir den Hintergrund, die Unternehmensinitiativen und wichtige Punkte vor, die Kreative beachten sollten.

Der Mangel an Trainingsdaten und die Nutzung synthetischer Daten

In den letzten Jahren hat Elon Musk darauf hingewiesen, dass „die kumulierten Kenntnisse der Menschheit für das Training von KI aufgebraucht sind“. Um dieses Datenmangelproblem zu lösen, beginnen viele Unternehmen, „synthetische Daten“ zu nutzen.

Synthetische Daten sind eine Methode, bei der von der KI selbst generierte Daten erneut für das Training verwendet werden. Es besteht jedoch die Sorge, dass die Datenqualität abnimmt und die Genauigkeit der KI sinkt.

2025-01-ai-photo-training-data-rights-image-4

Die Generierung synthetischer Daten und deren Auswirkungen auf Fotowerke

Um diesem Datenmangel zu begegnen, entwickeln Unternehmen wie Technologien, um KI-Modelle mit wenigen realen Bildern zu trainieren. Gleichzeitig nutzen Unternehmen wie und synthetische Daten, um von der KI selbst generierte Daten erneut zu trainieren.

2025-01-ai-photo-training-data-rights-image-7

Besonders bei Fotodaten wird es als schwierig angesehen, mit synthetischen Daten allein realistische Texturen und Kompositionen nachzubilden. Daher bleibt die Abhängigkeit von hochwertigen realen Fotodaten hoch, was zu einer verstärkten Nutzung von alten Fotodaten führt.

Rechte und Schutzmaßnahmen, die Kreative beachten sollten

Oft werden die Werke von Kreativen als AI-Trainingsdaten genutzt, was zu urheberrechtlichen und ethischen Fragen führt. Es ist wichtig, sich darüber im Klaren zu sein, ob die eigenen Werke für das KI-Training verwendet werden, und gegebenenfalls Schutzmaßnahmen zu ergreifen.

Mit der Zunahme von KI-generierten Inhalten wird auch der Wert von Originalität neu bewertet.