Google, Meta und Co.

Tech-Firmen liefern sich millionenschweres Wettrennen um KI-Trainingsdaten

Uhr
von Lia Perbo und msc

Tech-Firmen zahlen Millionenbeträge, um an Daten für das Trainieren ihrer KI-Modelle zu gelangen. Dazu arbeiten sie mit Medienhäusern und Lizenzierungsfirmen zusammen. Die Preise variieren je nach Käufer und Inhaltstyp.

(Source: Pepi Stojanovski / unsplash.com)
(Source: Pepi Stojanovski / unsplash.com)

Tech-Firmen benötigen riesige Mengen an Daten, um ihre KI-Modelle zu trainieren. Um an diese Daten zu kommen, bedienen sie sich teilweise unlauterer Methoden - und geben Unmengen an Geld für die Rechte an Inhalten aus. 

Gemäss einem Bericht des Nachrichtenportals "Reuters" kaufen Big-Tech-Firmen von Menschen generierten Content bei Verlagen, Nachrichtenagenturen oder Bilderplattformen ein. Es handle sich um Millionengeschäfte: Die Deals mit den Medienhäusern hätten sich laut "Reuters" anfangs in einer Grössen­ordnung von jeweils 25 bis 50 Millionen Dollar bewegt und seien bei den meisten später nochmal erweitert worden. 

Kleinere Tech-Firmen seien dem Beispiel gefolgt und hätten in den vergangenen zwei Monaten eine neue "Flut von Aktivitäten" ausgelöst. Marktforscher wie Business Research Insights beziffern den Markt auf etwa 2,5 Milliarden US-Dollar und prognostizieren, dass er innerhalb eines Jahrzehnts auf fast 30 Milliarden US-Dollar anwachsen könnte. 

Nacktheit und Bewegtbilder kosten mehr

Während Tech-Giganten wie Google, Meta und das von Microsoft getragene OpenAI anfangs Daten kostenlos aus dem gesamten Internet "gescraped" haben, reichen diese Daten heute nicht mehr aus. Deshalb erleben Urheberrechtsinhaber aktuell einen regelrechten Ansturm und stehen vor der Herausforderung, ihre Inhalte zu lizenzieren.

Die Preise für lizenzierte Daten variieren stark. Laut Daniela Braga, CEO der Lizenzierungsfirma Defined.ai, zahlen KI-Unternehmen für die Verwendung eines Bildes rund einen US-Dollar. Bei Texten liege der Marktpreis bei 0,001 Dollar pro Wort. 

Teurer seien Bewegtbilder: Laut Angaben belaufen sich die Kosten für ein Kurzvideo zwischen zwei und vier Dollar. Für längere Filme werden Preise im Bereich von 100 bis 300 Dollar pro Stunde veranschlagt. Auch Bilder mit Nacktheit seien gefragt und sollen 5 bis 7 Dollar kosten, schreibt "Reuters".  

Fragwürdiger Datenschutz

Die Lizenzierung dürfte zwar einige Urheberrechts-Probleme der Tech-Unternehmen lösen, wirft aber auch neue Fragen auf im Hinblick auf die Privatsphäre der Nutzerinnen und Nutzer. Insbesondere wenn Daten von Bilderplattformen und Datenarchiven wie Photobucket gespeist werden, wie "Reuters" weiter schreibt. Das hat zur Folge, dass private Fotos oder intime Gedanken einer Person, die vor Jahrzehnten gepostet wurden, ohne Vorwarnung oder ausdrückliche Zustimmung der Person in KI-Ausgaben landen könnten. 

Lesen Sie ausserdem: Rechtsanwältin Isabelle Oehri erklärt im Fachbeitrag, wie KI-Training mit urheberrechtlich geschütztem Material zu beurteilen ist.

Webcode
LmEBKSK9