Video-Scraping bei Youtube, Netflix und Co.

Nvidia sammelt Daten im grossen Stil

Uhr
von Alexandra Hüsler und yzu

Nvidia will mit Video-Scraping bei Youtube, Netflix und Co. täglich eine Datenmenge sammeln, die der entspricht, die ein Mensch während seines Lebens visuell wahrnimmt. Der verwendete Open-Source-Downloader soll von 20 bis 30 virtuellen Maschinen unterstützt werden, um nicht blockiert zu werden.

(Source: BoliviaInteligente / Unsplash)
(Source: BoliviaInteligente / Unsplash)

Chip-Gigant Nvidia soll laut internen Dokumenten, die von "404 Media" aufgedeckt wurden, in grossem Stil Videos aus dem Internet gesammelt haben, berichtet der "Standard". Das Ziel dieses Projekts, das den Namen "Cosmos" trägt, sei, die KI-Modelle des Unternehmens mit einer grossen Menge an visuellen Daten zu trainieren.

Nvidia strebte an, täglich eine Datenmenge zu sammeln, die dem entspricht, was ein Mensch in einem ganzen Leben visuell wahrnimmt. Das seien schätzungsweise etwa 53 Jahre oder 464’000 Stunden an Videos. Diese Daten sollen für das KI-Training verschiedener Anwendungen genutzt werden, dazu gehören der  "Omniverse-3D-Welt-Generator", autonome Fahrsysteme und "Digital Humans" ("Digitale Menschen").

Ethische Bedenken bei Mitarbeitenden

Die Methode, die Nvidia dabei anwende, sei ebenso umstritten: Mithilfe automatisierter Tools werden Millionen von Videos von Plattformen wie YouTube und Netflix heruntergeladen. Um nicht blockiert zu werden, sei der verwendete Open-Source-Youtube-Downloader von 20 bis 30 virtuellen Maschinen unterstützt worden, die regelmässig die IP-Adressen erneuern sollten.

Nvidia rechtfertigt dieses Vorgehen mit dem Argument, dass das Urheberrecht primär die Ausdrucksform, nicht aber die zugrundeliegenden Fakten oder Ideen schütze. Zudem beruft sich das Unternehmen auf die sogenannte "faire Nutzung" für transformative Zwecke.

Über die rechtlichen Aspekte hinaus wirft die Praxis des Video-Scrapings auch ethische Fragen auf. Von Mitarbeiterseite habe es Bedenken hinsichtlich der Rechtmässigkeit und Ethik des Vorgehens gegeben.

 

An der KI-Messe GTC in Kalifornien hat Nvidia im März 2024 eine neue GPU für KI-Training vorgestellt. Mit der GPU soll das Training von KI-Modellen weniger Energie verbrauchen. Mehr dazu lesen Sie hier.

Webcode
VpZTvd6c