Nvidia beschuldigt, für KI-Training auf Anna's Archive zuzugreifen

Nvidia steht unter schweren Vorwürfen: Das Unternehmen soll versucht haben, mit Anna's Archive – einer der größten 'Schattenbibliotheken' für urheberrechtlich geschützte Bücher und akademische Materialien – bezahlten Zugang zu dessen Archiven für das Training von KI-Modellen auszuhandeln. Das berichtete TorrentFreak unter Berufung auf Dokumente, die im Rahmen eines US-Gerichtsverfahrens aufgetaucht sind.

Den veröffentlichten Unterlagen zufolge diskutierten Vertreter von Nvidias Datenstrategieteam angeblich die Möglichkeit, für 'Hochgeschwindigkeitszugang' zu Anna's Archive zu zahlen, dessen Umfang auf etwa 500 Terabyte Daten geschätzt wird. Zudem soll die Führungsebene von Nvidia einen solchen Plan bereits eine Woche nach dem ersten Kontakt genehmigt haben – trotz Warnungen vor der illegalen Herkunft der Inhalte.

Diese Dokumente kamen im Zuge einer Sammelklage ans Licht, die Nvidia der Urheberrechtsverletzung beim Training von Sprachmodellen mit dem Books3-Datensatz beschuldigt. Dieser Datensatz wurde bereits früher mit Raubkopie-Quellen wie der Seite Bibliotik in Verbindung gebracht. Nvidia behauptet, die Materialien unter 'Fair Use' genutzt zu haben, doch die neuen Beweise veranlassten die Kläger, die Klage um den Vorfall mit Anna's Archive zu erweitern.

Die Situation wirkt vor dem Hintergrund besonders brisant, dass große KI-Unternehmen ihre eigenen Entwicklungen hartnäckig schützen, während sie – so die Vorwürfe – bei der Ausbildung ihrer Modelle die Rechte von Autoren ignorieren. Es gibt noch keine Bestätigung, ob ein Deal mit Anna's Archive abgeschlossen wurde oder Geld geflossen ist, doch allein die Tatsache solcher Verhandlungen könnte Nvidias Ruf erheblich schädigen.