Nvidia wordt geconfronteerd met ernstige beschuldigingen. Het bedrijf zou geprobeerd hebben te onderhandelen met Anna's Archive, een van de grootste 'schaduwbibliotheken' die piratenboeken en academisch materiaal host, voor betaalde toegang tot de archieven om AI-modellen te trainen. Dit meldt TorrentFreak op basis van documenten die naar voren zijn gekomen in een Amerikaanse rechtszaak.
Volgens de gepubliceerde stukken zouden vertegenwoordigers van Nvidia's datastrategieteam de mogelijkheid hebben besproken om te betalen voor 'snelle toegang' tot Anna's Archive, waarvan het volume wordt geschat op ongeveer 500 terabyte aan data. Bovendien zou de leiding van Nvidia het plan binnen een week na het eerste contact hebben goedgekeurd, ondanks waarschuwingen over de illegale oorsprong van de inhoud.
Deze documenten kwamen aan het licht tijdens een collectieve rechtszaak waarin Nvidia wordt beschuldigd van auteursrechtinbreuk bij het trainen van taalmodellen op de Books3-dataset. Deze dataset is eerder in verband gebracht met piratenbronnen, waaronder de site Bibliotik. Nvidia houdt vol dat het de materialen onder 'fair use' heeft gebruikt, maar het nieuwe bewijs heeft de eisers ertoe aangezet de rechtszaak uit te breiden met de Anna's Archive-episode.
De situatie lijkt extra gevoelig te liggen nu grote AI-bedrijven hun eigen ontwikkelingen fel beschermen, terwijl ze, zoals wordt beweerd, een oogje dichtknijpen voor auteursrechten bij het trainen van hun modellen. Er is nog geen bevestiging dat een deal met Anna's Archive is afgerond of dat er geld is overgemaakt, maar het feit alleen al dat dergelijke onderhandelingen hebben plaatsgevonden, kan Nvidia's reputatie ernstige schade toebrengen.