Nvidia står overfor alvorlige beskyldninger: Selskapet mistenkes for å ha forsøkt å forhandle med Anna's Archive – et av de største 'skyggebibliotekene' som huser piratkopierte bøker og akademisk materiale – for å få betalt tilgang til arkivene for å trene AI-modeller. Dette ble rapportert av TorrentFreak, som siterer dokumenter som dukket opp som del av en amerikansk rettssak.
Ifølge de publiserte materialene skal representanter fra Nvidias datastrategiteam ha diskutert muligheten for å betale for 'høyhastighetstilgang' til Anna's Archive, hvis volum estimeres til omtrent 500 terabyte data. Korrespondansen hevder dessuten at Nvidias ledelse godkjente en slik plan bare én uke etter første kontakt, til tross for advarsler om innholdets ulovlige opprinnelse.
Disse dokumentene dukket opp under en gruppesøksmål som anklager Nvidia for brudd på opphavsrett ved trening av språkmodeller på Books3-datasettet. Dette datasettet har tidligere blitt knyttet til piratkilder, inkludert nettstedet Bibliotik. Nvidia insisterer på at de brukte materialet under 'fair use', men det nye beviset fikk saksøkerne til å utvide søksmålet til å inkludere Anna's Archive-episoden.
Situasjonen virker spesielt betydningsfull mot bakteppet av store AI-selskaper som ivrig beskytter sine egne utviklinger, mens de samtidig, som påstått, ser gjennom fingrene med forfatteres rettigheter når de trener sine modeller. Det er ennå ikke bekreftet om en avtale med Anna's Archive ble inngått eller om penger ble overført, men det faktum at slike forhandlinger fant sted, kan alvorlig skade Nvidias omdømme.