NVIDIA kaltinama naudojusi piratines knygas savo AI mokymui
Pataisytame kolektyviniame ieškinyje, pateiktame JAV Kalifornijos šiaurės apygardos federaliniame teisme, teigiama, kad NVIDIA darbuotojai kreipėsi į „Anna’s Archive“ – svetainę, kurioje talpinama milijonai piratinių knygų ir akademinių straipsnių.
Ieškinyje teigiama, kad derybos vyko dėl „greitosios prieigos“ prie archyvo duomenų. „Anna’s Archive“ tariamai pranešė NVIDIA, kad medžiaga buvo gauta neteisėtai, ir paklausė, ar NVIDIA turi vidinį leidimą tęsti veiklą. Ieškinyje teigiama, kad vadovybė netrukus po to davė sutikimą.
„Anna’s Archive“ tariamai pasiūlė prieigą prie maždaug 500 terabaitų duomenų. Ši kolekcija tariamai apėmė milijonus knygų, iš kurių kai kurios paprastai yra prieinamos tik per „Internet Archive“ ir jos kontroliuojamą skaitmeninę skolinimo sistemą. Skunde nenurodyta, ar NVIDIA sumokėjo už prieigą ar naudojosi pasiūlytais duomenimis.
Autoriai kaltina NVIDIA naudojus kitus piratinius šaltinius, įskaitant „Books3“ duomenų rinkinį ir tokias svetaines kaip „Library Genesis“, „Sci-Hub“ ir „Z-Library“. Kitas teiginys sako, kad NVIDIA pateikė scenarijus ar įrankius, leidžiančius klientams atsisiųsti dalį „The Pile“ duomenų rinkinio, kuris apima „Books3“ (didelį duomenų rinkinį, kuriame yra 200 tūkst. knygų). Autoriai teigia, kad tai lėmė prisidėjimą prie autorių teisių pažeidimo ir netiesioginį autorių teisių pažeidimą, nes klientai galėjo naudotis piratinėmis knygomis per NVIDIA pateiktas priemones.
NVIDIA anksčiau teigė, kad AI mokymas yra sąžiningas naudojimas ir kad modeliai mokosi modelių, o ne saugo knygas. Byla tebenagrinėjama, o šie duomenys pateikiami iš naujausio ieškovų ieškinio.
