Nové súdne dokumenty v prípade Kadrey v. Meta ukazujú, že zamestnanci spoločnosti Meta interne diskutovali o používaní chránených autorských diel na trénovanie svojich AI modelov. Podľa žaloby, ktorú podali viacerí autori vrátane Sarah Silvermanovej a Ta-Nehisiho Coatesa, Meta vedome využívala chránené knihy bez licencie, pričom tvrdí, že ich použitie spadá pod „fair use“ (spravodlivé využitie).

Najnovšie uniknuté interné správy a e-maily naznačujú, že Meta uvažovala o získavaní tréningových údajov aj nelegálnou cestou. Diskusie sa týkali možného využívania pirátskych databáz, ako je Libgen, ako aj zneužitia údajov z platformy Reddit. O téme informoval portál TechCrunch.

Žiadosť o povolenie

V jednej zo správ z februára 2023 Meta výskumný inžinier Xavier Martinet navrhoval, aby firma kúpila e-knihy na maloobchodnom trhu namiesto uzatvárania licenčných dohôd s vydavateľmi. Zároveň poznamenal, že množstvo startupov už pravdepodobne používa pirátske knihy na trénovanie svojich modelov.

Melanie Kambadur, senior manažérka výskumného tímu Llama AI, v rovnakom chate uviedla, že Meta síce rokovala o licencovaní obsahu so službou Scribd, no zároveň zdôraznila, že firemní právnici sú v otázkach autorských práv čoraz menej konzervatívni. „Teraz máme viac peňazí, viac právnikov, viac obchodných partnerov a dokážeme veci urýchliť,“ napísala Kambadur.

Logo spoločnosti Meta.
Freepik

Diskusie o využití Libgen

Ďalšia správa odhalila, že Meta zvažovala použitie databázy Libgen, ktorá poskytuje prístup k nelegálne šíreným knihám a vedeckým článkom. Libgen bol v minulosti viackrát žalovaný, súd mu nariadil ukončenie činnosti a udelil pokuty v desiatkach miliónov dolárov.

V jednej z interných správ manažér produktového riadenia Meta Sony Theakanath označil Libgen za kľúčový zdroj na udržanie konkurencieschopnosti v AI odvetví. Podľa jeho slov by bez využitia Libgenu mohli mať modely Meta problém dosiahnuť špičkovú kvalitu (SOTA – state-of-the-art) v porovnaní s konkurenciou.

Zamestnanci Meta taktiež diskutovali o spôsoboch, ako minimalizovať právne riziká pri používaní neautorizovaných dát. Medzi návrhmi boli odstránenie súborov s označením „ukradnuté“ alebo „pirátstvo“ a nezverejňovanie informácií o využívaní týchto zdrojov.

Hoci Meta doteraz neposkytla oficiálne vyjadrenie k obvineniam, uniknuté dokumenty naznačujú, že firma vedome riskovala právne dôsledky, aby udržala krok s konkurenciou v pretekoch o vývoj najpokročilejších AI modelov.

Pošli nám TIP na článok



Teraz čítajú

NAJČÍTANEJŠIE ZO STARTITUP