
Image by Nokia621, from Wiki Commons
Meta E-maily odhalují Torrenting Pirátských Knih pro Trénink AI
Nově odhalené emaily se objevily jako to, co autoři knih nazývají „nejzničujícějšími důkazy“ proti Metě v probíhajícím soudním sporu o autorská práva, jak bylo poprvé nahlášeno na stránkách Ars Technica.
Na skok? Zde jsou rychlé fakty!
- Meta stáhla pomocí torrentů 81,7 terabajtů pirátských knih ze stínových knihoven jako LibGen a Z-Library.
- Vnitřní e-maily ukazují, že zaměstnanci společnosti Meta vyjádřili právní obavy ohledně torrentingu a seedingu autorsky chráněného materiálu.
- Meta údajně skrývala torrenting tím, že se vyhýbala serverům Facebooku a minimalizovala aktivitu seedingu.
Ars Technica informuje, že autoři tvrdí, že Meta nelegálně trénovala své AI modely na ukradených knihách a e-maily odhalují interní obavy týkající se legality torrentování a sdílení autorsky chráněného materiálu.
Minulý měsíc společnost Meta přiznala, že stahovala kontroverzní datovou sadu známou jako LibGen, která obsahuje desítky milionů pirátsky získaných knih.
Nicméně detaily zůstaly nejasné, dokud nebyly zveřejněny necenzurované e-maily.
Podle soudního podání autorů společnost Meta „stáhla pomocí torrentu minimálně 81,7 terabajtů dat z několika temných knihoven skrze stránku Anna’s Archive, včetně minimálně 35,7 terabajtů dat ze Z-Library a LibGen.“ Navíc „Meta také dříve stáhla pomocí torrentu 80,6 terabajtů dat z knihovny LibGen.“
„Rozsah nelegálního torrentového schématu společnosti Meta je ohromující,“ uvádí podání autorů, připomínající, že i „mnohem menší akty datové pirátství – pouhých 0,008 procenta z množství autorsky chráněných děl, která Meta nelegálně stáhla – vyústily v to, že soudci předali případ k trestnímu vyšetření do kanceláře státního zástupce USA.“
Ars Technica poznamenává, že e-maily odhalují také interní neklid mezi zaměstnanci Meta. V dubnu 2023 napsal výzkumný inženýr Nikolay Bashlykov: „Stahování přes torrenty z firemního laptopu se mi nezdá správné,“ a přidal emotikon s úsměvem.
Vyjádřil obavy z použití IP adres Meta „k načtení pirátského obsahu pomocí torrentů.“ Do září 2023 Bashlykov humor opustil, konzultoval právní tým Meta a varoval, že „používání torrentů by znamenalo ‚seedování‘ souborů – tj. sdílení obsahu venku, což by právně nemuselo být v pořádku.“
Navzdory těmto varováním autoři tvrdí, že Meta pokračovala v torrentování a sdílení pirátského obsahu, dokonce se pokoušela své aktivity skrýt.
Ars Technica uvádí, že interní zprávy ukazují, že Meta se vyhnula použití serverů Facebooku pro stažení datasetu, aby „vyhnula“ se „riziku“, že by někdo „vystopoval zdroj/seedaře/stažení“, jak popsal výzkumník Frank Zhang.
Michael Clark, výkonný ředitel společnosti Meta, také přiznal v usazení, že nastavení bylo upraveno „tak, aby mohlo dojít k co nejmenšímu možnému sezení.“
Autoři nyní tvrdí, že zaměstnanci společnosti Meta zapojení do rozhodnutí o torrentingu musí být znovu vyslechnuti, protože nové důkazy údajně „protiřečí předchozí svědectví z deponování.“
Například, ačkoliv generální ředitel Mark Zuckerberg tvrdil, že neměl při využívání LibGen pro trénink AI žádnou účast, nezamaskované zprávy naznačují, že „rozhodnutí využít LibGen bylo učiněno“ po „předchozím eskalování k MZ.“
Ars Technica informuje, že Meta tvrdí, že její trénink AI na LibGen představuje „rozumné užití“ a popírá jakékoliv nelegální šíření děl autorů. Nicméně, odhalení o torrentingu komplikují její obranu a umožňují autorům rozšířit svá tvrzení o přímém porušení autorských práv.
Jak případ pokračuje, Meta čelí rostoucí kritice za své zacházení s autorskými právy, přičemž autoři jsou odhodláni postavit technologického giganta před soud za to, co popisují jako „masivní nelegální schéma torrentování“.
Zanechat komentář
Zrušit