
Image by Marco Verch, from Ccnull
AI Labyrint: Cloudflareův nový nástroj klame AI vyhledávače falešnými webovými stránkami
Cloudflare oznámil „AI Labyrinth“, nástroj určený k boji proti webovým scraperům poháněným umělou inteligencí, které bez povolení extrahují data z webových stránek.
Spěcháte? Zde jsou rychlé fakty:
- Nástroj generuje realistický, ale zbytečný obsah vytvořený AI, aby plýtval časem scraperů.
- AI Labyrinth cílí na boty, které ignorují robots.txt, včetně těch od Anthropic a Perplexity AI.
- Funguje jako honeypot nové generace, detekuje a identifikuje neautorizované crawlers.
Namísto přímého blokování těchto botů je AI Labyrint svede do nekonečného bludiště stránek generovaných umělou inteligencí, čímž plýtvá jejich časem a výpočetním výkonem.
„Když zjistíme neautorizované procházení, místo blokování požadavku odkážeme na sérii stránek generovaných umělou inteligencí, které jsou dostatečně přesvědčivé, aby lákaly procházecí roboty k jejich procházení,“ vysvětlil Cloudflare na svém blogu.
„Přestože vypadá tento obsah realisticky, ve skutečnosti to není obsah stránek, které chráníme, takže procházecí robot zbytečně plýtvá časem a zdroji,“ dodal Cloudflare.
ArsTechnica upozorňuje, že tzv. AI scrapery jsou problém, protože sbírají obrovské množství dat z webových stránek, často bez povolení, aby trénovaly AI modely. To vytváří několik problémů: může to porušovat práva k duševnímu vlastnictví, obcházet kontrolní mechanismy, které majitelé webových stránek používají k regulaci přístupu.
Navíc může scraping vést k zneužití citlivých nebo vlastnických dat. Objem scrapingu dramaticky vzrostl, Cloudflare hlásí přes 50 miliard požadavků na crawlers denně.
Toto rozsáhlé extrahování dat vyčerpává zdroje webových stránek, ovlivňuje jejich výkon a soukromí a přispívá k rostoucím obavám z využívání dat vývojáři AI.
Zatímco vlastníci webových stránek tradičně spoléhají na soubor robots.txt pro řízení toho, co mohou a nemohou boti přistupovat, mnoho společností v oblasti AI – včetně hlavních hráčů jako Anthropic a Perplexity AI – bylo obviněno z ignorování těchto direktiv, jak uvedl The Verge.
AI Labyrint společnosti Cloudflare nabízí agresivnější přístup k řešení těchto nežádoucích botů. Nástroj funguje jako „honeypot nové generace“, který láká boty hlouběji do umělé sítě obsahu, který vypadá skutečně, ale pro trénink AI je nakonec zcela zbytečný.
Na rozdíl od tradičních honeypotů, které boty již umí identifikovat, vytváří AI Labyrint realisticky vypadající, avšak nerelevantní informace pomocí AI platformy Cloudflare Workers.
„Žádný skutečný člověk by se nevydal čtyři úrovně hluboko do bludiště nesmyslů generovaných umělou inteligencí,“ poznamenala společnost Cloudflare. „Každý návštěvník, který tak učiní, je velmi pravděpodobně bot, takže to nám dává zcela nový nástroj k identifikaci a otisku škodlivých botů.“
Obsah generovaný umělou inteligencí je navržen tak, aby byl vědecky přesný, ale nesouvisející s chráněnou webovou stránkou.
Toto zajišťuje, že nástroj nepřispívá k šíření dezinformací, zároveň ale stále mate AI scrapery. Klamavé stránky jsou pro lidské návštěvníky neviditelné a neovlivňují hodnocení ve vyhledávačích.
AI Labyrinth je dostupný jako bezplatná funkce na přání pro všechny uživatele Cloudflare. Správci webových stránek ji mohou aktivovat prostřednictvím svého nástěnky Cloudflare v nastavení správy botů.
Společnost toto popisuje pouze jako začátek protiopatření poháněných AI, s budoucími plány na vytvoření ještě klamavějších falešných stránek.
Kočka-a-myš hra mezi webovými stránkami a AI scrapery pokračuje, přičemž Cloudflare přichází s inovativním přístupem k ochraně online obsahu. Stále však zůstávají otázky o tom, jak rychle se AI společnosti přizpůsobí těmto pastem a zda by tato strategie mohla vést k eskalaci v boji o webová data.
Zanechat komentář
Zrušit