V tomto texte boli použité materiály TASR.

Umelá inteligencia sa stala neoddeliteľnou súčasťou digitálneho sveta. Uľahčuje prácu, zrýchľuje vyhľadávanie informácií a prináša efektivitu, o akej sa pred pár rokmi len snívalo. No spolu s rastom jej schopností prichádzajú aj nové riziká. Jedným z nich je tzv. scrapovanie pomocou AI botov. Ide o automatizované sťahovanie obsahu z webových stránok, ktoré môže mať pre ich prevádzkovateľov nečakané dôsledky.

AI boty ako tichí „návštevníci“ so silou útoku

Zatiaľ čo klasické vyhľadávače, ako Google či Bing, webové stránky prechádzajú a následne ukladajú ich obsah do indexu, jazykové modely typu ChatGPT alebo Claude fungujú úplne inak. Informácie neukladajú, ale pri každom dopyte ich znovu sťahujú z webov v reálnom čase. To znamená, že aj jedna jednoduchá otázka od používateľa môže vyvolať desiatky požiadaviek na rôzne servery.

„V praxi sme sa u jedného z našich klientov stretli s tým, že sa jeho web musel počas niekoľkých dní vyrovnať so 120 000 dopytmi od jediného AI bota,“ uviedol Martin Michálek zo spoločnosti Pagespeed.ONE, ktorá sa špecializuje na optimalizáciu rýchlosti webov. Takéto správanie sa môže pre bežné webhostingy rovnať záťaži, ktorú by bežne spôsobil menší kybernetický útok.

Podobnú skúsenosť opisuje aj Ivan Sárközi z obchodného oddelenia poskytovateľa hostingu WEDOS. „Keď sa používateľ spýta ChatGPT na niečo, čo vyžaduje prechádzanie internetu, model si obsah z webov sťahuje v reálnom čase. Pri jednej otázke prejde aj desať stránok a viac, čo môže pri menších weboch spôsobovať krátke spomalenie alebo oneskorenie odpovedí pre ostatných návštevníkov,“ vysvetľuje.

Podľa Sárköziho sa v niektorých prípadoch intenzita prístupov od AI modelov blíži DDoS útokom. „Stretli sme sa s tým, že prístup z infraštruktúry AI modelu Claude bol natoľko intenzívny, že začal spomaľovať alebo aj krátkodobo odstavovať niekoľko webov. Technicky to zodpovedalo menšiemu DDoS útoku, a tak k tomu pristupovali aj naši technici,“ dodáva.

Právne riziká aj otázky férovosti

Scrapovanie pritom nepredstavuje len technický problém. Mnohé AI modely takto získavajú obsah bez súhlasu autorov a majiteľov webov, čím sa dostávajú do kolízie s právom. „Z právneho hľadiska môže scrapovanie zasahovať do autorských a súvisiacich práv, prípadne do práv k databázam, najmä v prípade takzvaného dolovania z textu a dát,“ upozorňuje Jiří Čermák z advokátskej kancelárie Jansa, Mokrý, Otevřel & partneři.

Podľa neho môže dôjsť aj k porušeniu zmluvných podmienok, ak súvisia so súhlasom používateľa, alebo dokonca ku konaniu v rozpore s pravidlami hospodárskej súťaže. Ide napríklad o neoprávnené spracovanie osobných údajov, zneužitie obchodného tajomstva či neetické využívanie konkurenčného obsahu.

Niektoré weby už začali proti AI botom bojovať, napríklad blokovaním ich prístupu prostredníctvom súboru robots.txt alebo iných technických opatrení. Podľa odborníkov však tento prístup nemusí byť dlhodobo výhodný. „V dávnych časoch podobne niektorí zakazovali prístup botom od Googlu. Až neskôr zistili, že ich konkurencia predbehla, pretože Google im prinášal cennú návštevnosť. Podobne je to teraz s novou vlnou AI botov. Rozhodne neodporúčam paušálne zákazy a robte ich len v opodstatnených prípadoch,“ upozorňuje Michálek.

Pošli nám TIP na článok



Teraz čítajú

NAJČÍTANEJŠIE ZO STARTITUP