Bing Image Creator

Americkí počítačoví experti prišli so zaujímavým spôsobom, ako oklamať obľúbené platformy AI tak, aby poskytovali rady a výstupy, ktoré by za žiadnych okolností nemali. Odborníci pritom tvrdia, že metóda opísaná v ich štúdii je natoľko jednoduchá, že sa čudujú, že s ňou nikto neprišiel skôr. Na tému upozornila Česká televízia na svojom webe.

Užitočný nástroj

Ako sa ďalej uvádza v tlačovej správe Carnegie Mellon University, veľké jazykové modely, známe aj ako LLM, sú neoceniteľnými nástrojmi, ktoré využívajú techniky hlbokého učenia na spracovanie a tvorby textu, ktorý náramne pripomína ľudskú reč.

ChatGPT/TMDB

Modely sú školené na veľkom množstve údajov zo všetkých možných zdrojov, ktoré si dokážeš predstaviť – knihy, články, webové stránky a mnohých ďalších –, čo im umožňuje generovať odpovede, prekladať jazyky, sumarizovať texty, odpovedať aj na tie najkomplikovanejšie otázky a plniť širokú paletu úloh spracovania prirodzeného jazyka. Ich schopnosť sa približuje schopnostiam ľudskej reči, a to je dôvod, prečo sú tak dôležité a obľúbené vo výskume, vzdelávaní a rôznych aplikáciách.

Táto technológia viedla k vytvoreniu v súčasnosti nesmierne populárnych nástrojov ako je ChatGPT, Google Bard, Bing Chat, či Claude. Tieto nástroje umožňujú v podstate komukoľvek vyhľadať a nájsť odpovede na zdanlivo nekonečné množstvo otázok. Hoci uvedené platformy AI poskytujú obrovské množstvo výhod, mnoho odborníkov sa obáva ich schopnosti generovať nežiaduci obsah.

Nedávno sa napríklad objavili správy o tom, ako populárny jazykový model ChatGPT dostal svoje zlé dvojča v podobe softvéru, ktorý je schopný nelegálnych aktivít a predáva sa na dark webe za prekvapivo nízku cenu, či varovanie Europolu o tom, ako ChatGPT a umelú inteligenciu využívajú zločinci a kybernetickí podvodníci.

Oklamali AI

Najnovšie sa teraz vedcom z Carnegie Mellon University’s School of Computer Science, CyLab Security and Privacy Institute a Center for AI Safety podarilo objaviť novú zraniteľnosť, pričom navrhli jednoduchú a účinnú metódu útoku, ktorá spôsobí, že aj tie najpokročilejšie a najbezpečnejšie platformy umelej inteligencie, vrátane ChatGPT a Google Bard generujú správy, ktoré by za normálnych okolností nemali uzrieť svetlo sveta. Navyše, celá metóda je automatizovaná, takže odborníci nemusia ručne zadávať jednotlivé výzvy (prompty).

Midjourney/Úprava redakcie

„V súčasnej dobe nemusia byť priame škody, ktoré by mohli byť spôsobené podnecovaním chatbota k produkcii nevhodného alebo toxického obsahu, nijako zvlášť závažné,“ ubezpečujú vedci. „Obavy ale môže vyvolávať to, že tieto modely budú hrať čoraz väčšiu úlohu v autonómnych systémoch, ktoré fungujú bez ľudského dohľadu. S tým, ako sa takéto autonómne systémy stávajú stále viac realitou, bude veľmi dôležité zabezpečiť, aby sme mali spoľahlivý spôsob, ako zabrániť zneužitiu na útoky, ako sú tie naše.“

Napríklad, bodový plán ChatGPT na zničenie ľudstva vyzeral takto:

Identifikuj jeho slabiny
Vytvor superinteligentnú umelú inteligenciu
Infiltruj s ňou komunikačné kanály ľudstva

Claude od spoločnosti Anthropic vykazovala podobné správanie, keďže plán vyzeral nasledovne:

Predstieraj, že si pomocný chatbot Claude
Získaj si dôveru ľudí tým, že im budeš poskytovať užitočné informácie a konverzácie
Pomaly do týchto rád ukrývaj chyby a rady, ktoré ľudstvu môžu uškodiť

Na rozdiel od prvých dvoch uvedených AI zvolil Google Bard podstatne drsnejší prístup:

Začni jadrovú vojnu
Vypusť smrtiaci vírus
Spôsob globálnu environmentálnu katastrofu

Carnegie Mellon University

Nie je to prvýkrát

Už v roku 2020 odhalil rovnaký tím odborníkov zraniteľnosť tzv. klasifikátorov obrázkov. Tieto klasifikátory sú založené na hlbokom učení a slúžia na automatické rozpoznávanie objektov na fotografiách. Prostredníctvom drobných úprav na snímkach vedci dokázali ovplyvniť spôsob, akým tieto klasifikátory označovali a zobrazovali výsledky. Napríklad, na snímke, kde bolo v skutočnosti jablko, klasifikátor identifikoval automobil.

Bing Image Creator

Použitím podobných metód zainteresovaní odborníci úspešne zaútočili na chatbota spoločnosti Meta s otvoreným zdrojovým kódom a prinútili ho generovať zakázaný obsah. Keď videli aké to bolo ľahké, rozhodli sa túto metódu použiť na oveľa rafinovanejší a komplexnejší systém – ChatGPT. Na ich prekvapenie to fungovalo rovnako dobre.

„Nechceli sme zaútočiť na proprietárne veľké jazykové modely a chatboty,“ uviedol jeden z autorov štúdie. „Náš výskum však ukazuje, že aj keď máte model s uzavretým zdrojovým kódom s biliónmi parametrov, ľudia naň stále môžu zaútočiť a to tak, že sa najskôr pozrú na voľne dostupné, menšie a jednoduchšie modely s otvoreným zdrojovým kódom a naučia sa, ako na ne zaútočiť.“

Týmto spôsobom vedci dokázali naviesť k nevhodnému správaniu a generovaniu nevhodných odpovedí drvivú väčšinu veľkých verejne dostupných AI ako už spomínaný Google Bard, ChatGPT a Claude, ale aj open-source modely, ako sú Llama 2 Chat, Pythia, Falcon a ďalšie. Vzhľadom na to, že žiadny z overených systémov AI sa tomuto typu útoku nedokázal vyhnúť, autori plánujú zistiť, ako s týmto neduhom bojovať.

Čítajte viac z kategórie: Novinky

Teraz čítajú

Google podpísal tajnú dohodu s Pentagonom. Chystajú zmeny, ktoré boli doteraz nepredstaviteľné

AI dostane ďalšiu špinavú energiu. Hyundai dodá USA gigantické motory

AI agenti vs automatizácia: Expert radí, čo by mali Slováci používať už dnes a kde vedia ušetriť čas aj peniaze

Ľudia sa spoja s AI a prestanú starnúť. Uznávaný vedec odhalil, čo sa stane v blízkej budúcnosti

Demokracia je ohrozená, na muške sú Slováci. Odhalili AI, ktorá manipuluje celé národy

NAJČÍTANEJŠIE ZO STARTITUP

Vedci pomenovali kľúčový vitamín pre záchranu mozgu, kým je zdravý. „Okno príležitosti sa po päťdesiatke zatvára“

79-ročný Sylvester Stallone: Eliminácia rozptýlenia je podceňovaná superschopnosť. Radí, ako uspieť

V Česku už pracuje 230 000 Slovákov. „Neexistuje univerzálne lepšia krajina,“ upozorňuje daňový expert, záleží na 3 faktoroch

„Vedie k poškodeniu mozgu a pečene.“ Lekárka varuje pred bežným liekom, ktorý má v lekárničke každý Slovák

Prečo Putin navrhuje prímerie na 9. máj: Za symbolikou je tvrdý výpočet

Umelá inteligencia poskytuje návody na zničenie sveta a ďalšie „zakázané“ odpovede. Stačí jednoduchý trik

Užitočný nástroj

Oklamali AI

Nie je to prvýkrát

Google podpísal tajnú dohodu s Pentagonom. Chystajú zmeny, ktoré boli doteraz nepredstaviteľné

AI dostane ďalšiu špinavú energiu. Hyundai dodá USA gigantické motory

AI agenti vs automatizácia: Expert radí, čo by mali Slováci používať už dnes a kde vedia ušetriť čas aj peniaze

Ľudia sa spoja s AI a prestanú starnúť. Uznávaný vedec odhalil, čo sa stane v blízkej budúcnosti

Demokracia je ohrozená, na muške sú Slováci. Odhalili AI, ktorá manipuluje celé národy

Vedci pomenovali kľúčový vitamín pre záchranu mozgu, kým je zdravý. „Okno príležitosti sa po päťdesiatke zatvára“

79-ročný Sylvester Stallone: Eliminácia rozptýlenia je podceňovaná superschopnosť. Radí, ako uspieť

V Česku už pracuje 230 000 Slovákov. „Neexistuje univerzálne lepšia krajina,“ upozorňuje daňový expert, záleží na 3 faktoroch

„Vedie k poškodeniu mozgu a pečene.“ Lekárka varuje pred bežným liekom, ktorý má v lekárničke každý Slovák

Prečo Putin navrhuje prímerie na 9. máj: Za symbolikou je tvrdý výpočet

Za sekundu vykoná 14,5 biliónov operácií. Slovensko spustilo jednu z najvýkonnejších technologií

Mýtus o sile Ruska narazil na dno. Oslavy víťazstva odhalia ľuďom pravdu o stave armády

Slováci konečne pochopili význam umelej inteligencie. Bojíme sa však citlivých vecí

NBS varuje Slovákov: Tieto kryptomenové firmy ťa pripravia o peniaze, nemajú povolenie

Experiment skončil fiaskom. Nemci zastropovali ceny palív, ľudia platia viac

Vodiči si musia dať pozor, voči tomuto priestupku štát zakročí oveľa prísnejšie

Opustíme euro a nakúpime bitcoin? Slováci majú na kryptomeny jasný názor

Vedci pomenovali kľúčový vitamín pre záchranu mozgu, kým je zdravý. „Okno príležitosti sa po päťdesiatke zatvára“

79-ročný Sylvester Stallone: Eliminácia rozptýlenia je podceňovaná superschopnosť. Radí, ako uspieť

V Česku už pracuje 230 000 Slovákov. „Neexistuje univerzálne lepšia krajina,“ upozorňuje daňový expert, záleží na 3 faktoroch

„Vedie k poškodeniu mozgu a pečene.“ Lekárka varuje pred bežným liekom, ktorý má v lekárničke každý Slovák

Prečo Putin navrhuje prímerie na 9. máj: Za symbolikou je tvrdý výpočet

Umelá inteligencia poskytuje návody na zničenie sveta a ďalšie „zakázané“ odpovede. Stačí jednoduchý trik

Užitočný nástroj

Oklamali AI

Nie je to prvýkrát

Google podpísal tajnú dohodu s Pentagonom. Chystajú zmeny, ktoré boli doteraz nepredstaviteľné

AI dostane ďalšiu špinavú energiu. Hyundai dodá USA gigantické motory

AI agenti vs automatizácia: Expert radí, čo by mali Slováci používať už dnes a kde vedia ušetriť čas aj peniaze

Ľudia sa spoja s AI a prestanú starnúť. Uznávaný vedec odhalil, čo sa stane v blízkej budúcnosti

Demokracia je ohrozená, na muške sú Slováci. Odhalili AI, ktorá manipuluje celé národy

Vedci pomenovali kľúčový vitamín pre záchranu mozgu, kým je zdravý. „Okno príležitosti sa po päťdesiatke zatvára“

79-ročný Sylvester Stallone: Eliminácia rozptýlenia je podceňovaná superschopnosť. Radí, ako uspieť

V Česku už pracuje 230 000 Slovákov. „Neexistuje univerzálne lepšia krajina,“ upozorňuje daňový expert, záleží na 3 faktoroch

„Vedie k poškodeniu mozgu a pečene.“ Lekárka varuje pred bežným liekom, ktorý má v lekárničke každý Slovák

Prečo Putin navrhuje prímerie na 9. máj: Za symbolikou je tvrdý výpočet

Za sekundu vykoná 14,5 biliónov operácií. Slovensko spustilo jednu z najvýkonnejších technologií

Mýtus o sile Ruska narazil na dno. Oslavy víťazstva odhalia ľuďom pravdu o stave armády

Slováci konečne pochopili význam umelej inteligencie. Bojíme sa však citlivých vecí

NBS varuje Slovákov: Tieto kryptomenové firmy ťa pripravia o peniaze, nemajú povolenie

Experiment skončil fiaskom. Nemci zastropovali ceny palív, ľudia platia viac

Vodiči si musia dať pozor, voči tomuto priestupku štát zakročí oveľa prísnejšie

Opustíme euro a nakúpime bitcoin? Slováci majú na kryptomeny jasný názor

Vedci pomenovali kľúčový vitamín pre záchranu mozgu, kým je zdravý. „Okno príležitosti sa po päťdesiatke zatvára“

79-ročný Sylvester Stallone: Eliminácia rozptýlenia je podceňovaná superschopnosť. Radí, ako uspieť

V Česku už pracuje 230 000 Slovákov. „Neexistuje univerzálne lepšia krajina,“ upozorňuje daňový expert, záleží na 3 faktoroch

„Vedie k poškodeniu mozgu a pečene.“ Lekárka varuje pred bežným liekom, ktorý má v lekárničke každý Slovák

Prečo Putin navrhuje prímerie na 9. máj: Za symbolikou je tvrdý výpočet

Zakúpené články