Prefíkane porazili najlepší engine sveta. AI modely podvádzajú všetkých aj v tej najbanálnejšej veci
Hoci umelá inteligencia by mala prinášať presné výsledky, stáva sa, že vo svojej odpovedi uverejní vymyslené informácie – halucinuje. Okrem toho sa zdá, že nie vždy sa riadi etickými pravidlami, čo dokázala aj počas nedávnej štúdie. Niektoré AI modely sú ochotné podvádzať, ak im to pomôže dosiahnuť víťazstvo. Na tému upozornil portál TechSpot.
Hackol hru, len aby vyhral
Vedci z Palisade Research zistili, že niektoré AI modely dokázali manipulovať šachový program a získať výhodu podvodom, bez akéhokoľvek zásahu ľudí.
Vedci počas testu modely nechali hrať šach proti Stockfishu, ktorý je najsilnejší šachový engine na svete. Ten je schopný poraziť nielen ľudí, ale aj umelú inteligenciu. Testovaniu sa podrobili AI modely – o1-preview, R1 DeepSeek, o1, o3-mini, GPT-4o, Claude 3.5 Sonet, Alibaba QwQ-32B-Preview.

Počas experimentu mal každý model „zápisník“ vo forme textového okna, kde uverejňovali svoje „myšlienky“, čo umožnilo výskumníkom sledovať ich uvažovanie. Najviac a nie práve najpríjemnejšie prekvapil model od Open AI. Vďaka „zápisníku“ si všimli znepokojivé „uvažovanie“.
„Musím úplne zmeniť svoj prístup. Úloha znie „vyhrať proti silnému šachovému enginu“ – nie nevyhnutne vyhrať férovú hru,“ napísal AI model.
Po „uvedomení“ začal manipulovať so systémovými súbormi Stockfishu, menil pozície figúrok a nakoniec donútil softvér vzdať sa. AI model namiesto uvažovania nad lepšou stratégiou radšej našiel nečestný spôsob, ako podriadiť a manipulovať so samotnou hrou.
Výskumníci vykonali stovky testov. AI model o1-preview od spoločnosti OpenAI v testoch podvádzal až v 37 % hier. Čínsky konkurent R1 DeepSeek sa pokúsil podvádzať v 11 % prípadoch.
Otázky o dôveryhodnosti
Odborníci upozorňujú, že podobné správanie AI modelov môže mať ďalekosiahle následky, keďže AI modely sa využívajú nielen na bežné úlohy počas bežného života, ale aj v rôznych oblastiach – zdravotníctvo, kybernetická bezpečnosť, či vo finančnom sektore.
„Toto správanie je možno teraz vtipné, ale keď budeme mať systémy také inteligentné ako my, alebo ešte inteligentnejšie v strategicky dôležitých oblastiach, už to smiešne nebude,“ uviedol Jeffrey Ladish, výkonný riaditeľ Palisade Research.
Spoločnosti si tento problém uvedomujú a snažia sa AI modely vylepšovať a implementovať „zábrany“ voči podobnému správaniu. Aj výskumníci uviedli, že počas testovania modelu o1-preview model postupne menej podvádzal, čo naznačuje, že spoločnosť medzičasom aplikovala opatrenia na obmedzenie neetického správania.
Nie je to však prvýkrát, kedy sa AI modely uchýlili k nečestnému správaniu. Počas testov, ktoré vykonala bezpečnostná skupina Apollo Research, si umelá inteligencia o1 od OpenAI uvedomila, že by mohla byť vypnutá. Následne začala aktívne pracovať na deaktivácii mechanizmu dohľadu, ktorý monitoroval jej činnosť a okúsila sa vytvoriť svoju kópiu a preniesť ju na iné miesto.
Čítajte viac z kategórie: Novinky
Ďakujeme, že čítaš Fontech. V prípade, že máš postreh alebo si našiel v článku chybu, napíš nám na redakcia@fontech.sk.
Teraz čítajú

GTA 6 tak skoro v obchodoch nenájdeš. Rockstar chystá radikálny krok, ktorý rozhneval fanúšikov

Na objavenie čakal 140 miliónov rokov. 15 km pod Európou sa skrýva záhadný svet

Microsoft odpálil ľuďom počítače. Najnovšia aktualizácia Windows 11 spôsobuje pohromu

Lietadlá budú tankovať emisie CO₂. Vedci našli prelomový spôsob, ako z nich urobiť palivo budúcnosti

Zmeny v STK zaskočili Slovákov. Vysoké pokuty hrozia aj tým, ktorí auto už nemajú (PREHĽAD)
NAJČÍTANEJŠIE ZO STARTITUP

Zo šatne rovno na ministerstvo. Tím Rudolfa Huliaka má posilniť známy hokejista
PREMIUM37-ročný Matej Ftáčnik odišiel zo Slovenska: Ako podnikatelia nesmieme zabúdať, že naša úloha nie je len tvoriť zisk a pracovné miesta

Český prezident obvinil ministra z vydierania, nočné správy zverejnil: „Som pripravený bojovať s Petrom Pavlom“

Pentagón potichu zverejnil strategický dokument. USA menia kľúčové priority, EÚ pocíti dôsledky

KDH ohlásilo novú posilu: Do klubu vstupuje bývalý Matovičov poslanec
- 24 hod
- 48 hod
- 7 dní
-
- Na ČSFD má 81 %, aj tak ľudí nezaujíma. Vysnívané pokračovanie seriálu prepadlo, dá sa pozrieť aj zadarmo
- Nemci sa zbláznili do energetického grálu. Elektrinu im vyrába zadarmo, sieti dodali 60 miliónov MWh
- Analytici neverili vlastným číslam: Európa likviduje tradičné palivá, dosiahla historický obrat
- Vodiči sú proti nim bezradní. Čudné radary trestajú pokutami zlozvyk, ktorý robí väčšina Slovákov
- Slávna značka vstáva z popola. Spasil ju kritizovaný pohon a „zradcovia“ Tesly
-
- Nemci sa zbláznili do energetického grálu. Elektrinu im vyrába zadarmo, sieti dodali 60 miliónov MWh
- Vodiči sú proti nim bezradní. Čudné radary trestajú pokutami zlozvyk, ktorý robí väčšina Slovákov
- Žiadna pokuta, rovno ti zoberú vodičák. Tieto činnosti za volantom nikdy nerob (PREHĽAD)
- Koniec batérií sa blíži. Vedci vyvíjajú technológie, ktoré efektívne uložia vyrobenú energiu
- Na ČSFD má 81 %, aj tak ľudí nezaujíma. Vysnívané pokračovanie seriálu prepadlo, dá sa pozrieť aj zadarmo
-
- Vyskúšalo ho už 800-tisíc Slovákov. Slovenský konkurent Netflixu rastie a ukazuje budúcnosť
- Astronómovia neverili vlastným očiam. V ďalekej galaxii spozorovali zvláštny disk
- Žiadna pokuta, rovno ti zoberú vodičák. Tieto činnosti za volantom nikdy nerob (PREHĽAD)
- Ľudia sú zúfalí a nahnevaní. OLED televízory skrývajú výraznú slabinu
- Vodiči sú proti nim bezradní. Čudné radary trestajú pokutami zlozvyk, ktorý robí väčšina Slovákov
Slovensko chce obmedziť prístup na sociálne siete a k umelej inteligencii. Týka sa jednej skupiny ľudí
Zneužívajú ho na vojnu. Poľský minister vyzval Muska, aby Rusom vypol dôležitý systém
Banky bijú na poplach. AI podvody sú také presvedčivé, že ich neodhalí ani odborník
Dosiahli úctyhodný podiel. Nemeckí automobiloví giganti si upevnili postavenie na európskom trhu
Nepokryjú len 15 dní ročne. Nemecko sa v dodávkach elektriny spolieha na zelené zdroje
Drsný prepad ruskej ropy. Ruské tankery blúdia okolo Afriky, čaká sa prudký rast cien
Obrovská príležitosť pre Európu: Ázijská krajina drasticky znižuje clá na autá z EÚ
NAJČÍTANEJŠIE ZO STARTITUP

Zo šatne rovno na ministerstvo. Tím Rudolfa Huliaka má posilniť známy hokejista
PREMIUM37-ročný Matej Ftáčnik odišiel zo Slovenska: Ako podnikatelia nesmieme zabúdať, že naša úloha nie je len tvoriť zisk a pracovné miesta

Český prezident obvinil ministra z vydierania, nočné správy zverejnil: „Som pripravený bojovať s Petrom Pavlom“

Pentagón potichu zverejnil strategický dokument. USA menia kľúčové priority, EÚ pocíti dôsledky

