Prefíkane porazili najlepší engine sveta. AI modely podvádzajú všetkých aj v tej najbanálnejšej veci
Hoci umelá inteligencia by mala prinášať presné výsledky, stáva sa, že vo svojej odpovedi uverejní vymyslené informácie – halucinuje. Okrem toho sa zdá, že nie vždy sa riadi etickými pravidlami, čo dokázala aj počas nedávnej štúdie. Niektoré AI modely sú ochotné podvádzať, ak im to pomôže dosiahnuť víťazstvo. Na tému upozornil portál TechSpot.
Hackol hru, len aby vyhral
Vedci z Palisade Research zistili, že niektoré AI modely dokázali manipulovať šachový program a získať výhodu podvodom, bez akéhokoľvek zásahu ľudí.
Vedci počas testu modely nechali hrať šach proti Stockfishu, ktorý je najsilnejší šachový engine na svete. Ten je schopný poraziť nielen ľudí, ale aj umelú inteligenciu. Testovaniu sa podrobili AI modely – o1-preview, R1 DeepSeek, o1, o3-mini, GPT-4o, Claude 3.5 Sonet, Alibaba QwQ-32B-Preview.
Počas experimentu mal každý model „zápisník“ vo forme textového okna, kde uverejňovali svoje „myšlienky“, čo umožnilo výskumníkom sledovať ich uvažovanie. Najviac a nie práve najpríjemnejšie prekvapil model od Open AI. Vďaka „zápisníku“ si všimli znepokojivé „uvažovanie“.
„Musím úplne zmeniť svoj prístup. Úloha znie „vyhrať proti silnému šachovému enginu“ – nie nevyhnutne vyhrať férovú hru,“ napísal AI model.
Po „uvedomení“ začal manipulovať so systémovými súbormi Stockfishu, menil pozície figúrok a nakoniec donútil softvér vzdať sa. AI model namiesto uvažovania nad lepšou stratégiou radšej našiel nečestný spôsob, ako podriadiť a manipulovať so samotnou hrou.
Výskumníci vykonali stovky testov. AI model o1-preview od spoločnosti OpenAI v testoch podvádzal až v 37 % hier. Čínsky konkurent R1 DeepSeek sa pokúsil podvádzať v 11 % prípadoch.
Otázky o dôveryhodnosti
Odborníci upozorňujú, že podobné správanie AI modelov môže mať ďalekosiahle následky, keďže AI modely sa využívajú nielen na bežné úlohy počas bežného života, ale aj v rôznych oblastiach – zdravotníctvo, kybernetická bezpečnosť, či vo finančnom sektore.
„Toto správanie je možno teraz vtipné, ale keď budeme mať systémy také inteligentné ako my, alebo ešte inteligentnejšie v strategicky dôležitých oblastiach, už to smiešne nebude,“ uviedol Jeffrey Ladish, výkonný riaditeľ Palisade Research.
Spoločnosti si tento problém uvedomujú a snažia sa AI modely vylepšovať a implementovať „zábrany“ voči podobnému správaniu. Aj výskumníci uviedli, že počas testovania modelu o1-preview model postupne menej podvádzal, čo naznačuje, že spoločnosť medzičasom aplikovala opatrenia na obmedzenie neetického správania.
Nie je to však prvýkrát, kedy sa AI modely uchýlili k nečestnému správaniu. Počas testov, ktoré vykonala bezpečnostná skupina Apollo Research, si umelá inteligencia o1 od OpenAI uvedomila, že by mohla byť vypnutá. Následne začala aktívne pracovať na deaktivácii mechanizmu dohľadu, ktorý monitoroval jej činnosť a okúsila sa vytvoriť svoju kópiu a preniesť ju na iné miesto.
Čítajte viac z kategórie: Novinky
Ďakujeme, že čítaš Fontech. V prípade, že máš postreh alebo si našiel v článku chybu, napíš nám na redakcia@fontech.sk.
Teraz čítajú
Rýchlo a zbesilo má problém, ktorý ho môže pochovať. Veľké finále je v ohrození
Zlom vo vojne? Trump chce dať Ukrajine desivú zbraň, ktorá prinúti Putina jednať o mieri
Na ČSFD má 90 %. Klenot z Česka dostáva nástupcu, práve pribudol online
Nepreniknuteľná obrana, ktorá zničí úplne všetko. Prvú krajinu sveta budú chrániť laserové zbrane
Vyriešili najväčší zlozvyk vodičov na diaľnici. Slovákom hrozí pokuta za činnosť, ktorú robia denne
NAJČÍTANEJŠIE ZO STARTITUP
„Idem preč,“ vyhlásil Trump a chcel vylúčiť 4 krajiny. NATO bolo na hrane kolapsu, odhalil Stoltenberg
Rusko vedie nízkointenzívnu vesmírnu vojnu, tvrdí holandský expert. Objektívmi za pár eur sleduje špionážne satelity (ROZHOVOR)
Šutaj Eštok o povolenkách: Radšej pôjdeme do súdneho sporu s EÚ, ako by sme toto mali akceptovať
Trump sa „v podstate rozhodol“ o dodávke Tomahawkov Ukrajine. Kremeľ sa obáva úderov hlboko v ruskom tyle
Podnikateľ Štefan Žiga, príbuzný podpredsedu parlamentu, je odsúdený. Rozhodol Najvyšší súd
- 24 hod
- 48 hod
- 7 dní
-
- Zmeny v STK zaskočili Slovákov. Vysoké pokuty hrozia aj tým, ktorí auto už nemajú (PREHĽAD)
- Nikto niečo podobné neskúsil. Čína nechala vybuchnúť tri jadrové bomby za sebou, výsledky sú znepokojivé
- Policajti to ignorujú a riziko narastá. Vodičov začalo za volantom ohrozovať niečo horšie ako mobily
- Na objavenie čakala 5000 rokov. Vedci našli záhadnú stavbu, z ktorej im padla sánka
- Zničia roj dronov za pár eur. Švédi ukázali minirakety, ktoré nahradia drahé stíhačky a zmenia vojnu
-
- Nikto niečo podobné neskúsil. Čína nechala vybuchnúť tri jadrové bomby za sebou, výsledky sú znepokojivé
- Zem je zachránená. Odborníci našli konečné riešenie na klimatickú krízu, máme ho „pod nosom“
- Majú zásoby 85 miliárd m³. Do Európy začne prúdiť nový zdroj plynu z prekvapivej krajiny
- Ako je to možné? Teleportovanie existuje a dochádza k nemu každý deň
- Zmeny v STK zaskočili Slovákov. Vysoké pokuty hrozia aj tým, ktorí auto už nemajú (PREHĽAD)
-
- Majú voňať, namiesto toho nám ničia pľúca. Vedci varujú pred tichým zabijakom ovzdušia v dome
- Majú zásoby 85 miliárd m³. Do Európy začne prúdiť nový zdroj plynu z prekvapivej krajiny
- Nikto niečo podobné neskúsil. Čína nechala vybuchnúť tri jadrové bomby za sebou, výsledky sú znepokojivé
- Zem je zachránená. Odborníci našli konečné riešenie na klimatickú krízu, máme ho „pod nosom“
- Neuveriteľné sa stalo skutočnosťou. Nekonečný energetický plán Slovenska je krok od spustenia
Obľúbená čínska značka všetkých prekvapila. Otvorila obchod budúcnosti, aký si ešte nevidel
Rusko získava kľúčové západné technológie. Zelenskyj ich v zostrelených zbraniach napočítal 100-tisíc
Slovákov okrádajú o tisíce eur na podvodných portáloch. SACKA upozorňuje na dovolenkový zločin
Putin sa jej bojí ako čert kríža. Ak USA dodá Ukrajine túto zbraň, Rusi s Američanmi skončili
Nemecké automobilky sa rútia do hlbokej krízy. Dodávatelia tŕpnu, masívne prepúšťanie je na spadnutie
NAJČÍTANEJŠIE ZO STARTITUP