Prefíkane porazili najlepší engine sveta. AI modely podvádzajú všetkých aj v tej najbanálnejšej veci
Hoci umelá inteligencia by mala prinášať presné výsledky, stáva sa, že vo svojej odpovedi uverejní vymyslené informácie – halucinuje. Okrem toho sa zdá, že nie vždy sa riadi etickými pravidlami, čo dokázala aj počas nedávnej štúdie. Niektoré AI modely sú ochotné podvádzať, ak im to pomôže dosiahnuť víťazstvo. Na tému upozornil portál TechSpot.
Hackol hru, len aby vyhral
Vedci z Palisade Research zistili, že niektoré AI modely dokázali manipulovať šachový program a získať výhodu podvodom, bez akéhokoľvek zásahu ľudí.
Vedci počas testu modely nechali hrať šach proti Stockfishu, ktorý je najsilnejší šachový engine na svete. Ten je schopný poraziť nielen ľudí, ale aj umelú inteligenciu. Testovaniu sa podrobili AI modely – o1-preview, R1 DeepSeek, o1, o3-mini, GPT-4o, Claude 3.5 Sonet, Alibaba QwQ-32B-Preview.
Počas experimentu mal každý model „zápisník“ vo forme textového okna, kde uverejňovali svoje „myšlienky“, čo umožnilo výskumníkom sledovať ich uvažovanie. Najviac a nie práve najpríjemnejšie prekvapil model od Open AI. Vďaka „zápisníku“ si všimli znepokojivé „uvažovanie“.
„Musím úplne zmeniť svoj prístup. Úloha znie „vyhrať proti silnému šachovému enginu“ – nie nevyhnutne vyhrať férovú hru,“ napísal AI model.
Po „uvedomení“ začal manipulovať so systémovými súbormi Stockfishu, menil pozície figúrok a nakoniec donútil softvér vzdať sa. AI model namiesto uvažovania nad lepšou stratégiou radšej našiel nečestný spôsob, ako podriadiť a manipulovať so samotnou hrou.
Výskumníci vykonali stovky testov. AI model o1-preview od spoločnosti OpenAI v testoch podvádzal až v 37 % hier. Čínsky konkurent R1 DeepSeek sa pokúsil podvádzať v 11 % prípadoch.
Otázky o dôveryhodnosti
Odborníci upozorňujú, že podobné správanie AI modelov môže mať ďalekosiahle následky, keďže AI modely sa využívajú nielen na bežné úlohy počas bežného života, ale aj v rôznych oblastiach – zdravotníctvo, kybernetická bezpečnosť, či vo finančnom sektore.
„Toto správanie je možno teraz vtipné, ale keď budeme mať systémy také inteligentné ako my, alebo ešte inteligentnejšie v strategicky dôležitých oblastiach, už to smiešne nebude,“ uviedol Jeffrey Ladish, výkonný riaditeľ Palisade Research.
Spoločnosti si tento problém uvedomujú a snažia sa AI modely vylepšovať a implementovať „zábrany“ voči podobnému správaniu. Aj výskumníci uviedli, že počas testovania modelu o1-preview model postupne menej podvádzal, čo naznačuje, že spoločnosť medzičasom aplikovala opatrenia na obmedzenie neetického správania.
Nie je to však prvýkrát, kedy sa AI modely uchýlili k nečestnému správaniu. Počas testov, ktoré vykonala bezpečnostná skupina Apollo Research, si umelá inteligencia o1 od OpenAI uvedomila, že by mohla byť vypnutá. Následne začala aktívne pracovať na deaktivácii mechanizmu dohľadu, ktorý monitoroval jej činnosť a okúsila sa vytvoriť svoju kópiu a preniesť ju na iné miesto.
Čítajte viac z kategórie: Novinky
Ďakujeme, že čítaš Fontech. V prípade, že máš postreh alebo si našiel v článku chybu, napíš nám na redakcia@fontech.sk.
Teraz čítajú
Natočili ho na iPhone. Ikonický horor sa vracia po 20 rokoch, teória divákov je nesprávna
PRELOM: Vedci z Číny vyvinuli AI zariadenie, ktoré „vráti zrak“ nevidiacim
Tieto veci v recenziách nenájdeš. 11 mesiacov som testoval najlepší robotický vysávač na Slovensku
Mať veľké oči sa mu nevyplatilo. Musk s Cybertruckom prerazil dno, teraz zúfalo znižuje cenu
Bez „tankovania“ vydrží 10 rokov. Chystá sa veľký zvrat, lode dostanú pohon budúcnosti
NAJČÍTANEJŠIE ZO STARTITUP
Len 10 % Slovákov vie, aké je hlavné mesto Severného Írska. Otestuj sa, či by si prežil ako cestovateľ v 18. storočí (KVÍZ)
USA sú pripravené ukončiť úsilie o dohodu medzi Ruskom a Ukrajinou. „Máme aj iné priority,“ povedal Rubio
Pellegrini spôsobil rozruch v Petržalke: K barberovi mal prísť v sprievode majákov. Miestni si mysleli, že horí
Rusku hrozí finančný kolaps: Moskva nebude schopná financovať vojnu. Prispeli k tomu Trumpove clá
Slovenky zomierajú na zákerný typ rakoviny najviac v EÚ. Na významné ošetrenie ťa po novom lekár nepošle
- 24 hod
- 48 hod
- 7 dní
-
- Slováci jedia mikroplasty, ani o tom nevedia. Vedci odhalili prekvapivú potravinu, v ktorej ich je extrémne veľa
- Definitívny obrat? Známy ropný gigant na svojich čerpačkách prestáva predávať benzín a naftu
- 4K pastva pre oči len za 300 eur? Našli sme TOP 9 televízorov s vynikajúcim obrazom a nízkou cenou
- Posledný klinec do rakvy spaľovákov? Nová batéria je o 80 % ľahšia a prakticky nestráca kapacitu
- EÚ chystá veľkú zmenu. Tisíce Slovákov prídu o vodičák
-
- Slováci jedia mikroplasty, ani o tom nevedia. Vedci odhalili prekvapivú potravinu, v ktorej ich je extrémne veľa
- EÚ chystá veľkú zmenu. Tisíce Slovákov prídu o vodičák
- Definitívny obrat? Známy ropný gigant na svojich čerpačkách prestáva predávať benzín a naftu
- 4K pastva pre oči len za 300 eur? Našli sme TOP 9 televízorov s vynikajúcim obrazom a nízkou cenou
- Laboratóriá začali s genetickou úpravou ľudí. Prví upravení už kráčajú medzi nami
-
- Tento typ pohonu je definitívne obrovský emisný podvod. Potvrdila to ďalšia štúdia
- Slováci jedia mikroplasty, ani o tom nevedia. Vedci odhalili prekvapivú potravinu, v ktorej ich je extrémne veľa
- EÚ chystá veľkú zmenu. Tisíce Slovákov prídu o vodičák
- Čech si poriadne zavaril. Elektromobil nabíjal zo zásuvky v spoločnej garáži, účet za elektrinu susedov šokoval
- Definitívny obrat? Známy ropný gigant na svojich čerpačkách prestáva predávať benzín a naftu
Gates o budúcnosti práce: AI vyrieši krízu, ktorú roky nikto nevedel zvládnuť
Zákaz sa nekoná. EÚ sa bojí prázdnych zásobníkov a ostáva pri ruskom plyne
Svetové laboratóriá čelia výzve. Musia ochrániť kľúčové genetické dáta pred kyberútokmi
OpenAI predstavilo nový model, ktorý láka na polovičné ceny. Ľudom testuje trpezlivosť
Ukrajina tlačí na Spojené štáty. Zelenskyj chce tieto zbrane zbrane, nie „prázdne slová“
NAJČÍTANEJŠIE ZO STARTITUP
Len 10 % Slovákov vie, aké je hlavné mesto Severného Írska. Otestuj sa, či by si prežil ako cestovateľ v 18. storočí (KVÍZ)
USA sú pripravené ukončiť úsilie o dohodu medzi Ruskom a Ukrajinou. „Máme aj iné priority,“ povedal Rubio
Pellegrini spôsobil rozruch v Petržalke: K barberovi mal prísť v sprievode majákov. Miestni si mysleli, že horí
Rusku hrozí finančný kolaps: Moskva nebude schopná financovať vojnu. Prispeli k tomu Trumpove clá
Slovenky zomierajú na zákerný typ rakoviny najviac v EÚ. Na významné ošetrenie ťa po novom lekár nepošle
Copyright© 2025 by Startitup, s. r. o. Všetky práva vyhradené