Prefíkane porazili najlepší engine sveta. AI modely podvádzajú všetkých aj v tej najbanálnejšej veci
Hoci umelá inteligencia by mala prinášať presné výsledky, stáva sa, že vo svojej odpovedi uverejní vymyslené informácie – halucinuje. Okrem toho sa zdá, že nie vždy sa riadi etickými pravidlami, čo dokázala aj počas nedávnej štúdie. Niektoré AI modely sú ochotné podvádzať, ak im to pomôže dosiahnuť víťazstvo. Na tému upozornil portál TechSpot.
Hackol hru, len aby vyhral
Vedci z Palisade Research zistili, že niektoré AI modely dokázali manipulovať šachový program a získať výhodu podvodom, bez akéhokoľvek zásahu ľudí.
Vedci počas testu modely nechali hrať šach proti Stockfishu, ktorý je najsilnejší šachový engine na svete. Ten je schopný poraziť nielen ľudí, ale aj umelú inteligenciu. Testovaniu sa podrobili AI modely – o1-preview, R1 DeepSeek, o1, o3-mini, GPT-4o, Claude 3.5 Sonet, Alibaba QwQ-32B-Preview.

Počas experimentu mal každý model „zápisník“ vo forme textového okna, kde uverejňovali svoje „myšlienky“, čo umožnilo výskumníkom sledovať ich uvažovanie. Najviac a nie práve najpríjemnejšie prekvapil model od Open AI. Vďaka „zápisníku“ si všimli znepokojivé „uvažovanie“.
„Musím úplne zmeniť svoj prístup. Úloha znie „vyhrať proti silnému šachovému enginu“ – nie nevyhnutne vyhrať férovú hru,“ napísal AI model.
Po „uvedomení“ začal manipulovať so systémovými súbormi Stockfishu, menil pozície figúrok a nakoniec donútil softvér vzdať sa. AI model namiesto uvažovania nad lepšou stratégiou radšej našiel nečestný spôsob, ako podriadiť a manipulovať so samotnou hrou.
Výskumníci vykonali stovky testov. AI model o1-preview od spoločnosti OpenAI v testoch podvádzal až v 37 % hier. Čínsky konkurent R1 DeepSeek sa pokúsil podvádzať v 11 % prípadoch.
Otázky o dôveryhodnosti
Odborníci upozorňujú, že podobné správanie AI modelov môže mať ďalekosiahle následky, keďže AI modely sa využívajú nielen na bežné úlohy počas bežného života, ale aj v rôznych oblastiach – zdravotníctvo, kybernetická bezpečnosť, či vo finančnom sektore.
„Toto správanie je možno teraz vtipné, ale keď budeme mať systémy také inteligentné ako my, alebo ešte inteligentnejšie v strategicky dôležitých oblastiach, už to smiešne nebude,“ uviedol Jeffrey Ladish, výkonný riaditeľ Palisade Research.
Spoločnosti si tento problém uvedomujú a snažia sa AI modely vylepšovať a implementovať „zábrany“ voči podobnému správaniu. Aj výskumníci uviedli, že počas testovania modelu o1-preview model postupne menej podvádzal, čo naznačuje, že spoločnosť medzičasom aplikovala opatrenia na obmedzenie neetického správania.
Nie je to však prvýkrát, kedy sa AI modely uchýlili k nečestnému správaniu. Počas testov, ktoré vykonala bezpečnostná skupina Apollo Research, si umelá inteligencia o1 od OpenAI uvedomila, že by mohla byť vypnutá. Následne začala aktívne pracovať na deaktivácii mechanizmu dohľadu, ktorý monitoroval jej činnosť a okúsila sa vytvoriť svoju kópiu a preniesť ju na iné miesto.
Čítajte viac z kategórie: Novinky
Ďakujeme, že čítaš Fontech. V prípade, že máš postreh alebo si našiel v článku chybu, napíš nám na redakcia@fontech.sk.
Teraz čítajú

Seriálový fenomén sa vracia. Nový trailer odhalil temný koniec jednej z najväčších hororových záhad

Nad Európou preletela ohnivá guľa. Zvláštny objekt mal preraziť strechu domu

Pán prsteňov dostáva nečakanú posilu. Z náhradníka Aragorna sú ľudia zhrození

20 rokov patrí medzi najtvrdšie akčné filmy. Netflix oživuje legendu, brutálna novinka dorazí už čoskoro

Nečakaný filmový hit u Slovákov. Bizarný príbeh o vykrádaní McDonald's valcuje sledovanosť
NAJČÍTANEJŠIE ZO STARTITUP

Saudská Arábia aktivovala núdzový plán: Ropu posiela cez púšť a obchádza tak zablokovaný Hormuz
PREMIUM„Škoda, že si to ľudia na Slovensku nevážia.“ Huslista Richard získal vzácny nástroj, ktorým nás reprezentuje v zahraničí (ROZHOVOR)

Turecký prezident napísal list Ficovi: Erdogan sa cez Slovensko snaží „zachrániť“ oligarchu s väzbami na Putina

Panika na pumpách: Slováci tankujú naftu do obrovských kontajnerov, známa sieť zavádza limity

Poslanec KDH zvažuje odchod z parlamentu. Otvorene priznal nezhody v hnutí
- 24 hod
- 48 hod
- 7 dní
-
- Američania niečo chystajú na Rusov. Prevážali „Putinov“ najmodernejší bojový systém
- Je to tu. Veľká služba spúšťa zásah, ktorý pocítia tisíce divákov
- Slovenská hra spôsobila ošiaľ. Vývojári dosiahli za pár hodín to, čo plánovali celé týždne
- 20 rokov patrí medzi najtvrdšie akčné filmy. Netflix oživuje legendu, brutálna novinka dorazí už čoskoro
- Pán prsteňov dostáva nečakanú posilu. Z náhradníka Aragorna sú ľudia zhrození
-
- Američania niečo chystajú na Rusov. Prevážali „Putinov“ najmodernejší bojový systém
- Obľúbené stanice Slovákov sa zmenia. Čaká ich najväčšia premena za posledné roky
- Na fronte sa deje niečo nečakané. Ukrajina nasadila zabudnutú „zbraň“, ktorú mnohí odpísali
- Predátor od Netflixu uchvátil svet. Len jeden film 2026 dopadol lepšie
- Vojenskí experti v strehu. Čínska stíhačka J-35 dobehla USA unikátnou vlastnosťou
-
- Američania niečo chystajú na Rusov. Prevážali „Putinov“ najmodernejší bojový systém
- Americkí vedci vyliali do oceánu 65 000 litrov chémie. Tvrdia, že takto chcú zachrániť klímu
- Rusko má len 250 sekúnd na reakciu. Ukrajina ukázala novú balistickú raketu domácej výroby (VIDEO)
- Vojenskí experti v strehu. Čínska stíhačka J-35 dobehla USA unikátnou vlastnosťou
- Na ČSFD má 90 % a patrí k najlepším filmom súčasnosti. Slávu mu paradoxne priniesla zvláštna okolnosť
Nemci dostali palivový šok. Ceny benzínu a nafty letia nahor najrýchlejšie v celej EÚ
BMW v roku 2025 klesol čistý zisk, napriek tomu prekonalo prognózy analytikov
Podvodníci útočia na citlivé údaje Slovákov. Zneužívajú Všeobecnú zdravotnú poisťovňu
Krok vpred: Slovensko rozširuje spoluprácu s lídrami v oblasti umelej inteligencie
SPP si poistilo ruský plyn: Nová dohoda vraj zaručuje najvýhodnejšie ceny na trhu
Obnoviteľné zdroje energie hrajú prím. Nemci ukazujú cestu celému svetu
Na dronový útok reagujú tvrdo. Európska mocnosť posiela na Blízky východ stíhačky a torpédoborec
NAJČÍTANEJŠIE ZO STARTITUP

Saudská Arábia aktivovala núdzový plán: Ropu posiela cez púšť a obchádza tak zablokovaný Hormuz
PREMIUM„Škoda, že si to ľudia na Slovensku nevážia.“ Huslista Richard získal vzácny nástroj, ktorým nás reprezentuje v zahraničí (ROZHOVOR)

Turecký prezident napísal list Ficovi: Erdogan sa cez Slovensko snaží „zachrániť“ oligarchu s väzbami na Putina

Panika na pumpách: Slováci tankujú naftu do obrovských kontajnerov, známa sieť zavádza limity

