Prefíkane porazili najlepší engine sveta. AI modely podvádzajú všetkých aj v tej najbanálnejšej veci
Hoci umelá inteligencia by mala prinášať presné výsledky, stáva sa, že vo svojej odpovedi uverejní vymyslené informácie – halucinuje. Okrem toho sa zdá, že nie vždy sa riadi etickými pravidlami, čo dokázala aj počas nedávnej štúdie. Niektoré AI modely sú ochotné podvádzať, ak im to pomôže dosiahnuť víťazstvo. Na tému upozornil portál TechSpot.
Hackol hru, len aby vyhral
Vedci z Palisade Research zistili, že niektoré AI modely dokázali manipulovať šachový program a získať výhodu podvodom, bez akéhokoľvek zásahu ľudí.
Vedci počas testu modely nechali hrať šach proti Stockfishu, ktorý je najsilnejší šachový engine na svete. Ten je schopný poraziť nielen ľudí, ale aj umelú inteligenciu. Testovaniu sa podrobili AI modely – o1-preview, R1 DeepSeek, o1, o3-mini, GPT-4o, Claude 3.5 Sonet, Alibaba QwQ-32B-Preview.

Počas experimentu mal každý model „zápisník“ vo forme textového okna, kde uverejňovali svoje „myšlienky“, čo umožnilo výskumníkom sledovať ich uvažovanie. Najviac a nie práve najpríjemnejšie prekvapil model od Open AI. Vďaka „zápisníku“ si všimli znepokojivé „uvažovanie“.
„Musím úplne zmeniť svoj prístup. Úloha znie „vyhrať proti silnému šachovému enginu“ – nie nevyhnutne vyhrať férovú hru,“ napísal AI model.
Po „uvedomení“ začal manipulovať so systémovými súbormi Stockfishu, menil pozície figúrok a nakoniec donútil softvér vzdať sa. AI model namiesto uvažovania nad lepšou stratégiou radšej našiel nečestný spôsob, ako podriadiť a manipulovať so samotnou hrou.
Výskumníci vykonali stovky testov. AI model o1-preview od spoločnosti OpenAI v testoch podvádzal až v 37 % hier. Čínsky konkurent R1 DeepSeek sa pokúsil podvádzať v 11 % prípadoch.
Otázky o dôveryhodnosti
Odborníci upozorňujú, že podobné správanie AI modelov môže mať ďalekosiahle následky, keďže AI modely sa využívajú nielen na bežné úlohy počas bežného života, ale aj v rôznych oblastiach – zdravotníctvo, kybernetická bezpečnosť, či vo finančnom sektore.
„Toto správanie je možno teraz vtipné, ale keď budeme mať systémy také inteligentné ako my, alebo ešte inteligentnejšie v strategicky dôležitých oblastiach, už to smiešne nebude,“ uviedol Jeffrey Ladish, výkonný riaditeľ Palisade Research.
Spoločnosti si tento problém uvedomujú a snažia sa AI modely vylepšovať a implementovať „zábrany“ voči podobnému správaniu. Aj výskumníci uviedli, že počas testovania modelu o1-preview model postupne menej podvádzal, čo naznačuje, že spoločnosť medzičasom aplikovala opatrenia na obmedzenie neetického správania.
Nie je to však prvýkrát, kedy sa AI modely uchýlili k nečestnému správaniu. Počas testov, ktoré vykonala bezpečnostná skupina Apollo Research, si umelá inteligencia o1 od OpenAI uvedomila, že by mohla byť vypnutá. Následne začala aktívne pracovať na deaktivácii mechanizmu dohľadu, ktorý monitoroval jej činnosť a okúsila sa vytvoriť svoju kópiu a preniesť ju na iné miesto.
Čítajte viac z kategórie: Novinky
Ďakujeme, že čítaš Fontech. V prípade, že máš postreh alebo si našiel v článku chybu, napíš nám na redakcia@fontech.sk.
Teraz čítajú

Slováci robia s televízorom jednu chybu každý večer. Pri OLED môže stáť stovky eur

Nový akčný film práve dorazil online aj s dabingom. Rýchle pridanie má odvrátiť katastrofu

Slováci nosia banku, občiansky aj heslá v mobile. Týchto 10 nastavení si zapni skôr, než príde podvod

Lacný jazdený elektromobil môže skrývať drahý problém. Toto si skontroluj ešte pred kúpou

Nie životný štýl, ale čas. Vedci zistili, prečo sa niektorí ľudia dožívajú 100+ rokov
NAJČÍTANEJŠIE ZO STARTITUP

Dlhodobá PN-ka odhalila podozrenia na úrade v Žiline. Prípad už rieši kriminálka

Polícia odhalila masívny podvod za 20 miliónov eur. Na Slovensku potajomky rozbehli mafiánsku taktiku

Slovensko prišlo o výnimočný talent: Olympionička Denisa Hurban Baránková bola tvárou lukostreľby, získala aj zlato zo Svetových hier

Smrť Denisy Hurban Baránkovej v Petržalke vyšetrujú. Modrý anjel vyvracia špekulácie o tragédii

58-ročná expertka na dopamín radí: Ak neprekonáš závislosť od rýchleho dopamínu, stratíš schopnosť byť šťastný
- 24 hod
- 48 hod
- 7 dní
-
- Zajtra štartuje najočakávanejší seriál leta. Videli sme ho, už prvá časť je brutálna
- Číňania stvorili 140-tonové monštrum, obrovskú batériu vymenia za 4 minúty
- Slováci nechápu fyziku v elektromobiloch. Batérie s vysokým dojazdom sú paradoxnou nevýhodou
- Nestíhajú ju vyrábať. Nová elektrická Kia vyvolala celosvetový ošiaľ, musia ju limitovať
- Vedci jasajú. Nová polovodičová batéria vyriešila kritický problém elektromobilov
-
- Zajtra štartuje najočakávanejší seriál leta. Videli sme ho, už prvá časť je brutálna
- Slováci nechápu fyziku v elektromobiloch. Batérie s vysokým dojazdom sú paradoxnou nevýhodou
- Vedci jasajú. Nová polovodičová batéria vyriešila kritický problém elektromobilov
- Akčný veľkofilm prichádza online v rekordne krátkom čase. V kinách škaredo pohorel
- Číňania stvorili 140-tonové monštrum, obrovskú batériu vymenia za 4 minúty
-
- Automobilky oklamali svet a budú platiť. Obľúbený pohon zlyhal na celej čiare, produkuje veľké emisie
- Zajtra štartuje najočakávanejší seriál leta. Videli sme ho, už prvá časť je brutálna
- Česi vymysleli lacnú zbraň proti dronom: Nemá radar, aj tak ich odhalí na kilometre
- Moderná elektronika vydrží menej ako kedysi. Nie je to konšpirácia a má to jasný dôvod
- Netflix vyhráva. Toto je TOP 11 najlepších seriálov tohto roka a kde ich nájdeš online
Ruský export ropných produktov sa prepadol. Doplatil na útoky aj stratu európskeho trhu
Slovensko posúva dopredu jeden z najväčších energetických projektov
Veľký mýtus o elektromobiloch dostáva ďalšiu trhlinu. Batérie zvládajú aj státisíce kilometrov
Nový poplatok môže zasiahnuť hit medzi Slovákmi. Mnohí zvažujú obmedzenie nákupov
Známa slovenská tvár mieri na streamovaciu službu. Táto platforma ukáže jeho kontroverznú výpravu
Intel pokračuje v návrate medzi elitu veľkolepým plánom. Pomôcť mu má partnerstvo s Applom
Volkswagen pokračuje v masívnom prepúšťaní. Do roku 2030 to schytá až 50 000 ľudí
NAJČÍTANEJŠIE ZO STARTITUP

Dlhodobá PN-ka odhalila podozrenia na úrade v Žiline. Prípad už rieši kriminálka

Polícia odhalila masívny podvod za 20 miliónov eur. Na Slovensku potajomky rozbehli mafiánsku taktiku

Slovensko prišlo o výnimočný talent: Olympionička Denisa Hurban Baránková bola tvárou lukostreľby, získala aj zlato zo Svetových hier

Smrť Denisy Hurban Baránkovej v Petržalke vyšetrujú. Modrý anjel vyvracia špekulácie o tragédii

