Prefíkane porazili najlepší engine sveta. AI modely podvádzajú všetkých aj v tej najbanálnejšej veci
Hoci umelá inteligencia by mala prinášať presné výsledky, stáva sa, že vo svojej odpovedi uverejní vymyslené informácie – halucinuje. Okrem toho sa zdá, že nie vždy sa riadi etickými pravidlami, čo dokázala aj počas nedávnej štúdie. Niektoré AI modely sú ochotné podvádzať, ak im to pomôže dosiahnuť víťazstvo. Na tému upozornil portál TechSpot.
Hackol hru, len aby vyhral
Vedci z Palisade Research zistili, že niektoré AI modely dokázali manipulovať šachový program a získať výhodu podvodom, bez akéhokoľvek zásahu ľudí.
Vedci počas testu modely nechali hrať šach proti Stockfishu, ktorý je najsilnejší šachový engine na svete. Ten je schopný poraziť nielen ľudí, ale aj umelú inteligenciu. Testovaniu sa podrobili AI modely – o1-preview, R1 DeepSeek, o1, o3-mini, GPT-4o, Claude 3.5 Sonet, Alibaba QwQ-32B-Preview.

Počas experimentu mal každý model „zápisník“ vo forme textového okna, kde uverejňovali svoje „myšlienky“, čo umožnilo výskumníkom sledovať ich uvažovanie. Najviac a nie práve najpríjemnejšie prekvapil model od Open AI. Vďaka „zápisníku“ si všimli znepokojivé „uvažovanie“.
„Musím úplne zmeniť svoj prístup. Úloha znie „vyhrať proti silnému šachovému enginu“ – nie nevyhnutne vyhrať férovú hru,“ napísal AI model.
Po „uvedomení“ začal manipulovať so systémovými súbormi Stockfishu, menil pozície figúrok a nakoniec donútil softvér vzdať sa. AI model namiesto uvažovania nad lepšou stratégiou radšej našiel nečestný spôsob, ako podriadiť a manipulovať so samotnou hrou.
Výskumníci vykonali stovky testov. AI model o1-preview od spoločnosti OpenAI v testoch podvádzal až v 37 % hier. Čínsky konkurent R1 DeepSeek sa pokúsil podvádzať v 11 % prípadoch.
Otázky o dôveryhodnosti
Odborníci upozorňujú, že podobné správanie AI modelov môže mať ďalekosiahle následky, keďže AI modely sa využívajú nielen na bežné úlohy počas bežného života, ale aj v rôznych oblastiach – zdravotníctvo, kybernetická bezpečnosť, či vo finančnom sektore.
„Toto správanie je možno teraz vtipné, ale keď budeme mať systémy také inteligentné ako my, alebo ešte inteligentnejšie v strategicky dôležitých oblastiach, už to smiešne nebude,“ uviedol Jeffrey Ladish, výkonný riaditeľ Palisade Research.
Spoločnosti si tento problém uvedomujú a snažia sa AI modely vylepšovať a implementovať „zábrany“ voči podobnému správaniu. Aj výskumníci uviedli, že počas testovania modelu o1-preview model postupne menej podvádzal, čo naznačuje, že spoločnosť medzičasom aplikovala opatrenia na obmedzenie neetického správania.
Nie je to však prvýkrát, kedy sa AI modely uchýlili k nečestnému správaniu. Počas testov, ktoré vykonala bezpečnostná skupina Apollo Research, si umelá inteligencia o1 od OpenAI uvedomila, že by mohla byť vypnutá. Následne začala aktívne pracovať na deaktivácii mechanizmu dohľadu, ktorý monitoroval jej činnosť a okúsila sa vytvoriť svoju kópiu a preniesť ju na iné miesto.
Čítajte viac z kategórie: Novinky
Ďakujeme, že čítaš Fontech. V prípade, že máš postreh alebo si našiel v článku chybu, napíš nám na redakcia@fontech.sk.
Teraz čítajú

Zateplený dom nemusí ušetriť toľko, koľko čakáš. Slovákov dobieha drahý omyl pri obnove budov

Slováci menia smartfóny zbytočne často. Nové modely už neprinášajú to, čo kedysi

Slovensko má plyn, ktorý necháva ležať bokom. Dá nám energetickú istotu, no má to veľký háčik

Z legendárnej Múmie je čistý horor a je dostupný už aj online. Ponúka ho jediná služba

„Utopí“ všetko v okruhu 200 km. Američania dostali jednu z najhrozivejších zbraní súčasnosti
NAJČÍTANEJŠIE ZO STARTITUP

Mohutné zemetrasenie v obľúbenej európskej destinácii. Patrí k najsilnejším otrasom za posledných 40 rokov
PREMIUM„Nájom už nebude núdzové riešenie.“ Šéf developerskej firmy opisuje, ako budú mladí ľudia bývať o 10 až 15 rokov

Fico na súde pohorel. Za fotografiu na obálke knihy chcel 200-tisíc eur, no sudkyňa jeho žalobu zamietla

Zatiaľ čo kolega zarába 1 700, tebe prischne 900 eur: Finančná správa láka ľudí na nové pozície, mzda je sklamaním

Štát predstavil 38 opatrení na megareset ekonomiky: Sľubuje lacnejšie energie, menej byrokracie a podnikanie od 16 rokov
- 24 hod
- 48 hod
- 7 dní
-
- Najlepšie sci-fi 2026 konečne pribudlo online aj s dabingom. Jedna vec ľudí nepoteší
- Prvá krajina stopla predaj obľúbeného elektromobilu Volvo, desaťtisíce áut majú mať vážny problém
- Ľudstvo je krok od „svätého grálu“ energetiky. Fúznu energiu môže odomknúť 330-tonový magnet
- 9 staníc úplne zadarmo. Veľký operátor sprístupnil stanice všetkým divákom
- Bluetooth slúchadlá skrývajú problém, o ktorom sa nehovorí. Väčšina ľudí si ho všimne neskoro
-
- Najlepšie sci-fi 2026 konečne pribudlo online aj s dabingom. Jedna vec ľudí nepoteší
- Prvá krajina stopla predaj obľúbeného elektromobilu Volvo, desaťtisíce áut majú mať vážny problém
- Ľudstvo je krok od „svätého grálu“ energetiky. Fúznu energiu môže odomknúť 330-tonový magnet
- 9 staníc úplne zadarmo. Veľký operátor sprístupnil stanice všetkým divákom
- Bluetooth slúchadlá skrývajú problém, o ktorom sa nehovorí. Väčšina ľudí si ho všimne neskoro
-
- Najlepšie sci-fi 2026 konečne pribudlo online aj s dabingom. Jedna vec ľudí nepoteší
- Ľudstvo je krok od „svätého grálu“ energetiky. Fúznu energiu môže odomknúť 330-tonový magnet
- Bluetooth slúchadlá skrývajú problém, o ktorom sa nehovorí. Väčšina ľudí si ho všimne neskoro
- Prvá krajina stopla predaj obľúbeného elektromobilu Volvo, desaťtisíce áut majú mať vážny problém
- 9 staníc úplne zadarmo. Veľký operátor sprístupnil stanice všetkým divákom
Umelá inteligencia pomáha pri navrhovaní obalov
Nemecku chýbajú nabíjacie stanice pre elektromobily, problémom sú malé obce
Slovensko dostalo kľúčový letecký spoj, na cestu k letisku už peniaze neostali
Dron zasiahol najväčšiu jadrovú elektráreň v Európe, MAAE je znepokojená
Holandsko testuje úplne nový typ turbíny. Bude plávať na mori a z vetra vyťaží oveľa viac
Zatiaľ čo sa Európa snaží zažehnať plynovú krízu, Brusel varuje pred väčším problémom
Brusel chystá veľký technologický obrat. EÚ sa chce odstrihnúť od amerických gigantov
NAJČÍTANEJŠIE ZO STARTITUP

Mohutné zemetrasenie v obľúbenej európskej destinácii. Patrí k najsilnejším otrasom za posledných 40 rokov
PREMIUM„Nájom už nebude núdzové riešenie.“ Šéf developerskej firmy opisuje, ako budú mladí ľudia bývať o 10 až 15 rokov

Fico na súde pohorel. Za fotografiu na obálke knihy chcel 200-tisíc eur, no sudkyňa jeho žalobu zamietla

Zatiaľ čo kolega zarába 1 700, tebe prischne 900 eur: Finančná správa láka ľudí na nové pozície, mzda je sklamaním

