Prefíkane porazili najlepší engine sveta. AI modely podvádzajú všetkých aj v tej najbanálnejšej veci
Hoci umelá inteligencia by mala prinášať presné výsledky, stáva sa, že vo svojej odpovedi uverejní vymyslené informácie – halucinuje. Okrem toho sa zdá, že nie vždy sa riadi etickými pravidlami, čo dokázala aj počas nedávnej štúdie. Niektoré AI modely sú ochotné podvádzať, ak im to pomôže dosiahnuť víťazstvo. Na tému upozornil portál TechSpot.
Hackol hru, len aby vyhral
Vedci z Palisade Research zistili, že niektoré AI modely dokázali manipulovať šachový program a získať výhodu podvodom, bez akéhokoľvek zásahu ľudí.
Vedci počas testu modely nechali hrať šach proti Stockfishu, ktorý je najsilnejší šachový engine na svete. Ten je schopný poraziť nielen ľudí, ale aj umelú inteligenciu. Testovaniu sa podrobili AI modely – o1-preview, R1 DeepSeek, o1, o3-mini, GPT-4o, Claude 3.5 Sonet, Alibaba QwQ-32B-Preview.

Počas experimentu mal každý model „zápisník“ vo forme textového okna, kde uverejňovali svoje „myšlienky“, čo umožnilo výskumníkom sledovať ich uvažovanie. Najviac a nie práve najpríjemnejšie prekvapil model od Open AI. Vďaka „zápisníku“ si všimli znepokojivé „uvažovanie“.
„Musím úplne zmeniť svoj prístup. Úloha znie „vyhrať proti silnému šachovému enginu“ – nie nevyhnutne vyhrať férovú hru,“ napísal AI model.
Po „uvedomení“ začal manipulovať so systémovými súbormi Stockfishu, menil pozície figúrok a nakoniec donútil softvér vzdať sa. AI model namiesto uvažovania nad lepšou stratégiou radšej našiel nečestný spôsob, ako podriadiť a manipulovať so samotnou hrou.
Výskumníci vykonali stovky testov. AI model o1-preview od spoločnosti OpenAI v testoch podvádzal až v 37 % hier. Čínsky konkurent R1 DeepSeek sa pokúsil podvádzať v 11 % prípadoch.
Otázky o dôveryhodnosti
Odborníci upozorňujú, že podobné správanie AI modelov môže mať ďalekosiahle následky, keďže AI modely sa využívajú nielen na bežné úlohy počas bežného života, ale aj v rôznych oblastiach – zdravotníctvo, kybernetická bezpečnosť, či vo finančnom sektore.
„Toto správanie je možno teraz vtipné, ale keď budeme mať systémy také inteligentné ako my, alebo ešte inteligentnejšie v strategicky dôležitých oblastiach, už to smiešne nebude,“ uviedol Jeffrey Ladish, výkonný riaditeľ Palisade Research.
Spoločnosti si tento problém uvedomujú a snažia sa AI modely vylepšovať a implementovať „zábrany“ voči podobnému správaniu. Aj výskumníci uviedli, že počas testovania modelu o1-preview model postupne menej podvádzal, čo naznačuje, že spoločnosť medzičasom aplikovala opatrenia na obmedzenie neetického správania.
Nie je to však prvýkrát, kedy sa AI modely uchýlili k nečestnému správaniu. Počas testov, ktoré vykonala bezpečnostná skupina Apollo Research, si umelá inteligencia o1 od OpenAI uvedomila, že by mohla byť vypnutá. Následne začala aktívne pracovať na deaktivácii mechanizmu dohľadu, ktorý monitoroval jej činnosť a okúsila sa vytvoriť svoju kópiu a preniesť ju na iné miesto.
Čítajte viac z kategórie: Novinky
Ďakujeme, že čítaš Fontech. V prípade, že máš postreh alebo si našiel v článku chybu, napíš nám na redakcia@fontech.sk.
Teraz čítajú

Sci‑fi udalosť roka dorazila online aj s dabingom. Tvorcovia hneď pri štarte urobili trápnu chybu

Má hodnotu vyše 116 miliárd eur a spasí svet. Veľmoc našla gigantické ložisko vzácnej suroviny

Mimozemšťania vstupujú do nášho sveta. Najočakávanejšie sci-fi roku 2026 dostalo prvú ukážku

Ľudstvo má obrovský probém. Po celom svete mizne sladká voda, vedci už poznajú dôvod

Európa sa pripravuje na najhoršie. Silná armáda kúpi 3-tisíc bojových vozidiel za 5 miliárd eur
NAJČÍTANEJŠIE ZO STARTITUP

Slovenský travel influencer má dlhovať klientom a cestovke desaťtisíce eur. „Na naše mená neexistovali žiadne letenky“
PREMIUMV 17. rokoch začala podnikať, vybudovala firmu s obratom 296 miliónov eur: Ak chceš robiť biznis, musíš sa naučiť žiť s rizikom. Inak to nejde

Novú reformu pocítia tisíce rodín: Jeden z príspevkov stúpne na 1 010 eur. Pellegrini podpísal zmeny

Na Európu sa rúti bombogenéza: Meteoexperti varujú pred hlbokou tlakovou nížou, vietor dosahuje až 200 km/h
PREMIUMVykoľajenia vlakov nie sú náhoda. Ferencei: Železnicu brzdí dlh 2 miliardy eur, všetky vlády majú „maslo na hlave“ (ROZHOVOR)
- 24 hod
- 48 hod
- 7 dní
-
- Zatiaľ čo Európa míňa miliardy v USA, Švédi postavili stíhačku s motorom Volvo pre reálnu vojnu
- Výrobcovia sa smejú Slovákom. Do mobilov zabudovali vec, ktorá im zarába miliardy na tvoj úkor
- Energetický prevrat je na dosah: Európsky štát našiel masívne ložisko, je v ňom 43 miliónov ton vzácnej suroviny
- Na Slovensko mieri nová TV cez anténu. Pokryje 97 % územia a nebude treba žiadny internet
- Prevezie 2 000 ľudí bez jedinej kvapky paliva. Najväčšia loď sveta s týmto pohonom prešla skúškou
-
- Zatiaľ čo Európa míňa miliardy v USA, Švédi postavili stíhačku s motorom Volvo pre reálnu vojnu
- Výrobcovia sa smejú Slovákom. Do mobilov zabudovali vec, ktorá im zarába miliardy na tvoj úkor
- Energetický prevrat je na dosah: Európsky štát našiel masívne ložisko, je v ňom 43 miliónov ton vzácnej suroviny
- Prevezie 2 000 ľudí bez jedinej kvapky paliva. Najväčšia loď sveta s týmto pohonom prešla skúškou
- Diesel je mŕtvy. Scania vyvinula prvý 60-tonový kolos 8×4 s ultimátnym pohonom
-
- Zatiaľ čo Európa míňa miliardy v USA, Švédi postavili stíhačku s motorom Volvo pre reálnu vojnu
- Výrobcovia sa smejú Slovákom. Do mobilov zabudovali vec, ktorá im zarába miliardy na tvoj úkor
- Diesel je mŕtvy. Scania vyvinula prvý 60-tonový kolos 8×4 s ultimátnym pohonom
- Spojenec Slovenska dostal ultimátnu zbraň. „Dračiemu ohňu“ neunikne ani jedna raketa, zasiahne aj mincu
- Energetický prevrat je na dosah: Európsky štát našiel masívne ložisko, je v ňom 43 miliónov ton vzácnej suroviny
Slovensko má dve šance na Oscara. Najdiskutovanejší film roka o hroznej tragédii ale vypadol
Kým ostatní riešia konflikty, Európa poslala do vesmíru raketu. Rusko ani USA už nepotrebujeme
Známa automobilka pochovala elektrické nákladiaky. Smeruje k hybridom a menším elektromobilom
Zlom v EÚ: Spaľovacie motory po roku 2035 nezmiznú. Nový balík umožní ich prežitie
Elon Musk prepisuje dejiny. Výška jeho majetku vyráža dych, vďačí za to jednej veci
Zostrihaný prejav spustil peklo. Trump od BBC žiada likvidačné odškodné
Poliakom došla trpezlivosť. Vyvíjajú štátnu aplikáciu na nahlasovanie podozrivých situácií
NAJČÍTANEJŠIE ZO STARTITUP

Slovenský travel influencer má dlhovať klientom a cestovke desaťtisíce eur. „Na naše mená neexistovali žiadne letenky“
PREMIUMV 17. rokoch začala podnikať, vybudovala firmu s obratom 296 miliónov eur: Ak chceš robiť biznis, musíš sa naučiť žiť s rizikom. Inak to nejde

Novú reformu pocítia tisíce rodín: Jeden z príspevkov stúpne na 1 010 eur. Pellegrini podpísal zmeny

Na Európu sa rúti bombogenéza: Meteoexperti varujú pred hlbokou tlakovou nížou, vietor dosahuje až 200 km/h
PREMIUM
