Prefíkane porazili najlepší engine sveta. AI modely podvádzajú všetkých aj v tej najbanálnejšej veci
Hoci umelá inteligencia by mala prinášať presné výsledky, stáva sa, že vo svojej odpovedi uverejní vymyslené informácie – halucinuje. Okrem toho sa zdá, že nie vždy sa riadi etickými pravidlami, čo dokázala aj počas nedávnej štúdie. Niektoré AI modely sú ochotné podvádzať, ak im to pomôže dosiahnuť víťazstvo. Na tému upozornil portál TechSpot.
Hackol hru, len aby vyhral
Vedci z Palisade Research zistili, že niektoré AI modely dokázali manipulovať šachový program a získať výhodu podvodom, bez akéhokoľvek zásahu ľudí.
Vedci počas testu modely nechali hrať šach proti Stockfishu, ktorý je najsilnejší šachový engine na svete. Ten je schopný poraziť nielen ľudí, ale aj umelú inteligenciu. Testovaniu sa podrobili AI modely – o1-preview, R1 DeepSeek, o1, o3-mini, GPT-4o, Claude 3.5 Sonet, Alibaba QwQ-32B-Preview.
Počas experimentu mal každý model „zápisník“ vo forme textového okna, kde uverejňovali svoje „myšlienky“, čo umožnilo výskumníkom sledovať ich uvažovanie. Najviac a nie práve najpríjemnejšie prekvapil model od Open AI. Vďaka „zápisníku“ si všimli znepokojivé „uvažovanie“.
„Musím úplne zmeniť svoj prístup. Úloha znie „vyhrať proti silnému šachovému enginu“ – nie nevyhnutne vyhrať férovú hru,“ napísal AI model.
Po „uvedomení“ začal manipulovať so systémovými súbormi Stockfishu, menil pozície figúrok a nakoniec donútil softvér vzdať sa. AI model namiesto uvažovania nad lepšou stratégiou radšej našiel nečestný spôsob, ako podriadiť a manipulovať so samotnou hrou.
Výskumníci vykonali stovky testov. AI model o1-preview od spoločnosti OpenAI v testoch podvádzal až v 37 % hier. Čínsky konkurent R1 DeepSeek sa pokúsil podvádzať v 11 % prípadoch.
Otázky o dôveryhodnosti
Odborníci upozorňujú, že podobné správanie AI modelov môže mať ďalekosiahle následky, keďže AI modely sa využívajú nielen na bežné úlohy počas bežného života, ale aj v rôznych oblastiach – zdravotníctvo, kybernetická bezpečnosť, či vo finančnom sektore.
„Toto správanie je možno teraz vtipné, ale keď budeme mať systémy také inteligentné ako my, alebo ešte inteligentnejšie v strategicky dôležitých oblastiach, už to smiešne nebude,“ uviedol Jeffrey Ladish, výkonný riaditeľ Palisade Research.
Spoločnosti si tento problém uvedomujú a snažia sa AI modely vylepšovať a implementovať „zábrany“ voči podobnému správaniu. Aj výskumníci uviedli, že počas testovania modelu o1-preview model postupne menej podvádzal, čo naznačuje, že spoločnosť medzičasom aplikovala opatrenia na obmedzenie neetického správania.
Nie je to však prvýkrát, kedy sa AI modely uchýlili k nečestnému správaniu. Počas testov, ktoré vykonala bezpečnostná skupina Apollo Research, si umelá inteligencia o1 od OpenAI uvedomila, že by mohla byť vypnutá. Následne začala aktívne pracovať na deaktivácii mechanizmu dohľadu, ktorý monitoroval jej činnosť a okúsila sa vytvoriť svoju kópiu a preniesť ju na iné miesto.
Čítajte viac z kategórie: Novinky
Ďakujeme, že čítaš Fontech. V prípade, že máš postreh alebo si našiel v článku chybu, napíš nám na redakcia@fontech.sk.
Teraz čítajú
Najskôr zima, potom drastické teplo. Jadrová vojna spôsobí v mestách peklo, ľudstvo by hneď nevyhynulo
Za málo peňazí dostaneš famózny stroj. Toto sú najlepšie a najlacnejšie drony na slovenskom trhu
Musk vulgárne vynadal veliteľovi ISS. O pár hodín chcel odstaviť vesmírnu stanicu
Expert predpovedá ďalšie zvyšovanie cien pre motoristov. Môže za to poplatok v servisoch
Hráči dostanú vysnívané funkcie. Nová konzola od Microsoftu skopíruje rozdielovú vlastnosť PlayStationu 5
NAJČÍTANEJŠIE ZO STARTITUP
Poľsko prišlo s revolučným nápadom: Elektromobil u našich severných susedov kúpiš už od 10-tisíc eur
Mesežnikov skritizoval Ficov prejav v USA: „Prvýkrát na tejto konferencii vystúpil bývalý komunista“
Trump osobitne vyzdvihol Fica na konferencii CPAC. Pozdravil ho slovami: „Ďakujem ti, Robert“
Tragédia v Nízkych Tatrách: V oblasti Derešského sedla zomrela 47-ročná žena
Šéfka proruskej propagandy na vojne zarába stámilióny. „Ak mám voľný víkend, vždy letím do Európy,“ priznala
- 24 hod
- 48 hod
- 7 dní
-
- Analytik odhalil krutú pravdu o plyne. Kým Česi šetria na plné obrátky, Slováci kúria bezhlavo
- Mali byť hitom, no nikto ich nechcel. TOP 8 technologických prepadákov slávnych značiek
- Lepší akčný seriál v súčasnosti nenájdeš. Dorazila nová séria obľúbeného titulu, kritici nešetria chválou
- Ak nepredáš auto, poškodíme ti ho. Majitelia populárnej značky čelia vyhrážkam po celom svete
- Netflix prerazil dno a zabil milovanú fantasy. Zaklínač na tom nikdy nebol horšie
-
- Mali byť hitom, no nikto ich nechcel. TOP 8 technologických prepadákov slávnych značiek
- Analytik odhalil krutú pravdu o plyne. Kým Česi šetria na plné obrátky, Slováci kúria bezhlavo
- Lepší akčný seriál v súčasnosti nenájdeš. Dorazila nová séria obľúbeného titulu, kritici nešetria chválou
- Kedysi boli sci-fi. Toto je TOP 8 technológií, ktoré sú dnes realita
- Európa je blízko k neobmedzenej energii. Západná mocnosť udržala jadrovú fúziu rekordných 22 minút
-
- Majú zásoby 85 miliárd m³. Do Európy začne prúdiť nový zdroj plynu z prekvapivej krajiny
- Mali byť hitom, no nikto ich nechcel. TOP 8 technologických prepadákov slávnych značiek
- Podmanil si divákov v 75 štátoch vrátane Slovenska. Drsný film dostal pokračovanie na Netflixe (TRAILER)
- Ľudstvo objavuje „nový svet“. V hĺbke 2 000 metrov našli mimoriadne vzácny zdroj energie
- Analytik odhalil krutú pravdu o plyne. Kým Česi šetria na plné obrátky, Slováci kúria bezhlavo
Ak chceš zhodnotiť peniaze, štát ti dá šancu. Slovensko spúšťa predaj dlhopisov
Klasickým robotom zvoní umieračik. Vedci vytvorili materiál, ktorý sa hýbe úplne sám
Súboj roka sa vyostruje. Musk a OpenAI sa hádajú o výkone svojich modelov
V reálnom čase mení tvar aj farbu. Číňania vyvinuli masku inšpirovanú známymi filmami
Vedci varujú pred veľkým problémom. DeepSeek umožňuje tvorbu škodlivého softvéru
NAJČÍTANEJŠIE ZO STARTITUP
Poľsko prišlo s revolučným nápadom: Elektromobil u našich severných susedov kúpiš už od 10-tisíc eur
Mesežnikov skritizoval Ficov prejav v USA: „Prvýkrát na tejto konferencii vystúpil bývalý komunista“
Trump osobitne vyzdvihol Fica na konferencii CPAC. Pozdravil ho slovami: „Ďakujem ti, Robert“
Tragédia v Nízkych Tatrách: V oblasti Derešského sedla zomrela 47-ročná žena
Šéfka proruskej propagandy na vojne zarába stámilióny. „Ak mám voľný víkend, vždy letím do Európy,“ priznala
Copyright© 2025 by Startitup, s. r. o. Všetky práva vyhradené