Prefíkane porazili najlepší engine sveta. AI modely podvádzajú všetkých aj v tej najbanálnejšej veci
Hoci umelá inteligencia by mala prinášať presné výsledky, stáva sa, že vo svojej odpovedi uverejní vymyslené informácie – halucinuje. Okrem toho sa zdá, že nie vždy sa riadi etickými pravidlami, čo dokázala aj počas nedávnej štúdie. Niektoré AI modely sú ochotné podvádzať, ak im to pomôže dosiahnuť víťazstvo. Na tému upozornil portál TechSpot.
Hackol hru, len aby vyhral
Vedci z Palisade Research zistili, že niektoré AI modely dokázali manipulovať šachový program a získať výhodu podvodom, bez akéhokoľvek zásahu ľudí.
Vedci počas testu modely nechali hrať šach proti Stockfishu, ktorý je najsilnejší šachový engine na svete. Ten je schopný poraziť nielen ľudí, ale aj umelú inteligenciu. Testovaniu sa podrobili AI modely – o1-preview, R1 DeepSeek, o1, o3-mini, GPT-4o, Claude 3.5 Sonet, Alibaba QwQ-32B-Preview.

Počas experimentu mal každý model „zápisník“ vo forme textového okna, kde uverejňovali svoje „myšlienky“, čo umožnilo výskumníkom sledovať ich uvažovanie. Najviac a nie práve najpríjemnejšie prekvapil model od Open AI. Vďaka „zápisníku“ si všimli znepokojivé „uvažovanie“.
„Musím úplne zmeniť svoj prístup. Úloha znie „vyhrať proti silnému šachovému enginu“ – nie nevyhnutne vyhrať férovú hru,“ napísal AI model.
Po „uvedomení“ začal manipulovať so systémovými súbormi Stockfishu, menil pozície figúrok a nakoniec donútil softvér vzdať sa. AI model namiesto uvažovania nad lepšou stratégiou radšej našiel nečestný spôsob, ako podriadiť a manipulovať so samotnou hrou.
Výskumníci vykonali stovky testov. AI model o1-preview od spoločnosti OpenAI v testoch podvádzal až v 37 % hier. Čínsky konkurent R1 DeepSeek sa pokúsil podvádzať v 11 % prípadoch.
Otázky o dôveryhodnosti
Odborníci upozorňujú, že podobné správanie AI modelov môže mať ďalekosiahle následky, keďže AI modely sa využívajú nielen na bežné úlohy počas bežného života, ale aj v rôznych oblastiach – zdravotníctvo, kybernetická bezpečnosť, či vo finančnom sektore.
„Toto správanie je možno teraz vtipné, ale keď budeme mať systémy také inteligentné ako my, alebo ešte inteligentnejšie v strategicky dôležitých oblastiach, už to smiešne nebude,“ uviedol Jeffrey Ladish, výkonný riaditeľ Palisade Research.
Spoločnosti si tento problém uvedomujú a snažia sa AI modely vylepšovať a implementovať „zábrany“ voči podobnému správaniu. Aj výskumníci uviedli, že počas testovania modelu o1-preview model postupne menej podvádzal, čo naznačuje, že spoločnosť medzičasom aplikovala opatrenia na obmedzenie neetického správania.
Nie je to však prvýkrát, kedy sa AI modely uchýlili k nečestnému správaniu. Počas testov, ktoré vykonala bezpečnostná skupina Apollo Research, si umelá inteligencia o1 od OpenAI uvedomila, že by mohla byť vypnutá. Následne začala aktívne pracovať na deaktivácii mechanizmu dohľadu, ktorý monitoroval jej činnosť a okúsila sa vytvoriť svoju kópiu a preniesť ju na iné miesto.
Čítajte viac z kategórie: Novinky
Ďakujeme, že čítaš Fontech. V prípade, že máš postreh alebo si našiel v článku chybu, napíš nám na redakcia@fontech.sk.
Teraz čítajú

Nebudeš si z nich vedieť vybrať. Toto sú najväčšie akčné filmy 2026

Hrozí kolaps. Záhadná anomália priťahuje všetky objekty na stovky miliónov svetelných rokov

Novinka od tvorcu Narcos mieri na Netflix. Prvý trailer ukazuje, ako sa nevinná noc zmení na peklo

Najodolnejší mobil vydrží 3 dni a stojí zlomok ceny. Našli sme špičkový mobil, ktorý búra predsudky o strednej triede

Vedci zmeraveli: Černobyľ prepísal gény ľuďom, ktorí výbuch ani nezažili
NAJČÍTANEJŠIE ZO STARTITUP
PREMIUMBanky znižujú úrokové sadzby hypoték: Teraz je ten správny čas začať vyjednávať, zhodujú sa odborníci

Bývalý princ Andrew skončil v rukách polície. „Nikto nestojí nad zákonom,“ vyhlásil premiér

Bolesti môžu trvať roky a liek neexistuje. Tropická choroba ohrozuje Európu, prenášač už žije aj na Slovensku

Blíži sa svetový kolaps? Dvaja finanční giganti naznačujú možné riešenie

Slovensko je krok od finále na ZOH 2026. Po drvivej výhre nad Nemeckom prichádza test menom USA
- 24 hod
- 48 hod
- 7 dní
-
- Ohromne zbohatnú a spasia celý svet. Veľmoc našla pod zemou nekonečný zdroj čistej energie
- Slováci dostanú 10 nových TV staníc zadarmo. Jedna zmena však poriadne zamrzí
- Jeden z najlepších českých filmov roka 2025 dnes dorazil na Netflix
- Nenápadný seriál poráža aj najväčšie hity. Kvôli realite ho museli zmeniť
- NATO by malo na reakciu len pár minút. Na hraniciach EÚ sa deje niečo doteraz nemysliteľné
-
- Ohromne zbohatnú a spasia celý svet. Veľmoc našla pod zemou nekonečný zdroj čistej energie
- Slováci dostanú 10 nových TV staníc zadarmo. Jedna zmena však poriadne zamrzí
- Jeden z najlepších českých filmov roka 2025 dnes dorazil na Netflix
- Nenápadný seriál poráža aj najväčšie hity. Kvôli realite ho museli zmeniť
- NATO by malo na reakciu len pár minút. Na hraniciach EÚ sa deje niečo doteraz nemysliteľné
-
- Rusi ju nevedeli nájsť 60 rokov, AI to zvládla hneď. Stará záhada Mesiaca má konečne riešenie
- Ohromne zbohatnú a spasia celý svet. Veľmoc našla pod zemou nekonečný zdroj čistej energie
- Vybabral s Rusmi a tí sa nestihli čudovať. Vojak unikol z obkľúčenia ako zo sci-fi filmu
- Sledovanie TV bude drahšie. Známa služba zdražuje, je tu posledná šanca ušetriť
- Sankcie ich úplne zlomili. Rusko môže prísť o najdôležitejšie zbrane, kľúčový výrobca to nezvláda
Teslu čaká strmhlavý pád. Trh s elektromobilmi zaznamená veľké zmeny
Priestor dostanú elektromobily. Slovenská Kia ohlásila smelé plány na rok 2026
Na Slovensko dorazila lukratívna TV stanica. V strednej Európe ju ponúka jediný operátor
Na Európu sa rúti najväčšia pohroma v histórii. Miliardovým škodám sa už nedá vyhnúť, varujú experti
Trump pripravuje rozhodnutie o ďalšej vojenskej pomoci pre Taiwan. Peking varuje USA
Slovákov terorizuje uveriteľný podvod. Útočníci sa vydávajú za Finančnú správu či daňový úrad
Slováci menia svoje priority. Trh s jazdenými vozidlami prechádza zmenou
NAJČÍTANEJŠIE ZO STARTITUP
PREMIUMBanky znižujú úrokové sadzby hypoték: Teraz je ten správny čas začať vyjednávať, zhodujú sa odborníci

Bývalý princ Andrew skončil v rukách polície. „Nikto nestojí nad zákonom,“ vyhlásil premiér

Bolesti môžu trvať roky a liek neexistuje. Tropická choroba ohrozuje Európu, prenášač už žije aj na Slovensku

Blíži sa svetový kolaps? Dvaja finanční giganti naznačujú možné riešenie

