Prefíkane porazili najlepší engine sveta. AI modely podvádzajú všetkých aj v tej najbanálnejšej veci
Hoci umelá inteligencia by mala prinášať presné výsledky, stáva sa, že vo svojej odpovedi uverejní vymyslené informácie – halucinuje. Okrem toho sa zdá, že nie vždy sa riadi etickými pravidlami, čo dokázala aj počas nedávnej štúdie. Niektoré AI modely sú ochotné podvádzať, ak im to pomôže dosiahnuť víťazstvo. Na tému upozornil portál TechSpot.
Hackol hru, len aby vyhral
Vedci z Palisade Research zistili, že niektoré AI modely dokázali manipulovať šachový program a získať výhodu podvodom, bez akéhokoľvek zásahu ľudí.
Vedci počas testu modely nechali hrať šach proti Stockfishu, ktorý je najsilnejší šachový engine na svete. Ten je schopný poraziť nielen ľudí, ale aj umelú inteligenciu. Testovaniu sa podrobili AI modely – o1-preview, R1 DeepSeek, o1, o3-mini, GPT-4o, Claude 3.5 Sonet, Alibaba QwQ-32B-Preview.

Počas experimentu mal každý model „zápisník“ vo forme textového okna, kde uverejňovali svoje „myšlienky“, čo umožnilo výskumníkom sledovať ich uvažovanie. Najviac a nie práve najpríjemnejšie prekvapil model od Open AI. Vďaka „zápisníku“ si všimli znepokojivé „uvažovanie“.
„Musím úplne zmeniť svoj prístup. Úloha znie „vyhrať proti silnému šachovému enginu“ – nie nevyhnutne vyhrať férovú hru,“ napísal AI model.
Po „uvedomení“ začal manipulovať so systémovými súbormi Stockfishu, menil pozície figúrok a nakoniec donútil softvér vzdať sa. AI model namiesto uvažovania nad lepšou stratégiou radšej našiel nečestný spôsob, ako podriadiť a manipulovať so samotnou hrou.
Výskumníci vykonali stovky testov. AI model o1-preview od spoločnosti OpenAI v testoch podvádzal až v 37 % hier. Čínsky konkurent R1 DeepSeek sa pokúsil podvádzať v 11 % prípadoch.
Otázky o dôveryhodnosti
Odborníci upozorňujú, že podobné správanie AI modelov môže mať ďalekosiahle následky, keďže AI modely sa využívajú nielen na bežné úlohy počas bežného života, ale aj v rôznych oblastiach – zdravotníctvo, kybernetická bezpečnosť, či vo finančnom sektore.
„Toto správanie je možno teraz vtipné, ale keď budeme mať systémy také inteligentné ako my, alebo ešte inteligentnejšie v strategicky dôležitých oblastiach, už to smiešne nebude,“ uviedol Jeffrey Ladish, výkonný riaditeľ Palisade Research.
Spoločnosti si tento problém uvedomujú a snažia sa AI modely vylepšovať a implementovať „zábrany“ voči podobnému správaniu. Aj výskumníci uviedli, že počas testovania modelu o1-preview model postupne menej podvádzal, čo naznačuje, že spoločnosť medzičasom aplikovala opatrenia na obmedzenie neetického správania.
Nie je to však prvýkrát, kedy sa AI modely uchýlili k nečestnému správaniu. Počas testov, ktoré vykonala bezpečnostná skupina Apollo Research, si umelá inteligencia o1 od OpenAI uvedomila, že by mohla byť vypnutá. Následne začala aktívne pracovať na deaktivácii mechanizmu dohľadu, ktorý monitoroval jej činnosť a okúsila sa vytvoriť svoju kópiu a preniesť ju na iné miesto.
Čítajte viac z kategórie: Novinky
Ďakujeme, že čítaš Fontech. V prípade, že máš postreh alebo si našiel v článku chybu, napíš nám na redakcia@fontech.sk.
Teraz čítajú

Na toto sme čakali 2 roky. Najväčší hit posledných rokov konečne pokračuje a dorazí už o pár dní

Diváci budú opäť utekať z kina. Najbrutálnejší film roka 2026 dostal nový trailer

Štúdia z Harvardu: Umelá inteligencia porazila špičkových lekárov v určovaní diagnóz

Ľudstvo je o krok bližšie k vyhynutiu. Prichádza úplne nový typ vojen, ktoré nič nezastaví

Boli mimo prevádzky, obnovia ich pre Európu. Severský štát nám zabezpečí energiu na desaťročia
NAJČÍTANEJŠIE ZO STARTITUP

Finančná správa varuje remeselníkov: Štát zmenil pravidlá pri platbách, hrozí pokuta až 20 000 eur
PREMIUMSlováci prichádzajú o peniaze: Staršie ročníky sa boja investovať kvôli minulosti, mladším chýba finančná gramotnosť (ROZHOVOR)

Ukrajinci rozobrali pýchu Moskvy: Nová strela S-71K funguje len vďaka súčiastkam z USA a Japonska

Sociálna poisťovňa už vie, aký budeš mať dôchodok: Jej prognózu dostane 3,5 miliónu Slovákov

RÚVZ o slovenskom jarnom klenote: Orgován netreba len obdivovať, skrýva silu, o ktorej mnohí netušia
- 24 hod
- 48 hod
- 7 dní
-
- Majú zásoby 200 miliárd m³ plynu. Európsky štát spustil výstavbu kľúčového plynovodu
- Nálož noviniek na Netflixe a ďalších. TOP 12 najväčších filmov a seriálov v máji
- Vysnívané pokračovanie je na dosah. Kultové akčné sci-fi sa vracia aj s hviezdnou dvojicou
- Diváci sa potešia. Veľký operátor odomkol tri platené stanice
- Netflix ruší jeden zo svojich najväčších hitov. Divákom zostáva jediná útecha
-
- Diváci sa potešia. Veľký operátor odomkol tri platené stanice
- V Ázii rastie neporaziteľná veľmoc. USA jej zabezpečí miliardovú prevahu na desaťročia
- Majú zásoby 200 miliárd m³ plynu. Európsky štát spustil výstavbu kľúčového plynovodu
- Vysnívané pokračovanie je na dosah. Kultové akčné sci-fi sa vracia aj s hviezdnou dvojicou
- Nálož noviniek na Netflixe a ďalších. TOP 12 najväčších filmov a seriálov v máji
-
- V Ázii rastie neporaziteľná veľmoc. USA jej zabezpečí miliardovú prevahu na desaťročia
- Diváci sa potešia. Veľký operátor odomkol tri platené stanice
- Ľudstvo dostane nevyčerpateľný zdroj energie. Iba časť z neho nám dá elektrinu na milióny rokov
- Majú zásoby 200 miliárd m³ plynu. Európsky štát spustil výstavbu kľúčového plynovodu
- Každý ich má doma, no následky sú desivé. Brusel chystá najväčší zákaz v histórii ľudstva
Gigantická metropola sa prepadáva šialeným tempom, vidno to z vesmíru
Za sekundu vykoná 14,5 biliónov operácií. Slovensko spustilo jednu z najvýkonnejších technologií
Mýtus o sile Ruska narazil na dno. Oslavy víťazstva odhalia ľuďom pravdu o stave armády
Slováci konečne pochopili význam umelej inteligencie. Bojíme sa však citlivých vecí
NBS varuje Slovákov: Tieto kryptomenové firmy ťa pripravia o peniaze, nemajú povolenie
Experiment skončil fiaskom. Nemci zastropovali ceny palív, ľudia platia viac
Vodiči si musia dať pozor, voči tomuto priestupku štát zakročí oveľa prísnejšie
NAJČÍTANEJŠIE ZO STARTITUP

Finančná správa varuje remeselníkov: Štát zmenil pravidlá pri platbách, hrozí pokuta až 20 000 eur
PREMIUMSlováci prichádzajú o peniaze: Staršie ročníky sa boja investovať kvôli minulosti, mladším chýba finančná gramotnosť (ROZHOVOR)

Ukrajinci rozobrali pýchu Moskvy: Nová strela S-71K funguje len vďaka súčiastkam z USA a Japonska

Sociálna poisťovňa už vie, aký budeš mať dôchodok: Jej prognózu dostane 3,5 miliónu Slovákov

