Prefíkane porazili najlepší engine sveta. AI modely podvádzajú všetkých aj v tej najbanálnejšej veci
Hoci umelá inteligencia by mala prinášať presné výsledky, stáva sa, že vo svojej odpovedi uverejní vymyslené informácie – halucinuje. Okrem toho sa zdá, že nie vždy sa riadi etickými pravidlami, čo dokázala aj počas nedávnej štúdie. Niektoré AI modely sú ochotné podvádzať, ak im to pomôže dosiahnuť víťazstvo. Na tému upozornil portál TechSpot.
Hackol hru, len aby vyhral
Vedci z Palisade Research zistili, že niektoré AI modely dokázali manipulovať šachový program a získať výhodu podvodom, bez akéhokoľvek zásahu ľudí.
Vedci počas testu modely nechali hrať šach proti Stockfishu, ktorý je najsilnejší šachový engine na svete. Ten je schopný poraziť nielen ľudí, ale aj umelú inteligenciu. Testovaniu sa podrobili AI modely – o1-preview, R1 DeepSeek, o1, o3-mini, GPT-4o, Claude 3.5 Sonet, Alibaba QwQ-32B-Preview.

Počas experimentu mal každý model „zápisník“ vo forme textového okna, kde uverejňovali svoje „myšlienky“, čo umožnilo výskumníkom sledovať ich uvažovanie. Najviac a nie práve najpríjemnejšie prekvapil model od Open AI. Vďaka „zápisníku“ si všimli znepokojivé „uvažovanie“.
„Musím úplne zmeniť svoj prístup. Úloha znie „vyhrať proti silnému šachovému enginu“ – nie nevyhnutne vyhrať férovú hru,“ napísal AI model.
Po „uvedomení“ začal manipulovať so systémovými súbormi Stockfishu, menil pozície figúrok a nakoniec donútil softvér vzdať sa. AI model namiesto uvažovania nad lepšou stratégiou radšej našiel nečestný spôsob, ako podriadiť a manipulovať so samotnou hrou.
Výskumníci vykonali stovky testov. AI model o1-preview od spoločnosti OpenAI v testoch podvádzal až v 37 % hier. Čínsky konkurent R1 DeepSeek sa pokúsil podvádzať v 11 % prípadoch.
Otázky o dôveryhodnosti
Odborníci upozorňujú, že podobné správanie AI modelov môže mať ďalekosiahle následky, keďže AI modely sa využívajú nielen na bežné úlohy počas bežného života, ale aj v rôznych oblastiach – zdravotníctvo, kybernetická bezpečnosť, či vo finančnom sektore.
„Toto správanie je možno teraz vtipné, ale keď budeme mať systémy také inteligentné ako my, alebo ešte inteligentnejšie v strategicky dôležitých oblastiach, už to smiešne nebude,“ uviedol Jeffrey Ladish, výkonný riaditeľ Palisade Research.
Spoločnosti si tento problém uvedomujú a snažia sa AI modely vylepšovať a implementovať „zábrany“ voči podobnému správaniu. Aj výskumníci uviedli, že počas testovania modelu o1-preview model postupne menej podvádzal, čo naznačuje, že spoločnosť medzičasom aplikovala opatrenia na obmedzenie neetického správania.
Nie je to však prvýkrát, kedy sa AI modely uchýlili k nečestnému správaniu. Počas testov, ktoré vykonala bezpečnostná skupina Apollo Research, si umelá inteligencia o1 od OpenAI uvedomila, že by mohla byť vypnutá. Následne začala aktívne pracovať na deaktivácii mechanizmu dohľadu, ktorý monitoroval jej činnosť a okúsila sa vytvoriť svoju kópiu a preniesť ju na iné miesto.
Čítajte viac z kategórie: Novinky
Ďakujeme, že čítaš Fontech. V prípade, že máš postreh alebo si našiel v článku chybu, napíš nám na redakcia@fontech.sk.
Teraz čítajú

Štát ušetrí Slovákom desiatky eur na STK. Ak spĺňaš túto podmienku, kontrola ťa čaká každé 4 roky

Príde najväčší seriál od Game of Thrones aj veľké veci od Netflixu. TOP 11 noviniek v novembri

Deň zúčtovania pre EÚ. Kontroverzný plán na záchranu planéty prechádza skúškou ohňom

Nový čip je 1000-krát rýchlejší ako špičková Nvidia. Vedci vyriešili analógový „problém storočia“

Energetická mafia v Európe. Takto sa miliardári „nabaľujú“ na tvojom účte za elektrinu
NAJČÍTANEJŠIE ZO STARTITUP

NAŽIVO: Predseda NKÚ prehovoril o „miznúcich miliardách z Bruselu“

Demencia sa nezačína v hlave, ale doma: Prostredie ovplyvňuje zdravie mozgu, odhalili vedci

LIVE: Zoroslav Kollár má údajné „dôkazy o vláde politickej mafie na Slovensku“

Fico kriticky na Rybníčka: „Otvorene odkážte protivládnemu voličstvu, že nás treba vítať s nabitou zbraňou“

Štát ti môže zaplatiť celý vodičák: 1 700 eur má možnosť získať viacero Slovákov
- 24 hod
- 48 hod
- 7 dní
-
- Na Slovensko prichádza nový kanál. Ponúkne desiatky filmov a bude úplne bez reklám
- Politici nám klamú, Slovákov dobehne krutá pravda. Ekonóm vysvetlil zdraženie energií, ktoré spôsobí Green Deal
- Slovákom hrozí pokuta 5800 €. Tento zlozvyk za volantom ťa vyjde poriadne draho
- Slováci majú doma zariadenie, ktoré ich oberá o stovky eur na energiách. Odborníci radia okamžitú výmenu
- Rusi urobili „geniálny“ ťah. Kým ich vojaci trpia na Ukrajine, africkému štátu dodali najmodernejšiu techniku
-
- Na Slovensko prichádza nový kanál. Ponúkne desiatky filmov a bude úplne bez reklám
- Politici nám klamú, Slovákov dobehne krutá pravda. Ekonóm vysvetlil zdraženie energií, ktoré spôsobí Green Deal
- Rusi urobili „geniálny“ ťah. Kým ich vojaci trpia na Ukrajine, africkému štátu dodali najmodernejšiu techniku
- Slovákom hrozí pokuta 5800 €. Tento zlozvyk za volantom ťa vyjde poriadne draho
- Len dva seriály dopadli lepšie. HBO má globálny hit, nie je pre slabé povahy
-
- O toto išlo Rusom celý čas. Obsadili jedno z najväčších ložísk dôležitej suroviny v Európe
- Slovákom hrozí pokuta 5800 €. Tento zlozvyk za volantom ťa vyjde poriadne draho
- Experti ostali bez slov. Najväčšiu pliagu ľudstva našli na mieste, kde nemá vôbec čo robiť
- AKTUÁLNE: K Zemi sa rúti záhadný objekt. Slávny astronóm tvrdí, že to má byť mimozemská loď
- Netflix priznáva zlyhanie. Zaklínač končí v predstihu, tvorcovia priznali smutnú pravdu
Veľmoc zrušila dotácie na EV a prišiel šok. Zrazu ich ľudia nechcú, automobilky strácajú dych
Slovensko kleslo v prestížnom rebríčku. Naša ekonomika v oblasti digitalizácie stagnuje, v tomto sme však prví na svete
Staneme sa energetickou veľmocou? V ideálnej oblasti Slovenska má vyrásť až 17 elektrárni
Kým Ukrajina bojuje, EÚ veselo dováža veľkú komoditu z Ruska. Nemec žiada okamžitý zákaz
Minister Smeru-SD v tom má jasno: Emisný systém je nezmyselný, EÚ stráca konkurencieschopnosť
NAJČÍTANEJŠIE ZO STARTITUP

NAŽIVO: Predseda NKÚ prehovoril o „miznúcich miliardách z Bruselu“

Demencia sa nezačína v hlave, ale doma: Prostredie ovplyvňuje zdravie mozgu, odhalili vedci

LIVE: Zoroslav Kollár má údajné „dôkazy o vláde politickej mafie na Slovensku“

Fico kriticky na Rybníčka: „Otvorene odkážte protivládnemu voličstvu, že nás treba vítať s nabitou zbraňou“

