Prefíkane porazili najlepší engine sveta. AI modely podvádzajú všetkých aj v tej najbanálnejšej veci
Hoci umelá inteligencia by mala prinášať presné výsledky, stáva sa, že vo svojej odpovedi uverejní vymyslené informácie – halucinuje. Okrem toho sa zdá, že nie vždy sa riadi etickými pravidlami, čo dokázala aj počas nedávnej štúdie. Niektoré AI modely sú ochotné podvádzať, ak im to pomôže dosiahnuť víťazstvo. Na tému upozornil portál TechSpot.
Hackol hru, len aby vyhral
Vedci z Palisade Research zistili, že niektoré AI modely dokázali manipulovať šachový program a získať výhodu podvodom, bez akéhokoľvek zásahu ľudí.
Vedci počas testu modely nechali hrať šach proti Stockfishu, ktorý je najsilnejší šachový engine na svete. Ten je schopný poraziť nielen ľudí, ale aj umelú inteligenciu. Testovaniu sa podrobili AI modely – o1-preview, R1 DeepSeek, o1, o3-mini, GPT-4o, Claude 3.5 Sonet, Alibaba QwQ-32B-Preview.
Počas experimentu mal každý model „zápisník“ vo forme textového okna, kde uverejňovali svoje „myšlienky“, čo umožnilo výskumníkom sledovať ich uvažovanie. Najviac a nie práve najpríjemnejšie prekvapil model od Open AI. Vďaka „zápisníku“ si všimli znepokojivé „uvažovanie“.
„Musím úplne zmeniť svoj prístup. Úloha znie „vyhrať proti silnému šachovému enginu“ – nie nevyhnutne vyhrať férovú hru,“ napísal AI model.
Po „uvedomení“ začal manipulovať so systémovými súbormi Stockfishu, menil pozície figúrok a nakoniec donútil softvér vzdať sa. AI model namiesto uvažovania nad lepšou stratégiou radšej našiel nečestný spôsob, ako podriadiť a manipulovať so samotnou hrou.
Výskumníci vykonali stovky testov. AI model o1-preview od spoločnosti OpenAI v testoch podvádzal až v 37 % hier. Čínsky konkurent R1 DeepSeek sa pokúsil podvádzať v 11 % prípadoch.
Otázky o dôveryhodnosti
Odborníci upozorňujú, že podobné správanie AI modelov môže mať ďalekosiahle následky, keďže AI modely sa využívajú nielen na bežné úlohy počas bežného života, ale aj v rôznych oblastiach – zdravotníctvo, kybernetická bezpečnosť, či vo finančnom sektore.
„Toto správanie je možno teraz vtipné, ale keď budeme mať systémy také inteligentné ako my, alebo ešte inteligentnejšie v strategicky dôležitých oblastiach, už to smiešne nebude,“ uviedol Jeffrey Ladish, výkonný riaditeľ Palisade Research.
Spoločnosti si tento problém uvedomujú a snažia sa AI modely vylepšovať a implementovať „zábrany“ voči podobnému správaniu. Aj výskumníci uviedli, že počas testovania modelu o1-preview model postupne menej podvádzal, čo naznačuje, že spoločnosť medzičasom aplikovala opatrenia na obmedzenie neetického správania.
Nie je to však prvýkrát, kedy sa AI modely uchýlili k nečestnému správaniu. Počas testov, ktoré vykonala bezpečnostná skupina Apollo Research, si umelá inteligencia o1 od OpenAI uvedomila, že by mohla byť vypnutá. Následne začala aktívne pracovať na deaktivácii mechanizmu dohľadu, ktorý monitoroval jej činnosť a okúsila sa vytvoriť svoju kópiu a preniesť ju na iné miesto.
Čítajte viac z kategórie: Novinky
Ďakujeme, že čítaš Fontech. V prípade, že máš postreh alebo si našiel v článku chybu, napíš nám na redakcia@fontech.sk.
Teraz čítajú
Dojazd 800 km a najvýkonnejšie nabíjanie v Európe. BMW predstavilo nový elektromobil
Ak si dostal tento email, okamžite spozorni. Experti varujú Slovákov, aby neprišli o všetko
Automaticky vypína motor a predvída terén. Volvo predstavilo inteligentnú novinku do áut
Európska únia udelila Google miliardovú pokutu. Trump sa nám okamžite začal vyhrážať
Slováci sa boja umelej inteligencie zbytočne. Toto je 7 najväčších mýtov, ktoré už dávno neplatia
NAJČÍTANEJŠIE ZO STARTITUP
Lacné lety do dovolenkového raja Slovákov končia. Ryanair zatvára základne a ruší desiatky letov
„Časovaná bomba“ v tvojej milovanej pochúťke devastuje mozog: Zrýchľuje starnutie až o 62 %
„Najdôležitejšie jedlo dňa“ dostalo nový význam: Každá hodina odkladu raňajok zvyšuje riziko úmrtia o 10 %
Pavol Gašpar čelí novej kauze: V majetkovom priznaní mal zatajiť zahraničnú firmu, v ktorej vlastní 90 % podiel
Vodičský preukaz Slovákov sa po desaťročiach bude meniť: Čakajú ťa nové limity a prísnejšie pravidlá
- 24 hod
- 48 hod
- 7 dní
-
- Susedná krajina kupuje ničivé zbrane za 1,4 miliardy eur. Moskve poslali jasný odkaz
- Trh s elektromobilmi v Číne explodoval. Teraz mu hrozí vlastná smrť
- Nový plán Tesly je fiasko. Elektromobily zmizli, toto má podľa Muska zachrániť budúcnosť
- Nič lepšie vraj na Netflixe tento rok neuvidíš. Hrozivo aktuálny film ohromil kritikov, 11 minút mu tlieskali v stoji
- Garmin predstavil najjasnejšie smart hodinky na svete. Ich cena ťa však poriadne zaskočí
-
- Nový plán Tesly je fiasko. Elektromobily zmizli, toto má podľa Muska zachrániť budúcnosť
- Nič lepšie vraj na Netflixe tento rok neuvidíš. Hrozivo aktuálny film ohromil kritikov, 11 minút mu tlieskali v stoji
- Susedná krajina kupuje ničivé zbrane za 1,4 miliardy eur. Moskve poslali jasný odkaz
- BMW to myslí naozaj vážne. Už čoskoro spustí sériovu výrobu odpísaného pohonu áut
- KVÍZ: Málo ľudí ho dá na 100 %. Tieto filmy by si mal spoznať podľa jedinej fotografie
-
- AKTUÁLNE: Na Slovensku končia tri obľúbené české stanice. Toto je ich náhrada
- Ochráni kontinent pred Rusmi aj CO₂. Európa má v rukách tajnú zbraň, odborníci zvažujú jej nasadenie
- Nemajú proti nej šancu. F-16 dostane desivú zbraň, ktorá môže zachrániť Ukrajinu
- Sylvester Stallone ako mafián aj veľký hit Netflixu. TOP 14 noviniek na streamovacích službách v septembri
- Najväčší problém elektromobilov rozpustili ako cukrovú vatu. Vedci ukázali riešenie, ktoré všetko zmení
Historický úspech na trhu ojazdených áut. SUV a crossovery vedú naprieč regiónom
Liga proti rakovine spustila AI poradkyňu. Ženám radí nonstop a zadarmo
Fico a Zelenskyj sa stretli v Užhorode. Témou bola energetika aj mier
Oficiálne závery sú vonku. SAV potvrdzuje bezpečné množstvá DNA v dávke
Putin a Si Ťin-pching sa rozprávali o nesmrteľnosti. Chcú sa dožiť 150 rokov, televízia zvuk vypla
NAJČÍTANEJŠIE ZO STARTITUP