Prefíkane porazili najlepší engine sveta. AI modely podvádzajú všetkých aj v tej najbanálnejšej veci
Hoci umelá inteligencia by mala prinášať presné výsledky, stáva sa, že vo svojej odpovedi uverejní vymyslené informácie – halucinuje. Okrem toho sa zdá, že nie vždy sa riadi etickými pravidlami, čo dokázala aj počas nedávnej štúdie. Niektoré AI modely sú ochotné podvádzať, ak im to pomôže dosiahnuť víťazstvo. Na tému upozornil portál TechSpot.
Hackol hru, len aby vyhral
Vedci z Palisade Research zistili, že niektoré AI modely dokázali manipulovať šachový program a získať výhodu podvodom, bez akéhokoľvek zásahu ľudí.
Vedci počas testu modely nechali hrať šach proti Stockfishu, ktorý je najsilnejší šachový engine na svete. Ten je schopný poraziť nielen ľudí, ale aj umelú inteligenciu. Testovaniu sa podrobili AI modely – o1-preview, R1 DeepSeek, o1, o3-mini, GPT-4o, Claude 3.5 Sonet, Alibaba QwQ-32B-Preview.
Počas experimentu mal každý model „zápisník“ vo forme textového okna, kde uverejňovali svoje „myšlienky“, čo umožnilo výskumníkom sledovať ich uvažovanie. Najviac a nie práve najpríjemnejšie prekvapil model od Open AI. Vďaka „zápisníku“ si všimli znepokojivé „uvažovanie“.
„Musím úplne zmeniť svoj prístup. Úloha znie „vyhrať proti silnému šachovému enginu“ – nie nevyhnutne vyhrať férovú hru,“ napísal AI model.
Po „uvedomení“ začal manipulovať so systémovými súbormi Stockfishu, menil pozície figúrok a nakoniec donútil softvér vzdať sa. AI model namiesto uvažovania nad lepšou stratégiou radšej našiel nečestný spôsob, ako podriadiť a manipulovať so samotnou hrou.
Výskumníci vykonali stovky testov. AI model o1-preview od spoločnosti OpenAI v testoch podvádzal až v 37 % hier. Čínsky konkurent R1 DeepSeek sa pokúsil podvádzať v 11 % prípadoch.
Otázky o dôveryhodnosti
Odborníci upozorňujú, že podobné správanie AI modelov môže mať ďalekosiahle následky, keďže AI modely sa využívajú nielen na bežné úlohy počas bežného života, ale aj v rôznych oblastiach – zdravotníctvo, kybernetická bezpečnosť, či vo finančnom sektore.
„Toto správanie je možno teraz vtipné, ale keď budeme mať systémy také inteligentné ako my, alebo ešte inteligentnejšie v strategicky dôležitých oblastiach, už to smiešne nebude,“ uviedol Jeffrey Ladish, výkonný riaditeľ Palisade Research.
Spoločnosti si tento problém uvedomujú a snažia sa AI modely vylepšovať a implementovať „zábrany“ voči podobnému správaniu. Aj výskumníci uviedli, že počas testovania modelu o1-preview model postupne menej podvádzal, čo naznačuje, že spoločnosť medzičasom aplikovala opatrenia na obmedzenie neetického správania.
Nie je to však prvýkrát, kedy sa AI modely uchýlili k nečestnému správaniu. Počas testov, ktoré vykonala bezpečnostná skupina Apollo Research, si umelá inteligencia o1 od OpenAI uvedomila, že by mohla byť vypnutá. Následne začala aktívne pracovať na deaktivácii mechanizmu dohľadu, ktorý monitoroval jej činnosť a okúsila sa vytvoriť svoju kópiu a preniesť ju na iné miesto.
Čítajte viac z kategórie: Novinky
Ďakujeme, že čítaš Fontech. V prípade, že máš postreh alebo si našiel v článku chybu, napíš nám na redakcia@fontech.sk.
Teraz čítajú
Koniec najkvalitnejšej služby? Budúcnosť konkurenta Netflixu visí na vlásku, čelí veľkým problémom
NESMIEŠ PREHLIADNUŤ Máš doma nevyužité USB kľúče? Toto sú najlepšie tipy, ako ich premeníš na užitočných pomocníkov
Stallone ako mafián sa vráti, obľúbený hit Slovákov oficiálne pokračuje (+kedy príde)
Mysleli sme si, že sú nemožné. Sci-fi svety z Halo sú podľa vedca reálne, musia spĺňať túto podmienku
Montujú ho už 3 roky. Mitsubishi vyvíja 130-tonový reaktor, ktorý poslúži armáde
NAJČÍTANEJŠIE ZO STARTITUP
Vedci varujú pred vitamínom, ktorý má doma každý. Môže spôsobiť poškodenie pečene a vypadávanie vlasov
Dubaj spustil revolúciu v realitnom sektore. Vlastniť nehnuteľnosť vieš, aj keď nemáš státisíce „vo vrecku“
Lákala hercov aj českého prezidenta. Legendárnu 200-ročnú bratislavskú krčmu predávajú za 2,8 milióna eur
Zatvorené ZOO, zákaz vstupu do lesa a utratenie domácich zvierat. Štát zavádza opatrenia proti šíreniu choroby
Nový rebríček najbezpečnejších áut pre rok 2025: Limity splnilo len 48 vozidiel
- 24 hod
- 48 hod
- 7 dní
-
- Radšej ju hneď vymaž. Známu appku zneužili hekeri, Slovákom cez ňu ukradli heslá aj peniaze
- Slovákom hrozí za volantom mastná pokuta. Tento zlozvyk ťa môže stáť až 5 800 €
- Koniec najkvalitnejšej služby? Budúcnosť konkurenta Netflixu visí na vlásku, čelí veľkým problémom
- Veľmoc našla ložisko mimoriadne vzácnej suroviny. Má astronomickú hodnotu
- Rusko a USA v pozore. Európska mocnosť nasadí stíhačky s desivými jadrovými zbraňami
-
- Slovákom hrozí za volantom mastná pokuta. Tento zlozvyk ťa môže stáť až 5 800 €
- Radšej ju hneď vymaž. Známu appku zneužili hekeri, Slovákom cez ňu ukradli heslá aj peniaze
- Rusko a USA v pozore. Európska mocnosť nasadí stíhačky s desivými jadrovými zbraňami
- Veľmoc našla ložisko mimoriadne vzácnej suroviny. Má astronomickú hodnotu
- Videli sme najkontroverznejší film roka. Má omnoho väčší problém ako snedú Snehulienku
-
- Vedci zistili hrozivú vec. Dážď na celom svete je kontaminovaný nebezpečnými časticami
- Veľmoc našla ložisko mimoriadne vzácnej suroviny. Má astronomickú hodnotu
- Prehliadaná krajina prechádza desivou premenou za miliardy. Čína ju zbrojí na úroveň superveľmocí
- Slováci sa zamilovali. Tieto pneumatiky sú absolútnym hitom, vodiči rozmýšľajú logicky
- Lacné nákupy z Temu a Shein skončili. EÚ hlási drastické zmeny, Slováci si priplatia
Štvrtý blok Mochoviec v ďalšej fáze testovania. Začala sa horúca hydroskúška
Putinov rozkaz neútočiť má platiť. Napriek tomu boje neprestávajú
Na mýte nechali milióny. Zaplatili vo februári za dialnice viac Slováci alebo cudzinci?
Ceny palív na Slovensku stagnujú. Výrazné zlacnenie sa nekoná, ale nafta môže klesnúť
Likvidujú ich roboty. Fukušima stále skrýva rádioaktívne hrozby
NAJČÍTANEJŠIE ZO STARTITUP
Vedci varujú pred vitamínom, ktorý má doma každý. Môže spôsobiť poškodenie pečene a vypadávanie vlasov
Dubaj spustil revolúciu v realitnom sektore. Vlastniť nehnuteľnosť vieš, aj keď nemáš státisíce „vo vrecku“
Lákala hercov aj českého prezidenta. Legendárnu 200-ročnú bratislavskú krčmu predávajú za 2,8 milióna eur
Zatvorené ZOO, zákaz vstupu do lesa a utratenie domácich zvierat. Štát zavádza opatrenia proti šíreniu choroby
Nový rebríček najbezpečnejších áut pre rok 2025: Limity splnilo len 48 vozidiel
Copyright© 2025 by Startitup, s. r. o. Všetky práva vyhradené