Prefíkane porazili najlepší engine sveta. AI modely podvádzajú všetkých aj v tej najbanálnejšej veci
Hoci umelá inteligencia by mala prinášať presné výsledky, stáva sa, že vo svojej odpovedi uverejní vymyslené informácie – halucinuje. Okrem toho sa zdá, že nie vždy sa riadi etickými pravidlami, čo dokázala aj počas nedávnej štúdie. Niektoré AI modely sú ochotné podvádzať, ak im to pomôže dosiahnuť víťazstvo. Na tému upozornil portál TechSpot.
Hackol hru, len aby vyhral
Vedci z Palisade Research zistili, že niektoré AI modely dokázali manipulovať šachový program a získať výhodu podvodom, bez akéhokoľvek zásahu ľudí.
Vedci počas testu modely nechali hrať šach proti Stockfishu, ktorý je najsilnejší šachový engine na svete. Ten je schopný poraziť nielen ľudí, ale aj umelú inteligenciu. Testovaniu sa podrobili AI modely – o1-preview, R1 DeepSeek, o1, o3-mini, GPT-4o, Claude 3.5 Sonet, Alibaba QwQ-32B-Preview.
Počas experimentu mal každý model „zápisník“ vo forme textového okna, kde uverejňovali svoje „myšlienky“, čo umožnilo výskumníkom sledovať ich uvažovanie. Najviac a nie práve najpríjemnejšie prekvapil model od Open AI. Vďaka „zápisníku“ si všimli znepokojivé „uvažovanie“.
„Musím úplne zmeniť svoj prístup. Úloha znie „vyhrať proti silnému šachovému enginu“ – nie nevyhnutne vyhrať férovú hru,“ napísal AI model.
Po „uvedomení“ začal manipulovať so systémovými súbormi Stockfishu, menil pozície figúrok a nakoniec donútil softvér vzdať sa. AI model namiesto uvažovania nad lepšou stratégiou radšej našiel nečestný spôsob, ako podriadiť a manipulovať so samotnou hrou.
Výskumníci vykonali stovky testov. AI model o1-preview od spoločnosti OpenAI v testoch podvádzal až v 37 % hier. Čínsky konkurent R1 DeepSeek sa pokúsil podvádzať v 11 % prípadoch.
Otázky o dôveryhodnosti
Odborníci upozorňujú, že podobné správanie AI modelov môže mať ďalekosiahle následky, keďže AI modely sa využívajú nielen na bežné úlohy počas bežného života, ale aj v rôznych oblastiach – zdravotníctvo, kybernetická bezpečnosť, či vo finančnom sektore.
„Toto správanie je možno teraz vtipné, ale keď budeme mať systémy také inteligentné ako my, alebo ešte inteligentnejšie v strategicky dôležitých oblastiach, už to smiešne nebude,“ uviedol Jeffrey Ladish, výkonný riaditeľ Palisade Research.
Spoločnosti si tento problém uvedomujú a snažia sa AI modely vylepšovať a implementovať „zábrany“ voči podobnému správaniu. Aj výskumníci uviedli, že počas testovania modelu o1-preview model postupne menej podvádzal, čo naznačuje, že spoločnosť medzičasom aplikovala opatrenia na obmedzenie neetického správania.
Nie je to však prvýkrát, kedy sa AI modely uchýlili k nečestnému správaniu. Počas testov, ktoré vykonala bezpečnostná skupina Apollo Research, si umelá inteligencia o1 od OpenAI uvedomila, že by mohla byť vypnutá. Následne začala aktívne pracovať na deaktivácii mechanizmu dohľadu, ktorý monitoroval jej činnosť a okúsila sa vytvoriť svoju kópiu a preniesť ju na iné miesto.
Čítajte viac z kategórie: Novinky
Ďakujeme, že čítaš Fontech. V prípade, že máš postreh alebo si našiel v článku chybu, napíš nám na redakcia@fontech.sk.
Teraz čítajú
KVÍZ: Všetky spozná len ozajstný filmový znalec. Čo sa stalo v týchto 20 legendárnych scénach?
Ľudia už nerobia skoro nič. V Ázii stavajú priehradu len stroje, riadi ich umelá inteligencia
„Zožerie“ ťa hviezda či rozseká dážď zo skla. Bývalý vedec NASA opísal najzvláštnejšie planéty (+čas prežitia)
Chceli nájsť Planétu Deväť, objavili niečo záhadnejšie. Vedcov uchvátilo teleso, ktoré rozbíja teórie
Rozpoznal chodca, aj tak ho zrazil. Systém Tesly opäť zlyhal, Musk je optimista (VIDEO)
NAJČÍTANEJŠIE ZO STARTITUP
Smrtiaca baktéria spôsobila už 3 pandémie a stále nezmizla. Vedci zistili, ako sa pred ňou ochrániť
Vstupné už od 6 eur: Letná sezóna 2025 štartuje, kúpaliská otvárajú brány (PREHĽAD)
Bývalý šéf CIA odhalil, ktorú európsku krajinu Putin plánuje najbližšie napadnúť. Nemecko do nej poslalo vojakov
Vedci objavili vitamín, ktorý ti predĺži život o 3 roky. Tisíce Slovákov ho majú kritický nedostatok
Polárna žiara môže byť viditeľná aj zo Slovenska. Odborníci hlásia silnú geomagnetickú búrku
- 24 hod
- 48 hod
- 7 dní
-
- „Našli“ signál pokročilej civilizácie. Vedci neverili vlastným očiam, keď zistili, o čo ide
- Ročne spravím spaľovákom 48 000 km, predal som ho a kúpil elektromobil. Výsledok ma dostal
- Najväčšie eso Netflixu aj nový Predátor. TOP 11 filmov a seriálov, ktoré musíš vidieť v júni (PREHĽAD)
- Ľudia už nerobia skoro nič. V Ázii stavajú priehradu len stroje, riadi ich umelá inteligencia
- Slovákov očarila nová česká komédia na Netflixe. Sledujú ju viac než ČERNÁKA
-
- „Našli“ signál pokročilej civilizácie. Vedci neverili vlastným očiam, keď zistili, o čo ide
- Ročne spravím spaľovákom 48 000 km, predal som ho a kúpil elektromobil. Výsledok ma dostal
- Najväčšie eso Netflixu aj nový Predátor. TOP 11 filmov a seriálov, ktoré musíš vidieť v júni (PREHĽAD)
- Koniec sa už nikdy nedozvieš. 12 seriálov, ktoré zrušili predčasne bez poriadneho konca
- Majú zásoby 85 miliárd m³. Do Európy začne prúdiť nový zdroj plynu z prekvapivej krajiny
-
- Pošlú ich rovno do šrotu. Kontroverzná regulácia Európskej komisie o autách je na spadnutie
- Majú zásoby 85 miliárd m³. Do Európy začne prúdiť nový zdroj plynu z prekvapivej krajiny
- Rusi urobili „geniálny“ ťah. Kým ich vojaci trpia na Ukrajine, africkému štátu dodali najmodernejšiu techniku
- „Našli“ signál pokročilej civilizácie. Vedci neverili vlastným očiam, keď zistili, o čo ide
- Za 12 tisíc eur dostaneš auto s dojazdom 2 000 km. Známa značka šokovala svet novým modelom
Volkswagen chystá masívne investície v USA. Chce zmierniť nepríjemný poplatok
Gigant definitívne padol. Microsoft opúšťa ruský trh, Putin má jasný zámer
Slovensko zažíva najväčší nárast počtu áut. Analytici upozornili na zaujímavý trend
Rusko zradil verný európsky spojenec. Poza jeho chrbát dodáva muníciu Ukrajine
Slovenské domácnosti budú môcť zdieľať elektrinu vyrobenú fotovoltikou
NAJČÍTANEJŠIE ZO STARTITUP
Smrtiaca baktéria spôsobila už 3 pandémie a stále nezmizla. Vedci zistili, ako sa pred ňou ochrániť
Vstupné už od 6 eur: Letná sezóna 2025 štartuje, kúpaliská otvárajú brány (PREHĽAD)
Bývalý šéf CIA odhalil, ktorú európsku krajinu Putin plánuje najbližšie napadnúť. Nemecko do nej poslalo vojakov
Vedci objavili vitamín, ktorý ti predĺži život o 3 roky. Tisíce Slovákov ho majú kritický nedostatok
Polárna žiara môže byť viditeľná aj zo Slovenska. Odborníci hlásia silnú geomagnetickú búrku
Copyright© 2025 by Startitup, s. r. o. Všetky práva vyhradené