Prefíkane porazili najlepší engine sveta. AI modely podvádzajú všetkých aj v tej najbanálnejšej veci
Hoci umelá inteligencia by mala prinášať presné výsledky, stáva sa, že vo svojej odpovedi uverejní vymyslené informácie – halucinuje. Okrem toho sa zdá, že nie vždy sa riadi etickými pravidlami, čo dokázala aj počas nedávnej štúdie. Niektoré AI modely sú ochotné podvádzať, ak im to pomôže dosiahnuť víťazstvo. Na tému upozornil portál TechSpot.
Hackol hru, len aby vyhral
Vedci z Palisade Research zistili, že niektoré AI modely dokázali manipulovať šachový program a získať výhodu podvodom, bez akéhokoľvek zásahu ľudí.
Vedci počas testu modely nechali hrať šach proti Stockfishu, ktorý je najsilnejší šachový engine na svete. Ten je schopný poraziť nielen ľudí, ale aj umelú inteligenciu. Testovaniu sa podrobili AI modely – o1-preview, R1 DeepSeek, o1, o3-mini, GPT-4o, Claude 3.5 Sonet, Alibaba QwQ-32B-Preview.

Počas experimentu mal každý model „zápisník“ vo forme textového okna, kde uverejňovali svoje „myšlienky“, čo umožnilo výskumníkom sledovať ich uvažovanie. Najviac a nie práve najpríjemnejšie prekvapil model od Open AI. Vďaka „zápisníku“ si všimli znepokojivé „uvažovanie“.
„Musím úplne zmeniť svoj prístup. Úloha znie „vyhrať proti silnému šachovému enginu“ – nie nevyhnutne vyhrať férovú hru,“ napísal AI model.
Po „uvedomení“ začal manipulovať so systémovými súbormi Stockfishu, menil pozície figúrok a nakoniec donútil softvér vzdať sa. AI model namiesto uvažovania nad lepšou stratégiou radšej našiel nečestný spôsob, ako podriadiť a manipulovať so samotnou hrou.
Výskumníci vykonali stovky testov. AI model o1-preview od spoločnosti OpenAI v testoch podvádzal až v 37 % hier. Čínsky konkurent R1 DeepSeek sa pokúsil podvádzať v 11 % prípadoch.
Otázky o dôveryhodnosti
Odborníci upozorňujú, že podobné správanie AI modelov môže mať ďalekosiahle následky, keďže AI modely sa využívajú nielen na bežné úlohy počas bežného života, ale aj v rôznych oblastiach – zdravotníctvo, kybernetická bezpečnosť, či vo finančnom sektore.
„Toto správanie je možno teraz vtipné, ale keď budeme mať systémy také inteligentné ako my, alebo ešte inteligentnejšie v strategicky dôležitých oblastiach, už to smiešne nebude,“ uviedol Jeffrey Ladish, výkonný riaditeľ Palisade Research.
Spoločnosti si tento problém uvedomujú a snažia sa AI modely vylepšovať a implementovať „zábrany“ voči podobnému správaniu. Aj výskumníci uviedli, že počas testovania modelu o1-preview model postupne menej podvádzal, čo naznačuje, že spoločnosť medzičasom aplikovala opatrenia na obmedzenie neetického správania.
Nie je to však prvýkrát, kedy sa AI modely uchýlili k nečestnému správaniu. Počas testov, ktoré vykonala bezpečnostná skupina Apollo Research, si umelá inteligencia o1 od OpenAI uvedomila, že by mohla byť vypnutá. Následne začala aktívne pracovať na deaktivácii mechanizmu dohľadu, ktorý monitoroval jej činnosť a okúsila sa vytvoriť svoju kópiu a preniesť ju na iné miesto.
Čítajte viac z kategórie: Novinky
Ďakujeme, že čítaš Fontech. V prípade, že máš postreh alebo si našiel v článku chybu, napíš nám na redakcia@fontech.sk.
Teraz čítajú

Akčná bomba na obzore. Yellowstone dostáva brutálny prídavok, máme prvý trailer a detaily

Európsky štát doplatil na lacné energie z Ruska. Nemá zásoby paliva, o 4 dni mu hrozí totálny kolaps

RECENZIA Hráčom ostane horká pachuť. Nové Call of Duty ma úplne šokovalo, prešlo obrovskými zmenami

Hyundai vymyslel jeden z najlepších elektromobilov vôbec. Závidí mu veľký rival, ktorý ho okopíruje

Vedci objavili časovanú bombu. Praveký zabijak môže vyhubiť celé ľudstvo, pomáha mu CO₂
NAJČÍTANEJŠIE ZO STARTITUP

Slovensko skončilo na 68. mieste zo 69 krajín v mimoriadne zásadnej oblasti. Byrokracia a vysoké odvody odrádzajú talenty aj investorov
PREMIUM„V bohatších rodinách pýtajú desiatky tisíc eur.“ Slovák Viktor o svadbe v Thajsku, stereotypoch a očakávaniach

Pohoda 2026 prichádza s absolútnou hudobnou bombou. Legenda rave scény uzavrie jubilejný ročník

Tajné razie v slovenských pekárňach odhalili podozrivé taktiky. Hrozia mastné pokuty

Drony narušili vzdušný priestor európskych krajín. Jedna vysiela stíhačky, druhá evakuuje ľudí
- 24 hod
- 48 hod
- 7 dní
-
- Na Slovensku o pár dní začína nový kanál. Ponúkne desiatky filmov úplne bez reklám
- Európsky štát doplatil na lacné energie z Ruska. Nemá zásoby paliva, o 4 dni mu hrozí totálny kolaps
- Ohromne zbohatnú a spasia celý svet. Veľmoc našla pod zemou nekonečný zdroj čistej energie
- Vedci odhalili jednoduchý trik, ktorý dokáže omladiť tvoj mozog. Stačí zmeniť túto vec v tele
- Rusko zradil dlhoročný spojenec. Ukrajine posiela obrovské množstvo zbraní
-
- Kotly a tepelné čerpadlá skončili. Táto inovácia kúrením zarába peniaze
- Ohromne zbohatnú a spasia celý svet. Veľmoc našla pod zemou nekonečný zdroj čistej energie
- Na Slovensku o pár dní začína nový kanál. Ponúkne desiatky filmov úplne bez reklám
- Rusko zradil dlhoročný spojenec. Ukrajine posiela obrovské množstvo zbraní
- Vedci odhalili jednoduchý trik, ktorý dokáže omladiť tvoj mozog. Stačí zmeniť túto vec v tele
-
- Kotly a tepelné čerpadlá skončili. Táto inovácia kúrením zarába peniaze
- Ohromne zbohatnú a spasia celý svet. Veľmoc našla pod zemou nekonečný zdroj čistej energie
- Je efektívnejší než tepelné čerpadlo a ušetrí ti stovky eur. Na svete je revolučný spôsob, ako ohrievať vodu
- Britská armáda zničila 100 dronov v zlomku sekundy. Použili 40-miliónovú zbraň s neviditeľnou muníciou
- V spoľahlivosti nemajú konkurenciu. Týchto 5+1 automobiliek má najlepšie motory (PREHĽAD)
Vesmírna stanica hlási kritický problém s kapsulou. Posádka ostala uväznená na orbite
Medzi ázijskými veľmocami to poriadne vrie. Dron spustil okamžitú reakciu stíhačiek
Šéfka ECB poslala Európe tvrdý odkaz. Už si nemôžeme dovoliť premeškať kľúčovú technologickú vlnu
Online podvodníci využívajú slabosť Slovákov. Nákupnú horúčku drzo zneužívajú
Systém sa rúca a nemajú na výber. Volkswagen oznamuje krok, na aký sa doposiaľ neodvážil
Koniec éry slovenských áut? Automobilky sa dostali do slepej uličky, z ktorej niet úniku
Už nepotrebuješ ukazovať občiansky. Digitálne doklady v mobile dostali nové funkcie (PREHĽAD)
NAJČÍTANEJŠIE ZO STARTITUP

Slovensko skončilo na 68. mieste zo 69 krajín v mimoriadne zásadnej oblasti. Byrokracia a vysoké odvody odrádzajú talenty aj investorov
PREMIUM„V bohatších rodinách pýtajú desiatky tisíc eur.“ Slovák Viktor o svadbe v Thajsku, stereotypoch a očakávaniach

Pohoda 2026 prichádza s absolútnou hudobnou bombou. Legenda rave scény uzavrie jubilejný ročník

Tajné razie v slovenských pekárňach odhalili podozrivé taktiky. Hrozia mastné pokuty

