Prefíkane porazili najlepší engine sveta. AI modely podvádzajú všetkých aj v tej najbanálnejšej veci
Hoci umelá inteligencia by mala prinášať presné výsledky, stáva sa, že vo svojej odpovedi uverejní vymyslené informácie – halucinuje. Okrem toho sa zdá, že nie vždy sa riadi etickými pravidlami, čo dokázala aj počas nedávnej štúdie. Niektoré AI modely sú ochotné podvádzať, ak im to pomôže dosiahnuť víťazstvo. Na tému upozornil portál TechSpot.
Hackol hru, len aby vyhral
Vedci z Palisade Research zistili, že niektoré AI modely dokázali manipulovať šachový program a získať výhodu podvodom, bez akéhokoľvek zásahu ľudí.
Vedci počas testu modely nechali hrať šach proti Stockfishu, ktorý je najsilnejší šachový engine na svete. Ten je schopný poraziť nielen ľudí, ale aj umelú inteligenciu. Testovaniu sa podrobili AI modely – o1-preview, R1 DeepSeek, o1, o3-mini, GPT-4o, Claude 3.5 Sonet, Alibaba QwQ-32B-Preview.
Počas experimentu mal každý model „zápisník“ vo forme textového okna, kde uverejňovali svoje „myšlienky“, čo umožnilo výskumníkom sledovať ich uvažovanie. Najviac a nie práve najpríjemnejšie prekvapil model od Open AI. Vďaka „zápisníku“ si všimli znepokojivé „uvažovanie“.
„Musím úplne zmeniť svoj prístup. Úloha znie „vyhrať proti silnému šachovému enginu“ – nie nevyhnutne vyhrať férovú hru,“ napísal AI model.
Po „uvedomení“ začal manipulovať so systémovými súbormi Stockfishu, menil pozície figúrok a nakoniec donútil softvér vzdať sa. AI model namiesto uvažovania nad lepšou stratégiou radšej našiel nečestný spôsob, ako podriadiť a manipulovať so samotnou hrou.
Výskumníci vykonali stovky testov. AI model o1-preview od spoločnosti OpenAI v testoch podvádzal až v 37 % hier. Čínsky konkurent R1 DeepSeek sa pokúsil podvádzať v 11 % prípadoch.
Otázky o dôveryhodnosti
Odborníci upozorňujú, že podobné správanie AI modelov môže mať ďalekosiahle následky, keďže AI modely sa využívajú nielen na bežné úlohy počas bežného života, ale aj v rôznych oblastiach – zdravotníctvo, kybernetická bezpečnosť, či vo finančnom sektore.
„Toto správanie je možno teraz vtipné, ale keď budeme mať systémy také inteligentné ako my, alebo ešte inteligentnejšie v strategicky dôležitých oblastiach, už to smiešne nebude,“ uviedol Jeffrey Ladish, výkonný riaditeľ Palisade Research.
Spoločnosti si tento problém uvedomujú a snažia sa AI modely vylepšovať a implementovať „zábrany“ voči podobnému správaniu. Aj výskumníci uviedli, že počas testovania modelu o1-preview model postupne menej podvádzal, čo naznačuje, že spoločnosť medzičasom aplikovala opatrenia na obmedzenie neetického správania.
Nie je to však prvýkrát, kedy sa AI modely uchýlili k nečestnému správaniu. Počas testov, ktoré vykonala bezpečnostná skupina Apollo Research, si umelá inteligencia o1 od OpenAI uvedomila, že by mohla byť vypnutá. Následne začala aktívne pracovať na deaktivácii mechanizmu dohľadu, ktorý monitoroval jej činnosť a okúsila sa vytvoriť svoju kópiu a preniesť ju na iné miesto.
Čítajte viac z kategórie: Novinky
Ďakujeme, že čítaš Fontech. V prípade, že máš postreh alebo si našiel v článku chybu, napíš nám na redakcia@fontech.sk.
Teraz čítajú
Trump dostal nebezpečný nápad. Chce ťažiť cenné suroviny na dne oceánov, spôsobí tým pohromu
Vedci sú v koncoch. Gigantický objekt popiera základné pravidlá vesmíru, fyzika na to nemá odpoveď
AKTUÁLNE: Bitcoin znova prekonal magickú hranicu. Vystrelil po Trumpovom dôležitom oznámení
Konečne sme sa dočkali. Nová Mafia predviedla svoju hrateľnosť v oficiálnom traileri
Ak zastavíš, bez milosti ťa popravia. Brutálny film podľa námetu Stephena Kinga dostal drsnú ukážku
NAJČÍTANEJŠIE ZO STARTITUP
Slovensko o pár hodín zasiahnu prudké mrazy. Vieme, kde ich pocítia najviac (PREDPOVEĎ)
Slováci majú v obývačke poklady za tisíce eur. Tieto predmety majú päťcifernú hodnotu (PREHĽAD)
Nový pápež Lev XIV. mal prísť v júni na Slovensko. Plánoval odslúžiť omšu aj navštíviť známy vrch
Revolúcia v liečbe depresie: Domorodá rastlina môže zachrániť milióny životov, hlási nový výskum
V zóne smrti nemôžeme zachrániť nikoho. Horolezci odhaľujú drsnú stránku výstupu na Mount Everest
- 24 hod
- 48 hod
- 7 dní
-
- Robí si na ňu zálusk NATO aj Ukrajina. Sused Ruska má novú kamikadze zbraň na obranu štátu
- Vedci sú v koncoch. Gigantický objekt popiera základné pravidlá vesmíru, fyzika na to nemá odpoveď
- Majitelia elektromobilov dostali studenú sprchu. Po novom majú platiť nespravodlivú a vysokú daň
- ČERNÁK pobláznil Slovákov. Netflix však ponúka ešte niečo omnoho lepšie
- AKTUÁLNE: Bitcoin znova prekonal magickú hranicu. Vystrelil po Trumpovom dôležitom oznámení
-
- ČERNÁK pobláznil Slovákov. Netflix však ponúka ešte niečo omnoho lepšie
- Majitelia elektromobilov dostali studenú sprchu. Po novom majú platiť nespravodlivú a vysokú daň
- Robí si na ňu zálusk NATO aj Ukrajina. Sused Ruska má novú kamikadze zbraň na obranu štátu
- Vedci sú v koncoch. Gigantický objekt popiera základné pravidlá vesmíru, fyzika na to nemá odpoveď
- Google Mapy ťa vodia za nos. Tento skrytý trik ťa stojí kilometre navyše (+ako to zmeniť)
-
- Vedci našli skrytý trik, ako obnoviť zrak. Takéto niečo by ti nikdy nenapadlo
- Našli artefakt starý 80 000 rokov. Odhalil, že o minulosti ľudstva sme sa totálne mýlili
- ČERNÁK pobláznil Slovákov. Netflix však ponúka ešte niečo omnoho lepšie
- KVÍZ: Väčšina „znalcov“ nedá už tretiu otázku. Ukáž, že filmové akčné legendy máš v malíčku
- Čína vypustila na moria 5000-tonového lovca jadrových ponoriek. USA sa pred ním budú skrývať
Brent sa šplhá nahor. Investorov ťahá nádej na obchodnú dohodu medzi veľmocami
Brusel chce zastaviť ruský plyn. Hlas-SD varuje pred ohrozením Slovenska
Začína to rutinou a končí hladovaním. Na sociálnej sieti sa šíri trend, ktorý vydesil expertov
Severná Kórea opäť odpálila balistickú raketu. Napätie na polostrove stúpa
Ani silný zisk nestačil. Slabšie tržby poslali akcie Uberu do mínusu
NAJČÍTANEJŠIE ZO STARTITUP
Slovensko o pár hodín zasiahnu prudké mrazy. Vieme, kde ich pocítia najviac (PREDPOVEĎ)
Slováci majú v obývačke poklady za tisíce eur. Tieto predmety majú päťcifernú hodnotu (PREHĽAD)
Nový pápež Lev XIV. mal prísť v júni na Slovensko. Plánoval odslúžiť omšu aj navštíviť známy vrch
Revolúcia v liečbe depresie: Domorodá rastlina môže zachrániť milióny životov, hlási nový výskum
V zóne smrti nemôžeme zachrániť nikoho. Horolezci odhaľujú drsnú stránku výstupu na Mount Everest
Copyright© 2025 by Startitup, s. r. o. Všetky práva vyhradené