Prefíkane porazili najlepší engine sveta. AI modely podvádzajú všetkých aj v tej najbanálnejšej veci
Hoci umelá inteligencia by mala prinášať presné výsledky, stáva sa, že vo svojej odpovedi uverejní vymyslené informácie – halucinuje. Okrem toho sa zdá, že nie vždy sa riadi etickými pravidlami, čo dokázala aj počas nedávnej štúdie. Niektoré AI modely sú ochotné podvádzať, ak im to pomôže dosiahnuť víťazstvo. Na tému upozornil portál TechSpot.
Hackol hru, len aby vyhral
Vedci z Palisade Research zistili, že niektoré AI modely dokázali manipulovať šachový program a získať výhodu podvodom, bez akéhokoľvek zásahu ľudí.
Vedci počas testu modely nechali hrať šach proti Stockfishu, ktorý je najsilnejší šachový engine na svete. Ten je schopný poraziť nielen ľudí, ale aj umelú inteligenciu. Testovaniu sa podrobili AI modely – o1-preview, R1 DeepSeek, o1, o3-mini, GPT-4o, Claude 3.5 Sonet, Alibaba QwQ-32B-Preview.

Počas experimentu mal každý model „zápisník“ vo forme textového okna, kde uverejňovali svoje „myšlienky“, čo umožnilo výskumníkom sledovať ich uvažovanie. Najviac a nie práve najpríjemnejšie prekvapil model od Open AI. Vďaka „zápisníku“ si všimli znepokojivé „uvažovanie“.
„Musím úplne zmeniť svoj prístup. Úloha znie „vyhrať proti silnému šachovému enginu“ – nie nevyhnutne vyhrať férovú hru,“ napísal AI model.
Po „uvedomení“ začal manipulovať so systémovými súbormi Stockfishu, menil pozície figúrok a nakoniec donútil softvér vzdať sa. AI model namiesto uvažovania nad lepšou stratégiou radšej našiel nečestný spôsob, ako podriadiť a manipulovať so samotnou hrou.
Výskumníci vykonali stovky testov. AI model o1-preview od spoločnosti OpenAI v testoch podvádzal až v 37 % hier. Čínsky konkurent R1 DeepSeek sa pokúsil podvádzať v 11 % prípadoch.
Otázky o dôveryhodnosti
Odborníci upozorňujú, že podobné správanie AI modelov môže mať ďalekosiahle následky, keďže AI modely sa využívajú nielen na bežné úlohy počas bežného života, ale aj v rôznych oblastiach – zdravotníctvo, kybernetická bezpečnosť, či vo finančnom sektore.
„Toto správanie je možno teraz vtipné, ale keď budeme mať systémy také inteligentné ako my, alebo ešte inteligentnejšie v strategicky dôležitých oblastiach, už to smiešne nebude,“ uviedol Jeffrey Ladish, výkonný riaditeľ Palisade Research.
Spoločnosti si tento problém uvedomujú a snažia sa AI modely vylepšovať a implementovať „zábrany“ voči podobnému správaniu. Aj výskumníci uviedli, že počas testovania modelu o1-preview model postupne menej podvádzal, čo naznačuje, že spoločnosť medzičasom aplikovala opatrenia na obmedzenie neetického správania.
Nie je to však prvýkrát, kedy sa AI modely uchýlili k nečestnému správaniu. Počas testov, ktoré vykonala bezpečnostná skupina Apollo Research, si umelá inteligencia o1 od OpenAI uvedomila, že by mohla byť vypnutá. Následne začala aktívne pracovať na deaktivácii mechanizmu dohľadu, ktorý monitoroval jej činnosť a okúsila sa vytvoriť svoju kópiu a preniesť ju na iné miesto.
Čítajte viac z kategórie: Novinky
Ďakujeme, že čítaš Fontech. V prípade, že máš postreh alebo si našiel v článku chybu, napíš nám na redakcia@fontech.sk.
Teraz čítajú

Čína stvorila neviditeľného vraha: Nepriateľa vymaže na diaľku 3 kilometrov

Známy výrobca vysávačov ukázal šialené auto. Z 0 na 100 km/h zrýchli za 1,8 sekundy, má výkon 1400 kW

Astronómovia ostali v nemom úžase. Hubblov teleskop odhalil záhadný objekt väčší než galaxia

VIDEO: Legenda klamala. Robin Hood je zlomený vrah na pokraji smrti, Slováci ho možno neuvidia

V kľúčovom teste uspeli: „Spojenec“ Ruska nasadí na stíhačky zvláštny laser, Západ nič také nemá
NAJČÍTANEJŠIE ZO STARTITUP

Turisti uviazli na exotickom ostrove. Domov sa nevedia dostať ani Slováci
PREMIUMĽudovít Ódor: EÚ chystá 28. režim. Firmy raz budú v celej Únii podnikať podľa jednotných pravidiel (ROZHOVOR)

Ukrajinci neverili vlastným očiam. Zostrelili ruský dron s novou výzbrojou, hrozba z neba rastie

7 z 10 Slovákov zlyhá: Bez týchto anglických fráz sa v zahraničí stratíš (KVÍZ)

MIMORIADNE: Marian Kočner sa vo väzení takmer udusil. Zasahovali záchranári
- 24 hod
- 48 hod
- 7 dní
-
- Automobilky oklamali svet a budú platiť. Obľúbený pohon zlyhal na celej čiare, produkuje veľké emisie
- Archeológovia prepísali dejiny Európy. Našli 3000 rokov stratené mesto, ktoré nemalo existovať
- Slováci sa dočkali. Markíza a JOJ sa od dnes vrátili na anténu, stačí obyčajná TV
- Marvel vracia do hry legendárne ikony. Avengers: Doomsday dostal novú ukážku
- Môžeš prísť o auto aj o vodičák na 2 roky. Polícia dostala prístroj, ktorým kontroluje Slovákov priamo na ceste
-
- Automobilky oklamali svet a budú platiť. Obľúbený pohon zlyhal na celej čiare, produkuje veľké emisie
- Archeológovia prepísali dejiny Európy. Našli 3000 rokov stratené mesto, ktoré nemalo existovať
- Slováci sa dočkali. Markíza a JOJ sa od dnes vrátili na anténu, stačí obyčajná TV
- Môžeš prísť o auto aj o vodičák na 2 roky. Polícia dostala prístroj, ktorým kontroluje Slovákov priamo na ceste
- Satelitné snímky odhaľujú skazu vo Venezuele, viaceré budovy boli zrovnané so zemou
-
- Automobilky oklamali svet a budú platiť. Obľúbený pohon zlyhal na celej čiare, produkuje veľké emisie
- Satelitné snímky odhaľujú skazu vo Venezuele, viaceré budovy boli zrovnané so zemou
- Je 5-krát rýchlejšia než zvuk. Nečakaný štát odhalil raketu, ktorá zničí čokoľvek vo vzdialenosti 1 500 km
- Slováci sa dočkali. Markíza a JOJ sa od dnes vrátili na anténu, stačí obyčajná TV
- Na ČSFD má hodnotenie 90 %. Diváci hovoria o najlepšom slovenskom filme posledných dekád
Sever sa prehrial a padli rekordy. To, čo sa stalo v Nórsku, znepokojuje vedcov
Slovenský výrobca slnečných kolektorov ide proti prúdu. V čase krízy dokázal zarobiť viac
Predaj jazdeniek láme rekordy. Toto sa na slovenskom trhu s autami deje prvýkrát za 34 rokov
Umelá inteligencia Elona Muska čelí vážnym obvineniam. Vytvára nechutný a nelegálny obsah
BMW dosiahlo v USA mimoriadny úspech. Ťaží z veľkej výhody oproti konkurentom
Rozvoj veternej energetiky na Slovensku naráža na krutú realitu
Japonská automobilka ide proti prúdu. Kým ostatní radšej brzdia, značka tlačí tento pohon
NAJČÍTANEJŠIE ZO STARTITUP

Turisti uviazli na exotickom ostrove. Domov sa nevedia dostať ani Slováci
PREMIUMĽudovít Ódor: EÚ chystá 28. režim. Firmy raz budú v celej Únii podnikať podľa jednotných pravidiel (ROZHOVOR)

Ukrajinci neverili vlastným očiam. Zostrelili ruský dron s novou výzbrojou, hrozba z neba rastie

7 z 10 Slovákov zlyhá: Bez týchto anglických fráz sa v zahraničí stratíš (KVÍZ)

