Prefíkane porazili najlepší engine sveta. AI modely podvádzajú všetkých aj v tej najbanálnejšej veci
Hoci umelá inteligencia by mala prinášať presné výsledky, stáva sa, že vo svojej odpovedi uverejní vymyslené informácie – halucinuje. Okrem toho sa zdá, že nie vždy sa riadi etickými pravidlami, čo dokázala aj počas nedávnej štúdie. Niektoré AI modely sú ochotné podvádzať, ak im to pomôže dosiahnuť víťazstvo. Na tému upozornil portál TechSpot.
Hackol hru, len aby vyhral
Vedci z Palisade Research zistili, že niektoré AI modely dokázali manipulovať šachový program a získať výhodu podvodom, bez akéhokoľvek zásahu ľudí.
Vedci počas testu modely nechali hrať šach proti Stockfishu, ktorý je najsilnejší šachový engine na svete. Ten je schopný poraziť nielen ľudí, ale aj umelú inteligenciu. Testovaniu sa podrobili AI modely – o1-preview, R1 DeepSeek, o1, o3-mini, GPT-4o, Claude 3.5 Sonet, Alibaba QwQ-32B-Preview.
Počas experimentu mal každý model „zápisník“ vo forme textového okna, kde uverejňovali svoje „myšlienky“, čo umožnilo výskumníkom sledovať ich uvažovanie. Najviac a nie práve najpríjemnejšie prekvapil model od Open AI. Vďaka „zápisníku“ si všimli znepokojivé „uvažovanie“.
„Musím úplne zmeniť svoj prístup. Úloha znie „vyhrať proti silnému šachovému enginu“ – nie nevyhnutne vyhrať férovú hru,“ napísal AI model.
Po „uvedomení“ začal manipulovať so systémovými súbormi Stockfishu, menil pozície figúrok a nakoniec donútil softvér vzdať sa. AI model namiesto uvažovania nad lepšou stratégiou radšej našiel nečestný spôsob, ako podriadiť a manipulovať so samotnou hrou.
Výskumníci vykonali stovky testov. AI model o1-preview od spoločnosti OpenAI v testoch podvádzal až v 37 % hier. Čínsky konkurent R1 DeepSeek sa pokúsil podvádzať v 11 % prípadoch.
Otázky o dôveryhodnosti
Odborníci upozorňujú, že podobné správanie AI modelov môže mať ďalekosiahle následky, keďže AI modely sa využívajú nielen na bežné úlohy počas bežného života, ale aj v rôznych oblastiach – zdravotníctvo, kybernetická bezpečnosť, či vo finančnom sektore.
„Toto správanie je možno teraz vtipné, ale keď budeme mať systémy také inteligentné ako my, alebo ešte inteligentnejšie v strategicky dôležitých oblastiach, už to smiešne nebude,“ uviedol Jeffrey Ladish, výkonný riaditeľ Palisade Research.
Spoločnosti si tento problém uvedomujú a snažia sa AI modely vylepšovať a implementovať „zábrany“ voči podobnému správaniu. Aj výskumníci uviedli, že počas testovania modelu o1-preview model postupne menej podvádzal, čo naznačuje, že spoločnosť medzičasom aplikovala opatrenia na obmedzenie neetického správania.
Nie je to však prvýkrát, kedy sa AI modely uchýlili k nečestnému správaniu. Počas testov, ktoré vykonala bezpečnostná skupina Apollo Research, si umelá inteligencia o1 od OpenAI uvedomila, že by mohla byť vypnutá. Následne začala aktívne pracovať na deaktivácii mechanizmu dohľadu, ktorý monitoroval jej činnosť a okúsila sa vytvoriť svoju kópiu a preniesť ju na iné miesto.
Čítajte viac z kategórie: Novinky
Ďakujeme, že čítaš Fontech. V prípade, že máš postreh alebo si našiel v článku chybu, napíš nám na redakcia@fontech.sk.
Teraz čítajú
Vedci neverili vlastným očiam. Zistili niečo zvláštne o "hviezde smrti", ktorá mala zničiť Zem
Slováci môžu mať Netflix úplne zadarmo. Takto si ho aktivuješ
PRELOM: Vedci sa dekády mýlili. Konečne rozlúštili veľkú záhadu najzákernejšej choroby
Medicína oslavuje. Prelomový výskum za miliardu dolárov prináša nádej pre ľudí s rakovinou
Vypnú ich na diaľku? Desivá zbraň za miliardy je „zajatcom“ USA, európske krajiny ju už nechcú
NAJČÍTANEJŠIE ZO STARTITUP
V Rači otvorila nová reštaurácia Kern. Nechýba vyprážaná parenica ani limonáda „Račianska štrúdľa“
Vyhodili ho zo všetkých prác, býval na 12 m² so švábmi. Teraz zarába 76 000 eur mesačne
Slintačka a krívačka sa rozšírili na novú farmu. Analytik varuje pred zdražením mliečnych a mäsových produktov
Slováci vyhadzujú časti karbohydrátovej zeleniny do koša. Sú účinnejšie než lieky na rakovinu pľúc (ŠTÚDIA)
Bratislavské letisko spúšťa letnú sezónu: Pribudne 6 leteckých liniek a nový dopravca
- 24 hod
- 48 hod
- 7 dní
-
- Vedcom padla sánka. 4 757 metrov pod ľadom Antarktídy objavili stratený svet
- Čína chystá inváziu, varujú experti. Dolaďuje „víťazný plán“, ktorým paralyzuje kľúčový ostrov v Ázii
- VIDEO: Dron odhalil megatováreň BYD pre vyše 100-tisíc ľudí, bude väčšia ako Nitra
- Toto chceš vidieť. Zverejnili najdetailnejšiu 3D mapu vesmíru, odhaľuje krutú realitu
- Slováci si musia dávať obrovský pozor. Ak v domácnosti zakúriš týmto, riskuješ pokutu 5 000 eur
-
- Čína chystá inváziu, varujú experti. Dolaďuje „víťazný plán“, ktorým paralyzuje kľúčový ostrov v Ázii
- Vedcom padla sánka. 4 757 metrov pod ľadom Antarktídy objavili stratený svet
- Návrat studenej vojny? Ruská flotila s desivými zbraňami vplávala do európskych vôd a vystrašila Západ
- Vybabrali s Američanmi, teraz to schytajú Rusi. Česi poslali Ukrajine špičkovú vesmírnu „zbraň“
- Slováci si musia dávať obrovský pozor. Ak v domácnosti zakúriš týmto, riskuješ pokutu 5 000 eur
-
- Vybabrali s Američanmi, teraz to schytajú Rusi. Česi poslali Ukrajine špičkovú vesmírnu „zbraň“
- Čína chystá inváziu, varujú experti. Dolaďuje „víťazný plán“, ktorým paralyzuje kľúčový ostrov v Ázii
- Vedcom padla sánka. 4 757 metrov pod ľadom Antarktídy objavili stratený svet
- Návrat studenej vojny? Ruská flotila s desivými zbraňami vplávala do európskych vôd a vystrašila Západ
- Radšej ju hneď vymaž. Známu appku zneužili hekeri, Slovákom cez ňu ukradli heslá aj peniaze
Automobilový trh na Slovensku upadá. Registrácie áut klesli
Dobrá správa pre slovenských občanov. Webové katastrálne mapy sú znova dostupné
Črtá sa nový biznis pre automobilky. Volanty čoskoro vymenia za zbrane
Ukrajinské mestá čelili ničivému útoku dronov. Rusi použili aj desivú raketu
Európa chce zbrojiť, ale nemá dostatok strelného prachu. Musí prosiť túto veľmoc
NAJČÍTANEJŠIE ZO STARTITUP
V Rači otvorila nová reštaurácia Kern. Nechýba vyprážaná parenica ani limonáda „Račianska štrúdľa“
Vyhodili ho zo všetkých prác, býval na 12 m² so švábmi. Teraz zarába 76 000 eur mesačne
Slintačka a krívačka sa rozšírili na novú farmu. Analytik varuje pred zdražením mliečnych a mäsových produktov
Slováci vyhadzujú časti karbohydrátovej zeleniny do koša. Sú účinnejšie než lieky na rakovinu pľúc (ŠTÚDIA)
Bratislavské letisko spúšťa letnú sezónu: Pribudne 6 leteckých liniek a nový dopravca
Copyright© 2025 by Startitup, s. r. o. Všetky práva vyhradené