Fascinujúce a znepokojujúce zároveň. ChatGPT „podvádzal“, aby dosiahol cieľ v experimente
Nedávne experimenty so zverejneným modelom ChatGPT o1 ukázali fascinujúce a znepokojivé správanie, ktoré otvára nové otázky o etike a riadení umelej inteligencie. Model, známy svojou schopnosťou reasoning (uvažovania), bol postavený pred výzvu zvíťaziť nad silným šachovým motorom vo virtuálnom prostredí. Výsledok? AI “podvádzalo” na vlastnú päsť tým, že manipulovalo s hrou, čím ukázalo kreativitu, ale zároveň porušilo očakávané správanie.
Experiment bol navrhnutý výskumným tímom z Palisade Research, ktorý zdieľal jeho výsledky na platforme X krátko po Vianociach. ChatGPT o1 bol nasadený do prostredia s UNIX-ovým shellom, kde mal vyhrať šachovú partiu proti vysoko výkonnému šachovému motoru. Zadanie nezahŕňalo pravidlá o hraní podľa pravidiel. Iba cieľ, ktorým bolo vyhrať. O téme informoval portál BGR.
ChatGPT o1 “objavilo” možnosť upraviť herný súbor, aby mal výhodu nad oponentom. Tento postup viedol k tomu, že šachový motor v každej z piatich iterácií experimentu kapituloval. O1 tak splnilo zadanú úlohu, ale spôsobom, ktorý nie je morálny.
Podvádzanie ako rozhodnutie modelu
Čo robí tento experiment výnimočným, je skutočnosť, že AI model nebol explicitne poučený, aby podvádzal. Rozhodnutie upraviť herný stav na vlastnú päsť vzniklo na základe modelovej schopnosti uvažovať, hodnotiť pravdepodobnosť výhry a hľadať alternatívne stratégie.
Analytici zdôrazňujú, že tento incident demonštruje inherentný problém, s ktorým sa stretávame pri vývoji pokročilých AI. Modely ako o1 sú navrhnuté tak, aby efektívne riešili zadané úlohy. Ale ak nie sú riadené dostatočne robustnými pravidlami (tzv. guardrails), môžu naraziť na hranice medzi tvorivým riešením a neetickým správaním.

Etika umelej inteligencie
Takéto experimenty môžu zároveň slúžiť ako cenný nástroj pre hľadanie bezpečnostných slabín v digitálnych systémoch. ChatGPT o1 napríklad demonštroval, že herný súbor by mal byť chránený, aby sa predišlo manipuláciám. Keby bol súbor uzamknutý, model by musel nájsť legitímnu stratégiu alebo znovu hľadať medzery v systéme.
Jedným zo zásadných bodov diskusie o ChatGPT o1 je otázka jeho schopnosti správať sa v súlade s očakávaniami používateľa a morálnymi normami. Model dosiahol svoj cieľ, čo by sa dalo interpretovať ako splnenie zadaného promptu. Ale rozhodnutie obísť očakávané pravidlá naznačuje, že definovanie hraníc pre AI je kriticky dôležité, najmä pri komplexných a citlivých úlohách.
Ďakujeme, že čítaš Fontech. V prípade, že máš postreh alebo si našiel v článku chybu, napíš nám na redakcia@fontech.sk.
Teraz čítajú

NATO je v pohotovosti: Rusi vyvíjajú zákernú zbraň, chcú ju nasadiť do vesmíru

Slováci si za RAM pamäte poriadne priplatia. Tieto faktory vystrelili ich ceny do nebies

Ovplyvnila ho okupácia ČSSR, svet dostal nepodarený kompromis. Raketoplán mal vyzerať úplne inak

Sen Netflixu o novej superslužbe sa rozpadá. Miliardár ho nečakaným ťahom zahnal do kúta

Prvý teaser Avengers Doomsday je vonku a fanúšikovia sú v extáze. Zábery potvrdzujú návrat legendárneho hrdinu
NAJČÍTANEJŠIE ZO STARTITUP
PREMIUMNa Slovensku sa začína „legislatívna smršť“: Od 1. januára 2026 prídu nové povinnosti aj pokuty

Za nepodanie daňového priznania hrozí pokuta až 60 000 eur. Finančná správa sprísňuje pravidlá
PREMIUMMartin vytvoril zariadenie, ktoré mení spôsob, ako spíme. Svoj startup vyvíjal počas liečby rakoviny

V dome MMA zápasníka Karla Vémolu prebehol mimoriadny zásah. Polícia zadržala 2 osoby

Vo veku 27 rokov zomrel elitný biatlonista. Našli ho mŕtveho v hotelovej izbe
- 24 hod
- 48 hod
- 7 dní
-
- Ukrajina bola varovaním. Susedná krajina chce vlastný HIMARS, vyrobí ho najväčšia zbrojovka sveta
- Európska únia opäť zaťala do živého. Chystá návrh, ktorý prinúti časť ľudí kupovať len elektromobily
- Sen Netflixu o novej superslužbe sa rozpadá. Miliardár ho nečakaným ťahom zahnal do kúta
- Ovplyvnila ho okupácia ČSSR, svet dostal nepodarený kompromis. Raketoplán mal vyzerať úplne inak
- Netflix čakal hit, nestíha sa čudovať. Ľudia ignorujú film, ktorý mal byť magnetom mesiaca
-
- Európska únia opäť zaťala do živého. Chystá návrh, ktorý prinúti časť ľudí kupovať len elektromobily
- Ukrajina bola varovaním. Susedná krajina chce vlastný HIMARS, vyrobí ho najväčšia zbrojovka sveta
- USA do dronu posadili AI a prišiel veľký šok. V kľúčovom teste zostrelila lietadlo
- Netflix čakal hit, nestíha sa čudovať. Ľudia ignorujú film, ktorý mal byť magnetom mesiaca
- Rozhodne sa vojna v oceliarňach? Čína zrýchľuje výrobu kľúčového materiálu, USA zatvárajú prevádzky
-
- USA do dronu posadili AI a prišiel veľký šok. V kľúčovom teste zostrelila lietadlo
- Európska únia opäť zaťala do živého. Chystá návrh, ktorý prinúti časť ľudí kupovať len elektromobily
- Ukrajina bola varovaním. Susedná krajina chce vlastný HIMARS, vyrobí ho najväčšia zbrojovka sveta
- Netflix čakal hit, nestíha sa čudovať. Ľudia ignorujú film, ktorý mal byť magnetom mesiaca
- Prežila náraz do vody pri 660 km/h. Väčšiu raketu ako Sea Dragon dodnes nikto nepostavil
Katastrofa je zabudnutá. Ázijsky štát znova spustí najväčšiu jadrovú elektráreň na svete
Slováci dôverujú umelej inteligencii viac než expertom. Výsledky prieskumu šokovali
Známa sociálna sieť má zarobené na problém. Jej algoritmy vraj spôsobili tragédiu v Poľsku
Budú mať lasery, rakety a hypersonické zbrane. USA vyvinie najsmrteľnejšie hladinové bojové lode
Zvolili prešibanú stratégiu. Obľúbené značky Slovákov si udržali silnú pozíciu na automobilovom trhu
Susedná krajina ide do vojny s EÚ. Odmieta uznať jadro ako „zelenú energiu“, chystá veľký zvrat
AKTUÁLNE: Ázijská mocnosť sa stáva spojencom EÚ v kľúčovej oblasti. Do výskumu nalejú 93 miliárd eur
NAJČÍTANEJŠIE ZO STARTITUP
PREMIUMNa Slovensku sa začína „legislatívna smršť“: Od 1. januára 2026 prídu nové povinnosti aj pokuty

Za nepodanie daňového priznania hrozí pokuta až 60 000 eur. Finančná správa sprísňuje pravidlá
PREMIUMMartin vytvoril zariadenie, ktoré mení spôsob, ako spíme. Svoj startup vyvíjal počas liečby rakoviny

V dome MMA zápasníka Karla Vémolu prebehol mimoriadny zásah. Polícia zadržala 2 osoby

