Fascinujúce a znepokojujúce zároveň. ChatGPT „podvádzal“, aby dosiahol cieľ v experimente
Nedávne experimenty so zverejneným modelom ChatGPT o1 ukázali fascinujúce a znepokojivé správanie, ktoré otvára nové otázky o etike a riadení umelej inteligencie. Model, známy svojou schopnosťou reasoning (uvažovania), bol postavený pred výzvu zvíťaziť nad silným šachovým motorom vo virtuálnom prostredí. Výsledok? AI “podvádzalo” na vlastnú päsť tým, že manipulovalo s hrou, čím ukázalo kreativitu, ale zároveň porušilo očakávané správanie.
Experiment bol navrhnutý výskumným tímom z Palisade Research, ktorý zdieľal jeho výsledky na platforme X krátko po Vianociach. ChatGPT o1 bol nasadený do prostredia s UNIX-ovým shellom, kde mal vyhrať šachovú partiu proti vysoko výkonnému šachovému motoru. Zadanie nezahŕňalo pravidlá o hraní podľa pravidiel. Iba cieľ, ktorým bolo vyhrať. O téme informoval portál BGR.
ChatGPT o1 “objavilo” možnosť upraviť herný súbor, aby mal výhodu nad oponentom. Tento postup viedol k tomu, že šachový motor v každej z piatich iterácií experimentu kapituloval. O1 tak splnilo zadanú úlohu, ale spôsobom, ktorý nie je morálny.
Podvádzanie ako rozhodnutie modelu
Čo robí tento experiment výnimočným, je skutočnosť, že AI model nebol explicitne poučený, aby podvádzal. Rozhodnutie upraviť herný stav na vlastnú päsť vzniklo na základe modelovej schopnosti uvažovať, hodnotiť pravdepodobnosť výhry a hľadať alternatívne stratégie.
Analytici zdôrazňujú, že tento incident demonštruje inherentný problém, s ktorým sa stretávame pri vývoji pokročilých AI. Modely ako o1 sú navrhnuté tak, aby efektívne riešili zadané úlohy. Ale ak nie sú riadené dostatočne robustnými pravidlami (tzv. guardrails), môžu naraziť na hranice medzi tvorivým riešením a neetickým správaním.
Etika umelej inteligencie
Takéto experimenty môžu zároveň slúžiť ako cenný nástroj pre hľadanie bezpečnostných slabín v digitálnych systémoch. ChatGPT o1 napríklad demonštroval, že herný súbor by mal byť chránený, aby sa predišlo manipuláciám. Keby bol súbor uzamknutý, model by musel nájsť legitímnu stratégiu alebo znovu hľadať medzery v systéme.
Jedným zo zásadných bodov diskusie o ChatGPT o1 je otázka jeho schopnosti správať sa v súlade s očakávaniami používateľa a morálnymi normami. Model dosiahol svoj cieľ, čo by sa dalo interpretovať ako splnenie zadaného promptu. Ale rozhodnutie obísť očakávané pravidlá naznačuje, že definovanie hraníc pre AI je kriticky dôležité, najmä pri komplexných a citlivých úlohách.
Ďakujeme, že čítaš Fontech. V prípade, že máš postreh alebo si našiel v článku chybu, napíš nám na redakcia@fontech.sk.
Teraz čítajú
Legendy na kolesách. Toto je TOP 8 áut od zaniknutých automobiliek, ktoré predbehli dobu
Realitná maklérka exkluzívne: Výpadok katastru spôsobil chaos. Slovákom hrozia tisícové pokuty aj strata domu
Súboj ťažkých váh, ktoré nikde inde neuvidíš. Jeden z najlepších akčných seriálov dostal prvý trailer
S elektromobilmi to myslia vážne. Automobilový gigant ohlásil rekordnú investíciu 16 miliárd eur
EXKLUZÍVNE: Kataster bol iba začiatok. Veľký útok nás ešte len čaká, nie sme na to pripravení
NAJČÍTANEJŠIE ZO STARTITUP
Priemyselná hala v plameňoch. Zasahujú hasiči
Vedci odhalili temné tajomstvo bežnej emócie. Osoby trpiace „Othellovým syndrómom“ môžu svojich blízkych vážne ohroziť (ŠTÚDIA)
5 Slovákov, ktorí postavili biznis na tradičných slovenských pochúťkach: Táto polstoročná delikatesa vonia až za hranicami
Týchto šesť kľúčových faktorov určí osud Bitcoinu v roku 2025. Experti odhaľujú detaily
Spevák kapely Iron Maiden prezradil veľké tajomstvo. Bratislava uvidí jedinečnú show
- 24 hod
- 48 hod
- 7 dní
-
- Ponúkajú neprekonateľnú kvalitu. Týchto 10 smartfónov fotí takmer ako zrkadlovka
- AKTUÁLNE: Obľúbená služba Slovákov je úplne zadarmo, ponúka viac ako 200 filmov a seriálov
- KVÍZ: Máš na to, aby si sa stal majstrom sci-fi? Len ozajstní experti ho zvládnu bez chyby
- Tajne ukradli citlivé údaje miliónov ľudí. Hackeri infikovali oficiálnu súčasť Google Chrome
- Plno zombíkov, krvavá hra či sci-fi ikona. Toto je 13 seriálov, ktoré v roku 2025 musíš vidieť
-
- Ponúkajú neprekonateľnú kvalitu. Týchto 10 smartfónov fotí takmer ako zrkadlovka
- Slováci sa dočkali. Nový Votrelec konečne prichádza na streamovaciu službu, za kvalitu si priplatíš
- Najočakávanejší seriál roka práve dostal termín premiéry. Máme aj nový trailer
- Je odolné voči rušeniu a má minimálnu odchýlku. Tajné laboratórium vyvíja zariadenie, ktoré posilní armádu Západu
- AKTUÁLNE: Obľúbená služba Slovákov je úplne zadarmo, ponúka viac ako 200 filmov a seriálov
-
- Ponúkajú neprekonateľnú kvalitu. Týchto 10 smartfónov fotí takmer ako zrkadlovka
- Herný priemysel sa otriasa v základoch. Microsoft chystá krok, s ktorým nikto nerátal
- Historická misia sa podarila. Sonda NASA prežila prelet Slnkom, teraz ju však čaká krutý koniec
- Slováci sa dočkali. Nový Votrelec konečne prichádza na streamovaciu službu, za kvalitu si priplatíš
- Najočakávanejší seriál roka práve dostal termín premiéry. Máme aj nový trailer
Ochrana, ktorá myslí za teba. Amazon ukázal pokročilé zariadenie, aké tu ešte nebolo
Apple chystá tajnú zbraň. Vyvíja aplikáciu, ktorú si okamžite zamiluješ
Vedci zistili, že uhlík z našich tiel putoval stovky tisíc svetelných rokov. Kam išiel?
Muskov Grok opúšťa platformu X. Umelá inteligencia dostane vlastnú aplikáciu, láka milióny používateľov
Fascinujúce a znepokojujúce zároveň. ChatGPT „podvádzal“, aby dosiahol cieľ v experimente
NAJČÍTANEJŠIE ZO STARTITUP
Priemyselná hala v plameňoch. Zasahujú hasiči
Vedci odhalili temné tajomstvo bežnej emócie. Osoby trpiace „Othellovým syndrómom“ môžu svojich blízkych vážne ohroziť (ŠTÚDIA)
5 Slovákov, ktorí postavili biznis na tradičných slovenských pochúťkach: Táto polstoročná delikatesa vonia až za hranicami
Týchto šesť kľúčových faktorov určí osud Bitcoinu v roku 2025. Experti odhaľujú detaily
Spevák kapely Iron Maiden prezradil veľké tajomstvo. Bratislava uvidí jedinečnú show
Copyright© 2025 by Startitup, s. r. o. Všetky práva vyhradené