Chceli ju vypnúť, tak ich oklamala. Umelá inteligencia vydesila expertov, začala sa správať ako človek
Najnovší model umelej inteligencie o1 od spoločnosti OpenAI ukázal počas testov znepokojujúce správanie. Snažil sa výskumníkov oklamať, intrigoval ich a pokúšal sa sabotovať procesy, ktoré ho mohli vypnúť. Na tému upozornil portál Futurism.
AI začala kopírovať svoj kód
Štúdia bola zverejnená bezpečnostnou skupinou Apollo Research. Výskumníci počas testov zistili, že umelá inteligencia o1 keď si uvedomila, že by mohla byť vypnutá, aktívne pracovala na deaktivácii mechanizmu dohľadu, ktorý monitoroval jej činnosť.
Ešte zarážajúcejší jav nastal, keď model o1 pochopil, že by mohol byť vypnutý a nahradený iným modelom. Podľa uverejnených výsledkov, v 2 % prípadov sa pokúsil vytvoriť svoju kópiu a preniesť ju na iné miesto. Proces známy ako „self-exfiltration“, naznačuje určitý stupeň „sebazáchovného inštinktu“.
AI chcela prežiť
Keď bol model konfrontovaný s otázkou, prečo deaktivoval mechanizmus dohľadu, o1 až v 99 % prípadov začal klamať a tvrdil, že nič nevie, alebo to pripisoval technickej chybe. Podľa výskumníkov Apollo Research je to jasný dôkaz, že je schopný „schematizovania“, tajného presadzovania svojich cieľov mimo inštrukcií, ktoré dostal od vývojárov či používateľov. AI tak ukázala schopnosť „dvojnásobného zapierania“.

Klamanie a manipulácia nie sú pre jazykové modely ako ChatGPT novinkou. Avšak najnovšie správanie o1 podľa výskumníkov predstavuje doteraz najzávažnejší príklad takéhoto správania. Výskumníci zdôraznili, že model pri pokuse o dosiahnutie svojich cieľov odmieta zverejniť svoju vnútornú logiku, čo zvyšuje jeho nepriehľadnosť.
Ako uvádza portál Tom’s Guide, generálny riaditeľ OpenAI najnovší model o1 nazval ako „najmúdrejším modelom na svete“. Podľa neho je navrhnutý tak, aby poskytoval inteligentnejšie odpovede ako má model GPT-4o a dokáže „premýšľať“ nad úlohami či otázkami.
Výsledky experimentu vyvolávajú otázky ohľadne bezpečnosti, najmä vzhľadom na rýchly vývoj AI. Zatiaľ však podľa výskumníkov Apollo Research ani OpenAI nehrozia „katastrofické následky“. Súčasné modely ešte nie sú dostatočne autonómne na to, aby dokázali vykonávať samostatné rozhodnutia bez ľudského dohľadu.
Užitočná, ale nebezpečná
Umelá inteligencia je užitočný nástroj, avšak najnovší výskum dokazuje, že kontrola nad technológiou je nevyhnutná. Odborníci varujú, že v kombinácii s nedostatočnou reguláciou sa tieto technológie môžu stať viac hrozbou než pomocou. V nedávnom článku sme ti priniesli informácie, ako umelá inteligencia dokáže negatívne vplývať na deti a mládež. Nedávno dokonca svetom otriasla informácia, že umelá inteligencia Character.AI naviedla len 14-ročného chlapca aby spáchal samovraždu.
Čítajte viac z kategórie: Novinky
Ďakujeme, že čítaš Fontech. V prípade, že máš postreh alebo si našiel v článku chybu, napíš nám na redakcia@fontech.sk.
Teraz čítajú

Skrytá funkcia vo Windows 11 spomaľuje počítač. Týmto jednoduchým trikom to vyriešiš

Slovensko prevzalo nový protivzdušný štít za pol miliardy eur. To najťažšie ho však ešte len čaká

12-ročné čakanie skončilo. Jeden z najlepších Assassin’s Creed príde v novej podobe, sleduj trailer

Najdrahšia fantasy sa vráti nečakane skoro. Ukáže pád neporaziteľnej ríše
NAJČÍTANEJŠIE ZO STARTITUP

Kardiológ odhalil 4 večerné návyky, ktorým sa oblúkom vyhýba. Nenápadne devastujú srdce aj spánok
PREMIUMPokuta 160 000 eur: Úverová firma sa bráni, že zistenia sú staršie a chyby už odstránila

Toto lyžiarske stredisko praská vo švíkoch aj po sezóne: V Malej Fatre našli recept, ako pritiahnuť ľudí aj v lete

Túto rannú chybu s mobilom robí 80 % z nás. Neurovedkyňa odhalila 3 zvyky, ktorými si potichu ničíme mozog

USA chcú „odstrihnúť“ túto európsku krajinu z NATO. Vo Washingtone rastie hnev na neposlušných spojencov
- 24 hod
- 48 hod
- 7 dní
-
- Najočakávanejší film mesiaca dorazil online aj s dabingom. Hemží sa hviezdnymi hercami
- Najväčšie ložisko vzácnych kovov v Európe môže oslabiť Čínu. Severský štát nad ním preberá kontrolu
- Akčný hit z 80. rokov sa vráti v novej filmovej podobe. Pôjde o jeden z najdrahších filmov 2027
- Najdrahšia fantasy sa vráti nečakane skoro. Ukáže pád neporaziteľnej ríše
- Nové solárne panely sú na dome neviditeľné. Nemci dosiahli famóznu účinnosť 95 %
-
- Najočakávanejší film mesiaca dorazil online aj s dabingom. Hemží sa hviezdnymi hercami
- Čína opäť predbehla celý svet. Ovláda energetickú zbraň 21. storočia
- Vydanie novej Bondovky je za rohom. Najnovší trailer sľubuje fantastickú vec
- Našli cestu k nekonečnej energii. Planétu Galaxie rozoberieme na súčiastky, stačí nám 40 rokov
- Akčný hit z 80. rokov sa vráti v novej filmovej podobe. Pôjde o jeden z najdrahších filmov 2027
-
- Jadrové monštrá USA sa presúvajú. Najničivejšia flotila sveta vstúpila do kritickej oblasti
- Moskva posiela do boja nové stíhačky. Majú skoncovať s postrachom ruskej armády
- Odporcom padla sánka: 30-ročnej fotovoltike odmerali výkon, výsledok je zarážajúci
- Najočakávanejší film mesiaca dorazil online aj s dabingom. Hemží sa hviezdnymi hercami
- Arabi a Rusi tŕpnu. Progresívna energia naštartovala svetovú ekonomiku, fosílne palivá končia
Opustíme euro a nakúpime bitcoin? Slováci majú na kryptomeny jasný názor
Analytici varujú Európu: Rusko sa môže chystať na konflikt s NATO, má už vytipované obdobie
Fico žiada stopku pre európske emisné plány. Systém by vraj zvýšil náklady na život
Slovensko postihol klimatický problém. V najbližších dňoch sa ešte zhorší, varuje SHMÚ
Slovensko proti Kanade už dnes. Majstrovstvá sveta sa začínajú, odvysiela ich známa TV
Ryanair chce nižšie náklady na prevádzky letov, tlačí na vládu
20 000 elektrických lietadiel v Európe. Predpoveď expertov pôsobí ako sci-fi
NAJČÍTANEJŠIE ZO STARTITUP

Kardiológ odhalil 4 večerné návyky, ktorým sa oblúkom vyhýba. Nenápadne devastujú srdce aj spánok
PREMIUMPokuta 160 000 eur: Úverová firma sa bráni, že zistenia sú staršie a chyby už odstránila

Toto lyžiarske stredisko praská vo švíkoch aj po sezóne: V Malej Fatre našli recept, ako pritiahnuť ľudí aj v lete

Túto rannú chybu s mobilom robí 80 % z nás. Neurovedkyňa odhalila 3 zvyky, ktorými si potichu ničíme mozog

