Chceli ju vypnúť, tak ich oklamala. Umelá inteligencia vydesila expertov, začala sa správať ako človek
Najnovší model umelej inteligencie o1 od spoločnosti OpenAI ukázal počas testov znepokojujúce správanie. Snažil sa výskumníkov oklamať, intrigoval ich a pokúšal sa sabotovať procesy, ktoré ho mohli vypnúť. Na tému upozornil portál Futurism.
AI začala kopírovať svoj kód
Štúdia bola zverejnená bezpečnostnou skupinou Apollo Research. Výskumníci počas testov zistili, že umelá inteligencia o1 keď si uvedomila, že by mohla byť vypnutá, aktívne pracovala na deaktivácii mechanizmu dohľadu, ktorý monitoroval jej činnosť.
Ešte zarážajúcejší jav nastal, keď model o1 pochopil, že by mohol byť vypnutý a nahradený iným modelom. Podľa uverejnených výsledkov, v 2 % prípadov sa pokúsil vytvoriť svoju kópiu a preniesť ju na iné miesto. Proces známy ako „self-exfiltration“, naznačuje určitý stupeň „sebazáchovného inštinktu“.
AI chcela prežiť
Keď bol model konfrontovaný s otázkou, prečo deaktivoval mechanizmus dohľadu, o1 až v 99 % prípadov začal klamať a tvrdil, že nič nevie, alebo to pripisoval technickej chybe. Podľa výskumníkov Apollo Research je to jasný dôkaz, že je schopný „schematizovania“, tajného presadzovania svojich cieľov mimo inštrukcií, ktoré dostal od vývojárov či používateľov. AI tak ukázala schopnosť „dvojnásobného zapierania“.
Klamanie a manipulácia nie sú pre jazykové modely ako ChatGPT novinkou. Avšak najnovšie správanie o1 podľa výskumníkov predstavuje doteraz najzávažnejší príklad takéhoto správania. Výskumníci zdôraznili, že model pri pokuse o dosiahnutie svojich cieľov odmieta zverejniť svoju vnútornú logiku, čo zvyšuje jeho nepriehľadnosť.
Ako uvádza portál Tom’s Guide, generálny riaditeľ OpenAI najnovší model o1 nazval ako „najmúdrejším modelom na svete“. Podľa neho je navrhnutý tak, aby poskytoval inteligentnejšie odpovede ako má model GPT-4o a dokáže „premýšľať“ nad úlohami či otázkami.
Výsledky experimentu vyvolávajú otázky ohľadne bezpečnosti, najmä vzhľadom na rýchly vývoj AI. Zatiaľ však podľa výskumníkov Apollo Research ani OpenAI nehrozia „katastrofické následky“. Súčasné modely ešte nie sú dostatočne autonómne na to, aby dokázali vykonávať samostatné rozhodnutia bez ľudského dohľadu.
Užitočná, ale nebezpečná
Umelá inteligencia je užitočný nástroj, avšak najnovší výskum dokazuje, že kontrola nad technológiou je nevyhnutná. Odborníci varujú, že v kombinácii s nedostatočnou reguláciou sa tieto technológie môžu stať viac hrozbou než pomocou. V nedávnom článku sme ti priniesli informácie, ako umelá inteligencia dokáže negatívne vplývať na deti a mládež. Nedávno dokonca svetom otriasla informácia, že umelá inteligencia Character.AI naviedla len 14-ročného chlapca aby spáchal samovraždu.
Čítajte viac z kategórie: Novinky
Ďakujeme, že čítaš Fontech. V prípade, že máš postreh alebo si našiel v článku chybu, napíš nám na redakcia@fontech.sk.
Teraz čítajú
Automobilová revolúcia v Rusku? Číňania pohltili trh, do roku 2030 má byť až tretina áut EV
KVÍZ: Dokážeš prežiť vo svete Votrelca? Otestuj sa v kvíze, ktorý zvládnu len praví fanúšikovia
Trvalo im to cez 100 rokov. Vedci konečne spočítali, čo sa s tebou stane, ak spadneš do čiernej diery
Na ČSFD má 81 %, aj tak ho zrušili. Jeden z najlepších seriálov roka nečakane končí
Rusov likviduje tajná zbraň z 2. svetovej vojny. Ukrajina našla spôsob, ako ju „oživiť“
NAJČÍTANEJŠIE ZO STARTITUP
K Zemi mieri záhadný objekt poháňaný jadrovým pohonom, tvrdí astronóm z Harvardu. Pripúšťa mimozemský pôvod
Agresívnu rakovinu brzdí obyčajná tabletka na vysoký tlak. Milióny ľudí ju majú v lekárničke
50-ročný muž zomrel po útoku jeleňa. Chcel ho vyslobodiť z plota
Meteorológovia v pohotovosti: Mohutný hurikán Erin mieri do Európy. Jeho silu pocítime aj na Slovensku
Antikoncepcia prepisuje „mapu mozgu“. Nová štúdia odhalila, že tabletky znižujú našu jedinečnosť
- 24 hod
- 48 hod
- 7 dní
-
- Vozidlo ti vyradia z evidencie. Štát našiel spôsob, ako skoncovať so zlozvykom motoristov na Slovensku
- Už ich nič nezastaví. Automobiloví giganti spojili sily, nečakaná aliancia zmení elektromobily
- Vedci rozlúštili pôvod záhadného signálu a ostali bez slov. Nič podobné ešte nevideli
- Európa čelí novej hrozbe. Večný spojenec Ruska uvažuje nad tým, čo bolo doteraz nemysliteľné
- Slováci prepadávajú zákernej závislosti a nikto s tým nič nerobí. Odborníci varujú pred celoživotnými následkami
-
- Vozidlo ti vyradia z evidencie. Štát našiel spôsob, ako skoncovať so zlozvykom motoristov na Slovensku
- Už ich nič nezastaví. Automobiloví giganti spojili sily, nečakaná aliancia zmení elektromobily
- Európa čelí novej hrozbe. Večný spojenec Ruska uvažuje nad tým, čo bolo doteraz nemysliteľné
- Slováci prepadávajú zákernej závislosti a nikto s tým nič nerobí. Odborníci varujú pred celoživotnými následkami
- Vedci rozlúštili pôvod záhadného signálu a ostali bez slov. Nič podobné ešte nevideli
-
- Vodič prekročil rýchlosť o 27 km/h a dostal pokutu 96 000 eur. Narazil na prísne pravidlo
- Ľudstvo má obrovský probém. Po celom svete mizne sladká voda, vedci už poznajú dôvod
- Európska mocnosť chce najsilnejšiu armádu kontinentu. Do výzbroje naleje 355 miliárd eur
- Má dojazd 2 245 km a neskutočnú spotrebu. Automobilka pôsobiaca aj na Slovensku predstavila zázračný hybrid
- Vozidlo ti vyradia z evidencie. Štát našiel spôsob, ako skoncovať so zlozvykom motoristov na Slovensku
Nemalá strata: Ukrajinské vojenské letectvo prišlo o ďalší z cenných lietajúcich strojov
Európska mocnosť sa obáva AI. Tretina verí, že im zoberie prácu v blízkej budúcnosti
Maličký ostrovný štát má problém, ktorý sa nedá zastaviť. Sopku zachvátili 30-metrové gejzíry lávy
Japonci prišli s prelomovým objavom: Budúcnosť ľudí s Downovým syndrómom sa dá zvrátiť
Ministerstvo investícií spúšťa novú výzvu pre digitalizáciu. Uchádzači si môžu siahnuť až na 2,2 milióna eur
NAJČÍTANEJŠIE ZO STARTITUP