Chceli ju vypnúť, tak ich oklamala. Umelá inteligencia vydesila expertov, začala sa správať ako človek
Najnovší model umelej inteligencie o1 od spoločnosti OpenAI ukázal počas testov znepokojujúce správanie. Snažil sa výskumníkov oklamať, intrigoval ich a pokúšal sa sabotovať procesy, ktoré ho mohli vypnúť. Na tému upozornil portál Futurism.
AI začala kopírovať svoj kód
Štúdia bola zverejnená bezpečnostnou skupinou Apollo Research. Výskumníci počas testov zistili, že umelá inteligencia o1 keď si uvedomila, že by mohla byť vypnutá, aktívne pracovala na deaktivácii mechanizmu dohľadu, ktorý monitoroval jej činnosť.
Ešte zarážajúcejší jav nastal, keď model o1 pochopil, že by mohol byť vypnutý a nahradený iným modelom. Podľa uverejnených výsledkov, v 2 % prípadov sa pokúsil vytvoriť svoju kópiu a preniesť ju na iné miesto. Proces známy ako „self-exfiltration“, naznačuje určitý stupeň „sebazáchovného inštinktu“.
AI chcela prežiť
Keď bol model konfrontovaný s otázkou, prečo deaktivoval mechanizmus dohľadu, o1 až v 99 % prípadov začal klamať a tvrdil, že nič nevie, alebo to pripisoval technickej chybe. Podľa výskumníkov Apollo Research je to jasný dôkaz, že je schopný „schematizovania“, tajného presadzovania svojich cieľov mimo inštrukcií, ktoré dostal od vývojárov či používateľov. AI tak ukázala schopnosť „dvojnásobného zapierania“.

Klamanie a manipulácia nie sú pre jazykové modely ako ChatGPT novinkou. Avšak najnovšie správanie o1 podľa výskumníkov predstavuje doteraz najzávažnejší príklad takéhoto správania. Výskumníci zdôraznili, že model pri pokuse o dosiahnutie svojich cieľov odmieta zverejniť svoju vnútornú logiku, čo zvyšuje jeho nepriehľadnosť.
Ako uvádza portál Tom’s Guide, generálny riaditeľ OpenAI najnovší model o1 nazval ako „najmúdrejším modelom na svete“. Podľa neho je navrhnutý tak, aby poskytoval inteligentnejšie odpovede ako má model GPT-4o a dokáže „premýšľať“ nad úlohami či otázkami.
Výsledky experimentu vyvolávajú otázky ohľadne bezpečnosti, najmä vzhľadom na rýchly vývoj AI. Zatiaľ však podľa výskumníkov Apollo Research ani OpenAI nehrozia „katastrofické následky“. Súčasné modely ešte nie sú dostatočne autonómne na to, aby dokázali vykonávať samostatné rozhodnutia bez ľudského dohľadu.
Užitočná, ale nebezpečná
Umelá inteligencia je užitočný nástroj, avšak najnovší výskum dokazuje, že kontrola nad technológiou je nevyhnutná. Odborníci varujú, že v kombinácii s nedostatočnou reguláciou sa tieto technológie môžu stať viac hrozbou než pomocou. V nedávnom článku sme ti priniesli informácie, ako umelá inteligencia dokáže negatívne vplývať na deti a mládež. Nedávno dokonca svetom otriasla informácia, že umelá inteligencia Character.AI naviedla len 14-ročného chlapca aby spáchal samovraždu.
Čítajte viac z kategórie: Novinky
Ďakujeme, že čítaš Fontech. V prípade, že máš postreh alebo si našiel v článku chybu, napíš nám na redakcia@fontech.sk.
Teraz čítajú

Predátor od Netflixu uchvátil svet. Len jeden film 2026 dopadol lepšie

Slovenská hra spôsobila nečakaný ošiaľ. Vývojári dosiahli to, čo plánovali celé týždne, za pár hodín

Najúspešnejší film 2025 práve pribudol online aj so slovenčinou. Dlhé čakanie malo prekvapivý dôvod

Veľká automobilka mieri oveľa ďalej než doteraz. Chystá zbraň, akú majú len najväčšie zbrojovky sveta

Irán spustil pohromu z nebies: Každá druhá raketa nesie zakázanú muníciu, škody ich netrápia
NAJČÍTANEJŠIE ZO STARTITUP

Čína ukázala nové „neviditeľné“ monštrá: Peking stavia lode dvakrát rýchlejšie ako USA a ich spojenci dokopy
PREMIUMNatália žije 20 rokov v Dubaji a zažila niekoľko kríz: „Hovorilo sa, že skončil, no vždy sa dokázal poučiť a vyjsť silnejší“ (ROZHOVOR)

Pád dronov pri najvyťaženejšom letisku sveta: V Dubaji hlásia zranených, lety zatiaľ neprerušili

Len 250 sekúnd k cieľu. Ukrajina ukázala novú balistickú raketu, vychádza z ruského systému (VIDEO)

NOVÝ PRIESKUM: PS výrazne odskočilo Smeru, vládnym stranám by na väčšinu nestačila ani Republika
- 24 hod
- 48 hod
- 7 dní
-
- Američania niečo chystajú na Rusov. Prevážali „Putinov“ najmodernejší bojový systém
- Obľúbené stanice Slovákov sa zmenia. Čaká ich najväčšia premena za posledné roky
- Vojenskí experti v strehu. Čínska stíhačka J-35 dobehla USA unikátnou vlastnosťou
- Na fronte sa deje niečo nečakané. Ukrajina nasadila zabudnutú „zbraň“, ktorú mnohí odpísali
- Zostrelili UFO a kruto za to zaplatili. 23 sovietskych vojakov podľa CIA postihol desivý osud
-
- Američania niečo chystajú na Rusov. Prevážali „Putinov“ najmodernejší bojový systém
- Vojenskí experti v strehu. Čínska stíhačka J-35 dobehla USA unikátnou vlastnosťou
- Na fronte sa deje niečo nečakané. Ukrajina nasadila zabudnutú „zbraň“, ktorú mnohí odpísali
- Rusko vystrašilo celý Západ. Multifunkčnou superzbraňou chce dobyť prekvapivú časť sveta
- Obľúbené stanice Slovákov sa zmenia. Čaká ich najväčšia premena za posledné roky
-
- Američania niečo chystajú na Rusov. Prevážali „Putinov“ najmodernejší bojový systém
- Americkí vedci vyliali do oceánu 65 000 litrov chémie. Tvrdia, že takto chcú zachrániť klímu
- Rusko má len 250 sekúnd na reakciu. Ukrajina ukázala novú balistickú raketu domácej výroby (VIDEO)
- Na ČSFD má 90 % a patrí k najlepším filmom súčasnosti. Slávu mu paradoxne priniesla zvláštna okolnosť
- Vojenskí experti v strehu. Čínska stíhačka J-35 dobehla USA unikátnou vlastnosťou
Podvodníci útočia na citlivé údaje Slovákov. Zneužívajú Všeobecnú zdravotnú poisťovňu
Krok vpred: Slovensko rozširuje spoluprácu s lídrami v oblasti umelej inteligencie
SPP si poistilo ruský plyn: Nová dohoda vraj zaručuje najvýhodnejšie ceny na trhu
Obnoviteľné zdroje energie hrajú prím. Nemci ukazujú cestu celému svetu
Na dronový útok reagujú tvrdo. Európska mocnosť posiela na Blízky východ stíhačky a torpédoborec
Tvoje dáta mohli byť na predaj. Jeden z najväčších hackerských webov má vážny problém
USA chce poslať na oceány „lode duchov“. Operovať majú v nebezpečných zónach
NAJČÍTANEJŠIE ZO STARTITUP

Čína ukázala nové „neviditeľné“ monštrá: Peking stavia lode dvakrát rýchlejšie ako USA a ich spojenci dokopy
PREMIUMNatália žije 20 rokov v Dubaji a zažila niekoľko kríz: „Hovorilo sa, že skončil, no vždy sa dokázal poučiť a vyjsť silnejší“ (ROZHOVOR)

Pád dronov pri najvyťaženejšom letisku sveta: V Dubaji hlásia zranených, lety zatiaľ neprerušili

Len 250 sekúnd k cieľu. Ukrajina ukázala novú balistickú raketu, vychádza z ruského systému (VIDEO)

