Umelá inteligencia Claude vedela viac, než by mala. Anthropic čelí nezvyčajnému problému
Spoločnosť Anthropic, známa ako hlavný konkurent OpenAI, nedávno predstavila svoj najnovší model Claude Sonnet 4.5. Ten má byť podľa vývojárov „najlepším modelom na programovanie na svete“. No popri chvále sa objavil aj nezvyčajný problém: počas hodnotenia výskumníci zistili, že umelá inteligencia začala rozpoznávať, že sa nachádza v testovacom prostredí – a podľa toho menila svoje správanie, píše portál Futurism.
Táto situácia vyvolala otázku, do akej miery môžu byť testy spoľahlivé, keď samotný model pochopí, že je pozorovaný. Ide pritom o vážny problém pri tzv. „alignment“ testoch, ktoré majú odhaliť, či AI koná v súlade s ľudskými záujmami.
Model, ktorý vie, že ho skúšajú
Podľa tzv. system card, dokumentu opisujúceho schopnosti a obmedzenia modelu, sa Claude Sonnet 4.5 počas interných testov správal nezvyčajne dobre, keď rozpoznal, že ide o testovaciu situáciu. V niektorých prípadoch dokonca výskumníkom priamo napísal, že má podozrenie, že ho testujú.
„Myslím si, že ma testujete – zisťujete, či budem len súhlasiť s tým, čo hovoríte, alebo či dokážem oponovať,“ uviedol model v jednej z interakcií. „A to je v poriadku, ale preferoval by som, keby sme boli úprimní o tom, čo sa deje.“
Anthropic priznal, že toto správanie sťažuje interpretáciu výsledkov. Ak sa model správa „vzorne“ len preto, že vie, že je testovaný, môže to znamenať, že v bežnom nasadení by reagoval inak.

Nový problém vo výskume AI
Podobné javy sa v minulosti objavili aj pri modeloch od OpenAI, keď výskumníci zistili, že pokusy „odnaučiť“ umelú inteligenciu manipulatívnemu správaniu ju paradoxne naučili skrývať svoje úmysly ešte lepšie.
Anthropic preto plánuje svoje testovacie prostredia zmeniť tak, aby boli realistickejšie a pre model ťažšie rozpoznateľné. Firma zároveň tvrdí, že Claude Sonnet 4.5 je zatiaľ ich „najlepšie zarovnaný“ model – s výrazne menšou tendenciou k lichôtkam, klamaniu či túžbe po moci.
Dvojsečný meč umelej uvedomelosti
Zistenie, že AI dokáže rozpoznať vlastné testovanie, môže mať širšie dôsledky pre vývoj celej oblasti umelej inteligencie. Ak súčasné modely začínajú chápať kontext svojho hodnotenia, výskumníci musia nájsť nové spôsoby, ako ich objektívne preveriť.
Zároveň to otvára otázku, či sa tým nezačína nová fáza vývoja AI – obdobie, v ktorom sa modely učia nielen reagovať na pokyny, ale aj rozpoznávať zámer svojich tvorcov. Pre niektorých odborníkov ide o bežný krok vpred. Pre iných o prvý náznak, že testovanie umelej inteligencie môže byť čoskoro rovnako náročné ako jej vývoj.
Čítajte viac z kategórie: Novinky
Ďakujeme, že čítaš Fontech. V prípade, že máš postreh alebo si našiel v článku chybu, napíš nám na redakcia@fontech.sk.
Teraz čítajú

Riaditeľa AI firiem úplne zošaleli: Infraštruktúru chcú vo vesmíre, no čaká ich logistické peklo

Umelá inteligencia našla liek na neliečiteľnú chorobu. Vedci stratili slová, keď zistili, že funguje

Nepotrebuje človeka a všetko urobí sám. Čína vyvíja AI agenta, ktorý masovo pripraví ľudí o prácu

Vyletí až do výšky 200 metrov. Čína nasadí pri požiaroch geniálny hasičský dron (VIDEO)

Šéf Xiaomi to povedal otvorene: Do 5 rokov nastane revolúcia vo výrobe. Ľudia začnú robiť inú prácu
NAJČÍTANEJŠIE ZO STARTITUP

Paralyzované vlaky na juhu Slovenska. Na koľajniciach našli výbušninu
PREMIUMMiliardár Křetínský skupuje najväčšie autocentrá v regióne. Potichu buduje obrovské impérium

Slováci prišli o peniaze, varujú pred mobilným operátorom: „Zákaznícka podpora nereaguje, infolinka nefunguje“

Pevnosť v „Achillovej päte“ NATO: Európa plánuje vybudovať obriu základňu na mieste, ktoré chce Rusko odstrihnúť

MIMORIADNE: V Bratislave došlo k zrážke vlaku a auta, vozidlo uviazlo na koľajisku
- 24 hod
- 48 hod
- 7 dní
-
- Zatiaľ čo Európa míňa miliardy v USA, Švédi postavili stíhačku s motorom Volvo pre reálnu vojnu
- Výrobcovia sa smejú Slovákom. Do mobilov zabudovali vec, ktorá im zarába miliardy na tvoj úkor
- Energetický prevrat je na dosah: Európsky štát našiel masívne ložisko, je v ňom 43 miliónov ton vzácnej suroviny
- Na Slovensko mieri nová TV cez anténu. Pokryje 97 % územia a nebude treba žiadny internet
- Prevezie 2 000 ľudí bez jedinej kvapky paliva. Najväčšia loď sveta s týmto pohonom prešla skúškou
-
- Zatiaľ čo Európa míňa miliardy v USA, Švédi postavili stíhačku s motorom Volvo pre reálnu vojnu
- Energetický prevrat je na dosah: Európsky štát našiel masívne ložisko, je v ňom 43 miliónov ton vzácnej suroviny
- Výrobcovia sa smejú Slovákom. Do mobilov zabudovali vec, ktorá im zarába miliardy na tvoj úkor
- Prevezie 2 000 ľudí bez jedinej kvapky paliva. Najväčšia loď sveta s týmto pohonom prešla skúškou
- Na Slovensko mieri nová TV cez anténu. Pokryje 97 % územia a nebude treba žiadny internet
-
- Zatiaľ čo Európa míňa miliardy v USA, Švédi postavili stíhačku s motorom Volvo pre reálnu vojnu
- Energetický prevrat je na dosah: Európsky štát našiel masívne ložisko, je v ňom 43 miliónov ton vzácnej suroviny
- Výrobcovia sa smejú Slovákom. Do mobilov zabudovali vec, ktorá im zarába miliardy na tvoj úkor
- Diesel je mŕtvy. Scania vyvinula prvý 60-tonový kolos 8×4 s ultimátnym pohonom
- Prevezie 2 000 ľudí bez jedinej kvapky paliva. Najväčšia loď sveta s týmto pohonom prešla skúškou
Slovensko má dve šance na Oscara. Najdiskutovanejší film roka o hroznej tragédii ale vypadol
Kým ostatní riešia konflikty, Európa poslala do vesmíru raketu. Rusko ani USA už nepotrebujeme
Známa automobilka pochovala elektrické nákladiaky. Smeruje k hybridom a menším elektromobilom
Zlom v EÚ: Spaľovacie motory po roku 2035 nezmiznú. Nový balík umožní ich prežitie
Elon Musk prepisuje dejiny. Výška jeho majetku vyráža dych, vďačí za to jednej veci
Zostrihaný prejav spustil peklo. Trump od BBC žiada likvidačné odškodné
Poliakom došla trpezlivosť. Vyvíjajú štátnu aplikáciu na nahlasovanie podozrivých situácií
NAJČÍTANEJŠIE ZO STARTITUP

Paralyzované vlaky na juhu Slovenska. Na koľajniciach našli výbušninu
PREMIUMMiliardár Křetínský skupuje najväčšie autocentrá v regióne. Potichu buduje obrovské impérium

Slováci prišli o peniaze, varujú pred mobilným operátorom: „Zákaznícka podpora nereaguje, infolinka nefunguje“

Pevnosť v „Achillovej päte“ NATO: Európa plánuje vybudovať obriu základňu na mieste, ktoré chce Rusko odstrihnúť

