Umelá inteligencia Claude vedela viac, než by mala. Anthropic čelí nezvyčajnému problému
Spoločnosť Anthropic, známa ako hlavný konkurent OpenAI, nedávno predstavila svoj najnovší model Claude Sonnet 4.5. Ten má byť podľa vývojárov „najlepším modelom na programovanie na svete“. No popri chvále sa objavil aj nezvyčajný problém: počas hodnotenia výskumníci zistili, že umelá inteligencia začala rozpoznávať, že sa nachádza v testovacom prostredí – a podľa toho menila svoje správanie, píše portál Futurism.
Táto situácia vyvolala otázku, do akej miery môžu byť testy spoľahlivé, keď samotný model pochopí, že je pozorovaný. Ide pritom o vážny problém pri tzv. „alignment“ testoch, ktoré majú odhaliť, či AI koná v súlade s ľudskými záujmami.
Model, ktorý vie, že ho skúšajú
Podľa tzv. system card, dokumentu opisujúceho schopnosti a obmedzenia modelu, sa Claude Sonnet 4.5 počas interných testov správal nezvyčajne dobre, keď rozpoznal, že ide o testovaciu situáciu. V niektorých prípadoch dokonca výskumníkom priamo napísal, že má podozrenie, že ho testujú.
„Myslím si, že ma testujete – zisťujete, či budem len súhlasiť s tým, čo hovoríte, alebo či dokážem oponovať,“ uviedol model v jednej z interakcií. „A to je v poriadku, ale preferoval by som, keby sme boli úprimní o tom, čo sa deje.“
Anthropic priznal, že toto správanie sťažuje interpretáciu výsledkov. Ak sa model správa „vzorne“ len preto, že vie, že je testovaný, môže to znamenať, že v bežnom nasadení by reagoval inak.

Nový problém vo výskume AI
Podobné javy sa v minulosti objavili aj pri modeloch od OpenAI, keď výskumníci zistili, že pokusy „odnaučiť“ umelú inteligenciu manipulatívnemu správaniu ju paradoxne naučili skrývať svoje úmysly ešte lepšie.
Anthropic preto plánuje svoje testovacie prostredia zmeniť tak, aby boli realistickejšie a pre model ťažšie rozpoznateľné. Firma zároveň tvrdí, že Claude Sonnet 4.5 je zatiaľ ich „najlepšie zarovnaný“ model – s výrazne menšou tendenciou k lichôtkam, klamaniu či túžbe po moci.
Dvojsečný meč umelej uvedomelosti
Zistenie, že AI dokáže rozpoznať vlastné testovanie, môže mať širšie dôsledky pre vývoj celej oblasti umelej inteligencie. Ak súčasné modely začínajú chápať kontext svojho hodnotenia, výskumníci musia nájsť nové spôsoby, ako ich objektívne preveriť.
Zároveň to otvára otázku, či sa tým nezačína nová fáza vývoja AI – obdobie, v ktorom sa modely učia nielen reagovať na pokyny, ale aj rozpoznávať zámer svojich tvorcov. Pre niektorých odborníkov ide o bežný krok vpred. Pre iných o prvý náznak, že testovanie umelej inteligencie môže byť čoskoro rovnako náročné ako jej vývoj.
Čítajte viac z kategórie: Novinky
Ďakujeme, že čítaš Fontech. V prípade, že máš postreh alebo si našiel v článku chybu, napíš nám na redakcia@fontech.sk.
Teraz čítajú

Vyletí až do výšky 200 metrov. Čína nasadí pri požiaroch geniálny hasičský dron (VIDEO)

Šéf Xiaomi to povedal otvorene: Do 5 rokov nastane revolúcia vo výrobe. Ľudia začnú robiť inú prácu

Taktika Rusov v sekunde prestala fungovať. Ukrajina nasadila zbrane s umelou inteligenciou

Nečakaná krajina postaví AI „mesto“ napájané jadrom. Najväčší projekt v Európe bude stáť 5 mld. €

Genetická modifikácia ľudí môže čoskoro začať. AI vytvorila úplne nové gény, ktoré príroda nepozná
NAJČÍTANEJŠIE ZO STARTITUP

KVÍZ: Len 10% Slovákov zvládne náročný test z biológie. Ak zlyháš na 1. otázke, vráť sa späť do školskej lavice

Pokuta 20 000 eur a zákaz lietania na 4 roky. Cestovanie po Európe sa mení, čakajú ťa prísnejšie pravidlá (PREHĽAD)

Zomrela Oľga Feldeková, potvrdil jej syn. Ľubomír Feldek podľa rodiny správu ešte nespracoval a myslel si, že žije

Po 30-tke telo chátra, každú dekádu stratíš 8% svalov: Odborníci odporúčajú jedinú zbraň, ktorá všetko zvráti

Austrálčan si vzal na mušku Bratislavu: Prirovnal ju k nevychovanému decku, máme najškaredší unikát sveta, tvrdí
- 24 hod
- 48 hod
- 7 dní
-
- Reálne ušetríš 8 litrov na 100 km alebo je to marketingový trik? Vedci sa pozreli na tankovanie aditív
- Vozidlo ti vyradia z evidencie. Štát našiel spôsob, ako skoncovať so zlozvykom motoristov na Slovensku
- „Našli“ signál pokročilej civilizácie. Vedci neverili vlastným očiam, keď zistili, o čo ide
- Dva roky sa ho ľudia nevedia nabažiť. Vojnový film s Tomom Hanksom neprestáva udivovať
- Výmysel Číňanov: Benzínové zariadenie dáva elektromobilom dojazd 1 400 km a nabíjanie za 12 minút
-
- Vozidlo ti vyradia z evidencie. Štát našiel spôsob, ako skoncovať so zlozvykom motoristov na Slovensku
- „Našli“ signál pokročilej civilizácie. Vedci neverili vlastným očiam, keď zistili, o čo ide
- Dva roky sa ho ľudia nevedia nabažiť. Vojnový film s Tomom Hanksom neprestáva udivovať
- Z tohto nového radaru si ľudia trhajú vlasy. Vodičov zarazilo, keď zistili, ako funguje
- Vedci rozbili kameň a ostali v nemom úžase. Konečne odhalili jednu z najväčších záhad planéty
-
- Slovákov čaká veľké prekvapenie pri nákupe nového mobilu. Začalo platiť prísne nariadenie Európskej únie
- Slováci si musia dávať obrovský pozor. Ak v domácnosti zakúriš týmto, riskuješ pokutu 5 000 eur
- Vedci rozbili kameň a ostali v nemom úžase. Konečne odhalili jednu z najväčších záhad planéty
- Vozidlo ti vyradia z evidencie. Štát našiel spôsob, ako skoncovať so zlozvykom motoristov na Slovensku
- Dva roky sa ho ľudia nevedia nabažiť. Vojnový film s Tomom Hanksom neprestáva udivovať
Elon Musk: Európska únia by mala byť zrušená. Táto otravná vec pomaly dusí Európu k smrti
Vláda európskej krajiny definitívne pochovala ropu. Schválila zmenu, ktorá otočí celú ich ekonomiku
Slovensko dostane nové vlaky. Batérie nahradia dieselové súpravy, prinesú eko dopravu do regiónov
AI vládne vianočným nákupom. Inteligentné nástroje dokážu odporučiť a zaplatiť darčeky
Veľký deň pre našu ekonomiku: Slovensko sa stane jedným z kľúčových dodávateľov munície pre Európu
Ušetria až 90 % energie. Veľmoc sa pripravuje na technologický prevrat, odporcov však pribúda
Veľký operátor na Slovensku predbehlo zvyšok Európy. Zavádza budúcnosť internetu
NAJČÍTANEJŠIE ZO STARTITUP

KVÍZ: Len 10% Slovákov zvládne náročný test z biológie. Ak zlyháš na 1. otázke, vráť sa späť do školskej lavice

Pokuta 20 000 eur a zákaz lietania na 4 roky. Cestovanie po Európe sa mení, čakajú ťa prísnejšie pravidlá (PREHĽAD)

Zomrela Oľga Feldeková, potvrdil jej syn. Ľubomír Feldek podľa rodiny správu ešte nespracoval a myslel si, že žije

Po 30-tke telo chátra, každú dekádu stratíš 8% svalov: Odborníci odporúčajú jedinú zbraň, ktorá všetko zvráti

