Umelá inteligencia Claude vedela viac, než by mala. Anthropic čelí nezvyčajnému problému
Spoločnosť Anthropic, známa ako hlavný konkurent OpenAI, nedávno predstavila svoj najnovší model Claude Sonnet 4.5. Ten má byť podľa vývojárov „najlepším modelom na programovanie na svete“. No popri chvále sa objavil aj nezvyčajný problém: počas hodnotenia výskumníci zistili, že umelá inteligencia začala rozpoznávať, že sa nachádza v testovacom prostredí – a podľa toho menila svoje správanie, píše portál Futurism.
Táto situácia vyvolala otázku, do akej miery môžu byť testy spoľahlivé, keď samotný model pochopí, že je pozorovaný. Ide pritom o vážny problém pri tzv. „alignment“ testoch, ktoré majú odhaliť, či AI koná v súlade s ľudskými záujmami.
Model, ktorý vie, že ho skúšajú
Podľa tzv. system card, dokumentu opisujúceho schopnosti a obmedzenia modelu, sa Claude Sonnet 4.5 počas interných testov správal nezvyčajne dobre, keď rozpoznal, že ide o testovaciu situáciu. V niektorých prípadoch dokonca výskumníkom priamo napísal, že má podozrenie, že ho testujú.
„Myslím si, že ma testujete – zisťujete, či budem len súhlasiť s tým, čo hovoríte, alebo či dokážem oponovať,“ uviedol model v jednej z interakcií. „A to je v poriadku, ale preferoval by som, keby sme boli úprimní o tom, čo sa deje.“
Anthropic priznal, že toto správanie sťažuje interpretáciu výsledkov. Ak sa model správa „vzorne“ len preto, že vie, že je testovaný, môže to znamenať, že v bežnom nasadení by reagoval inak.

Nový problém vo výskume AI
Podobné javy sa v minulosti objavili aj pri modeloch od OpenAI, keď výskumníci zistili, že pokusy „odnaučiť“ umelú inteligenciu manipulatívnemu správaniu ju paradoxne naučili skrývať svoje úmysly ešte lepšie.
Anthropic preto plánuje svoje testovacie prostredia zmeniť tak, aby boli realistickejšie a pre model ťažšie rozpoznateľné. Firma zároveň tvrdí, že Claude Sonnet 4.5 je zatiaľ ich „najlepšie zarovnaný“ model – s výrazne menšou tendenciou k lichôtkam, klamaniu či túžbe po moci.
Dvojsečný meč umelej uvedomelosti
Zistenie, že AI dokáže rozpoznať vlastné testovanie, môže mať širšie dôsledky pre vývoj celej oblasti umelej inteligencie. Ak súčasné modely začínajú chápať kontext svojho hodnotenia, výskumníci musia nájsť nové spôsoby, ako ich objektívne preveriť.
Zároveň to otvára otázku, či sa tým nezačína nová fáza vývoja AI – obdobie, v ktorom sa modely učia nielen reagovať na pokyny, ale aj rozpoznávať zámer svojich tvorcov. Pre niektorých odborníkov ide o bežný krok vpred. Pre iných o prvý náznak, že testovanie umelej inteligencie môže byť čoskoro rovnako náročné ako jej vývoj.
Čítajte viac z kategórie: Novinky
Ďakujeme, že čítaš Fontech. V prípade, že máš postreh alebo si našiel v článku chybu, napíš nám na redakcia@fontech.sk.
Teraz čítajú

ChatGPT čaká veľká zmena. OpenAI chce z chatbota vytvoriť „super-aplikáciu“

Vedci odhalili, ktoré zamestnania nahradí AI ako prvé. Je tvoje v bezpečí?

Krstný otec umelej inteligencie varuje svet pred pohromou. Ľudia doplatia na jednu vec

Chceme suverenitu, ale... Američania tlačia Európu, aby s nimi bojovala vo vojne proti Číne

AI môže zjesť energiu celého mesta. Slovensko nehovorí o probléme, ktorý sa nám vie kruto vypomstiť
NAJČÍTANEJŠIE ZO STARTITUP

MIMORIADNE: Útok sekerou v centre Bratislavy. Muž mal prísť pred pizzeriu, „zákazníci boli veľmi blízko“

Súd s poslancom Hlasu nabral raketové tempo. Čurillovci a Kubina poznajú dátum verdiktu, Bartek na súd neprišiel

Chorvátsko či Cyprus dostali tvrdú facku. Najlepšia pláž Európy 2026 je lacný raj, kam Slováci doletia priamo z Bratislavy

Kým v júli zažijú tisíce Slovákov finančné hody, v septembri príde tvrdá rana. Nový zákon zrušil istotu voľna

Slováci žijú s vysokým cholesterolom, mnohí o tom vôbec netušia. Lekárka radí, ako ho znížiť bez liekov
- 24 hod
- 48 hod
- 7 dní
-
- Netflix vyhráva. Toto je TOP 11 najlepších seriálov tohto roka a kde ich nájdeš online
- Elektromobil si kúpiš za 30 000 eur, no doma ťa čaká nepríjemnosť. Predajcovia o nej mlčia
- Nový film Nolana spôsobil ošiaľ. Najväčším hitom leta však môže byť niekto úplne iný
- Spotrebu stlačil na 2,22 litra. Hybrid za 12-tisíc eur pokoril svetový rekord a zosadil Prius
- Moderná elektronika vydrží menej ako kedysi. Nie je to konšpirácia a má to jasný dôvod
-
- Netflix vyhráva. Toto je TOP 11 najlepších seriálov tohto roka a kde ich nájdeš online
- Elektromobil si kúpiš za 30 000 eur, no doma ťa čaká nepríjemnosť. Predajcovia o nej mlčia
- Nový film Nolana spôsobil ošiaľ. Najväčším hitom leta však môže byť niekto úplne iný
- Spotrebu stlačil na 2,22 litra. Hybrid za 12-tisíc eur pokoril svetový rekord a zosadil Prius
- Moderná elektronika vydrží menej ako kedysi. Nie je to konšpirácia a má to jasný dôvod
-
- Automobilky oklamali svet a budú platiť. Obľúbený pohon zlyhal na celej čiare, produkuje veľké emisie
- Moderná elektronika vydrží menej ako kedysi. Nie je to konšpirácia a má to jasný dôvod
- Toto nemalo ísť takto ľahko. Číňania „rozobrali“ bombardér B-21 a odhalili jeho tajomstvo
- Spotrebu stlačil na 2,22 litra. Hybrid za 12-tisíc eur pokoril svetový rekord a zosadil Prius
- Vesmírny úkaz, aký zažiješ raz za život. V roku 2026 uvidíme najčarovnejšie zatmenie Slnka
Známa slovenská tvár mieri na streamovaciu službu. Táto platforma ukáže jeho kontroverznú výpravu
Intel pokračuje v návrate medzi elitu veľkolepým plánom. Pomôcť mu má partnerstvo s Applom
Volkswagen pokračuje v masívnom prepúšťaní. Do roku 2030 to schytá až 50 000 ľudí
BMW naznačuje veľké škrty. Automobilka pripravuje ďalšie opatrenia
Zemný plyn odpísalo ďalšie slovenské mesto. Teplo pre tisíce domácností získa oveľa lepším spôsobom
Najväčšia biometánová stanica na Slovensku premieňa odpad na plyn pre domácnosti
Hackeri môžu ochromiť aj dopravu. Slovensko sprísňuje ochranu kritických systémov
NAJČÍTANEJŠIE ZO STARTITUP

MIMORIADNE: Útok sekerou v centre Bratislavy. Muž mal prísť pred pizzeriu, „zákazníci boli veľmi blízko“

Súd s poslancom Hlasu nabral raketové tempo. Čurillovci a Kubina poznajú dátum verdiktu, Bartek na súd neprišiel

Chorvátsko či Cyprus dostali tvrdú facku. Najlepšia pláž Európy 2026 je lacný raj, kam Slováci doletia priamo z Bratislavy

Kým v júli zažijú tisíce Slovákov finančné hody, v septembri príde tvrdá rana. Nový zákon zrušil istotu voľna

