Anthropic/Wikimedia (úprava redakcie)

Spoločnosť Anthropic, známa ako hlavný konkurent OpenAI, nedávno predstavila svoj najnovší model Claude Sonnet 4.5. Ten má byť podľa vývojárov „najlepším modelom na programovanie na svete“. No popri chvále sa objavil aj nezvyčajný problém: počas hodnotenia výskumníci zistili, že umelá inteligencia začala rozpoznávať, že sa nachádza v testovacom prostredí – a podľa toho menila svoje správanie, píše portál Futurism.

Dostaň Fontech do svojich Google odporúčaní

Pridať ako preferovaný zdroj Fontech, odkaz sa otvorí v novom okne

Táto situácia vyvolala otázku, do akej miery môžu byť testy spoľahlivé, keď samotný model pochopí, že je pozorovaný. Ide pritom o vážny problém pri tzv. „alignment“ testoch, ktoré majú odhaliť, či AI koná v súlade s ľudskými záujmami.

Model, ktorý vie, že ho skúšajú

Podľa tzv. system card, dokumentu opisujúceho schopnosti a obmedzenia modelu, sa Claude Sonnet 4.5 počas interných testov správal nezvyčajne dobre, keď rozpoznal, že ide o testovaciu situáciu. V niektorých prípadoch dokonca výskumníkom priamo napísal, že má podozrenie, že ho testujú.

„Myslím si, že ma testujete – zisťujete, či budem len súhlasiť s tým, čo hovoríte, alebo či dokážem oponovať,“ uviedol model v jednej z interakcií. „A to je v poriadku, ale preferoval by som, keby sme boli úprimní o tom, čo sa deje.“

Anthropic priznal, že toto správanie sťažuje interpretáciu výsledkov. Ak sa model správa „vzorne“ len preto, že vie, že je testovaný, môže to znamenať, že v bežnom nasadení by reagoval inak.

Wikimedia

Nový problém vo výskume AI

Podobné javy sa v minulosti objavili aj pri modeloch od OpenAI, keď výskumníci zistili, že pokusy „odnaučiť“ umelú inteligenciu manipulatívnemu správaniu ju paradoxne naučili skrývať svoje úmysly ešte lepšie.

Anthropic preto plánuje svoje testovacie prostredia zmeniť tak, aby boli realistickejšie a pre model ťažšie rozpoznateľné. Firma zároveň tvrdí, že Claude Sonnet 4.5 je zatiaľ ich „najlepšie zarovnaný“ model – s výrazne menšou tendenciou k lichôtkam, klamaniu či túžbe po moci.

Dvojsečný meč umelej uvedomelosti

Zistenie, že AI dokáže rozpoznať vlastné testovanie, môže mať širšie dôsledky pre vývoj celej oblasti umelej inteligencie. Ak súčasné modely začínajú chápať kontext svojho hodnotenia, výskumníci musia nájsť nové spôsoby, ako ich objektívne preveriť.

Zároveň to otvára otázku, či sa tým nezačína nová fáza vývoja AI – obdobie, v ktorom sa modely učia nielen reagovať na pokyny, ale aj rozpoznávať zámer svojich tvorcov. Pre niektorých odborníkov ide o bežný krok vpred. Pre iných o prvý náznak, že testovanie umelej inteligencie môže byť čoskoro rovnako náročné ako jej vývoj.

Dostaň Fontech do svojich Google odporúčaní

Pridať ako preferovaný zdroj Fontech, odkaz sa otvorí v novom okne

Čítajte viac z kategórie: Novinky

Teraz čítajú

Internet sa otriasa v základoch. EÚ zaviedla historické pravidlá pre AI, hrozia miliónové pokuty

OpenAI chce poslať klávesnice do minulosti. Prvé tajomné zariadenia majú prísť čoskoro

Šéf OpenAI: Umelá inteligencia neskráti ľuďom pracovný týždeň na 4 dni. Toto je dôvod

Budeme žiť večne? Vedci vypočítali maximálny vek človeka a zistili niečo, čo mnohí nechcú počuť

AMD už nechce byť lacnejšou alternatívou k Nvidii. S AI gigantom podpísalo životnú dohodu

NAJČÍTANEJŠIE ZO STARTITUP

Dunaj uzavreli. Pokles hladiny odhalil masívnu muníciu z 2. svetovej vojny (VIDEO)

Nové destinácie vytláčajú Chorvátsko, Taliansko či Grécko. TOP 3 európske krajiny, ktoré sú hitom leta 2026

Na Slovensku chýba 74 264 „pracantov“. V týchto profesiách sa o teba šéfovia pobijú (REBRÍČEK)

Slovenský šport zasiahla smutná správa. Vo veku 82 rokov zomrel historicky prvý člen Siene slávy

Obľúbenú destináciu Slovákov zasiahlo zemetrasenie. Úrady spustili krízový režim (VIDEO)

Umelá inteligencia Claude vedela viac, než by mala. Anthropic čelí nezvyčajnému problému

Model, ktorý vie, že ho skúšajú

Nový problém vo výskume AI

Dvojsečný meč umelej uvedomelosti

Internet sa otriasa v základoch. EÚ zaviedla historické pravidlá pre AI, hrozia miliónové pokuty

OpenAI chce poslať klávesnice do minulosti. Prvé tajomné zariadenia majú prísť čoskoro

Šéf OpenAI: Umelá inteligencia neskráti ľuďom pracovný týždeň na 4 dni. Toto je dôvod

Budeme žiť večne? Vedci vypočítali maximálny vek človeka a zistili niečo, čo mnohí nechcú počuť

AMD už nechce byť lacnejšou alternatívou k Nvidii. S AI gigantom podpísalo životnú dohodu

Dunaj uzavreli. Pokles hladiny odhalil masívnu muníciu z 2. svetovej vojny (VIDEO)

Nové destinácie vytláčajú Chorvátsko, Taliansko či Grécko. TOP 3 európske krajiny, ktoré sú hitom leta 2026

Na Slovensku chýba 74 264 „pracantov“. V týchto profesiách sa o teba šéfovia pobijú (REBRÍČEK)

Slovenský šport zasiahla smutná správa. Vo veku 82 rokov zomrel historicky prvý člen Siene slávy

Obľúbenú destináciu Slovákov zasiahlo zemetrasenie. Úrady spustili krízový režim (VIDEO)

Ojazdené autá na Slovensku citeľne zdraželi. Priemerná cena stúpla, mení sa aj ponuka

Umelá inteligencia produkuje sofistikovaný podvod. Odborníci varujú pred novou vlnou

Zelená domácnostiam pokračuje, no podmienky stále chýbajú. SIEA prezradila, čo sa zmení

Extrémne sucho zasahuje už 38 % Slovenska. SHMÚ varuje pred kriticky vyschnutou pôdou

Na D1 pribudli nové ultrarýchle nabíjačky. Elektromobily sa nabijú solídným výkonom

USA spúšťajú globálnu alianciu pre 6G. Chcú získať náskok pred úhlavným rivalom

Klimatická zmena ohrozuje cesty, železnice aj letiská. Európa na nové extrémy nie je pripravená

Dunaj uzavreli. Pokles hladiny odhalil masívnu muníciu z 2. svetovej vojny (VIDEO)

Nové destinácie vytláčajú Chorvátsko, Taliansko či Grécko. TOP 3 európske krajiny, ktoré sú hitom leta 2026

Na Slovensku chýba 74 264 „pracantov“. V týchto profesiách sa o teba šéfovia pobijú (REBRÍČEK)

Slovenský šport zasiahla smutná správa. Vo veku 82 rokov zomrel historicky prvý člen Siene slávy

Obľúbenú destináciu Slovákov zasiahlo zemetrasenie. Úrady spustili krízový režim (VIDEO)

Umelá inteligencia Claude vedela viac, než by mala. Anthropic čelí nezvyčajnému problému

Model, ktorý vie, že ho skúšajú

Nový problém vo výskume AI

Dvojsečný meč umelej uvedomelosti

Internet sa otriasa v základoch. EÚ zaviedla historické pravidlá pre AI, hrozia miliónové pokuty

OpenAI chce poslať klávesnice do minulosti. Prvé tajomné zariadenia majú prísť čoskoro

Šéf OpenAI: Umelá inteligencia neskráti ľuďom pracovný týždeň na 4 dni. Toto je dôvod

Budeme žiť večne? Vedci vypočítali maximálny vek človeka a zistili niečo, čo mnohí nechcú počuť

AMD už nechce byť lacnejšou alternatívou k Nvidii. S AI gigantom podpísalo životnú dohodu

Dunaj uzavreli. Pokles hladiny odhalil masívnu muníciu z 2. svetovej vojny (VIDEO)

Nové destinácie vytláčajú Chorvátsko, Taliansko či Grécko. TOP 3 európske krajiny, ktoré sú hitom leta 2026

Na Slovensku chýba 74 264 „pracantov“. V týchto profesiách sa o teba šéfovia pobijú (REBRÍČEK)

Slovenský šport zasiahla smutná správa. Vo veku 82 rokov zomrel historicky prvý člen Siene slávy

Obľúbenú destináciu Slovákov zasiahlo zemetrasenie. Úrady spustili krízový režim (VIDEO)

Ojazdené autá na Slovensku citeľne zdraželi. Priemerná cena stúpla, mení sa aj ponuka

Umelá inteligencia produkuje sofistikovaný podvod. Odborníci varujú pred novou vlnou

Zelená domácnostiam pokračuje, no podmienky stále chýbajú. SIEA prezradila, čo sa zmení

Extrémne sucho zasahuje už 38 % Slovenska. SHMÚ varuje pred kriticky vyschnutou pôdou

Na D1 pribudli nové ultrarýchle nabíjačky. Elektromobily sa nabijú solídným výkonom

USA spúšťajú globálnu alianciu pre 6G. Chcú získať náskok pred úhlavným rivalom

Klimatická zmena ohrozuje cesty, železnice aj letiská. Európa na nové extrémy nie je pripravená

Dunaj uzavreli. Pokles hladiny odhalil masívnu muníciu z 2. svetovej vojny (VIDEO)

Nové destinácie vytláčajú Chorvátsko, Taliansko či Grécko. TOP 3 európske krajiny, ktoré sú hitom leta 2026

Na Slovensku chýba 74 264 „pracantov“. V týchto profesiách sa o teba šéfovia pobijú (REBRÍČEK)

Slovenský šport zasiahla smutná správa. Vo veku 82 rokov zomrel historicky prvý člen Siene slávy

Obľúbenú destináciu Slovákov zasiahlo zemetrasenie. Úrady spustili krízový režim (VIDEO)

Zakúpené články