Tromfol by ju aj prvák na ZŠ. Umelá inteligencia totálne zlyhala v najjednoduchšej úlohe
V nasledujúcom texte boli použité materiály TASR.
Aj keď sa môže zdať, že čítanie hodín či orientácia v kalendári patrí medzi úplné základy, ktoré zvládne každý školák, umelá inteligencia s tým má naďalej obrovské problémy. Nová štúdia z dielne výskumníkov na Edinburghskej univerzite totiž odhalila, že aj tie najpokročilejšie modely umelej inteligencie – vrátane GPT-4o od OpenAI, Gemini 2.0 od Googlu či Claude-3.5 Sonnet od Anthropic – zlyhávajú pri zdanlivo jednoduchých úlohách. Majú problém, napríklad, určiť čas na ručičkových hodinách alebo vypočítať, na aký deň v týždni pripadá konkrétny deň v roku.
Autori štúdie zverejnili svoje zistenia v elektronickom archíve arXiv a zároveň ich prezentovali počas Medzinárodnej konferencie o reprezentatívnom učení ICLR 2025, ktorá sa konala koncom apríla v Singapure. Testovali schopnosti tzv. multimodálnych veľkých jazykových modelov (MLLM), ktoré sú navrhnuté tak, aby vedeli spracovávať vizuálne aj textové vstupy súčasne. V praxi to znamená, že by mali byť schopné pozrieť sa na obrázok hodín či kalendára a pochopiť, čo ukazuje.
Problém v realite
Výsledky však boli podľa vedcov zarážajúco slabé. V prípade určovania času z klasických ručičkových hodín dokázali modely uspieť iba v 38,7 % prípadov. A keď mali odpovedať na otázku typu „Na aký deň v týždni padne 153. deň roka?“, úspešnosť sa prepadla ešte nižšie – len na 26,3 %.
Hlavný autor štúdie Rohit Saxena upozorňuje, že takéto nedostatky AI by mohli predstavovať problém v reálnych aplikáciách, kde sa presnosť práce s časom jednoducho neodpúšťa. „Tieto nedostatky je potrebné odstrániť, ak má AI úspešne fungovať v oblastiach vyžadujúcich presnú prácu s časom, napríklad tvorbe časových rozvrhov, automatizácii a asistenčných technológiách,“ vysvetľuje Saxena.
Za slabé výsledky môže najmä to, že modely sa netrénujú na riešenie takýchto vizuálnych priestorových úloh. Na rozdiel od klasickej výpočtovej techniky totiž AI modely nefungujú na báze pravidiel a logiky, ale predpovedajú odpovede na základe vzorcov, ktoré rozpoznali v tréningových dátach. To je podľa Saxenu hlavný dôvod, prečo sa AI nie vždy dopracuje ku správnej odpovedi logickou cestou.
„AI občas trafí aritmetický výsledok, no nedopracuje sa k nemu konzistentnou logikou založenou na pravidlách,“ hovorí Saxena.
Nedisponuje schopnosťou
Odčítanie času z analógových hodín je pre umelú inteligenciu zložité aj preto, že si vyžaduje schopnosť priestorového vnímania – AI musí pochopiť, ako sa ručičky navzájom prekrývajú, aký majú uhol, či interpretovať rôzne formy ciferníkov, napríklad rímske číslice. Kalendáre zas vyžadujú kombináciu aritmetiky, chápanie dní v týždni, mesiacov a výnimiek, ako sú priestupné roky. Pre človeka samozrejmosť, pre umelú inteligenciu stále problém.
Štúdia je tak ďalším dôkazom toho, že aj keď AI pôsobí čoraz inteligentnejšie, stále má slabiny tam, kde sa od nej vyžaduje skutočné chápanie alebo abstraktné myslenie. Saxena upozorňuje, že kým AI nebude zvládať takéto typy úloh konzistentne a spoľahlivo, bude nutné zabezpečovať systémy, ktoré ju využívajú, záložnou logikou a kontrolou zo strany človeka.
„AI je výkonná, no keď si úloha vyžaduje použitie (priestorového) vnímania a logiky, stále je treba dôkladné testovanie, záložnú logiku a človeka v procese,“ uzavrel.
Čítajte viac z kategórie: Novinky
Ďakujeme, že čítaš Fontech. V prípade, že máš postreh alebo si našiel v článku chybu, napíš nám na redakcia@fontech.sk.
Teraz čítajú
Príde Votrelec aj dve bomby od Netflixu. TOP 13 noviniek, ktoré sa oplatí vidieť v auguste (PREHĽAD)
Číňania vykopali 2000-ročné meče a ostali v šoku. Majú v rukách ultimátne vojenské vylepšenie
Nolan by bol zdesený, keby to vedel. Nový veľkofilm narazil na komplikácie a chcú ho zakázať
ZAUJÍMAVÉ Toto je Buran, sovietska „kópia“ Raketoplánu. Bol lepší a s najsilnejším motorom sveta
Drony budú bezradné. Nemci spravia vojakov „neviditeľnými“ vďaka geniálnemu vylepšeniu
NAJČÍTANEJŠIE ZO STARTITUP
KVÍZ: 90 % Slovákov nachytá 8. otázka. Otestuj sa a zisti, či by ťa učiteľka matematiky „potľapkala po pleci“
Matovič varuje: Po Ficovi bude treba nájsť 1,7 miliardy. Reálne sa obávam, čo zo Slovenska zostane
Prekvapivé zistenie: Kuracie mäso poškodzuje črevá viac než hovädzie, zistili vedci
Divoké počasie nekončí: Silné búrky zasiahnu tieto oblasti Slovenska, počítaj s lejakom a krúpami (PREDPOVEĎ)
Putinovou smrťou nič neskončí, tvrdí šéf ukrajinskej rozviedky: Kremeľ už má meno náhradníka pripravené
- 24 hod
- 48 hod
- 7 dní
-
- Nenápadný jed sa šíri po celej planéte. Zvláštna chemikália je v 94 percentách vody a bude to čoraz horšie
- Je efektívnejší než tepelné čerpadlo a ušetrí ti stovky eur. Na svete je revolučný spôsob, ako ohrievať vodu
- Slováci jedia mikroplasty, ani o tom nevedia. Vedci odhalili prekvapivú potravinu, v ktorej ich je extrémne veľa
- Vybabral s Rusmi a tí sa nestihli čudovať. Vojak unikol z obkľúčenia ako z vojenského sci-fi filmu
- Drony budú bezradné. Nemci spravia vojakov „neviditeľnými“ vďaka geniálnemu vylepšeniu
-
- Nenápadný jed sa šíri po celej planéte. Zvláštna chemikália je v 94 percentách vody a bude to čoraz horšie
- Vybabral s Rusmi a tí sa nestihli čudovať. Vojak unikol z obkľúčenia ako z vojenského sci-fi filmu
- Má všetko potrebné, aby na nej existoval život. Vedci objavili Superzem s ideálnymi podmienkami
- Je efektívnejší než tepelné čerpadlo a ušetrí ti stovky eur. Na svete je revolučný spôsob, ako ohrievať vodu
- Slováci jedia mikroplasty, ani o tom nevedia. Vedci odhalili prekvapivú potravinu, v ktorej ich je extrémne veľa
-
- Zmeny v STK zaskočili Slovákov. Vysoké pokuty hrozia aj tým, ktorí auto už nemajú (PREHĽAD)
- Vojenskí experti prišli s víťazným plánom: Nad Ukrajinou bude lietať stovka európskych stíhačiek
- Žiadna pokuta, rovno ti zoberú vodičák. Tieto činnosti za volantom nikdy nerob (PREHĽAD)
- Nenápadný jed sa šíri po celej planéte. Zvláštna chemikália je v 94 percentách vody a bude to čoraz horšie
- Uniklo 90 miliárd litrov vody a nikto si to nevšimol. Vedci hovoria o nevídanej sile Zeme
EÚ zaskočila svet. Nečakaná krajina môže cez Rusko vyvážať uhlie napriek sankciám
Taraba ohlásil energetickú megainvestíciu. Slovenské mestá získajú milióny eur
Slováci kupujú jazdené autá, ako nikdy predtým. Priemerný vek a nájazd prudko rastie, dominuje jedna značka
Zubár odhalil šokujúce riziká populárneho spánkového triku. Riskuješ veľké nepríjemnosti
Slováci si neuvedomujú, že to môže vybuchnúť. Odborník varuje pred „elektronickým“ zlozvykom domácností
NAJČÍTANEJŠIE ZO STARTITUP