Tromfol by ju aj prvák na ZŠ. Umelá inteligencia totálne zlyhala v najjednoduchšej úlohe
V nasledujúcom texte boli použité materiály TASR.
Aj keď sa môže zdať, že čítanie hodín či orientácia v kalendári patrí medzi úplné základy, ktoré zvládne každý školák, umelá inteligencia s tým má naďalej obrovské problémy. Nová štúdia z dielne výskumníkov na Edinburghskej univerzite totiž odhalila, že aj tie najpokročilejšie modely umelej inteligencie – vrátane GPT-4o od OpenAI, Gemini 2.0 od Googlu či Claude-3.5 Sonnet od Anthropic – zlyhávajú pri zdanlivo jednoduchých úlohách. Majú problém, napríklad, určiť čas na ručičkových hodinách alebo vypočítať, na aký deň v týždni pripadá konkrétny deň v roku.
Autori štúdie zverejnili svoje zistenia v elektronickom archíve arXiv a zároveň ich prezentovali počas Medzinárodnej konferencie o reprezentatívnom učení ICLR 2025, ktorá sa konala koncom apríla v Singapure. Testovali schopnosti tzv. multimodálnych veľkých jazykových modelov (MLLM), ktoré sú navrhnuté tak, aby vedeli spracovávať vizuálne aj textové vstupy súčasne. V praxi to znamená, že by mali byť schopné pozrieť sa na obrázok hodín či kalendára a pochopiť, čo ukazuje.
Problém v realite
Výsledky však boli podľa vedcov zarážajúco slabé. V prípade určovania času z klasických ručičkových hodín dokázali modely uspieť iba v 38,7 % prípadov. A keď mali odpovedať na otázku typu „Na aký deň v týždni padne 153. deň roka?“, úspešnosť sa prepadla ešte nižšie – len na 26,3 %.
Hlavný autor štúdie Rohit Saxena upozorňuje, že takéto nedostatky AI by mohli predstavovať problém v reálnych aplikáciách, kde sa presnosť práce s časom jednoducho neodpúšťa. „Tieto nedostatky je potrebné odstrániť, ak má AI úspešne fungovať v oblastiach vyžadujúcich presnú prácu s časom, napríklad tvorbe časových rozvrhov, automatizácii a asistenčných technológiách,“ vysvetľuje Saxena.
Za slabé výsledky môže najmä to, že modely sa netrénujú na riešenie takýchto vizuálnych priestorových úloh. Na rozdiel od klasickej výpočtovej techniky totiž AI modely nefungujú na báze pravidiel a logiky, ale predpovedajú odpovede na základe vzorcov, ktoré rozpoznali v tréningových dátach. To je podľa Saxenu hlavný dôvod, prečo sa AI nie vždy dopracuje ku správnej odpovedi logickou cestou.
„AI občas trafí aritmetický výsledok, no nedopracuje sa k nemu konzistentnou logikou založenou na pravidlách,“ hovorí Saxena.
Nedisponuje schopnosťou
Odčítanie času z analógových hodín je pre umelú inteligenciu zložité aj preto, že si vyžaduje schopnosť priestorového vnímania – AI musí pochopiť, ako sa ručičky navzájom prekrývajú, aký majú uhol, či interpretovať rôzne formy ciferníkov, napríklad rímske číslice. Kalendáre zas vyžadujú kombináciu aritmetiky, chápanie dní v týždni, mesiacov a výnimiek, ako sú priestupné roky. Pre človeka samozrejmosť, pre umelú inteligenciu stále problém.
Štúdia je tak ďalším dôkazom toho, že aj keď AI pôsobí čoraz inteligentnejšie, stále má slabiny tam, kde sa od nej vyžaduje skutočné chápanie alebo abstraktné myslenie. Saxena upozorňuje, že kým AI nebude zvládať takéto typy úloh konzistentne a spoľahlivo, bude nutné zabezpečovať systémy, ktoré ju využívajú, záložnou logikou a kontrolou zo strany človeka.
„AI je výkonná, no keď si úloha vyžaduje použitie (priestorového) vnímania a logiky, stále je treba dôkladné testovanie, záložnú logiku a človeka v procese,“ uzavrel.
Čítajte viac z kategórie: Novinky
Ďakujeme, že čítaš Fontech. V prípade, že máš postreh alebo si našiel v článku chybu, napíš nám na redakcia@fontech.sk.
Teraz čítajú
EXKLUZÍVNE: Slovákov okráda „falošná Alza”. Experti varujú, že ťa pripraví o všetky peniaze
Slabé povahy pozor. Nová hororová hra je tak realistická, že nezaspíš (VIDEO)
Na nabíjanie zabudni. Na svete je prvý elektromobil s nekonečným dojazdom (+video)
RECENZIA: Rodinný kolos s excelentnou spotrebou. Za týmto Hyundaiom sa na ulici všetci otáčajú
Ani elektrina, ani benzín. Dve obrovské automobilky sa spojili a odhalili pohon budúcnosti
NAJČÍTANEJŠIE ZO STARTITUP
10 náročných otázok, ktoré potrápia aj vzdelaných Slovákov. Zisti, či máš všeobecný prehľad (KVÍZ)
„Vnuk zbil babku. Pre 400 eur.“ Bývalý elitný vyšetrovateľ odhaľuje mrazivé príbehy detskej kriminality (PREHĽAD)
Odborník radí, ako sa naučiť čokoľvek za polovičný čas. Najpoužívanejšie metódy sú neúčinné
Ľudia s týmito vlastnosťami sa dožívajú viac rokov. Nová štúdia skúmala vplyv osobnosti na dĺžku života
Slovensko čakajú silné búrky vo viacerých okresoch, meteorológovia vydali výstrahu prvého stupňa (PREDPOVEĎ)
- 24 hod
- 48 hod
- 7 dní
-
- Na nabíjanie zabudni. Na svete je prvý elektromobil s nekonečným dojazdom (+video)
- Vedcom rovno padla sánka. Objavili zabudnuté mesto, v ktorom 250 rokov nikto nebol
- Ani elektrina, ani benzín. Dve obrovské automobilky sa spojili a odhalili pohon budúcnosti
- Izraelský útok v Iráne spustil v Rusku paniku. Ak by na nich zaútočil akýkoľvek štát NATO, padlo by do pár dní
- RECENZIA: Rodinný kolos s excelentnou spotrebou. Za týmto Hyundaiom sa na ulici všetci otáčajú
-
- Vedcom rovno padla sánka. Objavili zabudnuté mesto, v ktorom 250 rokov nikto nebol
- Vedci v Černobyle našli bizarné psy. Prešli extrémnou evolúciou a v DNA majú vec, ktorá tam nemá čo robiť
- Izraelský útok v Iráne spustil v Rusku paniku. Ak by na nich zaútočil akýkoľvek štát NATO, padlo by do pár dní
- Na nabíjanie zabudni. Na svete je prvý elektromobil s nekonečným dojazdom (+video)
- Znič ruský dron, dostaneš tisíce dolárov. Ukrajinci vytiahli nečakanú zbraň a Rusi tŕpnu
-
- Bez Západu by rýchlo prehrali. Ukrajina zistila, čo v skutočnosti poháňa „ruské“ drony
- Vedci v Černobyle našli bizarné psy. Prešli extrémnou evolúciou a v DNA majú vec, ktorá tam nemá čo robiť
- Vylepšuje im každú novú zbraň, napriek tomu je jeho „nepriateľom“. Ak spojenec zradí Rusko, Moskva padne
- Vedci neverili vlastným očiam. Len 600 km nad pyramídami objavili zvláštnu bublinu
- Uniesli 20 jadrových striel a 10 000 ton. Rusi mali v rukách brutálne ponorky, zrazu sa ich chcú zbaviť
Konflikt v ropnej oblasti hýbe pumpami. Slovenské ceny sa menia, na toto sa priprav
Spojenci Iránu hlásia novú etapu boja. Varujú pred koordinovanými útokmi a hypersonickými raketami
Spálená koža nie je len nepríjemná. Môže ťa stáť oveľa viac, než si myslíš, varujú vedci
Bez cloudu by nefungovali. Digitálna infraštruktúra Nemecka závisí od USA
Falošné správy sa šíria rýchlejšie ako pravda. Pomôcť môže špecializovaná AI
NAJČÍTANEJŠIE ZO STARTITUP
10 náročných otázok, ktoré potrápia aj vzdelaných Slovákov. Zisti, či máš všeobecný prehľad (KVÍZ)
„Vnuk zbil babku. Pre 400 eur.“ Bývalý elitný vyšetrovateľ odhaľuje mrazivé príbehy detskej kriminality (PREHĽAD)
Odborník radí, ako sa naučiť čokoľvek za polovičný čas. Najpoužívanejšie metódy sú neúčinné
Ľudia s týmito vlastnosťami sa dožívajú viac rokov. Nová štúdia skúmala vplyv osobnosti na dĺžku života
Slovensko čakajú silné búrky vo viacerých okresoch, meteorológovia vydali výstrahu prvého stupňa (PREDPOVEĎ)
Copyright© 2025 by Startitup, s. r. o. Všetky práva vyhradené