Tromfol by ju aj prvák na ZŠ. Umelá inteligencia totálne zlyhala v najjednoduchšej úlohe
V nasledujúcom texte boli použité materiály TASR.
Aj keď sa môže zdať, že čítanie hodín či orientácia v kalendári patrí medzi úplné základy, ktoré zvládne každý školák, umelá inteligencia s tým má naďalej obrovské problémy. Nová štúdia z dielne výskumníkov na Edinburghskej univerzite totiž odhalila, že aj tie najpokročilejšie modely umelej inteligencie – vrátane GPT-4o od OpenAI, Gemini 2.0 od Googlu či Claude-3.5 Sonnet od Anthropic – zlyhávajú pri zdanlivo jednoduchých úlohách. Majú problém, napríklad, určiť čas na ručičkových hodinách alebo vypočítať, na aký deň v týždni pripadá konkrétny deň v roku.
Autori štúdie zverejnili svoje zistenia v elektronickom archíve arXiv a zároveň ich prezentovali počas Medzinárodnej konferencie o reprezentatívnom učení ICLR 2025, ktorá sa konala koncom apríla v Singapure. Testovali schopnosti tzv. multimodálnych veľkých jazykových modelov (MLLM), ktoré sú navrhnuté tak, aby vedeli spracovávať vizuálne aj textové vstupy súčasne. V praxi to znamená, že by mali byť schopné pozrieť sa na obrázok hodín či kalendára a pochopiť, čo ukazuje.
Problém v realite
Výsledky však boli podľa vedcov zarážajúco slabé. V prípade určovania času z klasických ručičkových hodín dokázali modely uspieť iba v 38,7 % prípadov. A keď mali odpovedať na otázku typu „Na aký deň v týždni padne 153. deň roka?“, úspešnosť sa prepadla ešte nižšie – len na 26,3 %.
Hlavný autor štúdie Rohit Saxena upozorňuje, že takéto nedostatky AI by mohli predstavovať problém v reálnych aplikáciách, kde sa presnosť práce s časom jednoducho neodpúšťa. „Tieto nedostatky je potrebné odstrániť, ak má AI úspešne fungovať v oblastiach vyžadujúcich presnú prácu s časom, napríklad tvorbe časových rozvrhov, automatizácii a asistenčných technológiách,“ vysvetľuje Saxena.
Za slabé výsledky môže najmä to, že modely sa netrénujú na riešenie takýchto vizuálnych priestorových úloh. Na rozdiel od klasickej výpočtovej techniky totiž AI modely nefungujú na báze pravidiel a logiky, ale predpovedajú odpovede na základe vzorcov, ktoré rozpoznali v tréningových dátach. To je podľa Saxenu hlavný dôvod, prečo sa AI nie vždy dopracuje ku správnej odpovedi logickou cestou.
„AI občas trafí aritmetický výsledok, no nedopracuje sa k nemu konzistentnou logikou založenou na pravidlách,“ hovorí Saxena.

Nedisponuje schopnosťou
Odčítanie času z analógových hodín je pre umelú inteligenciu zložité aj preto, že si vyžaduje schopnosť priestorového vnímania – AI musí pochopiť, ako sa ručičky navzájom prekrývajú, aký majú uhol, či interpretovať rôzne formy ciferníkov, napríklad rímske číslice. Kalendáre zas vyžadujú kombináciu aritmetiky, chápanie dní v týždni, mesiacov a výnimiek, ako sú priestupné roky. Pre človeka samozrejmosť, pre umelú inteligenciu stále problém.
Štúdia je tak ďalším dôkazom toho, že aj keď AI pôsobí čoraz inteligentnejšie, stále má slabiny tam, kde sa od nej vyžaduje skutočné chápanie alebo abstraktné myslenie. Saxena upozorňuje, že kým AI nebude zvládať takéto typy úloh konzistentne a spoľahlivo, bude nutné zabezpečovať systémy, ktoré ju využívajú, záložnou logikou a kontrolou zo strany človeka.
„AI je výkonná, no keď si úloha vyžaduje použitie (priestorového) vnímania a logiky, stále je treba dôkladné testovanie, záložnú logiku a človeka v procese,“ uzavrel.
Čítajte viac z kategórie: Novinky
Ďakujeme, že čítaš Fontech. V prípade, že máš postreh alebo si našiel v článku chybu, napíš nám na redakcia@fontech.sk.
Teraz čítajú

Najdrahší film Christophera Nolana má nečakané obmedzenie. Nie každý sa dostane do kina

Domáce kamery a smart zvončeky majú problém. Slováci ho začnú riešiť až pri prvom incidente

Chceme suverenitu, ale... Američania tlačia Európu, aby s nimi bojovala vo vojne proti Číne

Slovensko je jadrová veľmoc. Dve tretiny elektriny síce vyrábame z atómu, realita je však zložitejšia

S Grónskom sa deje zvláštna vec, ktorá prepisuje mapy. Vedci zistili absurdnú príčinu
NAJČÍTANEJŠIE ZO STARTITUP

Najlepší liek na stres nenájdeš v lekárni. Vedci hovoria o prekvapivo jednoduchom riešení
PREMIUMZamestnávatelia sa už nebudú môcť pýtať na tvoj predchádzajúci plat: Prichádzajú nové pravidlá (ROZHOVOR)

Sopečná erupcia zastavila leteckú dopravu v dovolenkovej destinácii: Oblaky popola siahajú do výšky 2,5 kilometra

Chorvátsko ukázalo veľkú mapu čistoty mora. Otestovali viac ako 1 100 pláží, 3 lokality však úplne pohoreli

Kardiologička odporúča 5 potravín na zníženie cholesterolu. Jedna z nich rastie takmer v každej slovenskej záhrade
- 24 hod
- 48 hod
- 7 dní
-
- Na ČSFD má 90 % a práve dorazil na Slovensko. Najlepší film roka čelil ostrej kontroverzii
- Spoliehali sa na Rusov, teraz im hrozí nedostatok plynu. Európsky štát čelí „najprísnejším sankciám v histórii“
- Pochoval spaľováky aj rivalov. Tento elektromobil vyhlásili za najlepšie rodinné auto roka
- Čínsky stroj rozdrvil najlepšiu európsku stíhačku v pomere 9:0. Je pritom horší
- Začína éra lacných e-áut: VW spustil výrobu kľúčových modelov, profitovať bude aj Škoda
-
- Na ČSFD má 90 % a práve dorazil na Slovensko. Najlepší film roka čelil ostrej kontroverzii
- Pochoval spaľováky aj rivalov. Tento elektromobil vyhlásili za najlepšie rodinné auto roka
- Čínsky stroj rozdrvil najlepšiu európsku stíhačku v pomere 9:0. Je pritom horší
- Spoliehali sa na Rusov, teraz im hrozí nedostatok plynu. Európsky štát čelí „najprísnejším sankciám v histórii“
- Začína éra lacných e-áut: VW spustil výrobu kľúčových modelov, profitovať bude aj Škoda
-
- Do Európy začne prúdiť nový plyn z prekvapivej krajiny. Konečne vieme, kedy sa tak stane
- Čínsky stroj rozdrvil najlepšiu európsku stíhačku v pomere 9:0. Je pritom horší
- Dorazila spása letectva. Rolls-Royce úspešne otestoval nový motor bez emisií, poháňa ho čistý vodík
- Najlepšie sci-fi 2026 konečne pribudlo online aj s dabingom. Jedna vec ľudí nepoteší
- Na ČSFD má 90 % a práve dorazil na Slovensko. Najlepší film roka čelil ostrej kontroverzii
Holanďania testujú netradičnú veternú turbínu. Pláva na vode a môže zmeniť budúcnosť energetiky
Slovensko rieši problém vykurovania. Odborníci sa hádajú, či majú ľudia odchádzať od teplární
Štát stopol kontroverzný IT projekt za 90 miliónov eur. Minister ho chce preveriť
USA spustí revolúciu v LNG. Pri pobreží postaví prvé plávajúce exportné zariadenie za miliardy
MOL spustil ťažbu plynu v zaujímavom štáte. Nový projekt posilní dodávky pre strednú Európu
EÚ chce zrušiť roaming aj na západnom Balkáne. Volania a dáta bez príplatkov sa priblížili ďalším štátom
Umelá inteligencia pomáha pri navrhovaní obalov
NAJČÍTANEJŠIE ZO STARTITUP

Najlepší liek na stres nenájdeš v lekárni. Vedci hovoria o prekvapivo jednoduchom riešení
PREMIUMZamestnávatelia sa už nebudú môcť pýtať na tvoj predchádzajúci plat: Prichádzajú nové pravidlá (ROZHOVOR)

Sopečná erupcia zastavila leteckú dopravu v dovolenkovej destinácii: Oblaky popola siahajú do výšky 2,5 kilometra

Chorvátsko ukázalo veľkú mapu čistoty mora. Otestovali viac ako 1 100 pláží, 3 lokality však úplne pohoreli

