Tromfol by ju aj prvák na ZŠ. Umelá inteligencia totálne zlyhala v najjednoduchšej úlohe
V nasledujúcom texte boli použité materiály TASR.
Aj keď sa môže zdať, že čítanie hodín či orientácia v kalendári patrí medzi úplné základy, ktoré zvládne každý školák, umelá inteligencia s tým má naďalej obrovské problémy. Nová štúdia z dielne výskumníkov na Edinburghskej univerzite totiž odhalila, že aj tie najpokročilejšie modely umelej inteligencie – vrátane GPT-4o od OpenAI, Gemini 2.0 od Googlu či Claude-3.5 Sonnet od Anthropic – zlyhávajú pri zdanlivo jednoduchých úlohách. Majú problém, napríklad, určiť čas na ručičkových hodinách alebo vypočítať, na aký deň v týždni pripadá konkrétny deň v roku.
Autori štúdie zverejnili svoje zistenia v elektronickom archíve arXiv a zároveň ich prezentovali počas Medzinárodnej konferencie o reprezentatívnom učení ICLR 2025, ktorá sa konala koncom apríla v Singapure. Testovali schopnosti tzv. multimodálnych veľkých jazykových modelov (MLLM), ktoré sú navrhnuté tak, aby vedeli spracovávať vizuálne aj textové vstupy súčasne. V praxi to znamená, že by mali byť schopné pozrieť sa na obrázok hodín či kalendára a pochopiť, čo ukazuje.
Problém v realite
Výsledky však boli podľa vedcov zarážajúco slabé. V prípade určovania času z klasických ručičkových hodín dokázali modely uspieť iba v 38,7 % prípadov. A keď mali odpovedať na otázku typu „Na aký deň v týždni padne 153. deň roka?“, úspešnosť sa prepadla ešte nižšie – len na 26,3 %.
Hlavný autor štúdie Rohit Saxena upozorňuje, že takéto nedostatky AI by mohli predstavovať problém v reálnych aplikáciách, kde sa presnosť práce s časom jednoducho neodpúšťa. „Tieto nedostatky je potrebné odstrániť, ak má AI úspešne fungovať v oblastiach vyžadujúcich presnú prácu s časom, napríklad tvorbe časových rozvrhov, automatizácii a asistenčných technológiách,“ vysvetľuje Saxena.
Za slabé výsledky môže najmä to, že modely sa netrénujú na riešenie takýchto vizuálnych priestorových úloh. Na rozdiel od klasickej výpočtovej techniky totiž AI modely nefungujú na báze pravidiel a logiky, ale predpovedajú odpovede na základe vzorcov, ktoré rozpoznali v tréningových dátach. To je podľa Saxenu hlavný dôvod, prečo sa AI nie vždy dopracuje ku správnej odpovedi logickou cestou.
„AI občas trafí aritmetický výsledok, no nedopracuje sa k nemu konzistentnou logikou založenou na pravidlách,“ hovorí Saxena.

Nedisponuje schopnosťou
Odčítanie času z analógových hodín je pre umelú inteligenciu zložité aj preto, že si vyžaduje schopnosť priestorového vnímania – AI musí pochopiť, ako sa ručičky navzájom prekrývajú, aký majú uhol, či interpretovať rôzne formy ciferníkov, napríklad rímske číslice. Kalendáre zas vyžadujú kombináciu aritmetiky, chápanie dní v týždni, mesiacov a výnimiek, ako sú priestupné roky. Pre človeka samozrejmosť, pre umelú inteligenciu stále problém.
Štúdia je tak ďalším dôkazom toho, že aj keď AI pôsobí čoraz inteligentnejšie, stále má slabiny tam, kde sa od nej vyžaduje skutočné chápanie alebo abstraktné myslenie. Saxena upozorňuje, že kým AI nebude zvládať takéto typy úloh konzistentne a spoľahlivo, bude nutné zabezpečovať systémy, ktoré ju využívajú, záložnou logikou a kontrolou zo strany človeka.
„AI je výkonná, no keď si úloha vyžaduje použitie (priestorového) vnímania a logiky, stále je treba dôkladné testovanie, záložnú logiku a človeka v procese,“ uzavrel.
Čítajte viac z kategórie: Novinky
Ďakujeme, že čítaš Fontech. V prípade, že máš postreh alebo si našiel v článku chybu, napíš nám na redakcia@fontech.sk.
Teraz čítajú

Nálož noviniek na Netflixe a ďalších. TOP 12 najväčších filmov a seriálov v máji

Vysnívané pokračovanie je na dosah. Kultové akčné sci-fi sa vracia aj s hviezdnou dvojicou

Netflix ruší jeden zo svojich najväčších hitov. Divákom zostáva jediná útecha

Prežiješ tam aspoň 60 sekúnd? Slovenský vedec rozobral mimozemský život na exoplenétach

Majú zásoby 200 miliárd m³ plynu. Európsky štát spustil výstavbu kľúčového plynovodu
NAJČÍTANEJŠIE ZO STARTITUP

MIMORIADNE: Veľká policajná razia na východe Slovenska. Od skorého rána zatýkajú pre násilné zločiny
PREMIUMHodnota CSG padla na 18,3 miliardy eur: Investori obviňujú Strnadovu firmu zo zavádzania, tá ostro reaguje

Dovolenka v Grécku sa Slovákom skomplikuje: Až 251 pláží sprísňuje pravidlá, prídu o najväčší komfort

Mapa Ukrajiny sa nečakane prepísala: Rusko prvýkrát od roku 2023 stratilo viac územia, než získalo

Irán vie zostrojiť jadrovú bombu už do roka. Trump dostal nepríjemnú správu od tajných, narazili na problém
- 24 hod
- 48 hod
- 7 dní
-
- Diváci sa potešia. Veľký operátor odomkol tri platené stanice
- V Ázii rastie neporaziteľná veľmoc. USA jej zabezpečí miliardovú prevahu na desaťročia
- Každý ich má doma, no následky sú desivé. Brusel chystá najväčší zákaz v histórii ľudstva
- Prehliadame poklady. Mesiac má „zlato“ na 10 000 rokov, blízka planéta oceán raketového paliva
- Pád Tróje aj boj s kyklopom. Nolan ukazuje svoj najdrahší film, Odysea bude veľkolepá
-
- V Ázii rastie neporaziteľná veľmoc. USA jej zabezpečí miliardovú prevahu na desaťročia
- Ľudstvo dostane nevyčerpateľný zdroj energie. Iba časť z neho nám dá elektrinu na milióny rokov
- Diváci sa potešia. Veľký operátor odomkol tri platené stanice
- Vodiči ho okamžite vypínali. Najotravnejší systém v autách končí, Európa je otázkou času
- Sú ultralacné a vydržia 16 rokov. Vynašli ideálne batérie na ukladanie energie z fotovoltiky
-
- Ľudstvo dostane nevyčerpateľný zdroj energie. Iba časť z neho nám dá elektrinu na milióny rokov
- Každý ich má doma, no následky sú desivé. Brusel chystá najväčší zákaz v histórii ľudstva
- Do Mesiaca narazí objekt rýchlosťou 8 700 km/h. Stane sa to počas tohto leta
- Česko objavilo „zlatú baňu“ zemného plynu. Rokuje o energii v objeme 2 miliárd m³
- Západ nič také nemá. „Spojenec“ Ruska nasadí na stíhačky a vrtuľníky oslepujúci laser, v teste ukázal silu
Gigantická metropola sa prepadáva šialeným tempom, vidno to z vesmíru
Za sekundu vykoná 14,5 biliónov operácií. Slovensko spustilo jednu z najvýkonnejších technologií
Mýtus o sile Ruska narazil na dno. Oslavy víťazstva odhalia ľuďom pravdu o stave armády
Slováci konečne pochopili význam umelej inteligencie. Bojíme sa však citlivých vecí
NBS varuje Slovákov: Tieto kryptomenové firmy ťa pripravia o peniaze, nemajú povolenie
Experiment skončil fiaskom. Nemci zastropovali ceny palív, ľudia platia viac
Vodiči si musia dať pozor, voči tomuto priestupku štát zakročí oveľa prísnejšie
NAJČÍTANEJŠIE ZO STARTITUP

MIMORIADNE: Veľká policajná razia na východe Slovenska. Od skorého rána zatýkajú pre násilné zločiny
PREMIUMHodnota CSG padla na 18,3 miliardy eur: Investori obviňujú Strnadovu firmu zo zavádzania, tá ostro reaguje

Dovolenka v Grécku sa Slovákom skomplikuje: Až 251 pláží sprísňuje pravidlá, prídu o najväčší komfort

Mapa Ukrajiny sa nečakane prepísala: Rusko prvýkrát od roku 2023 stratilo viac územia, než získalo

