Tromfol by ju aj prvák na ZŠ. Umelá inteligencia totálne zlyhala v najjednoduchšej úlohe
V nasledujúcom texte boli použité materiály TASR.
Aj keď sa môže zdať, že čítanie hodín či orientácia v kalendári patrí medzi úplné základy, ktoré zvládne každý školák, umelá inteligencia s tým má naďalej obrovské problémy. Nová štúdia z dielne výskumníkov na Edinburghskej univerzite totiž odhalila, že aj tie najpokročilejšie modely umelej inteligencie – vrátane GPT-4o od OpenAI, Gemini 2.0 od Googlu či Claude-3.5 Sonnet od Anthropic – zlyhávajú pri zdanlivo jednoduchých úlohách. Majú problém, napríklad, určiť čas na ručičkových hodinách alebo vypočítať, na aký deň v týždni pripadá konkrétny deň v roku.
Autori štúdie zverejnili svoje zistenia v elektronickom archíve arXiv a zároveň ich prezentovali počas Medzinárodnej konferencie o reprezentatívnom učení ICLR 2025, ktorá sa konala koncom apríla v Singapure. Testovali schopnosti tzv. multimodálnych veľkých jazykových modelov (MLLM), ktoré sú navrhnuté tak, aby vedeli spracovávať vizuálne aj textové vstupy súčasne. V praxi to znamená, že by mali byť schopné pozrieť sa na obrázok hodín či kalendára a pochopiť, čo ukazuje.
Problém v realite
Výsledky však boli podľa vedcov zarážajúco slabé. V prípade určovania času z klasických ručičkových hodín dokázali modely uspieť iba v 38,7 % prípadov. A keď mali odpovedať na otázku typu „Na aký deň v týždni padne 153. deň roka?“, úspešnosť sa prepadla ešte nižšie – len na 26,3 %.
Hlavný autor štúdie Rohit Saxena upozorňuje, že takéto nedostatky AI by mohli predstavovať problém v reálnych aplikáciách, kde sa presnosť práce s časom jednoducho neodpúšťa. „Tieto nedostatky je potrebné odstrániť, ak má AI úspešne fungovať v oblastiach vyžadujúcich presnú prácu s časom, napríklad tvorbe časových rozvrhov, automatizácii a asistenčných technológiách,“ vysvetľuje Saxena.
Za slabé výsledky môže najmä to, že modely sa netrénujú na riešenie takýchto vizuálnych priestorových úloh. Na rozdiel od klasickej výpočtovej techniky totiž AI modely nefungujú na báze pravidiel a logiky, ale predpovedajú odpovede na základe vzorcov, ktoré rozpoznali v tréningových dátach. To je podľa Saxenu hlavný dôvod, prečo sa AI nie vždy dopracuje ku správnej odpovedi logickou cestou.
„AI občas trafí aritmetický výsledok, no nedopracuje sa k nemu konzistentnou logikou založenou na pravidlách,“ hovorí Saxena.
Nedisponuje schopnosťou
Odčítanie času z analógových hodín je pre umelú inteligenciu zložité aj preto, že si vyžaduje schopnosť priestorového vnímania – AI musí pochopiť, ako sa ručičky navzájom prekrývajú, aký majú uhol, či interpretovať rôzne formy ciferníkov, napríklad rímske číslice. Kalendáre zas vyžadujú kombináciu aritmetiky, chápanie dní v týždni, mesiacov a výnimiek, ako sú priestupné roky. Pre človeka samozrejmosť, pre umelú inteligenciu stále problém.
Štúdia je tak ďalším dôkazom toho, že aj keď AI pôsobí čoraz inteligentnejšie, stále má slabiny tam, kde sa od nej vyžaduje skutočné chápanie alebo abstraktné myslenie. Saxena upozorňuje, že kým AI nebude zvládať takéto typy úloh konzistentne a spoľahlivo, bude nutné zabezpečovať systémy, ktoré ju využívajú, záložnou logikou a kontrolou zo strany človeka.
„AI je výkonná, no keď si úloha vyžaduje použitie (priestorového) vnímania a logiky, stále je treba dôkladné testovanie, záložnú logiku a človeka v procese,“ uzavrel.
Čítajte viac z kategórie: Novinky
Ďakujeme, že čítaš Fontech. V prípade, že máš postreh alebo si našiel v článku chybu, napíš nám na redakcia@fontech.sk.
Teraz čítajú
Sú nezničiteľné: 90 % všetkých vyrobených Ferrari stále jazdí, toto sú dôvody
Rozbije všetko, čo mu stojí v ceste. Rusi vypustili ľadového giganta, ktorý má ovládnuť Arktídu
Strach z Votrelca vôbec nehrali, herečka omdlela priamo pred kamerou. Takto vznikla najdesivejšia sci-fi bytosť histórie
Worldwide Rush posunie hranice stratégií. Staňeš sa dopravným magnátom na mape reálneho sveta
Explodujúce Slnko nebude príčinou. Superpočítač odhalil, kedy a ako vyhynie ľudstvo
NAJČÍTANEJŠIE ZO STARTITUP
90% Slovákov znervóznie už pri prvej otázke: Tento kvíz z biológie ťa pošle späť do školskej lavice
Pokuta až 100 eur: Polícia kontroluje tento doklad u vybranej skupiny vodičov, mnohí Slováci o tom nevedia
Zabudni na kávu a energetické nápoje: Prírodná „bomba“ zlepšuje výkon mozgu a sústredenie
Penzión na severe Slovenska zachvátili plamene. Škoda dosahuje 4 milióny eur
„Nie je žiadna dohoda,“ vyhlásil Trump. Hodinové rokovania na Aljaške skončili, Putin naznačil možné stretnutie v Moskve
- 24 hod
- 48 hod
- 7 dní
-
- Bill Gates mal pravdu. Umelá inteligencia narazila na veľký problém, môže znamenať jej koniec
- Západ ju nemá ako zastaviť. Desivá ruská zbraň dokáže vyradiť základne NATO v sekundách
- 30 rokov ho nič neprekonalo. Jeden z najlepších akčných filmov histórie hlási návrat, máme detaily
- Švajčiari ukázali Slovensku energetické riešenie. Vyvinuli vŕtačku, ktorá dodá energiu domácnosti
- Jeden z najlepších akčných filmov 2025 čoskoro dorazí online. Bude aj s dabingom
-
- Bill Gates mal pravdu. Umelá inteligencia narazila na veľký problém, môže znamenať jej koniec
- Západ ju nemá ako zastaviť. Desivá ruská zbraň dokáže vyradiť základne NATO v sekundách
- 30 rokov ho nič neprekonalo. Jeden z najlepších akčných filmov histórie hlási návrat, máme detaily
- Švajčiari ukázali Slovensku energetické riešenie. Vyvinuli vŕtačku, ktorá dodá energiu domácnosti
- Dodáva teplo a elektrinu v Arktíde. Plávajúca jadrová elektráreň Rusov dosiahla nový rekord
-
- NASA sleduje emisie CO2 z vesmíru. Najväčší znečisťovateľ v Európe je blízko Slovenska
- Najväčší nepriateľ nebol Rus, ale mikro zabijak. Vedci po 200 rokoch odhalili, čo zabilo armádu Napoleona
- Bill Gates mal pravdu. Umelá inteligencia narazila na veľký problém, môže znamenať jej koniec
- Európa sa vráti 20 000 rokov späť v čase, katastrofu už nemožno zastaviť
- Spojenec Slovenska stavia svoju najdrahšiu zbraň. Ponesie 144 jadrových hlavíc a vyzerá ako zo sci-fi
Postavia jadrové elektrárne, vysokorýchlostnú železnicu a predbehnú Slovensko. Ázia má nového tigra
Volkswagen znovu zaťal do živého. Vládu vyzval na štátnu podporu elektromobilov
Putin berie Rusom aj posledný kúsok slobody. Ľuďom bizarne ruší hovory cez obľúbené aplikácie
Rada Európy vyslala jasný odkaz: Prestaňte predávať zbrane do tejto krajiny
Niečo sa chystá a „nikto nevie čo“. USA začali vojenské cvičenia s nečakanou krajinou
NAJČÍTANEJŠIE ZO STARTITUP