Tromfol by ju aj prvák na ZŠ. Umelá inteligencia totálne zlyhala v najjednoduchšej úlohe
V nasledujúcom texte boli použité materiály TASR.
Aj keď sa môže zdať, že čítanie hodín či orientácia v kalendári patrí medzi úplné základy, ktoré zvládne každý školák, umelá inteligencia s tým má naďalej obrovské problémy. Nová štúdia z dielne výskumníkov na Edinburghskej univerzite totiž odhalila, že aj tie najpokročilejšie modely umelej inteligencie – vrátane GPT-4o od OpenAI, Gemini 2.0 od Googlu či Claude-3.5 Sonnet od Anthropic – zlyhávajú pri zdanlivo jednoduchých úlohách. Majú problém, napríklad, určiť čas na ručičkových hodinách alebo vypočítať, na aký deň v týždni pripadá konkrétny deň v roku.
Autori štúdie zverejnili svoje zistenia v elektronickom archíve arXiv a zároveň ich prezentovali počas Medzinárodnej konferencie o reprezentatívnom učení ICLR 2025, ktorá sa konala koncom apríla v Singapure. Testovali schopnosti tzv. multimodálnych veľkých jazykových modelov (MLLM), ktoré sú navrhnuté tak, aby vedeli spracovávať vizuálne aj textové vstupy súčasne. V praxi to znamená, že by mali byť schopné pozrieť sa na obrázok hodín či kalendára a pochopiť, čo ukazuje.
Problém v realite
Výsledky však boli podľa vedcov zarážajúco slabé. V prípade určovania času z klasických ručičkových hodín dokázali modely uspieť iba v 38,7 % prípadov. A keď mali odpovedať na otázku typu „Na aký deň v týždni padne 153. deň roka?“, úspešnosť sa prepadla ešte nižšie – len na 26,3 %.
Hlavný autor štúdie Rohit Saxena upozorňuje, že takéto nedostatky AI by mohli predstavovať problém v reálnych aplikáciách, kde sa presnosť práce s časom jednoducho neodpúšťa. „Tieto nedostatky je potrebné odstrániť, ak má AI úspešne fungovať v oblastiach vyžadujúcich presnú prácu s časom, napríklad tvorbe časových rozvrhov, automatizácii a asistenčných technológiách,“ vysvetľuje Saxena.
Za slabé výsledky môže najmä to, že modely sa netrénujú na riešenie takýchto vizuálnych priestorových úloh. Na rozdiel od klasickej výpočtovej techniky totiž AI modely nefungujú na báze pravidiel a logiky, ale predpovedajú odpovede na základe vzorcov, ktoré rozpoznali v tréningových dátach. To je podľa Saxenu hlavný dôvod, prečo sa AI nie vždy dopracuje ku správnej odpovedi logickou cestou.
„AI občas trafí aritmetický výsledok, no nedopracuje sa k nemu konzistentnou logikou založenou na pravidlách,“ hovorí Saxena.
Nedisponuje schopnosťou
Odčítanie času z analógových hodín je pre umelú inteligenciu zložité aj preto, že si vyžaduje schopnosť priestorového vnímania – AI musí pochopiť, ako sa ručičky navzájom prekrývajú, aký majú uhol, či interpretovať rôzne formy ciferníkov, napríklad rímske číslice. Kalendáre zas vyžadujú kombináciu aritmetiky, chápanie dní v týždni, mesiacov a výnimiek, ako sú priestupné roky. Pre človeka samozrejmosť, pre umelú inteligenciu stále problém.
Štúdia je tak ďalším dôkazom toho, že aj keď AI pôsobí čoraz inteligentnejšie, stále má slabiny tam, kde sa od nej vyžaduje skutočné chápanie alebo abstraktné myslenie. Saxena upozorňuje, že kým AI nebude zvládať takéto typy úloh konzistentne a spoľahlivo, bude nutné zabezpečovať systémy, ktoré ju využívajú, záložnou logikou a kontrolou zo strany človeka.
„AI je výkonná, no keď si úloha vyžaduje použitie (priestorového) vnímania a logiky, stále je treba dôkladné testovanie, záložnú logiku a človeka v procese,“ uzavrel.
Čítajte viac z kategórie: Novinky
Ďakujeme, že čítaš Fontech. V prípade, že máš postreh alebo si našiel v článku chybu, napíš nám na redakcia@fontech.sk.
Teraz čítajú
Európske automobilky sa otriasajú. Šéf Stellantisu poslal Bruselu tvrdý odkaz, čas sa kráti
RECENZIA Veľké finále sa nekoná. Kultová hororová séria končí s trpkou príchuťou, zabudla strašiť (RECENZIA)
kvíz KVÍZ: Väčšina „znalcov“ nedá už tretiu otázku. Ukáž, že filmové akčné legendy máš v malíčku
Krutá daň 1000 jadrových bômb. USA naozaj stavali raketu s hmotnosťou 8 miliónov ton
7 najväčších chýb, ktorými si denne ničíš smartfón (a ani o tom nevieš)
NAJČÍTANEJŠIE ZO STARTITUP
Prídeme o ďalšie sviatky? Vláda v rámci konsolidácie zvažuje takýto scenár, v hre môže byť až šesť dní
Štefančík: Robert Fico si obľúbil autoritárske krajiny a stretáva sa s vojnovým zločincom (TÝŽDENNÝ PREHĽAD)
Odborníci varujú: Upchávanie srdcových ciev prebieha potichu. Tieto príznaky môžu signalizovať infarkt
Rodinná anamnéza rakoviny: Vedci odhalili 6 kľúčových faktorov, ktoré môžu predísť jej vzniku
AKTUÁLNE Ruský nočný útok na Kyjev: Zo sídla vlády stúpa dym, Ukrajinci zasiahli ropovod Družba
- 24 hod
- 48 hod
- 7 dní
-
- Nič lepšie vraj na Netflixe tento rok neuvidíš. Hrozivo aktuálny film ohromil kritikov, 11 minút mu tlieskali v stoji
- Zbraň budúcnosti zlyhala na plnej čiare. Arabi testovali čínsky laser a ostali totálne zarazení
- Susedná krajina kupuje ničivé zbrane za 1,4 miliardy eur. Moskve poslali jasný odkaz
- Trh s elektromobilmi v Číne explodoval. Teraz mu hrozí vlastná smrť
- Veľmoc našla ložisko mimoriadne vzácnej suroviny. Má astronomickú hodnotu
-
- Susedná krajina kupuje ničivé zbrane za 1,4 miliardy eur. Moskve poslali jasný odkaz
- Nič lepšie vraj na Netflixe tento rok neuvidíš. Hrozivo aktuálny film ohromil kritikov, 11 minút mu tlieskali v stoji
- Trh s elektromobilmi v Číne explodoval. Teraz mu hrozí vlastná smrť
- Ak ich máš na ruke, máš to najlepšie na trhu. Apple po 10 rokoch zosadila z trónu táto značka smart hodiniek
- Zbraň budúcnosti zlyhala na plnej čiare. Arabi testovali čínsky laser a ostali totálne zarazení
-
- Ochráni kontinent pred Rusmi aj CO₂. Európa má v rukách tajnú zbraň, odborníci zvažujú jej nasadenie
- Nemajú proti nej šancu. F-16 dostane desivú zbraň, ktorá môže zachrániť Ukrajinu
- Sylvester Stallone ako mafián aj veľký hit Netflixu. TOP 14 noviniek na streamovacích službách v septembri
- Susedná krajina kupuje ničivé zbrane za 1,4 miliardy eur. Moskve poslali jasný odkaz
- Nič lepšie vraj na Netflixe tento rok neuvidíš. Hrozivo aktuálny film ohromil kritikov, 11 minút mu tlieskali v stoji
Západ vstúpil do nesprávnych vôd. Okolo kľúčového ostrova Ázie to vrie, Čína hovorí o provokácii
Svet sa rúti do jadrového rizika. Počet krajín s jadrovými zbraňami je alarmujúci, vznikajú nové veľmoci
Fosílne palivá ešte nekončia. Ropní giganti urobili rozhodnutie, ktoré zaskočilo svet
Nabiješ ich za 7 minút a majú rekordnú batériu. Nové mobily obľúbenej značky poriadne prekvapili
Slovensko sa hrnie do vesmíru. Postavíme dôležité zariadenie za 16 miliónov eur, na toto poslúži
NAJČÍTANEJŠIE ZO STARTITUP