Tromfol by ju aj prvák na ZŠ. Umelá inteligencia totálne zlyhala v najjednoduchšej úlohe
V nasledujúcom texte boli použité materiály TASR.
Aj keď sa môže zdať, že čítanie hodín či orientácia v kalendári patrí medzi úplné základy, ktoré zvládne každý školák, umelá inteligencia s tým má naďalej obrovské problémy. Nová štúdia z dielne výskumníkov na Edinburghskej univerzite totiž odhalila, že aj tie najpokročilejšie modely umelej inteligencie – vrátane GPT-4o od OpenAI, Gemini 2.0 od Googlu či Claude-3.5 Sonnet od Anthropic – zlyhávajú pri zdanlivo jednoduchých úlohách. Majú problém, napríklad, určiť čas na ručičkových hodinách alebo vypočítať, na aký deň v týždni pripadá konkrétny deň v roku.
Autori štúdie zverejnili svoje zistenia v elektronickom archíve arXiv a zároveň ich prezentovali počas Medzinárodnej konferencie o reprezentatívnom učení ICLR 2025, ktorá sa konala koncom apríla v Singapure. Testovali schopnosti tzv. multimodálnych veľkých jazykových modelov (MLLM), ktoré sú navrhnuté tak, aby vedeli spracovávať vizuálne aj textové vstupy súčasne. V praxi to znamená, že by mali byť schopné pozrieť sa na obrázok hodín či kalendára a pochopiť, čo ukazuje.
Problém v realite
Výsledky však boli podľa vedcov zarážajúco slabé. V prípade určovania času z klasických ručičkových hodín dokázali modely uspieť iba v 38,7 % prípadov. A keď mali odpovedať na otázku typu „Na aký deň v týždni padne 153. deň roka?“, úspešnosť sa prepadla ešte nižšie – len na 26,3 %.
Hlavný autor štúdie Rohit Saxena upozorňuje, že takéto nedostatky AI by mohli predstavovať problém v reálnych aplikáciách, kde sa presnosť práce s časom jednoducho neodpúšťa. „Tieto nedostatky je potrebné odstrániť, ak má AI úspešne fungovať v oblastiach vyžadujúcich presnú prácu s časom, napríklad tvorbe časových rozvrhov, automatizácii a asistenčných technológiách,“ vysvetľuje Saxena.
Za slabé výsledky môže najmä to, že modely sa netrénujú na riešenie takýchto vizuálnych priestorových úloh. Na rozdiel od klasickej výpočtovej techniky totiž AI modely nefungujú na báze pravidiel a logiky, ale predpovedajú odpovede na základe vzorcov, ktoré rozpoznali v tréningových dátach. To je podľa Saxenu hlavný dôvod, prečo sa AI nie vždy dopracuje ku správnej odpovedi logickou cestou.
„AI občas trafí aritmetický výsledok, no nedopracuje sa k nemu konzistentnou logikou založenou na pravidlách,“ hovorí Saxena.
Nedisponuje schopnosťou
Odčítanie času z analógových hodín je pre umelú inteligenciu zložité aj preto, že si vyžaduje schopnosť priestorového vnímania – AI musí pochopiť, ako sa ručičky navzájom prekrývajú, aký majú uhol, či interpretovať rôzne formy ciferníkov, napríklad rímske číslice. Kalendáre zas vyžadujú kombináciu aritmetiky, chápanie dní v týždni, mesiacov a výnimiek, ako sú priestupné roky. Pre človeka samozrejmosť, pre umelú inteligenciu stále problém.
Štúdia je tak ďalším dôkazom toho, že aj keď AI pôsobí čoraz inteligentnejšie, stále má slabiny tam, kde sa od nej vyžaduje skutočné chápanie alebo abstraktné myslenie. Saxena upozorňuje, že kým AI nebude zvládať takéto typy úloh konzistentne a spoľahlivo, bude nutné zabezpečovať systémy, ktoré ju využívajú, záložnou logikou a kontrolou zo strany človeka.
„AI je výkonná, no keď si úloha vyžaduje použitie (priestorového) vnímania a logiky, stále je treba dôkladné testovanie, záložnú logiku a človeka v procese,“ uzavrel.
Čítajte viac z kategórie: Novinky
Ďakujeme, že čítaš Fontech. V prípade, že máš postreh alebo si našiel v článku chybu, napíš nám na redakcia@fontech.sk.
Teraz čítajú
Netflix ulovil veľrybu. Natočí seriál Assassin's Creed, hráči sa už teraz obávajú výsledku
Vypredal sa za 5 minút. Nolanov film spôsobil ošiaľ, najlepší zážitok na Slovensku neuvidíš
Toto ťa v škole nenaučia. TOP 10 technológií, ktoré používajú experti – ale zmenia ti život
Veľký zvrat vo vojne: Ukrajina dostane zákernú zbraň, ktorá zničí Rusov v okruhu 2 000 m²
Slovákom hrozí pokuta 5800 €. Tento zlozvyk za volantom ťa vyjde poriadne draho
NAJČÍTANEJŠIE ZO STARTITUP
TOP 10 najlepších letísk v Európe podľa dochvíľnosti: Na vrchole zoznamu je veľké prekvapenie (REBRÍČEK)
18 mesiacov na prípravu: „Diktátori Číny a Ruska sa už pripravujú na koordinovaný útok,“ varuje generál NATO
Na zmenu života ti stačí 11 minút denne. Vedci odhalili overenú techniku na zníženie stresu
Veľká odstávka obľúbenej banky: O tomto čase nezaplatíš kartou, nepôjde ti ani aplikácia
Mladí Slováci si postavili na Bali dizajnovú vilu: „Generuje nám pekný pasívny príjem, oplatilo sa to“ (ROZHOVOR)
- 24 hod
- 48 hod
- 7 dní
-
- Prehliadaná krajina prechádza desivou premenou za miliardy. Čína ju zbrojí na úroveň superveľmocí
- Takto skoro to nikto nečakal. Gigantická zrážka našej Galaxie s Andromedou sa začala, je ju vidieť voľným okom
- Zmizla miliarda z eurofondov, no informatizácia skrachovala. Toto sú najväčšie IT zlyhania v histórii Slovenska
- Českí filmári zobrali „dezolátov“ na Ukrajinu a ukázali im vojnu. Takto vyzerali ich reakcie (VIDEO)
- Automobilky sa boria s ďalším problémom. Tieto autá sa vôbec nepredávajú, chýba im spaľovací motor
-
- Vedci našli niečo, čo popiera fyziku. Výbuch jadrovej bomby vytvoril materiál, ktorý nemal existovať
- Prehliadaná krajina prechádza desivou premenou za miliardy. Čína ju zbrojí na úroveň superveľmocí
- Českí filmári zobrali „dezolátov“ na Ukrajinu a ukázali im vojnu. Takto vyzerali ich reakcie (VIDEO)
- Automobilky sa boria s ďalším problémom. Tieto autá sa vôbec nepredávajú, chýba im spaľovací motor
- Netflix opäť trafil do čierneho. Drsnú krimi sériu považujú kritici za jeden z najlepších seriálov roka
-
- Väčšina Slovákov o nej ani netuší. Ak porušíš túto povinnosť, hrozí ti pokuta 1200 €
- Taiwan ukázal svetu, čo sa stane, ak zaútočí Čína. V kľúčovom teste všetkých zarazili
- Nočná mora Rusov funguje. Ukrajina dostala od USA špeciálne zariadenia, ktoré môžu rozhodnúť vojnu
- Našiel som dokonalé rodinné auto. Na novej Dacii som prešiel 1 400 km do Chorvátska, otvorila mi oči
- POZOR: Nová dopravná značka mätie vodičov. Toto musíš spraviť, keď ju uvidíš
Umelá inteligencia nepotrebuje tvoju ľudskosť. Týmto častým spôsobom kazíš jej odpovede
EÚ chystá zákon, ktorý si posvieti operátorov. Vo vesmíre ich prinúti robiť túto vec
Pre Teslu to už nemôže byť horšie. Na kľúčových európskych trhoch sa prepadla až o 60 %
Svetový úspech vedcov SAV: Slováci vyvinuli zbraň proti vírusu, ktorý môže spúšťať rakovinu
Aplikácia Slovenskej pošty sa mení na digitálnu pobočku: Pribudnú kľúčové novinky
NAJČÍTANEJŠIE ZO STARTITUP