Tromfol by ju aj prvák na ZŠ. Umelá inteligencia totálne zlyhala v najjednoduchšej úlohe
V nasledujúcom texte boli použité materiály TASR.
Aj keď sa môže zdať, že čítanie hodín či orientácia v kalendári patrí medzi úplné základy, ktoré zvládne každý školák, umelá inteligencia s tým má naďalej obrovské problémy. Nová štúdia z dielne výskumníkov na Edinburghskej univerzite totiž odhalila, že aj tie najpokročilejšie modely umelej inteligencie – vrátane GPT-4o od OpenAI, Gemini 2.0 od Googlu či Claude-3.5 Sonnet od Anthropic – zlyhávajú pri zdanlivo jednoduchých úlohách. Majú problém, napríklad, určiť čas na ručičkových hodinách alebo vypočítať, na aký deň v týždni pripadá konkrétny deň v roku.
Autori štúdie zverejnili svoje zistenia v elektronickom archíve arXiv a zároveň ich prezentovali počas Medzinárodnej konferencie o reprezentatívnom učení ICLR 2025, ktorá sa konala koncom apríla v Singapure. Testovali schopnosti tzv. multimodálnych veľkých jazykových modelov (MLLM), ktoré sú navrhnuté tak, aby vedeli spracovávať vizuálne aj textové vstupy súčasne. V praxi to znamená, že by mali byť schopné pozrieť sa na obrázok hodín či kalendára a pochopiť, čo ukazuje.
Problém v realite
Výsledky však boli podľa vedcov zarážajúco slabé. V prípade určovania času z klasických ručičkových hodín dokázali modely uspieť iba v 38,7 % prípadov. A keď mali odpovedať na otázku typu „Na aký deň v týždni padne 153. deň roka?“, úspešnosť sa prepadla ešte nižšie – len na 26,3 %.
Hlavný autor štúdie Rohit Saxena upozorňuje, že takéto nedostatky AI by mohli predstavovať problém v reálnych aplikáciách, kde sa presnosť práce s časom jednoducho neodpúšťa. „Tieto nedostatky je potrebné odstrániť, ak má AI úspešne fungovať v oblastiach vyžadujúcich presnú prácu s časom, napríklad tvorbe časových rozvrhov, automatizácii a asistenčných technológiách,“ vysvetľuje Saxena.
Za slabé výsledky môže najmä to, že modely sa netrénujú na riešenie takýchto vizuálnych priestorových úloh. Na rozdiel od klasickej výpočtovej techniky totiž AI modely nefungujú na báze pravidiel a logiky, ale predpovedajú odpovede na základe vzorcov, ktoré rozpoznali v tréningových dátach. To je podľa Saxenu hlavný dôvod, prečo sa AI nie vždy dopracuje ku správnej odpovedi logickou cestou.
„AI občas trafí aritmetický výsledok, no nedopracuje sa k nemu konzistentnou logikou založenou na pravidlách,“ hovorí Saxena.
Nedisponuje schopnosťou
Odčítanie času z analógových hodín je pre umelú inteligenciu zložité aj preto, že si vyžaduje schopnosť priestorového vnímania – AI musí pochopiť, ako sa ručičky navzájom prekrývajú, aký majú uhol, či interpretovať rôzne formy ciferníkov, napríklad rímske číslice. Kalendáre zas vyžadujú kombináciu aritmetiky, chápanie dní v týždni, mesiacov a výnimiek, ako sú priestupné roky. Pre človeka samozrejmosť, pre umelú inteligenciu stále problém.
Štúdia je tak ďalším dôkazom toho, že aj keď AI pôsobí čoraz inteligentnejšie, stále má slabiny tam, kde sa od nej vyžaduje skutočné chápanie alebo abstraktné myslenie. Saxena upozorňuje, že kým AI nebude zvládať takéto typy úloh konzistentne a spoľahlivo, bude nutné zabezpečovať systémy, ktoré ju využívajú, záložnou logikou a kontrolou zo strany človeka.
„AI je výkonná, no keď si úloha vyžaduje použitie (priestorového) vnímania a logiky, stále je treba dôkladné testovanie, záložnú logiku a človeka v procese,“ uzavrel.
Čítajte viac z kategórie: Novinky
Ďakujeme, že čítaš Fontech. V prípade, že máš postreh alebo si našiel v článku chybu, napíš nám na redakcia@fontech.sk.
Teraz čítajú
Nič vzácnejšie už dlho nenašli. Vedci odkryli 3 000 rokov staré „zlaté" mesto
Svetový expert exkluzívne pre Fontech: V Európe postavia najväčší urýchľovač histórie za 16 miliárd. Videli sme plány
Český mix Diabla a DOOMu prichádza na Kickstarter. Demo si už môžeš zahrať na populárnej službe
Vedci zistili niečo neuveriteľné: Einsteinova fyzika nám dáva nádej na mimozemský život
Európu postihla tichá kríza, akú ešte nezažila. Vedci varujú pred stratou kľúčového prvku prežitia
NAJČÍTANEJŠIE ZO STARTITUP
8 z 10 Slovákov stroskotá na druhej otázke. Dokáž, že máš všeobecný prehľad na jednotku (KVÍZ)
Taylor Swift odhalila tajomstvo svojho stravovania. Jej prístup predbehol dobu o 15 rokov
Sú prví na svete. Známa letecká spoločnosť spúšťa novinku, ktorá poteší všetkých
Pokuty až do 3 319 eur. Zákon hovorí jasne, čo musia psíčkari dodržať (PREHĽAD)
Odborníci bijú na poplach: Obľúbený zlozvyk tisícok Slovákov spôsobuje pri Covide dlhodobé následky
- 24 hod
- 48 hod
- 7 dní
-
- Američania ohúrili svet. Z opačného konca planéty vypustili jadrovú raketu, trafila cieľ na meter presne
- Ohromne zbohatnú a spasia Európu. Blízko Slovenska našli obrovské ložisko ropy a plynu
- Náš vesmír vznikol v počítači vyspelej civilizácie, simulácii života verí aj Elon Musk
- Európu postihla tichá kríza, akú ešte nezažila. Vedci varujú pred stratou kľúčového prvku prežitia
- Zostrelili UFO a kruto za to zaplatili. 23 sovietskych vojakov podľa CIA postihol desivý osud
-
- Ohromne zbohatnú a spasia Európu. Blízko Slovenska našli obrovské ložisko ropy a plynu
- Američania ohúrili svet. Z opačného konca planéty vypustili jadrovú raketu, trafila cieľ na meter presne
- Slováci majú v dome zdroj energie, o ktorom netušili. Nová technológia vykuruje aj chladí a šetrí tisíce eur
- Američania vytvorili magnet, ktorý ohýba realitu. Len o vlások prežil vlastný experiment
- Zostrelili UFO a kruto za to zaplatili. 23 sovietskych vojakov podľa CIA postihol desivý osud
-
- Ohromne zbohatnú a spasia Európu. Blízko Slovenska našli obrovské ložisko ropy a plynu
- Nikto niečo podobné neskúsil. Čína nechala vybuchnúť tri jadrové bomby za sebou, výsledky sú znepokojivé
- Zmeny v STK zaskočili Slovákov. Vysoké pokuty hrozia aj tým, ktorí auto už nemajú (PREHĽAD)
- Američania ohúrili svet. Z opačného konca planéty vypustili jadrovú raketu, trafila cieľ na meter presne
- Toto už nie je len dron. Najväčšia zbrojovka sveta ukázala zbraň budúcnosti, ktorá zmení vojny
Toto nemá ešte nikto. Kia spúšťa technológiu, ktorá ukáže pravdu o batérii EV v reálnom čase
Má vraj extrémny dolet. KĽDR predstavila najvýkonnejší jadrový zbraňový systém, aký kedy vyvinula
Umelá inteligencia ukazuje svoju temnú stránku. Firmy chceli ušetriť, namiesto toho zaplatili tvrdú daň
Podvodník ho prevedčil po 5 hodinách hovoru: Slovák prišiel o 55 000 eur, zavolal mu falošný policajt
Musk prekvapil Európu: Tesla predstavila novú verziu za cenu, ktorú nik nečakal
NAJČÍTANEJŠIE ZO STARTITUP