Tromfol by ju aj prvák na ZŠ. Umelá inteligencia totálne zlyhala v najjednoduchšej úlohe
V nasledujúcom texte boli použité materiály TASR.
Aj keď sa môže zdať, že čítanie hodín či orientácia v kalendári patrí medzi úplné základy, ktoré zvládne každý školák, umelá inteligencia s tým má naďalej obrovské problémy. Nová štúdia z dielne výskumníkov na Edinburghskej univerzite totiž odhalila, že aj tie najpokročilejšie modely umelej inteligencie – vrátane GPT-4o od OpenAI, Gemini 2.0 od Googlu či Claude-3.5 Sonnet od Anthropic – zlyhávajú pri zdanlivo jednoduchých úlohách. Majú problém, napríklad, určiť čas na ručičkových hodinách alebo vypočítať, na aký deň v týždni pripadá konkrétny deň v roku.
Autori štúdie zverejnili svoje zistenia v elektronickom archíve arXiv a zároveň ich prezentovali počas Medzinárodnej konferencie o reprezentatívnom učení ICLR 2025, ktorá sa konala koncom apríla v Singapure. Testovali schopnosti tzv. multimodálnych veľkých jazykových modelov (MLLM), ktoré sú navrhnuté tak, aby vedeli spracovávať vizuálne aj textové vstupy súčasne. V praxi to znamená, že by mali byť schopné pozrieť sa na obrázok hodín či kalendára a pochopiť, čo ukazuje.
Problém v realite
Výsledky však boli podľa vedcov zarážajúco slabé. V prípade určovania času z klasických ručičkových hodín dokázali modely uspieť iba v 38,7 % prípadov. A keď mali odpovedať na otázku typu „Na aký deň v týždni padne 153. deň roka?“, úspešnosť sa prepadla ešte nižšie – len na 26,3 %.
Hlavný autor štúdie Rohit Saxena upozorňuje, že takéto nedostatky AI by mohli predstavovať problém v reálnych aplikáciách, kde sa presnosť práce s časom jednoducho neodpúšťa. „Tieto nedostatky je potrebné odstrániť, ak má AI úspešne fungovať v oblastiach vyžadujúcich presnú prácu s časom, napríklad tvorbe časových rozvrhov, automatizácii a asistenčných technológiách,“ vysvetľuje Saxena.
Za slabé výsledky môže najmä to, že modely sa netrénujú na riešenie takýchto vizuálnych priestorových úloh. Na rozdiel od klasickej výpočtovej techniky totiž AI modely nefungujú na báze pravidiel a logiky, ale predpovedajú odpovede na základe vzorcov, ktoré rozpoznali v tréningových dátach. To je podľa Saxenu hlavný dôvod, prečo sa AI nie vždy dopracuje ku správnej odpovedi logickou cestou.
„AI občas trafí aritmetický výsledok, no nedopracuje sa k nemu konzistentnou logikou založenou na pravidlách,“ hovorí Saxena.
Nedisponuje schopnosťou
Odčítanie času z analógových hodín je pre umelú inteligenciu zložité aj preto, že si vyžaduje schopnosť priestorového vnímania – AI musí pochopiť, ako sa ručičky navzájom prekrývajú, aký majú uhol, či interpretovať rôzne formy ciferníkov, napríklad rímske číslice. Kalendáre zas vyžadujú kombináciu aritmetiky, chápanie dní v týždni, mesiacov a výnimiek, ako sú priestupné roky. Pre človeka samozrejmosť, pre umelú inteligenciu stále problém.
Štúdia je tak ďalším dôkazom toho, že aj keď AI pôsobí čoraz inteligentnejšie, stále má slabiny tam, kde sa od nej vyžaduje skutočné chápanie alebo abstraktné myslenie. Saxena upozorňuje, že kým AI nebude zvládať takéto typy úloh konzistentne a spoľahlivo, bude nutné zabezpečovať systémy, ktoré ju využívajú, záložnou logikou a kontrolou zo strany človeka.
„AI je výkonná, no keď si úloha vyžaduje použitie (priestorového) vnímania a logiky, stále je treba dôkladné testovanie, záložnú logiku a človeka v procese,“ uzavrel.
Čítajte viac z kategórie: Novinky
Ďakujeme, že čítaš Fontech. V prípade, že máš postreh alebo si našiel v článku chybu, napíš nám na redakcia@fontech.sk.
Teraz čítajú
Blízko Zeme sa deje zvláštny pohyb. Mŕtva planéta ožila a vedci netušia, ako je to možné
Čína vysmiala celý Západ. Prelomovou metódou vyťaží 100 % vzácneho materiálu za 40 minút
Milan Ondrík ohromuje aj mimo ČERNÁKA. Nový film zbiera obrovskú chválu v Európe, dokázal nemysliteľné
Čína ukázala zbraň budúcnosti. Ich superdron má dolet 7 000 km a vypúšťa roj smrti
Nemci urobili prevratný experiment: Ľudské bunky vystavili desaťnásobne silnejšiemu 5G, toto sa s nimi stalo
NAJČÍTANEJŠIE ZO STARTITUP
Otrasy v STVR: Nová riaditeľka Flašíková plánuje zrušiť niektoré relácie. Mnohé už začínajú pôsobiť unavene, tvrdí
Predseda Nitrianskeho kraja Becík podáva trestné oznámenie na poslanca SaS pre kauzu zámeny pozemkov
Skrytá hrozba wellness centier: Spojenie saunovania s obľúbenou neresťou môže skončiť tragicky
Černák na slobodu zatiaľ nepôjde. Súd odročil pojednávanie
Zdanlivo neškodný zvyk ubližuje tisícom Slovákov. Už po troch dňoch stúpa riziko srdcového zlyhania
- 24 hod
- 48 hod
- 7 dní
-
- Je 25-krát rýchlejšia než zvuk. Nečakaný štát odhalil raketu, ktorá zničí čokoľvek vo vzdialenosti 1 500 km
- Christopher Nolan natočí najväčší film všetkých čias. Urobil vec, ktorej sa doteraz všetci báli
- V kľúčovom teste všetkých zarazili. Večný spojenec Ruska ukázal nový zbraňový systém
- Neprežije nič na 8000 m2. Najlepšiu zbraň Ukrajiny závidí aj Rusko, v panike z nej minuli najdrahšie rakety
- Spomalí rast nádorov a je zo zlata. Vyvinuli 27-krát účinnejší prostriedok na liečbu rakoviny
-
- Je 25-krát rýchlejšia než zvuk. Nečakaný štát odhalil raketu, ktorá zničí čokoľvek vo vzdialenosti 1 500 km
- Neprežije nič na 8000 m2. Najlepšiu zbraň Ukrajiny závidí aj Rusko, v panike z nej minuli najdrahšie rakety
- ČERNÁK je len začiatok. Toto sú najočakávanejšie slovenské filmy roka
- Christopher Nolan natočí najväčší film všetkých čias. Urobil vec, ktorej sa doteraz všetci báli
- V kľúčovom teste všetkých zarazili. Večný spojenec Ruska ukázal nový zbraňový systém
-
- TEST: Vymenila som iPhone za najlacnejší Android. Už pri zapnutí prišiel šok, to však nebolo to najhoršie
- Je 25-krát rýchlejšia než zvuk. Nečakaný štát odhalil raketu, ktorá zničí čokoľvek vo vzdialenosti 1 500 km
- Potupa neutícha: Odhalili, čo poháňa ruské kamikadze drony
- Astronómovia neverili vlastným očiam. V ďalekej galaxii spozorovali zvláštny disk
- AKTUÁLNE: Obľúbená služba Slovákov sa stala obeťou útoku. Hacker napadol 89 miliónov účtov a odcudzil údaje
Naťahovacia batéria je realitou. Vedci ukázali, ako môže vyzerať budúcnosť napájania
Slováci milujú české e-shopy. Rastú aj bez kampaní
Najväčší výrobca batérií vstúpil na burzu. Čínsky CATL spolupracujem s Teslou aj BMW
Honda cúva z elektromobility. Miliardy presúva do hybridov
Veľký phishingový útok na Slovákov. Zneužili Slovensko.sk, pozor na falošné SMS
NAJČÍTANEJŠIE ZO STARTITUP
Otrasy v STVR: Nová riaditeľka Flašíková plánuje zrušiť niektoré relácie. Mnohé už začínajú pôsobiť unavene, tvrdí
Predseda Nitrianskeho kraja Becík podáva trestné oznámenie na poslanca SaS pre kauzu zámeny pozemkov
Skrytá hrozba wellness centier: Spojenie saunovania s obľúbenou neresťou môže skončiť tragicky
Černák na slobodu zatiaľ nepôjde. Súd odročil pojednávanie
Zdanlivo neškodný zvyk ubližuje tisícom Slovákov. Už po troch dňoch stúpa riziko srdcového zlyhania
Copyright© 2025 by Startitup, s. r. o. Všetky práva vyhradené