Spoločnosť OpenAI tvrdí, že nový model umelej inteligencie o3 dosiahol v teste ARC-AGI skóre 85 %. V teste všeobecnej inteligencie AI dosiahol výsledky na ľudskej úrovni. Podľa spoločnosti, model vynikal v mimoriadne ťažkom teste z matematiky. O téme informoval portál Gizmodo.

Priemerné skóre ľudí

ARC-AGI je benchmark na meranie schopnosti umelej inteligencie adaptovať sa na nové úlohy. Je to test, ktorý hodnotí efektivitu učenia AI z malého počtu vzoriek. Test meria to, ako efektívne sa model dokáže prispôsobiť novej situácií len na základe malého počtu dát. Sú to akoby IQ testy, akurát pre umelú inteligenciu. Zahŕňa tiež sériu úloh, kde sa model snaží odhaliť vzory v mriežkach a aplikovať ich na nové prípady.

Model v teste dosiahol 85 % skóre, ktoré je výrazne viac ako predchádzajúce maximum umelej inteligencie 55 % na úrovni priemerného skóre človeka. Zatiaľ ale nie je známe, ako model o3 dosiahol tak vysoký úspech. „Nevieme presne, ako to OpenAI urobil, ale výsledky naznačujú, že model o3 je vysoko prispôsobivý. Len na niekoľkých príkladoch nájde pravidlá, ktoré možno zovšeobecniť,“ uvádzajú autori článku Michael Timothy Bennett a Elija Perrier na portáli The Conversation.

Flickr

Otázne je, ako to dosiahol

Model sa zrejme spolieha na tzv. slabé pravidlá, ktoré sa dajú generalizovať a čím sú slabšie, tým viac sa dokáže prispôsobiť novým situáciám. Francúzsky výskumník François Chollet, autor benchmarku ARC-AGI, predpokladá, že model o3 funguje podobne ako systém AlphaGo od Google DeepMind, ktorý používa voľné pravidlá na hodnotenie možných sekvencií ťahov pri strategickej hre Go. Model o3 by tak mohol generovať množstvo „reťazcov myšlienok“ na riešenie úloh a následne vyberať tie najlepšie.

Zatiaľ je však na mieste skepticizmus, pretože sú to stále len „laboratórne testy“. Ak však je o3 schopný generalizovať svoje znalosti a riešiť úlohy na úrovni priemerného človeka, mohlo by to znamenať začiatok novej éry vo vývoji umelej inteligencii. Tvorcovia o o3 vyhlásili, že je „najpokročilejším modelom s uvažovaním“.

Pošli nám TIP na článok



Teraz čítajú

NAJČÍTANEJŠIE ZO STARTITUP