Spoločnosť DeepMind, ktorá patrí pod krídla Google, je známa vývojom systémov umelej inteligencie. Jej program AlphaGo a neskôr AlphaGo Zero sa preslávili svojimi úspechmi v stolovej hre Go. Teraz DeepMind predstavil ďalšiu verziu umelej inteligencie, AlphaZero. Tá dokázala predviesť obdivuhodné veci len v priebehu hodín.

Najnovšia verzia programu sa opäť predviedla pri stolových hrách, tentoraz však nešlo len o jednu verziu, ale hneď tri. O vývoji a úspechu AlphaZero informovali výskuníci DeepMind vo vedeckej štúdii publikovanej v databáze arXiv Cornellovej univerzity.

Učila sa sama

Umelá inteligencia AlphaZero síce vo veľkom využíva postupy použité pre AlphaGo Zero, ale na rozdiel od tohto programu nebola špeciálne vyvíjaná pre niektorú stolovú hru. Napriek tomu sa v priebehu niekoľkých hodín stala veľmajstom až v troch z nich.

Výskumníci pred ňu totiž postavili úlohu naučiť sa hrať šach, hru shogi (japonskú verziu šachu, ktorá sa hrá na väčšej hracej doske) a už spomínané Go. Umelá inteligencia pritom poznala len pravidlá jednotlivých hier a vedci do nej neimplementovali žiadne známe stratégie ani postupy. AlphaZero teda trénovala hraním sama proti sebe. Výsledok pritom udivuje.

V priebehu hodín sa stala veľmajstrom v troch hrách

Len štyri hodiny vlastného tréningu a 300 tisíc ťahov v šachu jej stačili na porazenie súčasného svetového šampióna – programu Stockfish 8. Zo 100 hier vyhrala AlphaZero 28 a neprehrala ani jeden, keďže všetky ostatné partie sa skončili remízou. 25 výhier pritom zaknihovala pri hraní s bielymi figúrkami (výhoda prvého ťahu). Na stolovú hru shogi trénovala AlphaZero 2 hodiny (110 tisíc ťahov) a porazila jeden z najlepších programov Elmo, a to pomerom – 90 výhier, 2 remízy a 8 prehier.

No a po ôsmich hodinách hraním Go (165 tisíc ťahov), si AlphaZero zmerala sily s programom AlphaGo Zero, ktorého schopnosti zodpovedali trom dňom tréningu. Novšia verzia umelej inteligencie od DeepMind zvíťazila pomerom 60 víťazstiev ku 40 porážkam.

O krok bližšie k plneniu všeobecnejších úloh

Umelá inteligencia AlphaZero sa tak napriek nulovým počiatočným vedomostiam o stratégii a ťahoch, dokázala v priebehu hodín sama vytrénovať a následne porážať najvyspelejšie počítačové systémy pre dané hry. To všetko napriek tomu, že nebola primárne špecializovaná pre žiadnu z týchto hier.

Nenechaj si ujsť
Najnovšia verzia umelej inteligencie Googlu má silu, ako keby mimozemská civilizácia vytvárala vlastnú matematiku

Ako uvádzajú vedci DeepMind vo svojom výskume, AlphaZero je „všeobecnejšia verzia“ AlphaGo Zero, ktorá využíva hlbokú neurónovú sieť a algoritmy založené na samostatnom učení. Je to zároveň ďalší krok k vývoju umelej inteligencie, ktorá bude schopná pomáhať pri rozličných úlohách v reálnom živote. Pred výskumníkmi však stále zostáva mnoho práce, pretože takéto riešenia sa značne odlišujú od hrania stolových hier. Isté však je, že vývoj umelej inteligencie robí veľké pokroky.

Pošli nám TIP na článok



Teraz čítajú