Spoločnosť DeepMind, ktorá patrí pod krídla Google, je známa vývojom umelej inteligencie AlphaGo. Ide o počítačový algoritmus, ktorý v uplynulých rokoch svojimi výkonmi terorizoval najlepších ľudských majstrov v stolovej hre Go. Lenže teraz sa programu AlphaGo postavil súper, ktorého nedokázal zdolať. 

Za novým šampiónom s označením AlphaGo Zero stojí opäť výskumný tím DeepMind a o detailoch z vývoja tohto algoritmu sa dozvedáme z výskumu publikovanom vo vedeckom magazíne Nature. Úvodnou informáciou je, že nový algoritmus dokázal zdolať všetky predchádzajúce, roky vyvíjané verzie len v priebehu niekoľkých dní od svojho spustenia. Ako je to možné?

Kľúčová vlastnosť – na začiatku nič nevedel

Vedci pri vývoji AlphaGo Zero zvolili úplne odlišný postup ako tomu bolo u predchádzajúcich verzií a všetko stavili na strojové učenie samotného algoritmu. Program AlphaGo Zero totiž začínal ako nepopísaný papier. To znamená, že nemal žiadne ľudské dáta, príklady hier či stratégie známe v Go. Jediné informácie, ktoré vývojári umelej inteligencii poskytli, boli pravidlá. Algoritmus AlphaGo Zero tak bez akýchkoľvek informácií o tom, ako vôbec vyhrať partiu Go, začal s tréningom, v ktorom hral len sám proti sebe.

Pri využití obrovskej výpočtove sily a počas takmer 30 miliónov hier, učinil program AlphaGo Zero obrovské množstvo spočiatku úplne náhodných ťahov. Neurónová sieť, ktorá u počítačov simuluje proces učenia podobný človeku, sa postupne zdokonaľovala. Kroky AlphaGo Zero neboli obmedzené žiadnymi ľudskými poznatkami a na základe vlastných predpovedí a analýzy svojich chýb, začal algoritmus po krátkom čase predvádzať úplne nové ťahy a stratégie, ktoré dosiaľ v hre Go neboli použité. Program od vývojárov DeepMind sa dokázal v priebehu pár dní vyvinúť z úplne amatéra v Go na svetového veľmajstra.

„Po čase sme začali pozorovať, že AlphaGo Zero nielenže objavil bežný vzorec hry a ťahy, ktoré majú ľudia tendenciu hrať, ale taktiež sa ich naučil, ďalej objavoval a nakoniec ich aj vyradil v prospech vlastných variácií, ktoré ľudia dosiaľ v tejto hre nepoznali a ani nehrali.“ – David Silver, výskumník v DeepMind

Zakrátko padli roky vyvíjané algoritmy

Trvalo len 3 dni tréningu než AlphaGo Zero zdolal svojho predchodcu s označením AlphaGo Lee. Celkovo sa odohrala stovka zápasov, pričom Zero všetky vyhral. Práve súperiaci program zdolal v roku 2016 dovtedy najlepšieho ľudského hráča, Lee Sedola, v ostro sledovanom súboji človeka proti stroju. Algoritmy DeepMind sa odvtedy neprestali rýchlo zlepšovať a ďalší algoritmus, tentoraz s označením Master, neskôr prešiel na online platformu.

Tam nedal šancu ďalším 60 hráčom zo svetovej špičky a následne porazil ďalšieho vyzývateľa a šampióna z Číny, Ke Jiea. Ani Master však nestačil na AlphaGo Zero a padol už po 21 dňoch od spustenia tréningu nového algoritmu. Po 41 dňoch samoučiaci program DeepMind porazil všetky verzie umelej inteligencie, ktoré dovtedy pre hru Go vytvorili.

Z hrania k medicíne

Go je zrejme najkomplexnejšia stolová hra, akú ľudstvo pozná. Ťahov, ktoré môžu dvaja súperiaci hráči vytvoriť pomocou bielych a čiernych kameňov je viac ako atómov v našom vesmíre. Nie je prekvapením, že ľuďom to trvá roky, kým sa v hre zdokonalia. Novému svetovému majstrovi to však trvalo len niekoľko dní. Vývoj umelej inteligencie sa našťastie neaplikuje len do stolových hier a postupne zasahuje dôležitejšie aspekty ľudského života.

„Skutočnosť, že vidíme program dosahujúci veľmi vysokú úroveň výkonnosti v oblasti, ktorá je tak zložitá a náročná ako Go, by mala znamenať, že teraz môžeme začať riešiť niektoré z najnáročnejších a najdôležitejších problémov ľudstva.“ – David Silver, výskumník v DeepMind

Tím DeepMind verí, že v nie príliš vzdialenej budúcnosti bude AlphaGo (alebo jeho ekvivalent) môcť pracovať a pomáhať napríklad v medicíne. AlphaGo Zero sa už má podieľať aj na dôležitom výskume, ktorý skúma fungovanie a skladanie proteínov v tele, čo by mohlo viesť k veľkým objavom.

Pošli nám TIP na článok



Teraz čítajú