
Za novým šampiónom s označením AlphaGo Zero stojí opäť výskumný tím DeepMind a o detailoch z vývoja tohto algoritmu sa dozvedáme z výskumu publikovanom vo vedeckom magazíne Nature. Úvodnou informáciou je, že nový algoritmus dokázal zdolať všetky predchádzajúce, roky vyvíjané verzie len v priebehu niekoľkých dní od svojho spustenia. Ako je to možné?
Kľúčová vlastnosť – na začiatku nič nevedel
Vedci pri vývoji AlphaGo Zero zvolili úplne odlišný postup ako tomu bolo u predchádzajúcich verzií a všetko stavili na strojové učenie samotného algoritmu. Program AlphaGo Zero totiž začínal ako nepopísaný papier. To znamená, že nemal žiadne ľudské dáta, príklady hier či stratégie známe v Go. Jediné informácie, ktoré vývojári umelej inteligencii poskytli, boli pravidlá. Algoritmus AlphaGo Zero tak bez akýchkoľvek informácií o tom, ako vôbec vyhrať partiu Go, začal s tréningom, v ktorom hral len sám proti sebe.
Our 2nd AlphaGo @nature paper! #AlphaGo Zero learns to master the game of Go ‚tabula rasa‘, entirely from self play https://t.co/oOTfiChTpO pic.twitter.com/4E33IEgMx6
— DeepMind (@DeepMindAI) 18. októbra 2017
Pri využití obrovskej výpočtove sily a počas takmer 30 miliónov hier, učinil program AlphaGo Zero obrovské množstvo spočiatku úplne náhodných ťahov. Neurónová sieť, ktorá u počítačov simuluje proces učenia podobný človeku, sa postupne zdokonaľovala. Kroky AlphaGo Zero neboli obmedzené žiadnymi ľudskými poznatkami a na základe vlastných predpovedí a analýzy svojich chýb, začal algoritmus po krátkom čase predvádzať úplne nové ťahy a stratégie, ktoré dosiaľ v hre Go neboli použité. Program od vývojárov DeepMind sa dokázal v priebehu pár dní vyvinúť z úplne amatéra v Go na svetového veľmajstra.
„Po čase sme začali pozorovať, že AlphaGo Zero nielenže objavil bežný vzorec hry a ťahy, ktoré majú ľudia tendenciu hrať, ale taktiež sa ich naučil, ďalej objavoval a nakoniec ich aj vyradil v prospech vlastných variácií, ktoré ľudia dosiaľ v tejto hre nepoznali a ani nehrali.“ – David Silver, výskumník v DeepMind
Zakrátko padli roky vyvíjané algoritmy
Trvalo len 3 dni tréningu než AlphaGo Zero zdolal svojho predchodcu s označením AlphaGo Lee. Celkovo sa odohrala stovka zápasov, pričom Zero všetky vyhral. Práve súperiaci program zdolal v roku 2016 dovtedy najlepšieho ľudského hráča, Lee Sedola, v ostro sledovanom súboji človeka proti stroju. Algoritmy DeepMind sa odvtedy neprestali rýchlo zlepšovať a ďalší algoritmus, tentoraz s označením Master, neskôr prešiel na online platformu.

Tam nedal šancu ďalším 60 hráčom zo svetovej špičky a následne porazil ďalšieho vyzývateľa a šampióna z Číny, Ke Jiea. Ani Master však nestačil na AlphaGo Zero a padol už po 21 dňoch od spustenia tréningu nového algoritmu. Po 41 dňoch samoučiaci program DeepMind porazil všetky verzie umelej inteligencie, ktoré dovtedy pre hru Go vytvorili.
Z hrania k medicíne
Go je zrejme najkomplexnejšia stolová hra, akú ľudstvo pozná. Ťahov, ktoré môžu dvaja súperiaci hráči vytvoriť pomocou bielych a čiernych kameňov je viac ako atómov v našom vesmíre. Nie je prekvapením, že ľuďom to trvá roky, kým sa v hre zdokonalia. Novému svetovému majstrovi to však trvalo len niekoľko dní. Vývoj umelej inteligencie sa našťastie neaplikuje len do stolových hier a postupne zasahuje dôležitejšie aspekty ľudského života.
„Skutočnosť, že vidíme program dosahujúci veľmi vysokú úroveň výkonnosti v oblasti, ktorá je tak zložitá a náročná ako Go, by mala znamenať, že teraz môžeme začať riešiť niektoré z najnáročnejších a najdôležitejších problémov ľudstva.“ – David Silver, výskumník v DeepMind
Tím DeepMind verí, že v nie príliš vzdialenej budúcnosti bude AlphaGo (alebo jeho ekvivalent) môcť pracovať a pomáhať napríklad v medicíne. AlphaGo Zero sa už má podieľať aj na dôležitom výskume, ktorý skúma fungovanie a skladanie proteínov v tele, čo by mohlo viesť k veľkým objavom.
Teraz čítajú

Dogecoin je minulosť. Teraz už môžeš investovať aj do kryptomeny so známym Pokémonom

Pôvodne vtip, dnes má prvého milionára. Dogecoin búra rekordy a za posledných 7 dní narástol o stovky percent

Muskov Neuralink desí aj uznávaných odborníkov. Je tu riziko, že bude predávať myšlienky ľudí

Bitcoinová horúčka eskaluje. Slováci sa vrhajú do kryptomien, od začiatku roka ich nakúpili za desiatky miliónov

Masové sledovanie ľudí a sociálny kredit dostane v EÚ „červenú“. Únia chce regulovať kritické dopady využitia umelej inteligencie
Články, ktoré hýbu svetom

Je Elon Musk agentom americkej tajnej služby? Vymýšľa si ďalšie bizarnosti v úradných dokumentoch

Rivian to rozbieha vo veľkom, elektrickú dodávku už začal využívať veľký investor aj Amazon na doručovanie balíkov

Obchod Kompot uviedol na trh výnimočnú novinku: Bezcennú handru Hëgër. Predávať ju ale nebude

Projekt „slovenského Dubaja” stále žije. Investor lyžiarskej haly na Donovaloch sa rozhodol súdiť
