Neuroverkot ja AlphaGo Zero

Tutkielmassa perehdytään AlphaGo Zeron toimintaan ja oleellisimpiin siinä käytettyihin tekniikoihin. AlphaGo Zero on tekoäly go-lautapelille, jota on pidetty tekoälyille hankalana. Tärkeä syy AlphaGo Zeron menestykseen oli käyttää neuroverkkojen ja Monte Carlo -puuhaun yhdistelmää. Löydän tälle mene...

Täydet tiedot

Bibliografiset tiedot
Päätekijä: Merikivi, Mikko
Muut tekijät: Informaatioteknologian tiedekunta, Faculty of Information Technology, Informaatioteknologia, Information Technology, Jyväskylän yliopisto, University of Jyväskylä
Aineistotyyppi: Kandityö
Kieli:fin
Julkaistu: 2019
Aiheet:
Linkit: https://jyx.jyu.fi/handle/123456789/64688
Kuvaus
Yhteenveto:Tutkielmassa perehdytään AlphaGo Zeron toimintaan ja oleellisimpiin siinä käytettyihin tekniikoihin. AlphaGo Zero on tekoäly go-lautapelille, jota on pidetty tekoälyille hankalana. Tärkeä syy AlphaGo Zeron menestykseen oli käyttää neuroverkkojen ja Monte Carlo -puuhaun yhdistelmää. Löydän tälle menetelmälle muitakin käyttökohteita. Kehitystä aikaisempaan AlphaGo-tekoälyyn nähden oli erityisesti pelaamaan oppiminen ilman ihmisten ohjausta, kahden neuroverkon yhdistäminen yhdeksi, joka antaa kaksi ulostuloa, sekä residuaalisten neuroverkkojen käyttäminen. This thesis explains how AlphaGo Zero and the most relevant of the techniques it utilizes work. AlphaGo Zero is an artificial intelligence for go, a board game that has been thought to be difficult for computers. An important reason for the success of AlphaGo Zero was how it combined neural networks and Monte Carlo tree search. I present other applications for this method as well. AlphaGo Zero had a number of improvements compared to its predecessor AlphaGo. The most important ones were that it learns without human guidance, that it combines two neural networks into one that has two outputs, and that it utilizes residual networks.