MuZero ja mallipohjainen vahvistusoppiminen

Tutkielmassa pyritään selvittämään, mitä mallipohjainen vahvistusoppiminen tarkoittaa, ja kuinka sitä hyödynnetään MuZero-nimisen tekoälyn algoritmissa. MuZeroa on testattu menestyksekkäästi sekä klassisissa lautapeleissä, että visuaalisesti monimutkaisissa Atari –peleissä. MuZero yhdistää toiminnas...

Full description

Bibliographic Details
Main Author:	Leinonen, Hertta
Other Authors:	Informaatioteknologian tiedekunta, Faculty of Information Technology, Informaatioteknologia, Information Technology, Jyväskylän yliopisto, University of Jyväskylä
Format:	Bachelor's thesis
Language:	fin
Published:	2021
Subjects:	MuZero syväoppiminen mallipohjainen vahvistusoppiminen Monte Carlo -puuhaku DeepMind Tietotekniikka Mathematical Information Technology 602 tekoäly algoritmit Monte Carlo -menetelmät tietotekniikka pelit koneoppiminen lautapelit
Online Access:	https://jyx.jyu.fi/handle/123456789/75464

Internet

https://jyx.jyu.fi/handle/123456789/75464

MuZero ja mallipohjainen vahvistusoppiminen

Internet

Similar Items