MuZero ja mallipohjainen vahvistusoppiminen
Tutkielmassa pyritään selvittämään, mitä mallipohjainen vahvistusoppiminen tarkoittaa, ja kuinka sitä hyödynnetään MuZero-nimisen tekoälyn algoritmissa. MuZeroa on testattu menestyksekkäästi sekä klassisissa lautapeleissä, että visuaalisesti monimutkaisissa Atari –peleissä. MuZero yhdistää toiminnas...
| Päätekijä: | |
|---|---|
| Muut tekijät: | , , , , , |
| Aineistotyyppi: | Kandityö |
| Kieli: | fin |
| Julkaistu: |
2021
|
| Aiheet: | |
| Linkit: | https://jyx.jyu.fi/handle/123456789/75464 |