Summary: | Tutkielmassa tutustutaan ryhmittelyn perusteisiin, todennäköisyysmallipohjaisen sekä ei-parametrisen datan klusterointiin ja menetelmiin. Klusterointimenetelmistä käydään läpi: EM-algoritmi, k-means, k-medoids, k-modes ja k-prototypes. Tutkitaan millaisendatan käsittelyyn menetelmät soveltuvat ja miksi juuri niitä hyödynnetään ryhmittelyssä.
The point of this study is to focus on the basics of clustering, probability model-based approaches and non-parametric approaches. The clustering methods that this study focuses on are: EM-algorithm, k-means, k-medoids, k-modes and k-prototypes. This study also focuses on how these methods are applied in clustering of data and why they are used.
|