Klusterointialgoritmien vertailu

Tutkielmassa tutustutaan ryhmittelyn perusteisiin, todennäköisyysmallipohjaisen sekä ei-parametrisen datan klusterointiin ja menetelmiin. Klusterointimenetelmistä käydään läpi: EM-algoritmi, k-means, k-medoids, k-modes ja k-prototypes. Tutkitaan millaisendatan käsittelyyn menetelmät soveltuvat ja mi...

Full description

Bibliographic Details
Main Author: Nättilä, Severi
Other Authors: Informaatioteknologian tiedekunta, Faculty of Information Technology, Informaatioteknologia, Information Technology, Jyväskylän yliopisto, University of Jyväskylä
Format: Bachelor's thesis
Language:fin
Published: 2021
Subjects:
Online Access: https://jyx.jyu.fi/handle/123456789/76413
Description
Summary:Tutkielmassa tutustutaan ryhmittelyn perusteisiin, todennäköisyysmallipohjaisen sekä ei-parametrisen datan klusterointiin ja menetelmiin. Klusterointimenetelmistä käydään läpi: EM-algoritmi, k-means, k-medoids, k-modes ja k-prototypes. Tutkitaan millaisendatan käsittelyyn menetelmät soveltuvat ja miksi juuri niitä hyödynnetään ryhmittelyssä. The point of this study is to focus on the basics of clustering, probability model-based approaches and non-parametric approaches. The clustering methods that this study focuses on are: EM-algorithm, k-means, k-medoids, k-modes and k-prototypes. This study also focuses on how these methods are applied in clustering of data and why they are used.