Vaaliennusteiden laadinta perustuen Twitter-palvelusta louhittuun dataan

Tässä tutkielmassa käsitellään Twitter-palvelusta louhitun datan hyödyntämistä vaaliennusteiden laadinnan työkaluna. Tutkielmassa esitellään ja analysoidaan tutkimuksia, joissa on louhittu ja pyritty analysoimaan Twitter-palvelun käyttäjien palveluun lähettämiä viestejä. Tutkielman tarkoituksena on...

Full description

Bibliographic Details
Main Author: Palvaila, Jaakko
Other Authors: Informaatioteknologian tiedekunta, Faculty of Information Technology, Informaatioteknologia, Information Technology, University of Jyväskylä, Jyväskylän yliopisto
Format: Bachelor's thesis
Language:fin
Published: 2017
Subjects:
Online Access: https://jyx.jyu.fi/handle/123456789/53936
Description
Summary:Tässä tutkielmassa käsitellään Twitter-palvelusta louhitun datan hyödyntämistä vaaliennusteiden laadinnan työkaluna. Tutkielmassa esitellään ja analysoidaan tutkimuksia, joissa on louhittu ja pyritty analysoimaan Twitter-palvelun käyttäjien palveluun lähettämiä viestejä. Tutkielman tarkoituksena on kertoa vastaus kysymykseen, voidaanko Twitteristä kerätyn datan pohjalta laatia vaaliennusteita. Aiempia tutkimuksia läpikäymällä esitellään twiittien louhinnan, seulonnan, analyysin ja ennusteiden laadinnan menetelmiä parhaan mahdollisen metodin löytämiseksi. Tässä tutkielmassa vertaillaan louhitun datan pohjalta tehtyjen ennusteiden tuloksia ja luotettavuutta perinteisiin, kyselytutkimuksina toteutettuihin vaalitulosennusteisiin. Lisäksi pyritään määrittämään, millä menetelmillä Twitter-datan perusteella laadittujen ennusteiden tarkkuutta voidaan parantaa, ja voidaanko Suomessakin hyödyntää Twitter-käyttäjien palveluun lähettämiä viestejä vaaliennusteiden laadinnassa. This thesis handles using data mined from Twitter as a tool in creating election forecasts. In this thesis I shall present and analyze prior studies in which Twitter users’ messages have been mined and analyzed. The aim of this thesis is to answer the question whether data collected from Twitter can be used as a basis in the process of creating election forecasts. I will present the best models for tweet mining, filtering, analysis and forecast creation by evaluating prior studies to find the best possible methods. In this thesis I will compare the results of election forecasts based on data mining to those achieved using more traditional polling methods. In addition to this I will attempt to define how the accuracy of forecasts based on Twitter data can be improved and whether it is possible to utilize Twitter users’ messages in election forecast creation in Finland as well.