Puuttuvuuden mallintaminen FINRISKI-tutkimuksessa

Puuttuva tieto on ongelma terveystutkimuksissa, koska tutkimukseen osallistujat ja ei-osallistujat usein eroavat toisistaan. Puuttuvuuden mallintaminen on tärkeää, jotta tuloksia pystyttäisiin korjaamaan ja jatkossa ottamaan mallinnettu puuttuvuus paremmin huomioon tutkimusta suunnitellessa. Myös Ka...

Full description

Bibliographic Details
Main Author: Hirvonen, Elli
Other Authors: Matemaattis-luonnontieteellinen tiedekunta, Faculty of Sciences, Matematiikan ja tilastotieteen laitos, Department of Mathematics and Statistics, University of Jyväskylä, Jyväskylän yliopisto
Format: Master's thesis
Language:fin
Published: 2017
Subjects:
Online Access: https://jyx.jyu.fi/handle/123456789/54554
Description
Summary:Puuttuva tieto on ongelma terveystutkimuksissa, koska tutkimukseen osallistujat ja ei-osallistujat usein eroavat toisistaan. Puuttuvuuden mallintaminen on tärkeää, jotta tuloksia pystyttäisiin korjaamaan ja jatkossa ottamaan mallinnettu puuttuvuus paremmin huomioon tutkimusta suunnitellessa. Myös Kansallinen FINRISKI-tutkimus kärsii puuttuvuudesta, sillä tutkimuksen osallistumisprosentti on laskenut jatkuvasti. Tutkimus on Terveyden ja hyvinvoinnin laitoksen väestötutkimussarja, jonka tavoitteena on seurata kansantauteja ja niiden riskitekijöitä Suomessa sekä tarkkailla suomalaisten terveydentilaa. Tässä työssä pyritään mallintamaan Kansallisen FINRISKI-tutkimuksen puuttuvuus tarkastelemalla, kuinka osallistumisaktiivisuus on muuttunut vuosien edetessä miehillä ja naisilla eri tutkimusalueilla. Kun tarkastellaan osallistumisaktiivisuuden muuttumista eri ihmisillä ajan kuluessa, ollaan kiinnostuneita aikamuuttujista ikä, tutkimusvuosi ja syntymävuosi. Nämä aikamuuttujat ovat matemaattisesti riippuvia toisistaan, joten niiden lisääminen malliin yhtä aikaa on hankalaa. Ikä-periodi-kohortti -analyysi pyrkii tähän, mutta vaatii vahvoja oletuksia, jotka harvoin täyttyvät. Periodi kuvaa analyysissä tutkimusvuotta ja kohortti syntymävuotta. Tässä tutkielmassa ikä-periodi-kohortti -analyysi toteutetaan osissa siten, että tehdään kolme mallia ja jokaisessa mallissa on aina kaksi aikamuuttujaa kerrallaan mukana. Tämä voidaan tehdä, sillä kun kaksi aikamuuttujaa tiedetään, kolmas voidaan laskea kahden muun avulla. Näin päästään eroon kolmen aikamuuttujan vaikutuksien identifioituvuusongelmasta. Mallien sovittamiseen käytetään additiivista logistista regressiota, joka kuuluu yleistettyihin additiivisiin malleihin. Yleistetyt additiiviset mallit ovat yleistettyjen lineaaristen mallien laajennus, missä lineaariset termit korvataan tasoittavien funktioiden summalla, jolloin epälineaarisia termejä voidaan sovittaa joustavammin. Mallit esitellään graafisesti ja jokainen malli tulkitaan erikseen. Tuloksiksi saatiin mielenkiintoisia eroja miesten ja naisten, eri ikäisten tutkittavien sekä tutkimusvuosien ja -alueiden välillä.