Sukulaisuussuhteiden vaikutukset tyypin 1 ja 2 virheisiin ja niiden minimointi genominlaajuisissa assosiaatiokartoituksissa

Genominlaajuisilla assosiaatiokartoituksilla (genome-wide association studies, GWAS) tutkitaan assosiaatioita geno- ja fenotyyppien välillä genominlaajuisesti tilastollisin menetelmin. GWAS-tutkimusten tuloksille on monia sovelluskohteita esimerkiksi lääkekehityksessä, periytyvyyden tutkimisessa ja...

Full description

Bibliographic Details
Main Author: Väänänen, Mikko
Other Authors: Matemaattis-luonnontieteellinen tiedekunta, Faculty of Sciences, Matematiikan ja tilastotieteen laitos, Department of Mathematics and Statistics, Jyväskylän yliopisto, University of Jyväskylä
Format: Master's thesis
Language:fin
Published: 2023
Subjects:
Online Access: https://jyx.jyu.fi/handle/123456789/92112
Description
Summary:Genominlaajuisilla assosiaatiokartoituksilla (genome-wide association studies, GWAS) tutkitaan assosiaatioita geno- ja fenotyyppien välillä genominlaajuisesti tilastollisin menetelmin. GWAS-tutkimusten tuloksille on monia sovelluskohteita esimerkiksi lääkekehityksessä, periytyvyyden tutkimisessa ja geneettisten terveysriskien arvioimisessa. GWAS on tutkimusalana kuitenkin nuori ja kehittyy nopeasti, sillä vasta 2000-luvun aikana merkittävästi kehittyneet DNA:n luentamenetelmät ovat mahdollistaneet riittävän suuret tutkimusaineistot assosiaatioiden tutkimiselle genominlaajuisesti. Yksilöiden välisten sukulaisuussuhteiden on havaittu vääristävän assosiaatiotestien tuloksia GWAS-tutkimuksissa, minkä vuoksi viime vuosina on pyritty kehittämään toimivia menetelmiä vääristymien korjaamiseksi. Tässä tutkielmassa tutkitaan, miten hyvin lineaarinen sekamalli (LMM), lineaarinen regressiomalli, jossa käytetään genomitiedoista muodostettuja pääkomponentteja kovariaatteina (LMP) ja lineaarinen regressiomalli (LM) huomioivat sukulaisuussuhteita assosiaatiotesteissä. Menetelmien toimivuutta arvioidaan sillä, kuinka vähän kukin menetelmä tuottaa tyypin 1 ja 2 virheitä. Menetelmien tuottamien tyypin 1 ja 2 virheiden määriä arvioitiin soveltamalla menetelmiä simuloituihin aineistoihin. Tutkielman tulosten mukaan LMM- ja LMP-menetelmät korjaavat sukulaisuussuhteiden aiheuttamia tyypin 1 ja 2 virheitä hyvin verrattuna LM-menetelmään. LMM ei tuottanut simuloinnissa yhtään tyypin 1 virhettä ja huomattavasti vähemmän tyypin 2 virheitä kuin LM. Hyvin valitulla kovariaatteina käytettävien pääkomponenttien määrällä LMP oli LMM-menetelmän tasoa tyypin 1 ja 2 virheiden määrällä mitattuna.