Klassisten ja mallipohjaisten ordinaatiomenetelmien vertailu mikrobiaineistojen analysoinnissa

Mikrobiaineistot ovat ekologisia runsausaineistoja, jotka sisältävät tietoa biologisten näytteiden mikrobiomeista. Mikrobiaineistojen analysointi on usein haastavaa, sillä aineistot ovat lähes aina suuriulotteisia. Muita mikrobiaineistoille tyypillisiä piirteitä ovat harvuus ja ylihajonta. Suuriulot...

Full description

Bibliographic Details
Main Author: Anttila, Aapo
Other Authors: Matemaattis-luonnontieteellinen tiedekunta, Faculty of Sciences, Matematiikan ja tilastotieteen laitos, Department of Mathematics and Statistics, Jyväskylän yliopisto, University of Jyväskylä
Format: Master's thesis
Language:fin
Published: 2024
Subjects:
Online Access: https://jyx.jyu.fi/handle/123456789/96893
Description
Summary:Mikrobiaineistot ovat ekologisia runsausaineistoja, jotka sisältävät tietoa biologisten näytteiden mikrobiomeista. Mikrobiaineistojen analysointi on usein haastavaa, sillä aineistot ovat lähes aina suuriulotteisia. Muita mikrobiaineistoille tyypillisiä piirteitä ovat harvuus ja ylihajonta. Suuriulotteisuudesta johtuen mikrobiaineistojen tutkimiseen on usein käytetty ulottuvuuksia vähentäviä ordinaatiomenetelmiä. Ordinaatiomenetelmien avulla moniulotteisen aineiston sisältämä tieto voidaan esittää kahdessa ulottuvuudessa. Tässä tutkielmassa on tavoitteena vertailla kahta mallipohjaista menetelmää – kopula-ordinaatiomenetelmää ja yleistettyä lineaarista latenttimuuttujamenetelmää – klassisiin ordinaatiomenetelmiin kuten pääkomponenttianalyysiin ja ei-metriseen moniulotteiseen skaalaukseen. Menetelmien vertailu tehtiin simulointikokeiden avulla, joissa aineistoja generoitiin eri menetelmillä. Simuloitujen aineistojen mallina käytettiin oikeaa, Ukrainan Tšernobylin alueelta kerättyä aineistoa. Alueelta pyydystettiin metsämyyriä, joiden suolten mikrobiomeja mitattiin sekvensointimenetelmällä. Aineiston myyrät oli pyydystetty neljästä eri kohteesta, joista kaksi oli säteilyn saastuttamia ja kaksi saastumattomia. Simulointikokeiden tulokset eivät antaneet yksiselitteistä vastausta siihen, mitkä ordinaatiomenetelmät toimivat parhaiten mikrobiaineistojen analysoimiseen. Eri menetelmät tulkitsevat aineiston sisältämän informaation eri tavoin, joten aineiston generointitapa vaikuttaa siihen, miten hyvin kukin menetelmä toimii. Tulokset osoittivat, että jakaumaperheen tai muunnoksen valinnalla – riippuen menetelmästä – on merkitystä menetelmän toimivuuden kannalta.