Sekaannusmatriisikorjaus ja sen vaikutus biologisiin indekseihin

Pohjaeläinten koneellinen tunnistaminen vähentäisi merkittävästi pohjaeläinten luokitteluun tarvittavaa työmäärää nykyiseen tilanteeseen verrattuna ja nopeuttaisi biologisten indeksien laskemista. Pohjaeläimistä laskettavat biologiset indeksit kertovat vesistöjen ekologisesta tilasta, joten niiden e...

Full description

Bibliographic Details
Main Author: Veistämö, Tommi
Other Authors: Matemaattis-luonnontieteellinen tiedekunta, Faculty of Sciences, Matematiikan ja tilastotieteen laitos, Department of Mathematics and Statistics, Jyväskylän yliopisto, University of Jyväskylä
Format: Master's thesis
Language:fin
Published: 2019
Subjects:
Online Access: https://jyx.jyu.fi/handle/123456789/64933
_version_ 1828193083587559424
author Veistämö, Tommi
author2 Matemaattis-luonnontieteellinen tiedekunta Faculty of Sciences Matematiikan ja tilastotieteen laitos Department of Mathematics and Statistics Jyväskylän yliopisto University of Jyväskylä
author_facet Veistämö, Tommi Matemaattis-luonnontieteellinen tiedekunta Faculty of Sciences Matematiikan ja tilastotieteen laitos Department of Mathematics and Statistics Jyväskylän yliopisto University of Jyväskylä Veistämö, Tommi Matemaattis-luonnontieteellinen tiedekunta Faculty of Sciences Matematiikan ja tilastotieteen laitos Department of Mathematics and Statistics Jyväskylän yliopisto University of Jyväskylä
author_sort Veistämö, Tommi
datasource_str_mv jyx
description Pohjaeläinten koneellinen tunnistaminen vähentäisi merkittävästi pohjaeläinten luokitteluun tarvittavaa työmäärää nykyiseen tilanteeseen verrattuna ja nopeuttaisi biologisten indeksien laskemista. Pohjaeläimistä laskettavat biologiset indeksit kertovat vesistöjen ekologisesta tilasta, joten niiden estimoiminen tarkasti on tärkeää. Koneellinen luokitteleminen aiheuttaa kuitenkin virheitä pohjaeläinten taksonomisten ryhmien tunnistamisessa, koska luokittelussa yksilö voi ominaisuuksiensa perusteella päätyä väärään taksonomiseen ryhmään. Näiden virheiden korjaamiseksi sovelletaan kolmea korjausmenetelmää: käyttäjän sekaannusmatriisikorjaus, tuottajan sekaannusmatriisikorjaus ja paras lineaarinen korjaus. Menetelmien toimivuutta tutkitaan 12 yleisen biologisen indeksin kohdalla. Tutkimuksen kohteena on luokitteluvirheen ja korjausmenetelmien vaikutus indeksien estimointiin. Sekaannusmatriisista nähdään, mihin luokkiin pohjaeläimet kuuluvat ja mihin luokkiin ne on luokiteltu. Tätä tietoa voidaan käyttää luokittelun korjaamiseen aineistoissa, joissa oikeat luokat eivät ole tiedossa. Käyttäjän sekaannusmatriisikorjaus ja tuottajan sekaannusmatriisikorjaus ovat suhteellisen yksinkertaisia menetelmiä, kun taas paras lineaarinen korjaus on mutkikkaampi, lineaarista muunnosta optimoiva menetelmä. Menetelmät korjaavat luokittelun tuloksena saatavia pohjaeläinten taksonomisten ryhmien suhteellisia osuuksia. Näitä korjattuja osuuksia käyttäen voidaan laskea halutut biologiset indeksit. Korjausten vaikutusta tutkitaan simulointikokeella, joka perustuu aikaisemmin toteutettuun pohjaeläinaineiston koneelliseen luokitteluun. Käyttäjän sekaannusmatriisikorjauksella saadaan lähes harhattomia arvoja pääosin kaikilla indekseillä. Menetelmä toimii myös, vaikka otoskoko olisi pieni ja luokittelija huonohko. Tuottajan sekaannusmatriisikorjaus ja paras lineaarinen korjaus vähentävät indeksien harhaa, mutta eivät niin hyvin kuin käyttäjän korjaus. Kaikki menetelmät eivät kuitenkaan toimi yhtä hyvin, jos sekaannusmatriisi on estimoitu erilaisesta populaatiosta kuin mihin korjausta käytetään. Tällöin paras lineaarinen korjaus on tarkin korjausmenetelmä, muttei kuitenkaan harhaton useimpien indeksien kohdalla. Käyttäjän sekaannusmatriisikorjaus on huonoin korjaus tällaisessa tapauksessa. Käyttäjän sekaannusmatriisikorjaus on suositeltava vaihtoehto luokittelusta aiheutuvan harhan korjaamiseksi. Käyttäjän sekaannusmatriisikorjaus on lähes aina tutkituista menetelmistä paras harhan vähentämiseen ja poistaa parhaimmillaan kokonaan luokittelusta aiheutuvan harhan. Tosin käyttäjän sekaannusmatriisikorjaus toimii erinomaisesti vain, jos sekaannusmatriisi on estimoitu samanlaisesta populaatiosta kuin mitä tutkitaan. Muuten paras lineaarinen korjaus on suositeltava vaihtoehto luokittelusta aiheutuvan harhan korjaamiseksi.
first_indexed 2019-08-19T08:21:30Z
format Pro gradu
free_online_boolean 1
fullrecord [{"key": "dc.contributor.advisor", "value": "K\u00e4rkk\u00e4inen, Salme", "language": "", "element": "contributor", "qualifier": "advisor", "schema": "dc"}, {"key": "dc.contributor.advisor", "value": "\u00c4rje, Johanna", "language": "", "element": "contributor", "qualifier": "advisor", "schema": "dc"}, {"key": "dc.contributor.author", "value": "Veist\u00e4m\u00f6, Tommi", "language": "", "element": "contributor", "qualifier": "author", "schema": "dc"}, {"key": "dc.date.accessioned", "value": "2019-07-02T05:08:47Z", "language": null, "element": "date", "qualifier": "accessioned", "schema": "dc"}, {"key": "dc.date.available", "value": "2019-07-02T05:08:47Z", "language": null, "element": "date", "qualifier": "available", "schema": "dc"}, {"key": "dc.date.issued", "value": "2019", "language": "", "element": "date", "qualifier": "issued", "schema": "dc"}, {"key": "dc.identifier.uri", "value": "https://jyx.jyu.fi/handle/123456789/64933", "language": null, "element": "identifier", "qualifier": "uri", "schema": "dc"}, {"key": "dc.description.abstract", "value": "Pohjael\u00e4inten koneellinen tunnistaminen v\u00e4hent\u00e4isi merkitt\u00e4v\u00e4sti pohjael\u00e4inten luokitteluun tarvittavaa ty\u00f6m\u00e4\u00e4r\u00e4\u00e4 nykyiseen tilanteeseen verrattuna ja nopeuttaisi biologisten indeksien laskemista. Pohjael\u00e4imist\u00e4 laskettavat biologiset indeksit kertovat vesist\u00f6jen ekologisesta tilasta, joten niiden estimoiminen tarkasti on t\u00e4rke\u00e4\u00e4. Koneellinen luokitteleminen aiheuttaa kuitenkin virheit\u00e4 pohjael\u00e4inten taksonomisten ryhmien tunnistamisessa, koska luokittelussa yksil\u00f6 voi ominaisuuksiensa perusteella p\u00e4\u00e4ty\u00e4 v\u00e4\u00e4r\u00e4\u00e4n taksonomiseen ryhm\u00e4\u00e4n. N\u00e4iden virheiden korjaamiseksi sovelletaan kolmea korjausmenetelm\u00e4\u00e4: k\u00e4ytt\u00e4j\u00e4n sekaannusmatriisikorjaus, tuottajan sekaannusmatriisikorjaus ja paras lineaarinen korjaus. Menetelmien toimivuutta tutkitaan 12 yleisen biologisen indeksin kohdalla. Tutkimuksen kohteena on luokitteluvirheen ja korjausmenetelmien vaikutus indeksien estimointiin. \n\nSekaannusmatriisista n\u00e4hd\u00e4\u00e4n, mihin luokkiin pohjael\u00e4imet kuuluvat ja mihin luokkiin ne on luokiteltu. T\u00e4t\u00e4 tietoa voidaan k\u00e4ytt\u00e4\u00e4 luokittelun korjaamiseen aineistoissa, joissa oikeat luokat eiv\u00e4t ole tiedossa. K\u00e4ytt\u00e4j\u00e4n sekaannusmatriisikorjaus ja tuottajan sekaannusmatriisikorjaus ovat suhteellisen yksinkertaisia menetelmi\u00e4, kun taas paras lineaarinen korjaus on mutkikkaampi, lineaarista muunnosta optimoiva menetelm\u00e4. Menetelm\u00e4t korjaavat luokittelun tuloksena saatavia pohjael\u00e4inten taksonomisten ryhmien suhteellisia osuuksia. N\u00e4it\u00e4 korjattuja osuuksia k\u00e4ytt\u00e4en voidaan laskea halutut biologiset indeksit.\n\nKorjausten vaikutusta tutkitaan simulointikokeella, joka perustuu aikaisemmin toteutettuun pohjael\u00e4inaineiston koneelliseen luokitteluun. K\u00e4ytt\u00e4j\u00e4n sekaannusmatriisikorjauksella saadaan l\u00e4hes harhattomia arvoja p\u00e4\u00e4osin kaikilla indekseill\u00e4. Menetelm\u00e4 toimii my\u00f6s, vaikka otoskoko olisi pieni ja luokittelija huonohko. Tuottajan sekaannusmatriisikorjaus ja paras lineaarinen korjaus v\u00e4hent\u00e4v\u00e4t indeksien harhaa, mutta eiv\u00e4t niin hyvin kuin k\u00e4ytt\u00e4j\u00e4n korjaus. Kaikki menetelm\u00e4t eiv\u00e4t kuitenkaan toimi yht\u00e4 hyvin, jos sekaannusmatriisi on estimoitu erilaisesta populaatiosta kuin mihin korjausta k\u00e4ytet\u00e4\u00e4n. T\u00e4ll\u00f6in paras lineaarinen korjaus on tarkin korjausmenetelm\u00e4, muttei kuitenkaan harhaton useimpien indeksien kohdalla. K\u00e4ytt\u00e4j\u00e4n sekaannusmatriisikorjaus on huonoin korjaus t\u00e4llaisessa tapauksessa. \n\nK\u00e4ytt\u00e4j\u00e4n sekaannusmatriisikorjaus on suositeltava vaihtoehto luokittelusta aiheutuvan harhan korjaamiseksi. K\u00e4ytt\u00e4j\u00e4n sekaannusmatriisikorjaus on l\u00e4hes aina tutkituista menetelmist\u00e4 paras harhan v\u00e4hent\u00e4miseen ja poistaa parhaimmillaan kokonaan luokittelusta aiheutuvan harhan. Tosin k\u00e4ytt\u00e4j\u00e4n sekaannusmatriisikorjaus toimii erinomaisesti vain, jos sekaannusmatriisi on estimoitu samanlaisesta populaatiosta kuin mit\u00e4 tutkitaan. Muuten paras lineaarinen korjaus on suositeltava vaihtoehto luokittelusta aiheutuvan harhan korjaamiseksi.", "language": "fi", "element": "description", "qualifier": "abstract", "schema": "dc"}, {"key": "dc.description.provenance", "value": "Submitted by Paivi Vuorio (paelvuor@jyu.fi) on 2019-07-02T05:08:47Z\nNo. of bitstreams: 0", "language": "en", "element": "description", "qualifier": "provenance", "schema": "dc"}, {"key": "dc.description.provenance", "value": "Made available in DSpace on 2019-07-02T05:08:47Z (GMT). No. of bitstreams: 0\n Previous issue date: 2019", "language": "en", "element": "description", "qualifier": "provenance", "schema": "dc"}, {"key": "dc.format.extent", "value": "55", "language": "", "element": "format", "qualifier": "extent", "schema": "dc"}, {"key": "dc.format.mimetype", "value": "application/pdf", "language": null, "element": "format", "qualifier": "mimetype", "schema": "dc"}, {"key": "dc.language.iso", "value": "fin", "language": null, "element": "language", "qualifier": "iso", "schema": "dc"}, {"key": "dc.rights", "value": "In Copyright", "language": "en", "element": "rights", "qualifier": null, "schema": "dc"}, {"key": "dc.subject.other", "value": "sekaannusmatriisi", "language": "", "element": "subject", "qualifier": "other", "schema": "dc"}, {"key": "dc.subject.other", "value": "sekaannusmatriisikorjaus", "language": "", "element": "subject", "qualifier": "other", "schema": "dc"}, {"key": "dc.subject.other", "value": "luokittelu", "language": "", "element": "subject", "qualifier": "other", "schema": "dc"}, {"key": "dc.subject.other", "value": "biologinen indeksi", "language": "", "element": "subject", "qualifier": "other", "schema": "dc"}, {"key": "dc.subject.other", "value": "pohjael\u00e4in", "language": "", "element": "subject", "qualifier": "other", "schema": "dc"}, {"key": "dc.title", "value": "Sekaannusmatriisikorjaus ja sen vaikutus biologisiin indekseihin", "language": "", "element": "title", "qualifier": null, "schema": "dc"}, {"key": "dc.type", "value": "master thesis", "language": null, "element": "type", "qualifier": null, "schema": "dc"}, {"key": "dc.identifier.urn", "value": "URN:NBN:fi:jyu-201907023517", "language": "", "element": "identifier", "qualifier": "urn", "schema": "dc"}, {"key": "dc.type.ontasot", "value": "Pro gradu -tutkielma", "language": "fi", "element": "type", "qualifier": "ontasot", "schema": "dc"}, {"key": "dc.type.ontasot", "value": "Master\u2019s thesis", "language": "en", "element": "type", "qualifier": "ontasot", "schema": "dc"}, {"key": "dc.contributor.faculty", "value": "Matemaattis-luonnontieteellinen tiedekunta", "language": "fi", "element": "contributor", "qualifier": "faculty", "schema": "dc"}, {"key": "dc.contributor.faculty", "value": "Faculty of Sciences", "language": "en", "element": "contributor", "qualifier": "faculty", "schema": "dc"}, {"key": "dc.contributor.department", "value": "Matematiikan ja tilastotieteen laitos", "language": "fi", "element": "contributor", "qualifier": "department", "schema": "dc"}, {"key": "dc.contributor.department", "value": "Department of Mathematics and Statistics", "language": "en", "element": "contributor", "qualifier": "department", "schema": "dc"}, {"key": "dc.contributor.organization", "value": "Jyv\u00e4skyl\u00e4n yliopisto", "language": "fi", "element": "contributor", "qualifier": "organization", "schema": "dc"}, {"key": "dc.contributor.organization", "value": "University of Jyv\u00e4skyl\u00e4", "language": "en", "element": "contributor", "qualifier": "organization", "schema": "dc"}, {"key": "dc.subject.discipline", "value": "Tilastotiede", "language": "fi", "element": "subject", "qualifier": "discipline", "schema": "dc"}, {"key": "dc.subject.discipline", "value": "Statistics", "language": "en", "element": "subject", "qualifier": "discipline", "schema": "dc"}, {"key": "yvv.contractresearch.funding", "value": "0", "language": "", "element": "contractresearch", "qualifier": "funding", "schema": "yvv"}, {"key": "dc.type.coar", "value": "http://purl.org/coar/resource_type/c_bdcc", "language": null, "element": "type", "qualifier": "coar", "schema": "dc"}, {"key": "dc.rights.accesslevel", "value": "openAccess", "language": null, "element": "rights", "qualifier": "accesslevel", "schema": "dc"}, {"key": "dc.type.publication", "value": "masterThesis", "language": null, "element": "type", "qualifier": "publication", "schema": "dc"}, {"key": "dc.subject.oppiainekoodi", "value": "4043", "language": "", "element": "subject", "qualifier": "oppiainekoodi", "schema": "dc"}, {"key": "dc.subject.yso", "value": "indeksit", "language": null, "element": "subject", "qualifier": "yso", "schema": "dc"}, {"key": "dc.subject.yso", "value": "korjaus", "language": null, "element": "subject", "qualifier": "yso", "schema": "dc"}, {"key": "dc.subject.yso", "value": "estimointi", "language": null, "element": "subject", "qualifier": "yso", "schema": "dc"}, {"key": "dc.format.content", "value": "fulltext", "language": null, "element": "format", "qualifier": "content", "schema": "dc"}, {"key": "dc.rights.url", "value": "https://rightsstatements.org/page/InC/1.0/", "language": null, "element": "rights", "qualifier": "url", "schema": "dc"}, {"key": "dc.type.okm", "value": "G2", "language": null, "element": "type", "qualifier": "okm", "schema": "dc"}]
id jyx.123456789_64933
language fin
last_indexed 2025-03-31T20:02:00Z
main_date 2019-01-01T00:00:00Z
main_date_str 2019
online_boolean 1
online_urls_str_mv {"url":"https:\/\/jyx.jyu.fi\/bitstreams\/504092b7-1b03-4b7c-ac15-899b4bcdb6ba\/download","text":"URN:NBN:fi:jyu-201907023517.pdf","source":"jyx","mediaType":"application\/pdf"}
publishDate 2019
record_format qdc
source_str_mv jyx
spellingShingle Veistämö, Tommi Sekaannusmatriisikorjaus ja sen vaikutus biologisiin indekseihin sekaannusmatriisi sekaannusmatriisikorjaus luokittelu biologinen indeksi pohjaeläin Tilastotiede Statistics 4043 indeksit korjaus estimointi
title Sekaannusmatriisikorjaus ja sen vaikutus biologisiin indekseihin
title_full Sekaannusmatriisikorjaus ja sen vaikutus biologisiin indekseihin
title_fullStr Sekaannusmatriisikorjaus ja sen vaikutus biologisiin indekseihin Sekaannusmatriisikorjaus ja sen vaikutus biologisiin indekseihin
title_full_unstemmed Sekaannusmatriisikorjaus ja sen vaikutus biologisiin indekseihin Sekaannusmatriisikorjaus ja sen vaikutus biologisiin indekseihin
title_short Sekaannusmatriisikorjaus ja sen vaikutus biologisiin indekseihin
title_sort sekaannusmatriisikorjaus ja sen vaikutus biologisiin indekseihin
title_txtP Sekaannusmatriisikorjaus ja sen vaikutus biologisiin indekseihin
topic sekaannusmatriisi sekaannusmatriisikorjaus luokittelu biologinen indeksi pohjaeläin Tilastotiede Statistics 4043 indeksit korjaus estimointi
topic_facet 4043 Statistics Tilastotiede biologinen indeksi estimointi indeksit korjaus luokittelu pohjaeläin sekaannusmatriisi sekaannusmatriisikorjaus
url https://jyx.jyu.fi/handle/123456789/64933 http://www.urn.fi/URN:NBN:fi:jyu-201907023517
work_keys_str_mv AT veistämötommi sekaannusmatriisikorjausjasenvaikutusbiologisiinindekseihin