Logistisen regressiomallin soveltaminen ekologisen tilan ennustamiseen

Tutkielmassa on tarkoitus selvittää vesimuodostumien kunnostustarvetta logistisella regressiomallilla. Vaste eli kunnostustarve on muunnos alkuperäisen aineiston viisiportaisesta ekologinen tila -muuttujasta. Haluttiin selvittää, voiko sitä ennustaa aineiston rekisterimuuttujilla, koska nämä ovat he...

Full description

Bibliographic Details
Main Author: Lehtonen, Eero
Other Authors: Faculty of Sciences, Matemaattis-luonnontieteellinen tiedekunta, Department of Mathematics and Statistics, Matematiikan ja tilastotieteen laitos, University of Jyväskylä, Jyväskylän yliopisto
Format: Master's thesis
Language:fin
Published: 2014
Subjects:
Online Access: https://jyx.jyu.fi/handle/123456789/95381
_version_ 1826225716034797568
author Lehtonen, Eero
author2 Faculty of Sciences Matemaattis-luonnontieteellinen tiedekunta Department of Mathematics and Statistics Matematiikan ja tilastotieteen laitos University of Jyväskylä Jyväskylän yliopisto
author_facet Lehtonen, Eero Faculty of Sciences Matemaattis-luonnontieteellinen tiedekunta Department of Mathematics and Statistics Matematiikan ja tilastotieteen laitos University of Jyväskylä Jyväskylän yliopisto Lehtonen, Eero Faculty of Sciences Matemaattis-luonnontieteellinen tiedekunta Department of Mathematics and Statistics Matematiikan ja tilastotieteen laitos University of Jyväskylä Jyväskylän yliopisto
author_sort Lehtonen, Eero
datasource_str_mv jyx
description Tutkielmassa on tarkoitus selvittää vesimuodostumien kunnostustarvetta logistisella regressiomallilla. Vaste eli kunnostustarve on muunnos alkuperäisen aineiston viisiportaisesta ekologinen tila -muuttujasta. Haluttiin selvittää, voiko sitä ennustaa aineiston rekisterimuuttujilla, koska nämä ovat helposti saatavilla. Koska aineistossa oli paljon puuttuvaa tietoa, käytettiin sen imputoimiseen moni-imputointia. Kaksi oleellista asiaa imputoinnin toteutuksen kannalta olivat, mitä muuttujia käytetään toisten muuttujien imputointiin ja mitä imputointimenetelmiä mihinkin muuttujaan sovelletaan. R-ohjelmiston mice-funktio tarjoaa vaihtoehtoja näiden ratkaisemiseen. Tutkimusongelmaa eli sitä, mitä muuttujia kunnostustarpeen ennustamiseen kannattaa käyttää, selvitettiin siten, että aineistoon sovitettiin erilaisia malleja, joita vertailtiin useilla kriteereillä. Esimerkiksi mallin antamaa tulosta siitä, tarvitseeko vesimuodostumaa kunnostaa, verrattiin todelliseen kunnostustarpeeseen, mikä oli tässä aineistossa tiedossa. Oleellista oli löytää ne rekisterimuuttujat, jotka parhaiten ennustavat kunnostustarvetta. Imputointien perusteella kunnostustarpeen ennustamiseen kannattaa käyttää seuraavia muuttujia: leveysaste, keskisyvyys, suurin syvyys, kunnan pinta- ala, kunnan väkiluku, piiri, korkeus merenpinnasta, maatalousmaan osuus, suuralue Helsinki, suuralue pohjoinen, suuralue etelä, valuma-alueen peltoala ja valuma-alueen suhteellinen peltopinta-ala. Lisäksi kannattaa käyttää leveysasteen ja maatalousmaan osuuden yhteisvaikutusta. Luokitteluvirhe imputoiduille aineistoille on vielä 11.6 % ja useimmiten vielä niin päin, että malli ei löydä niitä vesimuodostumia, joilla on kunnostustarvetta. Jopa 52.5 % vesimuodostumista, jotka olivat kunnostustarpeessa, jäi löytämättä. Toisaalta toisin päin luokitteluvirhe oli parempi. Kunnostustarvetta ennustettiin 3.2 %:ssa tapauksia silloin, kun sitä ei ollut.
first_indexed 2024-05-31T20:00:36Z
format Pro gradu
free_online_boolean 1
fullrecord [{"key": "dc.contributor.advisor", "value": "K\u00e4rkk\u00e4inen, Salme", "language": null, "element": "contributor", "qualifier": "advisor", "schema": "dc"}, {"key": "dc.contributor.advisor", "value": "H\u00f6gmander, Harri", "language": null, "element": "contributor", "qualifier": "advisor", "schema": "dc"}, {"key": "dc.contributor.author", "value": "Lehtonen, Eero", "language": "", "element": "contributor", "qualifier": "author", "schema": "dc"}, {"key": "dc.date.accessioned", "value": "2024-05-31T05:34:50Z", "language": null, "element": "date", "qualifier": "accessioned", "schema": "dc"}, {"key": "dc.date.available", "value": "2024-05-31T05:34:50Z", "language": null, "element": "date", "qualifier": "available", "schema": "dc"}, {"key": "dc.date.issued", "value": "2014", "language": null, "element": "date", "qualifier": "issued", "schema": "dc"}, {"key": "dc.identifier.uri", "value": "https://jyx.jyu.fi/handle/123456789/95381", "language": null, "element": "identifier", "qualifier": "uri", "schema": "dc"}, {"key": "dc.description.abstract", "value": "Tutkielmassa on tarkoitus selvitt\u00e4\u00e4 vesimuodostumien kunnostustarvetta logistisella regressiomallilla. Vaste eli kunnostustarve on muunnos alkuper\u00e4isen\naineiston viisiportaisesta ekologinen tila -muuttujasta. Haluttiin selvitt\u00e4\u00e4,\nvoiko sit\u00e4 ennustaa aineiston rekisterimuuttujilla, koska n\u00e4m\u00e4 ovat helposti\nsaatavilla.\nKoska aineistossa oli paljon puuttuvaa tietoa, k\u00e4ytettiin sen imputoimiseen moni-imputointia. Kaksi oleellista asiaa imputoinnin toteutuksen kannalta olivat, mit\u00e4 muuttujia k\u00e4ytet\u00e4\u00e4n toisten muuttujien imputointiin ja\nmit\u00e4 imputointimenetelmi\u00e4 mihinkin muuttujaan sovelletaan. R-ohjelmiston\nmice-funktio tarjoaa vaihtoehtoja n\u00e4iden ratkaisemiseen. Tutkimusongelmaa\neli sit\u00e4, mit\u00e4 muuttujia kunnostustarpeen ennustamiseen kannattaa k\u00e4ytt\u00e4\u00e4,\nselvitettiin siten, ett\u00e4 aineistoon sovitettiin erilaisia malleja, joita vertailtiin\nuseilla kriteereill\u00e4. Esimerkiksi mallin antamaa tulosta siit\u00e4, tarvitseeko vesimuodostumaa kunnostaa, verrattiin todelliseen kunnostustarpeeseen, mik\u00e4\noli t\u00e4ss\u00e4 aineistossa tiedossa. Oleellista oli l\u00f6yt\u00e4\u00e4 ne rekisterimuuttujat, jotka\nparhaiten ennustavat kunnostustarvetta.\nImputointien perusteella kunnostustarpeen ennustamiseen kannattaa k\u00e4ytt\u00e4\u00e4 seuraavia muuttujia: leveysaste, keskisyvyys, suurin syvyys, kunnan pinta-\nala, kunnan v\u00e4kiluku, piiri, korkeus merenpinnasta, maatalousmaan osuus,\nsuuralue Helsinki, suuralue pohjoinen, suuralue etel\u00e4, valuma-alueen peltoala\nja valuma-alueen suhteellinen peltopinta-ala. Lis\u00e4ksi kannattaa k\u00e4ytt\u00e4\u00e4 leveysasteen ja maatalousmaan osuuden yhteisvaikutusta. Luokitteluvirhe imputoiduille aineistoille on viel\u00e4 11.6 % ja useimmiten viel\u00e4 niin p\u00e4in, ett\u00e4\nmalli ei l\u00f6yd\u00e4 niit\u00e4 vesimuodostumia, joilla on kunnostustarvetta. Jopa 52.5\n% vesimuodostumista, jotka olivat kunnostustarpeessa, j\u00e4i l\u00f6yt\u00e4m\u00e4tt\u00e4. Toisaalta toisin p\u00e4in luokitteluvirhe oli parempi. Kunnostustarvetta ennustettiin\n3.2 %:ssa tapauksia silloin, kun sit\u00e4 ei ollut.", "language": "fi", "element": "description", "qualifier": "abstract", "schema": "dc"}, {"key": "dc.description.provenance", "value": "Submitted by Paivi Vuorio (paelvuor@jyu.fi) on 2024-05-31T05:34:50Z\nNo. of bitstreams: 0", "language": "en", "element": "description", "qualifier": "provenance", "schema": "dc"}, {"key": "dc.description.provenance", "value": "Made available in DSpace on 2024-05-31T05:34:50Z (GMT). No. of bitstreams: 0\n Previous issue date: 2014", "language": "en", "element": "description", "qualifier": "provenance", "schema": "dc"}, {"key": "dc.format.extent", "value": "30", "language": "", "element": "format", "qualifier": "extent", "schema": "dc"}, {"key": "dc.language.iso", "value": "fin", "language": null, "element": "language", "qualifier": "iso", "schema": "dc"}, {"key": "dc.rights", "value": "In Copyright", "language": "en", "element": "rights", "qualifier": null, "schema": "dc"}, {"key": "dc.subject.other", "value": "ekologinen status", "language": "", "element": "subject", "qualifier": "other", "schema": "dc"}, {"key": "dc.subject.other", "value": "logistinen malli", "language": "", "element": "subject", "qualifier": "other", "schema": "dc"}, {"key": "dc.subject.other", "value": "luokitteluvirhe", "language": "", "element": "subject", "qualifier": "other", "schema": "dc"}, {"key": "dc.subject.other", "value": "moni-imputointi", "language": "", "element": "subject", "qualifier": "other", "schema": "dc"}, {"key": "dc.subject.other", "value": "puuttuva tieto", "language": "", "element": "subject", "qualifier": "other", "schema": "dc"}, {"key": "dc.subject.other", "value": "sensitiivisyysanalyysi", "language": "", "element": "subject", "qualifier": "other", "schema": "dc"}, {"key": "dc.title", "value": "Logistisen regressiomallin soveltaminen ekologisen tilan ennustamiseen", "language": "", "element": "title", "qualifier": null, "schema": "dc"}, {"key": "dc.type", "value": "master thesis", "language": null, "element": "type", "qualifier": null, "schema": "dc"}, {"key": "dc.identifier.urn", "value": "URN:NBN:fi:jyu-202405314144", "language": null, "element": "identifier", "qualifier": "urn", "schema": "dc"}, {"key": "dc.type.ontasot", "value": "Master\u2019s thesis", "language": "en", "element": "type", "qualifier": "ontasot", "schema": "dc"}, {"key": "dc.type.ontasot", "value": "Pro gradu -tutkielma", "language": "fi", "element": "type", "qualifier": "ontasot", "schema": "dc"}, {"key": "dc.contributor.faculty", "value": "Faculty of Sciences", "language": "en", "element": "contributor", "qualifier": "faculty", "schema": "dc"}, {"key": "dc.contributor.faculty", "value": "Matemaattis-luonnontieteellinen tiedekunta", "language": "fi", "element": "contributor", "qualifier": "faculty", "schema": "dc"}, {"key": "dc.contributor.department", "value": "Department of Mathematics and Statistics", "language": "en", "element": "contributor", "qualifier": "department", "schema": "dc"}, {"key": "dc.contributor.department", "value": "Matematiikan ja tilastotieteen laitos", "language": "fi", "element": "contributor", "qualifier": "department", "schema": "dc"}, {"key": "dc.contributor.organization", "value": "University of Jyv\u00e4skyl\u00e4", "language": "en", "element": "contributor", "qualifier": "organization", "schema": "dc"}, {"key": "dc.contributor.organization", "value": "Jyv\u00e4skyl\u00e4n yliopisto", "language": "fi", "element": "contributor", "qualifier": "organization", "schema": "dc"}, {"key": "dc.subject.discipline", "value": "Statistics", "language": "en", "element": "subject", "qualifier": "discipline", "schema": "dc"}, {"key": "dc.subject.discipline", "value": "Tilastotiede", "language": "fi", "element": "subject", "qualifier": "discipline", "schema": "dc"}, {"key": "yvv.contractresearch.funding", "value": "0", "language": "", "element": "contractresearch", "qualifier": "funding", "schema": "yvv"}, {"key": "dc.type.coar", "value": "http://purl.org/coar/resource_type/c_bdcc", "language": null, "element": "type", "qualifier": "coar", "schema": "dc"}, {"key": "dc.rights.accesslevel", "value": "openAccess", "language": null, "element": "rights", "qualifier": "accesslevel", "schema": "dc"}, {"key": "dc.type.publication", "value": "masterThesis", "language": null, "element": "type", "qualifier": "publication", "schema": "dc"}, {"key": "dc.subject.oppiainekoodi", "value": "4043", "language": null, "element": "subject", "qualifier": "oppiainekoodi", "schema": "dc"}, {"key": "dc.subject.yso", "value": "tilastotiede", "language": null, "element": "subject", "qualifier": "yso", "schema": "dc"}, {"key": "dc.subject.yso", "value": "ekologinen tila", "language": null, "element": "subject", "qualifier": "yso", "schema": "dc"}, {"key": "dc.rights.url", "value": "https://rightsstatements.org/page/InC/1.0/", "language": null, "element": "rights", "qualifier": "url", "schema": "dc"}]
id jyx.123456789_95381
language fin
last_indexed 2025-02-18T10:55:43Z
main_date 2014-01-01T00:00:00Z
main_date_str 2014
online_boolean 1
online_urls_str_mv {"url":"https:\/\/jyx.jyu.fi\/bitstreams\/546cd930-e1ab-42b6-bb70-c404564ad04f\/download","text":"URN:NBN:fi:jyu-202405314144.pdf","source":"jyx","mediaType":"application\/pdf"}
publishDate 2014
record_format qdc
source_str_mv jyx
spellingShingle Lehtonen, Eero Logistisen regressiomallin soveltaminen ekologisen tilan ennustamiseen ekologinen status logistinen malli luokitteluvirhe moni-imputointi puuttuva tieto sensitiivisyysanalyysi Statistics Tilastotiede 4043 tilastotiede ekologinen tila
title Logistisen regressiomallin soveltaminen ekologisen tilan ennustamiseen
title_full Logistisen regressiomallin soveltaminen ekologisen tilan ennustamiseen
title_fullStr Logistisen regressiomallin soveltaminen ekologisen tilan ennustamiseen Logistisen regressiomallin soveltaminen ekologisen tilan ennustamiseen
title_full_unstemmed Logistisen regressiomallin soveltaminen ekologisen tilan ennustamiseen Logistisen regressiomallin soveltaminen ekologisen tilan ennustamiseen
title_short Logistisen regressiomallin soveltaminen ekologisen tilan ennustamiseen
title_sort logistisen regressiomallin soveltaminen ekologisen tilan ennustamiseen
title_txtP Logistisen regressiomallin soveltaminen ekologisen tilan ennustamiseen
topic ekologinen status logistinen malli luokitteluvirhe moni-imputointi puuttuva tieto sensitiivisyysanalyysi Statistics Tilastotiede 4043 tilastotiede ekologinen tila
topic_facet 4043 Statistics Tilastotiede ekologinen status ekologinen tila logistinen malli luokitteluvirhe moni-imputointi puuttuva tieto sensitiivisyysanalyysi tilastotiede
url https://jyx.jyu.fi/handle/123456789/95381 http://www.urn.fi/URN:NBN:fi:jyu-202405314144
work_keys_str_mv AT lehtoneneero logistisenregressiomallinsoveltaminenekologisentilanennustamiseen