Singulaariarvohajotelma ja sen sovelluksia data-analytiikassa ja koneoppimisessa

Tässä tutkielmassa perehdytään singulaariarvohajotelmaan sekä sen hyödyntämiseen data-analytiikan ja koneoppimisen näkökulmasta. Singulaariarvohajotelma on olemassa mille tahansa matriisille A muodossa A = UΣV^T, missä U ja V ovat ortonormaaleja matriiseja, ja Σ on diagonaalimatriisi. Matriisin Σ di...

Full description

Bibliographic Details
Main Author: Ilves, Tarmo
Other Authors: Faculty of Sciences, Matemaattis-luonnontieteellinen tiedekunta, Department of Mathematics and Statistics, Matematiikan ja tilastotieteen laitos, University of Jyväskylä, Jyväskylän yliopisto
Format: Master's thesis
Language:fin
Published: 2024
Subjects:
Online Access: https://jyx.jyu.fi/handle/123456789/95628
_version_ 1826225759632490496
author Ilves, Tarmo
author2 Faculty of Sciences Matemaattis-luonnontieteellinen tiedekunta Department of Mathematics and Statistics Matematiikan ja tilastotieteen laitos University of Jyväskylä Jyväskylän yliopisto
author_facet Ilves, Tarmo Faculty of Sciences Matemaattis-luonnontieteellinen tiedekunta Department of Mathematics and Statistics Matematiikan ja tilastotieteen laitos University of Jyväskylä Jyväskylän yliopisto Ilves, Tarmo Faculty of Sciences Matemaattis-luonnontieteellinen tiedekunta Department of Mathematics and Statistics Matematiikan ja tilastotieteen laitos University of Jyväskylä Jyväskylän yliopisto
author_sort Ilves, Tarmo
datasource_str_mv jyx
description Tässä tutkielmassa perehdytään singulaariarvohajotelmaan sekä sen hyödyntämiseen data-analytiikan ja koneoppimisen näkökulmasta. Singulaariarvohajotelma on olemassa mille tahansa matriisille A muodossa A = UΣV^T, missä U ja V ovat ortonormaaleja matriiseja, ja Σ on diagonaalimatriisi. Matriisin Σ diagonaalialkioita kutsutaan matriisin A singulaariarvoiksi, ja ne on järjestetty suuruudeltaan laskevaan järjestykseen. Singulaariarvohajotelma ja singulaariarvot mahdollistavat erinomaisen menetelmän alkuperäisen matriisin approksimoimiseksi. Matriisilla on aina astettaan r vastaava määrä singulaariarvoja, ja valitsemalla näistä vain k < r suurinta ja asettamalla loput nolliksi saadaan Eckartin ja Youngin lauseen nojalla paras astetta k oleva approksimaatio alkuperäisestä matriisista. Alempiasteisen matriisiapproksimaation hyödyntäminen on laskentatehokkuuden lisäksi myös datan yksinkertaistamisen kannalta houkuttelevaa, etenkin kun kyseessä on approksimaatioista paras. Visuaalisin esimerkki parhaasta approksimaatiosta alempiasteisella matriisilla ilmenee tarkastelemalla digitaalisia valokuvia. Digikuvat voidaan esittää matriisimuodossa, mikä mahdollistaa singulaariarvohajotelman käytön. Suurimmat singulaariarvot sisältävät pääpiirteet alkuperäisestä kuvasta, ja pienimmät unohdettaessa saadaan alkuperäistä kuvaa muistuttava approksimaatio, joka vie vähemmän tallennustilaa riippuen valittujen singulaariarvojen määrästä. Valittava k vaikuttaa tallennustilan lisäksi kuvanlaatuun. Kuvanpakkauksen lisäksi singulaariarvohajotelmaa voidaan soveltaa digitaalisissa palveluissa kerättävän tiedon analysoimiseen, jolloin pystytään tuottamaan käyttäjille personoituja suosituksia. Suosittelujärjestelmien perusideana on tarjota mahdollisimman hyviä suosituksia käyttäjän toiminnan, kuten tuotearvostelujen perusteella. Ihmisten tekemiä arvosteluja esimerkiksi elokuvista voidaan käsitellä suurena datamatriisina, jolloin singulaariarvohajotelmaa on mahdollista käyttää. Suosittelujärjestelmän rakentamisessa puhutaan yleisesti minimointiongelmasta, jossa halutaan etsiä lähimpänä alkuperäistä datamatriisia R oleva matriisi XY, missä X kuvastaa käyttäjäpiirteitä ja Y tässä tapauksessa elokuviin liittyviä piirteitä. Koska kaikki ihmiset eivät arvostele kaikkia elokuvia, täytyy matriisin tyhjät alkiot ensin alustaa, esimerkiksi käyttäjäkohtaisilla keskiarvoilla. Alustamisella on paljon vaikutusta singulaariarvohajotelmalla saataviin approksimaatioihin ja elokuvasuosituksiin. Tyypillisesti suositusten toimivuutta testataan mallin koulutus- eli opetusjoukosta erillisellä testijoukolla, jota ei ole käytetty approksimaation tekemiseen. Approksimaation tarkkuutta voi parantaa lisäämällä alkuperäiseen minimointiongelmaan regularisointitermin, jolloin paras approksimaatio saadaan vähentämällä singulaariarvoista regularisointikerroin γ ≥ 0. Toinen numeerinen tapa on iteroimalla laskea singulaariarvohajotelma useaan kertaan, ja päivittää ainoastaan puuttuneet arvot kullakin iterointikierroksella saatavilla uusilla approksimaatioilla.
first_indexed 2024-09-11T08:49:14Z
format Pro gradu
free_online_boolean 1
fullrecord [{"key": "dc.contributor.advisor", "value": "\u00c4kkinen, Tuomo", "language": null, "element": "contributor", "qualifier": "advisor", "schema": "dc"}, {"key": "dc.contributor.author", "value": "Ilves, Tarmo", "language": "", "element": "contributor", "qualifier": "author", "schema": "dc"}, {"key": "dc.date.accessioned", "value": "2024-06-07T07:09:04Z", "language": null, "element": "date", "qualifier": "accessioned", "schema": "dc"}, {"key": "dc.date.available", "value": "2024-06-07T07:09:04Z", "language": null, "element": "date", "qualifier": "available", "schema": "dc"}, {"key": "dc.date.issued", "value": "2024", "language": null, "element": "date", "qualifier": "issued", "schema": "dc"}, {"key": "dc.identifier.uri", "value": "https://jyx.jyu.fi/handle/123456789/95628", "language": null, "element": "identifier", "qualifier": "uri", "schema": "dc"}, {"key": "dc.description.abstract", "value": "T\u00e4ss\u00e4 tutkielmassa perehdyt\u00e4\u00e4n singulaariarvohajotelmaan sek\u00e4 sen hy\u00f6dynt\u00e4miseen data-analytiikan ja koneoppimisen n\u00e4k\u00f6kulmasta. Singulaariarvohajotelma on olemassa mille tahansa matriisille A muodossa A = U\u03a3V^T, miss\u00e4 U ja V ovat ortonormaaleja matriiseja, ja \u03a3 on diagonaalimatriisi. Matriisin \u03a3 diagonaalialkioita kutsutaan matriisin A singulaariarvoiksi, ja ne on j\u00e4rjestetty suuruudeltaan laskevaan j\u00e4rjestykseen.\n\nSingulaariarvohajotelma ja singulaariarvot mahdollistavat erinomaisen menetelm\u00e4n alkuper\u00e4isen matriisin approksimoimiseksi. Matriisilla on aina astettaan r vastaava m\u00e4\u00e4r\u00e4 singulaariarvoja, ja valitsemalla n\u00e4ist\u00e4 vain k < r suurinta ja asettamalla loput nolliksi saadaan Eckartin ja Youngin lauseen nojalla paras astetta k oleva approksimaatio alkuper\u00e4isest\u00e4 matriisista. Alempiasteisen matriisiapproksimaation hy\u00f6dynt\u00e4minen on laskentatehokkuuden lis\u00e4ksi my\u00f6s datan yksinkertaistamisen kannalta houkuttelevaa, etenkin kun kyseess\u00e4 on approksimaatioista paras.\n\nVisuaalisin esimerkki parhaasta approksimaatiosta alempiasteisella matriisilla ilmenee tarkastelemalla digitaalisia valokuvia. Digikuvat voidaan esitt\u00e4\u00e4 matriisimuodossa, mik\u00e4 mahdollistaa singulaariarvohajotelman k\u00e4yt\u00f6n. Suurimmat singulaariarvot sis\u00e4lt\u00e4v\u00e4t p\u00e4\u00e4piirteet alkuper\u00e4isest\u00e4 kuvasta, ja pienimm\u00e4t unohdettaessa saadaan alkuper\u00e4ist\u00e4 kuvaa muistuttava approksimaatio, joka vie v\u00e4hemm\u00e4n tallennustilaa riippuen valittujen singulaariarvojen m\u00e4\u00e4r\u00e4st\u00e4. Valittava k vaikuttaa tallennustilan lis\u00e4ksi kuvanlaatuun.\n\nKuvanpakkauksen lis\u00e4ksi singulaariarvohajotelmaa voidaan soveltaa digitaalisissa palveluissa ker\u00e4tt\u00e4v\u00e4n tiedon analysoimiseen, jolloin pystyt\u00e4\u00e4n tuottamaan k\u00e4ytt\u00e4jille personoituja suosituksia. Suositteluj\u00e4rjestelmien perusideana on tarjota mahdollisimman hyvi\u00e4 suosituksia k\u00e4ytt\u00e4j\u00e4n toiminnan, kuten tuotearvostelujen perusteella. Ihmisten tekemi\u00e4 arvosteluja esimerkiksi elokuvista voidaan k\u00e4sitell\u00e4 suurena datamatriisina, jolloin singulaariarvohajotelmaa on mahdollista k\u00e4ytt\u00e4\u00e4. \n\nSuositteluj\u00e4rjestelm\u00e4n rakentamisessa puhutaan yleisesti minimointiongelmasta, jossa halutaan etsi\u00e4 l\u00e4himp\u00e4n\u00e4 alkuper\u00e4ist\u00e4 datamatriisia R oleva matriisi XY, miss\u00e4 X kuvastaa k\u00e4ytt\u00e4j\u00e4piirteit\u00e4 ja Y t\u00e4ss\u00e4 tapauksessa elokuviin liittyvi\u00e4 piirteit\u00e4. Koska kaikki ihmiset eiv\u00e4t arvostele kaikkia elokuvia, t\u00e4ytyy matriisin tyhj\u00e4t alkiot ensin alustaa, esimerkiksi k\u00e4ytt\u00e4j\u00e4kohtaisilla keskiarvoilla. Alustamisella on paljon vaikutusta singulaariarvohajotelmalla saataviin approksimaatioihin ja elokuvasuosituksiin. Tyypillisesti suositusten toimivuutta testataan mallin koulutus- eli opetusjoukosta erillisell\u00e4 testijoukolla, jota ei ole k\u00e4ytetty approksimaation tekemiseen. Approksimaation tarkkuutta voi parantaa lis\u00e4\u00e4m\u00e4ll\u00e4 alkuper\u00e4iseen minimointiongelmaan regularisointitermin, jolloin paras approksimaatio saadaan v\u00e4hent\u00e4m\u00e4ll\u00e4 singulaariarvoista regularisointikerroin \u03b3 \u2265 0. Toinen numeerinen tapa on iteroimalla laskea singulaariarvohajotelma useaan kertaan, ja p\u00e4ivitt\u00e4\u00e4 ainoastaan puuttuneet arvot kullakin iterointikierroksella saatavilla uusilla approksimaatioilla.", "language": "fi", "element": "description", "qualifier": "abstract", "schema": "dc"}, {"key": "dc.description.provenance", "value": "Submitted by Paivi Vuorio (paelvuor@jyu.fi) on 2024-06-07T07:09:04Z\nNo. of bitstreams: 0", "language": "en", "element": "description", "qualifier": "provenance", "schema": "dc"}, {"key": "dc.description.provenance", "value": "Made available in DSpace on 2024-06-07T07:09:04Z (GMT). No. of bitstreams: 0\n Previous issue date: 2024", "language": "en", "element": "description", "qualifier": "provenance", "schema": "dc"}, {"key": "dc.format.extent", "value": "56", "language": "", "element": "format", "qualifier": "extent", "schema": "dc"}, {"key": "dc.language.iso", "value": "fin", "language": null, "element": "language", "qualifier": "iso", "schema": "dc"}, {"key": "dc.rights", "value": "In Copyright", "language": "en", "element": "rights", "qualifier": null, "schema": "dc"}, {"key": "dc.subject.other", "value": "singulaariarvohajotelma", "language": "", "element": "subject", "qualifier": "other", "schema": "dc"}, {"key": "dc.subject.other", "value": "data-analytiikka", "language": "", "element": "subject", "qualifier": "other", "schema": "dc"}, {"key": "dc.subject.other", "value": "kuvanpakkaus", "language": "", "element": "subject", "qualifier": "other", "schema": "dc"}, {"key": "dc.title", "value": "Singulaariarvohajotelma ja sen sovelluksia data-analytiikassa ja koneoppimisessa", "language": "", "element": "title", "qualifier": null, "schema": "dc"}, {"key": "dc.type", "value": "master thesis", "language": null, "element": "type", "qualifier": null, "schema": "dc"}, {"key": "dc.identifier.urn", "value": "URN:NBN:fi:jyu-202406074390", "language": null, "element": "identifier", "qualifier": "urn", "schema": "dc"}, {"key": "dc.type.ontasot", "value": "Master\u2019s thesis", "language": "en", "element": "type", "qualifier": "ontasot", "schema": "dc"}, {"key": "dc.type.ontasot", "value": "Pro gradu -tutkielma", "language": "fi", "element": "type", "qualifier": "ontasot", "schema": "dc"}, {"key": "dc.contributor.faculty", "value": "Faculty of Sciences", "language": "en", "element": "contributor", "qualifier": "faculty", "schema": "dc"}, {"key": "dc.contributor.faculty", "value": "Matemaattis-luonnontieteellinen tiedekunta", "language": "fi", "element": "contributor", "qualifier": "faculty", "schema": "dc"}, {"key": "dc.contributor.department", "value": "Department of Mathematics and Statistics", "language": "en", "element": "contributor", "qualifier": "department", "schema": "dc"}, {"key": "dc.contributor.department", "value": "Matematiikan ja tilastotieteen laitos", "language": "fi", "element": "contributor", "qualifier": "department", "schema": "dc"}, {"key": "dc.contributor.organization", "value": "University of Jyv\u00e4skyl\u00e4", "language": "en", "element": "contributor", "qualifier": "organization", "schema": "dc"}, {"key": "dc.contributor.organization", "value": "Jyv\u00e4skyl\u00e4n yliopisto", "language": "fi", "element": "contributor", "qualifier": "organization", "schema": "dc"}, {"key": "dc.subject.discipline", "value": "Mathematics", "language": "en", "element": "subject", "qualifier": "discipline", "schema": "dc"}, {"key": "dc.subject.discipline", "value": "Matematiikka", "language": "fi", "element": "subject", "qualifier": "discipline", "schema": "dc"}, {"key": "yvv.contractresearch.funding", "value": "0", "language": "", "element": "contractresearch", "qualifier": "funding", "schema": "yvv"}, {"key": "dc.type.coar", "value": "http://purl.org/coar/resource_type/c_bdcc", "language": null, "element": "type", "qualifier": "coar", "schema": "dc"}, {"key": "dc.rights.accesslevel", "value": "openAccess", "language": null, "element": "rights", "qualifier": "accesslevel", "schema": "dc"}, {"key": "dc.type.publication", "value": "masterThesis", "language": null, "element": "type", "qualifier": "publication", "schema": "dc"}, {"key": "dc.subject.oppiainekoodi", "value": "4041", "language": null, "element": "subject", "qualifier": "oppiainekoodi", "schema": "dc"}, {"key": "dc.subject.yso", "value": "koneoppiminen", "language": null, "element": "subject", "qualifier": "yso", "schema": "dc"}, {"key": "dc.subject.yso", "value": "suositteluj\u00e4rjestelm\u00e4t", "language": null, "element": "subject", "qualifier": "yso", "schema": "dc"}, {"key": "dc.subject.yso", "value": "matematiikka", "language": null, "element": "subject", "qualifier": "yso", "schema": "dc"}, {"key": "dc.subject.yso", "value": "matriisit", "language": null, "element": "subject", "qualifier": "yso", "schema": "dc"}, {"key": "dc.subject.yso", "value": "approksimointi", "language": null, "element": "subject", "qualifier": "yso", "schema": "dc"}, {"key": "dc.subject.yso", "value": "matriisilaskenta", "language": null, "element": "subject", "qualifier": "yso", "schema": "dc"}, {"key": "dc.subject.yso", "value": "lineaarialgebra", "language": null, "element": "subject", "qualifier": "yso", "schema": "dc"}, {"key": "dc.rights.url", "value": "https://rightsstatements.org/page/InC/1.0/", "language": null, "element": "rights", "qualifier": "url", "schema": "dc"}]
id jyx.123456789_95628
language fin
last_indexed 2025-02-18T10:56:15Z
main_date 2024-01-01T00:00:00Z
main_date_str 2024
online_boolean 1
online_urls_str_mv {"url":"https:\/\/jyx.jyu.fi\/bitstreams\/ef81906d-7806-4e11-b7d1-69908e7c7282\/download","text":"URN:NBN:fi:jyu-202406074390.pdf","source":"jyx","mediaType":"application\/pdf"}
publishDate 2024
record_format qdc
source_str_mv jyx
spellingShingle Ilves, Tarmo Singulaariarvohajotelma ja sen sovelluksia data-analytiikassa ja koneoppimisessa singulaariarvohajotelma data-analytiikka kuvanpakkaus Mathematics Matematiikka 4041 koneoppiminen suosittelujärjestelmät matematiikka matriisit approksimointi matriisilaskenta lineaarialgebra
title Singulaariarvohajotelma ja sen sovelluksia data-analytiikassa ja koneoppimisessa
title_full Singulaariarvohajotelma ja sen sovelluksia data-analytiikassa ja koneoppimisessa
title_fullStr Singulaariarvohajotelma ja sen sovelluksia data-analytiikassa ja koneoppimisessa Singulaariarvohajotelma ja sen sovelluksia data-analytiikassa ja koneoppimisessa
title_full_unstemmed Singulaariarvohajotelma ja sen sovelluksia data-analytiikassa ja koneoppimisessa Singulaariarvohajotelma ja sen sovelluksia data-analytiikassa ja koneoppimisessa
title_short Singulaariarvohajotelma ja sen sovelluksia data-analytiikassa ja koneoppimisessa
title_sort singulaariarvohajotelma ja sen sovelluksia data analytiikassa ja koneoppimisessa
title_txtP Singulaariarvohajotelma ja sen sovelluksia data-analytiikassa ja koneoppimisessa
topic singulaariarvohajotelma data-analytiikka kuvanpakkaus Mathematics Matematiikka 4041 koneoppiminen suosittelujärjestelmät matematiikka matriisit approksimointi matriisilaskenta lineaarialgebra
topic_facet 4041 Matematiikka Mathematics approksimointi data-analytiikka koneoppiminen kuvanpakkaus lineaarialgebra matematiikka matriisilaskenta matriisit singulaariarvohajotelma suosittelujärjestelmät
url https://jyx.jyu.fi/handle/123456789/95628 http://www.urn.fi/URN:NBN:fi:jyu-202406074390
work_keys_str_mv AT ilvestarmo singulaariarvohajotelmajasensovelluksiadataanalytiikassajakoneoppimisessa