Kliinisen big datan laatuongelmat ja niiden syyt tietoallasympäristössä

Terveydenhuollon kliinistä tietoa ja big dataa, kuten sairauskertomustietoa, hyödynnetään enenevässä määrin toissijaisiin tarkoituksiin, kuten tutkimukseen ja tiedolla johtamiseen. Tietolähteet ovat hyvin moninaisia ja tiedon laatu alhainen, mikä hankaloittaa tiedon käyttöä. Laatuongelmiin on big da...

Full description

Bibliographic Details
Main Author: Kiianmaa, Nelli
Other Authors: Informaatioteknologian tiedekunta, Faculty of Information Technology, Informaatioteknologia, Information Technology, Jyväskylän yliopisto, University of Jyväskylä
Format: Master's thesis
Language:fin
Published: 2020
Subjects:
Online Access: https://jyx.jyu.fi/handle/123456789/72803
_version_ 1826225752172920832
author Kiianmaa, Nelli
author2 Informaatioteknologian tiedekunta Faculty of Information Technology Informaatioteknologia Information Technology Jyväskylän yliopisto University of Jyväskylä
author_facet Kiianmaa, Nelli Informaatioteknologian tiedekunta Faculty of Information Technology Informaatioteknologia Information Technology Jyväskylän yliopisto University of Jyväskylä Kiianmaa, Nelli Informaatioteknologian tiedekunta Faculty of Information Technology Informaatioteknologia Information Technology Jyväskylän yliopisto University of Jyväskylä
author_sort Kiianmaa, Nelli
datasource_str_mv jyx
description Terveydenhuollon kliinistä tietoa ja big dataa, kuten sairauskertomustietoa, hyödynnetään enenevässä määrin toissijaisiin tarkoituksiin, kuten tutkimukseen ja tiedolla johtamiseen. Tietolähteet ovat hyvin moninaisia ja tiedon laatu alhainen, mikä hankaloittaa tiedon käyttöä. Laatuongelmiin on big dataa käsittelevässä kirjallisuudessa kiinnitetty verrattain vähän huomiota. Tässä tutkimuksessa tutkittiin kliinisen big datan laatuongelmia, niiden syitä ja niihin kehitettyjä ratkaisuja tutkimuksessa ja tiedolla johtamisessa. Näkökulma oli sosiotekninen. Tutkimus toteutettiin laadullisena tapaustutkimuksena Varsinais-Suomen sairaanhoitopiirin tietoallasympäristössä ja urologian tietoal-lashankkeessa. Aineisto koostui puolistrukturoiduista haastatteluista ja julkisista dokumenteista. Analyysimenetelminä käytettiin aineisto- ja teorialähtöistä sisällönanalyysiä sekä visualisointia. Tapauskontekstissa tiedon laatuongelmia syntyy kaikissa vaiheissa potilastiedon kirjaamisesta sen pohjalta tehtyihin johtopäätöksiin asti. Laatuongelmien syyt ovat moninaisia ja kytköksissä toisiinsa. Tietoaltaan potilastietojen relevanssi ja arvo toissijaisessa käytössä on lähtökohtaisesti heikko. Syynä on potilastietojen kirjaamisen muoto ja tapa, erityisesti rakenteisen tiedon puute. Rakenteisen tiedon puuttuessa on käytettävä sairauskertomustekstiä, jonka hyödyntäminen on vaativaa. Tiedon varastointi- ja jalostusvaiheessa tiedon laatuongelmia aiheuttaa tiedon sirpaleisuus, viiteavainten ja metatiedon puute sekä monipolvinen, virhealtis jalostusprosessi. Ilman riittäviä osaamis- ja teknologiaresursseja tietoallastiedon tehokas hyödyntäminen ei ole mahdollista. Urologian tietoallashankkeessa tiedon laatuongelmia pyrittiinkin ratkaisemaan erityisesti panostamalla kliinikoiden ja it-asiantuntijoiden yhteiseen, pitkäjänteiseen kehitystyöhön. Tutkimustulokset auttavat ymmärtämään, mitkä ovat keskeisiä kehityskohteita, kun kliinisestä tiedosta pyritään jalostamaan arvoa tietoallasympäristössä. Healthcare clinical data and big data, such as electronic health record, are increasingly being utilised for secondary purposes, such as research and knowledge management. The data sources are very diverse, and of low quality, creating challenges for their use. Relatively little attention has been paid to quality problems in the big data literature. This study examined the quality problems of clinical big data, their causes, and the solutions developed in research and knowledge management. The perspective was socio technical. The study was carried out as a qualitative case study in the data lake environment of the Hospital District of Southwest Finland and in their urology data lake project. The research material consisted of semi-structured interviews and public documents. Conventional and directed content analysis and visualisation were used as analysis. In the case context, data quality problems arise at all stages from the recording of patient data to the conclusions derived. The causes of quality problems are manifold and interconnected. The relevance and value of the data lake patient data in secondary use is weak per se. This is due to the form and manner of recording patient data, especially the lack of structured information. In the absence of structured information, narrative text must be used, the utilization of which is demanding. In the data storage and processing phase, data quality problems are caused by data fragmentation, lack of reference keys and metadata, and a multi-phase, error-prone processing process. Without sufficient know-how and technology resources, effective utilisation of data lake information is not possible. The urology data lake project sought to solve data quality problems, especially by investing in the joint, long-term development work of clinicians and IT experts. The results help to understand the key areas for development in the pursuit of acquiring value from clinical data in a data lake environment.
first_indexed 2020-11-25T21:02:09Z
format Pro gradu
free_online_boolean 1
fullrecord [{"key": "dc.contributor.advisor", "value": "Koskelainen, Tiina", "language": "", "element": "contributor", "qualifier": "advisor", "schema": "dc"}, {"key": "dc.contributor.advisor", "value": "Sepp\u00e4nen, Ville", "language": "", "element": "contributor", "qualifier": "advisor", "schema": "dc"}, {"key": "dc.contributor.advisor", "value": "Taipalus, Toni", "language": "", "element": "contributor", "qualifier": "advisor", "schema": "dc"}, {"key": "dc.contributor.author", "value": "Kiianmaa, Nelli", "language": "", "element": "contributor", "qualifier": "author", "schema": "dc"}, {"key": "dc.date.accessioned", "value": "2020-11-25T11:22:24Z", "language": null, "element": "date", "qualifier": "accessioned", "schema": "dc"}, {"key": "dc.date.available", "value": "2020-11-25T11:22:24Z", "language": null, "element": "date", "qualifier": "available", "schema": "dc"}, {"key": "dc.date.issued", "value": "2020", "language": "", "element": "date", "qualifier": "issued", "schema": "dc"}, {"key": "dc.identifier.uri", "value": "https://jyx.jyu.fi/handle/123456789/72803", "language": null, "element": "identifier", "qualifier": "uri", "schema": "dc"}, {"key": "dc.description.abstract", "value": "Terveydenhuollon kliinist\u00e4 tietoa ja big dataa, kuten sairauskertomustietoa, hy\u00f6dynnet\u00e4\u00e4n enenev\u00e4ss\u00e4 m\u00e4\u00e4rin toissijaisiin tarkoituksiin, kuten tutkimukseen ja tiedolla johtamiseen. Tietol\u00e4hteet ovat hyvin moninaisia ja tiedon laatu alhainen, mik\u00e4 hankaloittaa tiedon k\u00e4ytt\u00f6\u00e4. Laatuongelmiin on big dataa k\u00e4sittelev\u00e4ss\u00e4 kirjallisuudessa kiinnitetty verrattain v\u00e4h\u00e4n huomiota. \n\nT\u00e4ss\u00e4 tutkimuksessa tutkittiin kliinisen big datan laatuongelmia, niiden syit\u00e4 ja niihin kehitettyj\u00e4 ratkaisuja tutkimuksessa ja tiedolla johtamisessa. N\u00e4k\u00f6kulma oli sosiotekninen. Tutkimus toteutettiin laadullisena tapaustutkimuksena Varsinais-Suomen sairaanhoitopiirin tietoallasymp\u00e4rist\u00f6ss\u00e4 ja urologian tietoal-lashankkeessa. Aineisto koostui puolistrukturoiduista haastatteluista ja julkisista dokumenteista. Analyysimenetelmin\u00e4 k\u00e4ytettiin aineisto- ja teorial\u00e4ht\u00f6ist\u00e4 sis\u00e4ll\u00f6nanalyysi\u00e4 sek\u00e4 visualisointia.\n\nTapauskontekstissa tiedon laatuongelmia syntyy kaikissa vaiheissa potilastiedon kirjaamisesta sen pohjalta tehtyihin johtop\u00e4\u00e4t\u00f6ksiin asti. Laatuongelmien syyt ovat moninaisia ja kytk\u00f6ksiss\u00e4 toisiinsa. Tietoaltaan potilastietojen relevanssi ja arvo toissijaisessa k\u00e4yt\u00f6ss\u00e4 on l\u00e4ht\u00f6kohtaisesti heikko. Syyn\u00e4 on potilastietojen kirjaamisen muoto ja tapa, erityisesti rakenteisen tiedon puute. Rakenteisen tiedon puuttuessa on k\u00e4ytett\u00e4v\u00e4 sairauskertomusteksti\u00e4, jonka hy\u00f6dynt\u00e4minen on vaativaa. Tiedon varastointi- ja jalostusvaiheessa tiedon laatuongelmia aiheuttaa tiedon sirpaleisuus, viiteavainten ja metatiedon puute sek\u00e4 monipolvinen, virhealtis jalostusprosessi. Ilman riitt\u00e4vi\u00e4 osaamis- ja teknologiaresursseja tietoallastiedon tehokas hy\u00f6dynt\u00e4minen ei ole mahdollista. Urologian tietoallashankkeessa tiedon laatuongelmia pyrittiinkin ratkaisemaan erityisesti panostamalla kliinikoiden ja it-asiantuntijoiden yhteiseen, pitk\u00e4j\u00e4nteiseen kehitysty\u00f6h\u00f6n.\n\nTutkimustulokset auttavat ymm\u00e4rt\u00e4m\u00e4\u00e4n, mitk\u00e4 ovat keskeisi\u00e4 kehityskohteita, kun kliinisest\u00e4 tiedosta pyrit\u00e4\u00e4n jalostamaan arvoa tietoallasymp\u00e4rist\u00f6ss\u00e4.", "language": "fi", "element": "description", "qualifier": "abstract", "schema": "dc"}, {"key": "dc.description.abstract", "value": "Healthcare clinical data and big data, such as electronic health record, are increasingly being utilised for secondary purposes, such as research and knowledge management. The data sources are very diverse, and of low quality, creating challenges for their use. Relatively little attention has been paid to quality problems in the big data literature.\n\nThis study examined the quality problems of clinical big data, their causes, and the solutions developed in research and knowledge management. The perspective was socio technical. The study was carried out as a qualitative case study in the data lake environment of the Hospital District of Southwest Finland and in their urology data lake project. The research material consisted of semi-structured interviews and public documents. Conventional and directed content analysis and visualisation were used as analysis. \n\nIn the case context, data quality problems arise at all stages from the recording of patient data to the conclusions derived. The causes of quality problems are manifold and interconnected. The relevance and value of the data lake patient data in secondary use is weak per se. This is due to the form and manner of recording patient data, especially the lack of structured information. In the absence of structured information, narrative text must be used, the utilization of which is demanding. In the data storage and processing phase, data quality problems are caused by data fragmentation, lack of reference keys and metadata, and a multi-phase, error-prone processing process. Without sufficient know-how and technology resources, effective utilisation of data lake information is not possible. The urology data lake project sought to solve data quality problems, especially by investing in the joint, long-term development work of clinicians and IT experts.\n\nThe results help to understand the key areas for development in the pursuit of acquiring value from clinical data in a data lake environment.", "language": "en", "element": "description", "qualifier": "abstract", "schema": "dc"}, {"key": "dc.description.provenance", "value": "Submitted by Paivi Vuorio (paelvuor@jyu.fi) on 2020-11-25T11:22:24Z\nNo. of bitstreams: 0", "language": "en", "element": "description", "qualifier": "provenance", "schema": "dc"}, {"key": "dc.description.provenance", "value": "Made available in DSpace on 2020-11-25T11:22:24Z (GMT). No. of bitstreams: 0\n Previous issue date: 2020", "language": "en", "element": "description", "qualifier": "provenance", "schema": "dc"}, {"key": "dc.format.extent", "value": "103", "language": "", "element": "format", "qualifier": "extent", "schema": "dc"}, {"key": "dc.format.mimetype", "value": "application/pdf", "language": null, "element": "format", "qualifier": "mimetype", "schema": "dc"}, {"key": "dc.language.iso", "value": "fin", "language": null, "element": "language", "qualifier": "iso", "schema": "dc"}, {"key": "dc.rights", "value": "In Copyright", "language": "en", "element": "rights", "qualifier": null, "schema": "dc"}, {"key": "dc.subject.other", "value": "toissijainen k\u00e4ytt\u00f6", "language": "", "element": "subject", "qualifier": "other", "schema": "dc"}, {"key": "dc.subject.other", "value": "toisiok\u00e4ytt\u00f6", "language": "", "element": "subject", "qualifier": "other", "schema": "dc"}, {"key": "dc.subject.other", "value": "tiedolla johtaminen", "language": "", "element": "subject", "qualifier": "other", "schema": "dc"}, {"key": "dc.subject.other", "value": "tiedon laatu", "language": "", "element": "subject", "qualifier": "other", "schema": "dc"}, {"key": "dc.subject.other", "value": "tiedon laatuongelmat", "language": "", "element": "subject", "qualifier": "other", "schema": "dc"}, {"key": "dc.title", "value": "Kliinisen big datan laatuongelmat ja niiden syyt tietoallasymp\u00e4rist\u00f6ss\u00e4", "language": "", "element": "title", "qualifier": null, "schema": "dc"}, {"key": "dc.type", "value": "master thesis", "language": null, "element": "type", "qualifier": null, "schema": "dc"}, {"key": "dc.identifier.urn", "value": "URN:NBN:fi:jyu-202011256773", "language": "", "element": "identifier", "qualifier": "urn", "schema": "dc"}, {"key": "dc.type.ontasot", "value": "Pro gradu -tutkielma", "language": "fi", "element": "type", "qualifier": "ontasot", "schema": "dc"}, {"key": "dc.type.ontasot", "value": "Master\u2019s thesis", "language": "en", "element": "type", "qualifier": "ontasot", "schema": "dc"}, {"key": "dc.contributor.faculty", "value": "Informaatioteknologian tiedekunta", "language": "fi", "element": "contributor", "qualifier": "faculty", "schema": "dc"}, {"key": "dc.contributor.faculty", "value": "Faculty of Information Technology", "language": "en", "element": "contributor", "qualifier": "faculty", "schema": "dc"}, {"key": "dc.contributor.department", "value": "Informaatioteknologia", "language": "fi", "element": "contributor", "qualifier": "department", "schema": "dc"}, {"key": "dc.contributor.department", "value": "Information Technology", "language": "en", "element": "contributor", "qualifier": "department", "schema": "dc"}, {"key": "dc.contributor.organization", "value": "Jyv\u00e4skyl\u00e4n yliopisto", "language": "fi", "element": "contributor", "qualifier": "organization", "schema": "dc"}, {"key": "dc.contributor.organization", "value": "University of Jyv\u00e4skyl\u00e4", "language": "en", "element": "contributor", "qualifier": "organization", "schema": "dc"}, {"key": "dc.subject.discipline", "value": "Tietoj\u00e4rjestelm\u00e4tiede", "language": "fi", "element": "subject", "qualifier": "discipline", "schema": "dc"}, {"key": "dc.subject.discipline", "value": "Information Systems Science", "language": "en", "element": "subject", "qualifier": "discipline", "schema": "dc"}, {"key": "yvv.contractresearch.funding", "value": "0", "language": "", "element": "contractresearch", "qualifier": "funding", "schema": "yvv"}, {"key": "dc.type.coar", "value": "http://purl.org/coar/resource_type/c_bdcc", "language": null, "element": "type", "qualifier": "coar", "schema": "dc"}, {"key": "dc.rights.accesslevel", "value": "openAccess", "language": null, "element": "rights", "qualifier": "accesslevel", "schema": "dc"}, {"key": "dc.type.publication", "value": "masterThesis", "language": null, "element": "type", "qualifier": "publication", "schema": "dc"}, {"key": "dc.subject.oppiainekoodi", "value": "601", "language": "", "element": "subject", "qualifier": "oppiainekoodi", "schema": "dc"}, {"key": "dc.subject.yso", "value": "tiedonhallinta", "language": null, "element": "subject", "qualifier": "yso", "schema": "dc"}, {"key": "dc.subject.yso", "value": "tieto", "language": null, "element": "subject", "qualifier": "yso", "schema": "dc"}, {"key": "dc.subject.yso", "value": "laatu", "language": null, "element": "subject", "qualifier": "yso", "schema": "dc"}, {"key": "dc.subject.yso", "value": "terveydenhuolto", "language": null, "element": "subject", "qualifier": "yso", "schema": "dc"}, {"key": "dc.subject.yso", "value": "tietovarastot", "language": null, "element": "subject", "qualifier": "yso", "schema": "dc"}, {"key": "dc.subject.yso", "value": "big data", "language": null, "element": "subject", "qualifier": "yso", "schema": "dc"}, {"key": "dc.subject.yso", "value": "tietokannat", "language": null, "element": "subject", "qualifier": "yso", "schema": "dc"}, {"key": "dc.subject.yso", "value": "tiedontarve", "language": null, "element": "subject", "qualifier": "yso", "schema": "dc"}, {"key": "dc.format.content", "value": "fulltext", "language": null, "element": "format", "qualifier": "content", "schema": "dc"}, {"key": "dc.rights.url", "value": "https://rightsstatements.org/page/InC/1.0/", "language": null, "element": "rights", "qualifier": "url", "schema": "dc"}, {"key": "dc.type.okm", "value": "G2", "language": null, "element": "type", "qualifier": "okm", "schema": "dc"}]
id jyx.123456789_72803
language fin
last_indexed 2025-02-18T10:55:45Z
main_date 2020-01-01T00:00:00Z
main_date_str 2020
online_boolean 1
online_urls_str_mv {"url":"https:\/\/jyx.jyu.fi\/bitstreams\/4835e89e-3fac-4dec-835e-6ee23a4fb891\/download","text":"URN:NBN:fi:jyu-202011256773.pdf","source":"jyx","mediaType":"application\/pdf"}
publishDate 2020
record_format qdc
source_str_mv jyx
spellingShingle Kiianmaa, Nelli Kliinisen big datan laatuongelmat ja niiden syyt tietoallasympäristössä toissijainen käyttö toisiokäyttö tiedolla johtaminen tiedon laatu tiedon laatuongelmat Tietojärjestelmätiede Information Systems Science 601 tiedonhallinta tieto laatu terveydenhuolto tietovarastot big data tietokannat tiedontarve
title Kliinisen big datan laatuongelmat ja niiden syyt tietoallasympäristössä
title_full Kliinisen big datan laatuongelmat ja niiden syyt tietoallasympäristössä
title_fullStr Kliinisen big datan laatuongelmat ja niiden syyt tietoallasympäristössä Kliinisen big datan laatuongelmat ja niiden syyt tietoallasympäristössä
title_full_unstemmed Kliinisen big datan laatuongelmat ja niiden syyt tietoallasympäristössä Kliinisen big datan laatuongelmat ja niiden syyt tietoallasympäristössä
title_short Kliinisen big datan laatuongelmat ja niiden syyt tietoallasympäristössä
title_sort kliinisen big datan laatuongelmat ja niiden syyt tietoallasympäristössä
title_txtP Kliinisen big datan laatuongelmat ja niiden syyt tietoallasympäristössä
topic toissijainen käyttö toisiokäyttö tiedolla johtaminen tiedon laatu tiedon laatuongelmat Tietojärjestelmätiede Information Systems Science 601 tiedonhallinta tieto laatu terveydenhuolto tietovarastot big data tietokannat tiedontarve
topic_facet 601 Information Systems Science Tietojärjestelmätiede big data laatu terveydenhuolto tiedolla johtaminen tiedon laatu tiedon laatuongelmat tiedonhallinta tiedontarve tieto tietokannat tietovarastot toisiokäyttö toissijainen käyttö
url https://jyx.jyu.fi/handle/123456789/72803 http://www.urn.fi/URN:NBN:fi:jyu-202011256773
work_keys_str_mv AT kiianmaanelli kliinisenbigdatanlaatuongelmatjaniidensyyttietoallasympäristössä