Summary: | Data plays a significant role in modern business operations. However, data itself does not provide value to a company unless it can be reliably utilized, for example, to support decision-making. The reliability of data depends on several factors, one of which is data quality. Data quality has both direct and indirect impacts on various aspects, including decision-making and the development of artificial intelligence systems that rely on data collected by companies. Data quality can be measured, assessed, and improved using different methods. One such method is data profiling, which provides a clearer understanding of the data and its characteristics. This helps identify the root causes of potential errors and determine how to fix them. This study explores data quality, its measurement, and improvement from a theoretical perspective. It includes a literature review supported by empirical research and expert interviews on the outcomes of data profiling and data quality in general.
Data on merkittävässä roolissa yritysten liiketoiminnassa nykypäivänä. Data itsessään ei tuota yritykselle lisäarvoa, vaan sitä pitää pystyä myös luotettavasti hyödyntämään esimerkiksi päätöksenteon tukena. Datan luotettavuus riippuu monesta tekijästä ja yksi niistä on datan laatu. Datan laatu vaikuttaa suoraan ja välillisesti moneen eri asiaan, joista yhtenä on päätöksenteko, mutta toisena myös esimerkiksi tekoäly, jota koulutetaan yritysten keräämällä datalla. Datan laatua voidaan mitata, arvioida sekä kehittää eri tavoilla. Datan laadun tutkimiseksi on kehitetty erilaisia keinoja, joista yhtenä datan profilointi. Datan profiloinnilla datasta ja sen ominaisuuksista voidaan saada parempi kuva, ja näin ollen myös ymmärtää mistä mahdolliset virheet johtuvat ja kuinka ne voidaan korjata. Tutkimuksessa käsitellään datan laatua, sen mittaamista ja kehittämistä laajasti teorian pohjalta. Tutkimuksessa on toteutettu kirjallisuuskatsaus, jonka tueksi empiirinen tutkimus ja asiantuntijoiden haastattelut datan profiloinnin tuloksista.
|