Relaatio- ja graafitietokantojen sekä niiden hallintajärjestelmien vertailua

Tämän kandidaatintutkielman tarkoituksena on kirjallisuuskatsauksen keinoin kuvata relaatio- ja graafitietokantojen eroavaisuuksia tietomalliensa, käyttökohteidensa ja hallintajärjestelmiensä näkökulmista. Relaatiomalli on saavuttanut itsestään selvän aseman koko tietokanta-alalla, niin akateemis...

Full description

Bibliographic Details
Main Author: Ahonen, Mika
Other Authors: Informaatioteknologian tiedekunta, Faculty of Information Technology, Informaatioteknologia, Information Technology, University of Jyväskylä, Jyväskylän yliopisto
Format: Bachelor's thesis
Language:fin
Published: 2017
Subjects:
Online Access: https://jyx.jyu.fi/handle/123456789/53952
_version_ 1826225814134325248
author Ahonen, Mika
author2 Informaatioteknologian tiedekunta Faculty of Information Technology Informaatioteknologia Information Technology University of Jyväskylä Jyväskylän yliopisto
author_facet Ahonen, Mika Informaatioteknologian tiedekunta Faculty of Information Technology Informaatioteknologia Information Technology University of Jyväskylä Jyväskylän yliopisto Ahonen, Mika Informaatioteknologian tiedekunta Faculty of Information Technology Informaatioteknologia Information Technology University of Jyväskylä Jyväskylän yliopisto
author_sort Ahonen, Mika
datasource_str_mv jyx
description Tämän kandidaatintutkielman tarkoituksena on kirjallisuuskatsauksen keinoin kuvata relaatio- ja graafitietokantojen eroavaisuuksia tietomalliensa, käyttökohteidensa ja hallintajärjestelmiensä näkökulmista. Relaatiomalli on saavuttanut itsestään selvän aseman koko tietokanta-alalla, niin akateemisessa kuin liiketoiminnallisissakin yhteyksissä, mutta myös harrastajapiireissä. 1990- luvulta lähtien, internetin hyödyntämisen yleistyessä ja linkittyneen, verkkomuotoisen tiedon lisääntyessä yhä suurempi osa tiedosta on rakenteeltaan osittain tai kokonaan jäsentymätöntä, jatkuvasti uudelleen muotoutuvaa ja verkottunutta. Verkkomuotoinen tieto tietokantojen yhteydessä mukautuu niin sanottuun graafimalliin, jonka teoreettinen tausta on jo pitkään tunnetussa verkkoteoriassa. Graafimuotoisen tiedon käsittely perinteisillä relaatiotietokannan hallintajärjestelmillä (RDBMS) on osoittautunut haasteelliseksi. Tämä johtuu graafeille ominaisten, objektien välisten liitoksien runsaasta määrästä. Relaatiotietokannassa liitoksien runsas määrä aiheuttaa RDBMS:lle merkittäviä suorituskykyongelmia. Lisäksi osittain tai kokonaan jäsentymättömän tiedon käsittely on relaatiotietokannassa haasteellista, koska siinä hyödynnetään skeemaa eli tietokannan luonnin yhteydessä määriteltyä tietokannan rakenteellista mallia. Näiden pohjalta on syntynyt tarve kehittää uudenlaisia, graafeille sopivampia tietokannanhallintajärjestelmiä (DBMS). Uudenlaiset tietokannat kuuluvat NoSQL-tietomalliperheeseen. SQL on yleisesti RDBMS:issä käytetty kyselykieli ja termillä NoSQL pyritään luomaan eroa perinteiseen relaatiomalliin. Sana NoSQL on akronyymi sanoista Not only SQL. NoSQL-tietomalliperheeseen kuuluvat muun muassa dokumentti-, avainarvopari-, sarakeperhe-, ja graafitietokannat. Tässä kandidaatintutkielmassa kuvataan relaatiomalliin ja sen soveltamiseen liittyvät peruskäsitteet, mutta painotus on enemmän graafimallissa ja sen soveltamisessa sekä siihen liittyvissä hyödyissä, haasteissa ja sovellusalueiden kuvaamisessa. Lisäksi tutkielmassa kuvataan kaksi RDBMS:n ja GDBMS:n (Graph Database Management System) käyttötapauksia vertailevaa tutkimusta. Kirjallisuuden pohjalta voidaan tehdä johtopäätös, että GDBMS:t sopivat tarkoitukseensa ja ovat vakiinnuttamassa paikkaansa tietokanta-alalla. Silti niiden käytössä on edelleen haasteita. The purpose of this Bachelor’s thesis is to describe differences between relational and graph database in terms of data model they use, where they are used and what kind of management systems they are used on. The scientific method used in this thesis is based on literature review. In the area of databases a relational model and its applications have reached a self-evident status consisting academic and business contexts but also private enthusiasts. Since the early nineties along with Internet becoming more common and the amount of linked network related data increased, is data organized more and more semi-structured or unstructured ways and it is also frequently re-structured and linked. Relating to databases a networked data adapts to so called graph model, where its theoretical model is based on mathematical graph theory. Manipulating the graph data by traditional relational database management systems (RDBMS) has been proven to provoke challenges. This is due to a large amount of joins between objects characterized by the graphs. In the relational database a large amount of joins causes a significant performance reduction for RDBMS. The relational database makes use of a schema which is a model for database structure and is defined while creating the database. For that reason a processing of semi-structured or unstructured data in the relational database is challenging. Based on previously announced facts, there has emerged a need to develop new type of and more suitable database management systems (DBMS) and data models for the graphs. New type of data model family is called NoSQL. In the RDBMS, SQL is commonly used as query language and the term aims to make a difference to relational databases. Therefore the word NoSQL is an acronym for the words Not only SQL. Key-value stores, column family stores, document stores and also graph databases belong to the NoSQL. This Bachelor’s Thesis describes the basic concepts of relational model but the emphasis is more on the side of the graph model, benefits and challenges it faces and in the descriptions of application domains for the graph model. Moreover, the thesis describes two benchmarked use cases of RDBMS and GDBMS. Based on the literature used in the thesis it can be concluded that graph GDBMSs fit for their purpose, are consolidating status in the area of data bases but challenges still exist.
first_indexed 2024-09-11T08:50:15Z
format Kandityö
fullrecord [{"key": "dc.contributor.advisor", "value": "Taipalus, Toni", "language": "", "element": "contributor", "qualifier": "advisor", "schema": "dc"}, {"key": "dc.contributor.author", "value": "Ahonen, Mika", "language": "", "element": "contributor", "qualifier": "author", "schema": "dc"}, {"key": "dc.date.accessioned", "value": "2017-05-16T05:29:18Z", "language": "", "element": "date", "qualifier": "accessioned", "schema": "dc"}, {"key": "dc.date.available", "value": "2017-05-16T05:29:18Z", "language": "", "element": "date", "qualifier": "available", "schema": "dc"}, {"key": "dc.date.issued", "value": "2017", "language": "", "element": "date", "qualifier": "issued", "schema": "dc"}, {"key": "dc.identifier.uri", "value": "https://jyx.jyu.fi/handle/123456789/53952", "language": "", "element": "identifier", "qualifier": "uri", "schema": "dc"}, {"key": "dc.description.abstract", "value": "T\u00e4m\u00e4n kandidaatintutkielman tarkoituksena on kirjallisuuskatsauksen keinoin\r\nkuvata relaatio- ja graafitietokantojen eroavaisuuksia tietomalliensa,\r\nk\u00e4ytt\u00f6kohteidensa ja hallintaj\u00e4rjestelmiens\u00e4 n\u00e4k\u00f6kulmista. Relaatiomalli on\r\nsaavuttanut itsest\u00e4\u00e4n selv\u00e4n aseman koko tietokanta-alalla, niin akateemisessa\r\nkuin liiketoiminnallisissakin yhteyksiss\u00e4, mutta my\u00f6s harrastajapiireiss\u00e4. 1990-\r\nluvulta l\u00e4htien, internetin hy\u00f6dynt\u00e4misen yleistyess\u00e4 ja linkittyneen,\r\nverkkomuotoisen tiedon lis\u00e4\u00e4ntyess\u00e4 yh\u00e4 suurempi osa tiedosta on\r\nrakenteeltaan osittain tai kokonaan j\u00e4sentym\u00e4t\u00f6nt\u00e4, jatkuvasti uudelleen\r\nmuotoutuvaa ja verkottunutta. Verkkomuotoinen tieto tietokantojen yhteydess\u00e4\r\nmukautuu niin sanottuun graafimalliin, jonka teoreettinen tausta on jo pitk\u00e4\u00e4n\r\ntunnetussa verkkoteoriassa. Graafimuotoisen tiedon k\u00e4sittely perinteisill\u00e4\r\nrelaatiotietokannan hallintaj\u00e4rjestelmill\u00e4 (RDBMS) on osoittautunut\r\nhaasteelliseksi. T\u00e4m\u00e4 johtuu graafeille ominaisten, objektien v\u00e4listen liitoksien\r\nrunsaasta m\u00e4\u00e4r\u00e4st\u00e4. Relaatiotietokannassa liitoksien runsas m\u00e4\u00e4r\u00e4 aiheuttaa\r\nRDBMS:lle merkitt\u00e4vi\u00e4 suorituskykyongelmia. Lis\u00e4ksi osittain tai kokonaan\r\nj\u00e4sentym\u00e4tt\u00f6m\u00e4n tiedon k\u00e4sittely on relaatiotietokannassa haasteellista, koska\r\nsiin\u00e4 hy\u00f6dynnet\u00e4\u00e4n skeemaa eli tietokannan luonnin yhteydess\u00e4 m\u00e4\u00e4ritelty\u00e4\r\ntietokannan rakenteellista mallia. N\u00e4iden pohjalta on syntynyt tarve kehitt\u00e4\u00e4\r\nuudenlaisia, graafeille sopivampia tietokannanhallintaj\u00e4rjestelmi\u00e4 (DBMS).\r\nUudenlaiset tietokannat kuuluvat NoSQL-tietomalliperheeseen. SQL on\r\nyleisesti RDBMS:iss\u00e4 k\u00e4ytetty kyselykieli ja termill\u00e4 NoSQL pyrit\u00e4\u00e4n luomaan\r\neroa perinteiseen relaatiomalliin. Sana NoSQL on akronyymi sanoista Not only\r\nSQL. NoSQL-tietomalliperheeseen kuuluvat muun muassa dokumentti-, avainarvopari-,\r\nsarakeperhe-, ja graafitietokannat. T\u00e4ss\u00e4 kandidaatintutkielmassa\r\nkuvataan relaatiomalliin ja sen soveltamiseen liittyv\u00e4t perusk\u00e4sitteet, mutta\r\npainotus on enemm\u00e4n graafimallissa ja sen soveltamisessa sek\u00e4 siihen\r\nliittyviss\u00e4 hy\u00f6dyiss\u00e4, haasteissa ja sovellusalueiden kuvaamisessa. Lis\u00e4ksi\r\ntutkielmassa kuvataan kaksi RDBMS:n ja GDBMS:n (Graph Database\r\nManagement System) k\u00e4ytt\u00f6tapauksia vertailevaa tutkimusta. Kirjallisuuden\r\npohjalta voidaan tehd\u00e4 johtop\u00e4\u00e4t\u00f6s, ett\u00e4 GDBMS:t sopivat tarkoitukseensa ja\r\novat vakiinnuttamassa paikkaansa tietokanta-alalla. Silti niiden k\u00e4yt\u00f6ss\u00e4 on\r\nedelleen haasteita.", "language": "fi", "element": "description", "qualifier": "abstract", "schema": "dc"}, {"key": "dc.description.abstract", "value": "The purpose of this Bachelor\u2019s thesis is to describe differences between\r\nrelational and graph database in terms of data model they use, where they are\r\nused and what kind of management systems they are used on. The scientific\r\nmethod used in this thesis is based on literature review. In the area of databases\r\na relational model and its applications have reached a self-evident status\r\nconsisting academic and business contexts but also private enthusiasts. Since\r\nthe early nineties along with Internet becoming more common and the amount\r\nof linked network related data increased, is data organized more and more\r\nsemi-structured or unstructured ways and it is also frequently re-structured\r\nand linked. Relating to databases a networked data adapts to so called graph\r\nmodel, where its theoretical model is based on mathematical graph theory.\r\nManipulating the graph data by traditional relational database management\r\nsystems (RDBMS) has been proven to provoke challenges. This is due to a large\r\namount of joins between objects characterized by the graphs. In the relational\r\ndatabase a large amount of joins causes a significant performance reduction for\r\nRDBMS. The relational database makes use of a schema which is a model for\r\ndatabase structure and is defined while creating the database. For that reason a\r\nprocessing of semi-structured or unstructured data in the relational database is\r\nchallenging. Based on previously announced facts, there has emerged a need to\r\ndevelop new type of and more suitable database management systems (DBMS)\r\nand data models for the graphs. New type of data model family is called\r\nNoSQL. In the RDBMS, SQL is commonly used as query language and the term\r\naims to make a difference to relational databases. Therefore the word NoSQL is\r\nan acronym for the words Not only SQL. Key-value stores, column family\r\nstores, document stores and also graph databases belong to the NoSQL. This\r\nBachelor\u2019s Thesis describes the basic concepts of relational model but the\r\nemphasis is more on the side of the graph model, benefits and challenges it\r\nfaces and in the descriptions of application domains for the graph model.\r\nMoreover, the thesis describes two benchmarked use cases of RDBMS and\r\nGDBMS. Based on the literature used in the thesis it can be concluded that\r\ngraph GDBMSs fit for their purpose, are consolidating status in the area of data\r\nbases but challenges still exist.", "language": "en", "element": "description", "qualifier": "abstract", "schema": "dc"}, {"key": "dc.description.provenance", "value": "Submitted using Plone Publishing form by Mika Ahonen (mijuahon) on 2017-05-16 05:29:18.008071. Form: Kandidaatintutkielma -lomake (https://kirjasto.jyu.fi/julkaisut/julkaisulomakkeet/kandin-tutkielma-lomake). JyX data: [jyx_publishing-allowed (fi) =False]", "language": "en", "element": "description", "qualifier": "provenance", "schema": "dc"}, {"key": "dc.description.provenance", "value": "Submitted by jyx lomake-julkaisija (jyx-julkaisija.group@korppi.jyu.fi) on 2017-05-16T05:29:18Z\r\nNo. of bitstreams: 2\r\nURN:NBN:fi:jyu-201705162354.pdf: 697766 bytes, checksum: 236da79077a6fdab4980eb38a153e43a (MD5)\r\nlicense.html: 1118 bytes, checksum: c4115b066bec7ab53316e874f79ab294 (MD5)", "language": "en", "element": "description", "qualifier": "provenance", "schema": "dc"}, {"key": "dc.description.provenance", "value": "Made available in DSpace on 2017-05-16T05:29:18Z (GMT). No. of bitstreams: 2\r\nURN:NBN:fi:jyu-201705162354.pdf: 697766 bytes, checksum: 236da79077a6fdab4980eb38a153e43a (MD5)\r\nlicense.html: 1118 bytes, checksum: c4115b066bec7ab53316e874f79ab294 (MD5)\r\n Previous issue date: 2017", "language": "en", "element": "description", "qualifier": "provenance", "schema": "dc"}, {"key": "dc.format.extent", "value": "35", "language": "", "element": "format", "qualifier": "extent", "schema": "dc"}, {"key": "dc.language.iso", "value": "fin", "language": "", "element": "language", "qualifier": "iso", "schema": "dc"}, {"key": "dc.rights", "value": "In Copyright", "language": "en", "element": "rights", "qualifier": null, "schema": "dc"}, {"key": "dc.subject.other", "value": "relational database", "language": "", "element": "subject", "qualifier": "other", "schema": "dc"}, {"key": "dc.subject.other", "value": "graph database", "language": "", "element": "subject", "qualifier": "other", "schema": "dc"}, {"key": "dc.subject.other", "value": "NoSQL", "language": "", "element": "subject", "qualifier": "other", "schema": "dc"}, {"key": "dc.subject.other", "value": "MySQL", "language": "", "element": "subject", "qualifier": "other", "schema": "dc"}, {"key": "dc.subject.other", "value": "Neo4j", "language": "", "element": "subject", "qualifier": "other", "schema": "dc"}, {"key": "dc.subject.other", "value": "RDBMS", "language": "", "element": "subject", "qualifier": "other", "schema": "dc"}, {"key": "dc.subject.other", "value": "GDBMS", "language": "", "element": "subject", "qualifier": "other", "schema": "dc"}, {"key": "dc.title", "value": "Relaatio- ja graafitietokantojen sek\u00e4 niiden hallintaj\u00e4rjestelmien vertailua", "language": "", "element": "title", "qualifier": null, "schema": "dc"}, {"key": "dc.type", "value": "bachelor thesis", "language": null, "element": "type", "qualifier": null, "schema": "dc"}, {"key": "dc.identifier.urn", "value": "URN:NBN:fi:jyu-201705162354", "language": "", "element": "identifier", "qualifier": "urn", "schema": "dc"}, {"key": "dc.type.ontasot", "value": "Kandidaatintutkielma", "language": "fi", "element": "type", "qualifier": "ontasot", "schema": "dc"}, {"key": "dc.type.ontasot", "value": "Bachelor's thesis", "language": "en", "element": "type", "qualifier": "ontasot", "schema": "dc"}, {"key": "dc.contributor.faculty", "value": "Informaatioteknologian tiedekunta", "language": "fi", "element": "contributor", "qualifier": "faculty", "schema": "dc"}, {"key": "dc.contributor.faculty", "value": "Faculty of Information Technology", "language": "en", "element": "contributor", "qualifier": "faculty", "schema": "dc"}, {"key": "dc.contributor.department", "value": "Informaatioteknologia", "language": "fi", "element": "contributor", "qualifier": "department", "schema": "dc"}, {"key": "dc.contributor.department", "value": "Information Technology", "language": "en", "element": "contributor", "qualifier": "department", "schema": "dc"}, {"key": "dc.contributor.organization", "value": "University of Jyv\u00e4skyl\u00e4", "language": "en", "element": "contributor", "qualifier": "organization", "schema": "dc"}, {"key": "dc.contributor.organization", "value": "Jyv\u00e4skyl\u00e4n yliopisto", "language": "fi", "element": "contributor", "qualifier": "organization", "schema": "dc"}, {"key": "dc.subject.discipline", "value": "Tietoj\u00e4rjestelm\u00e4tiede", "language": "fi", "element": "subject", "qualifier": "discipline", "schema": "dc"}, {"key": "dc.subject.discipline", "value": "Information Systems Science", "language": "en", "element": "subject", "qualifier": "discipline", "schema": "dc"}, {"key": "dc.date.updated", "value": "2017-05-16T05:29:18Z", "language": "", "element": "date", "qualifier": "updated", "schema": "dc"}, {"key": "dc.type.coar", "value": "http://purl.org/coar/resource_type/c_7a1f", "language": null, "element": "type", "qualifier": "coar", "schema": "dc"}, {"key": "dc.rights.accesslevel", "value": "restrictedAccess", "language": "fi", "element": "rights", "qualifier": "accesslevel", "schema": "dc"}, {"key": "dc.type.publication", "value": "bachelorThesis", "language": null, "element": "type", "qualifier": "publication", "schema": "dc"}, {"key": "dc.rights.url", "value": "https://rightsstatements.org/page/InC/1.0/", "language": null, "element": "rights", "qualifier": "url", "schema": "dc"}, {"key": "dc.rights.accessrights", "value": "This material has a restricted access due to copyright reasons. It can be read at the workstation at Jyv\u00e4skyl\u00e4 University Library reserved for the use of archival materials: https://kirjasto.jyu.fi/en/workspaces/facilities.", "language": "en", "element": "rights", "qualifier": "accessrights", "schema": "dc"}, {"key": "dc.rights.accessrights", "value": "Aineistoon p\u00e4\u00e4sy\u00e4 on rajoitettu tekij\u00e4noikeussyist\u00e4. Aineisto on luettavissa Jyv\u00e4skyl\u00e4n yliopiston kirjaston arkistoty\u00f6asemalta. Ks. https://kirjasto.jyu.fi/fi/tyoskentelytilat/laitteet-ja-tilat.", "language": "fi", "element": "rights", "qualifier": "accessrights", "schema": "dc"}]
id jyx.123456789_53952
language fin
last_indexed 2025-02-18T10:56:26Z
main_date 2017-01-01T00:00:00Z
main_date_str 2017
publishDate 2017
record_format qdc
source_str_mv jyx
spellingShingle Ahonen, Mika Relaatio- ja graafitietokantojen sekä niiden hallintajärjestelmien vertailua relational database graph database NoSQL MySQL Neo4j RDBMS GDBMS Tietojärjestelmätiede Information Systems Science
title Relaatio- ja graafitietokantojen sekä niiden hallintajärjestelmien vertailua
title_full Relaatio- ja graafitietokantojen sekä niiden hallintajärjestelmien vertailua
title_fullStr Relaatio- ja graafitietokantojen sekä niiden hallintajärjestelmien vertailua Relaatio- ja graafitietokantojen sekä niiden hallintajärjestelmien vertailua
title_full_unstemmed Relaatio- ja graafitietokantojen sekä niiden hallintajärjestelmien vertailua Relaatio- ja graafitietokantojen sekä niiden hallintajärjestelmien vertailua
title_short Relaatio- ja graafitietokantojen sekä niiden hallintajärjestelmien vertailua
title_sort relaatio ja graafitietokantojen sekä niiden hallintajärjestelmien vertailua
title_txtP Relaatio- ja graafitietokantojen sekä niiden hallintajärjestelmien vertailua
topic relational database graph database NoSQL MySQL Neo4j RDBMS GDBMS Tietojärjestelmätiede Information Systems Science
topic_facet GDBMS Information Systems Science MySQL Neo4j NoSQL RDBMS Tietojärjestelmätiede graph database relational database
url https://jyx.jyu.fi/handle/123456789/53952 http://www.urn.fi/URN:NBN:fi:jyu-201705162354
work_keys_str_mv AT ahonenmika relaatiojagraafitietokantojensekäniidenhallintajärjestelmienvertailua