Linked research data for historical corpus linguistics new tools for describing, sharing and re-using data

Korpuslingvistiikan alan empiriinen tieteellinen evidenssi on pirstaloitunutta ja osa varsinkin vanhemmista, mutta edelleen ajankohtaisista, julkaistuista tuloksista on huonosti saatavilla. Tutkielma keskittyy historiallisen korpuslingisvistiikan alan tutkimustulosten löydettävyyden, saatavuuden ja...

Täydet tiedot

Bibliografiset tiedot
Päätekijä: Kesäniemi, Joonas
Muut tekijät: Informaatioteknologian tiedekunta, Faculty of Information Technology, Informaatioteknologia, Information Technology, Jyväskylän yliopisto, University of Jyväskylä
Aineistotyyppi: Pro gradu
Kieli:eng
Julkaistu: 2020
Aiheet:
Linkit: https://jyx.jyu.fi/handle/123456789/72037
Kuvaus
Yhteenveto:Korpuslingvistiikan alan empiriinen tieteellinen evidenssi on pirstaloitunutta ja osa varsinkin vanhemmista, mutta edelleen ajankohtaisista, julkaistuista tuloksista on huonosti saatavilla. Tutkielma keskittyy historiallisen korpuslingisvistiikan alan tutkimustulosten löydettävyyden, saatavuuden ja uudelleenkäytön parantamiseen esittelemällä linkitettyyn dataan perustuvan tutkimusdatanhallintajärjestelmän nimeltä Language Change Database (LCD), jonka tietomalli on suunniteltu kyseisen tieteenalan datan uudelleen\-käytön vaatimuksia silmällä pitäen. Uudelleenkäyttöä havainnollistamiseksi esitellään myös uusi työkalu meta-analyysien toteuttamiseen LCD:stä saatavilla olevan datan avulla. Empirical research in the field of historical corpus linguistics is fragmented and some of the older, but still relevant, results are difficult to come by. This thesis focuses on solutions enhancing the discoverability, accessibility and re-usability of diachronic corpus linguistic research results. A linked data based research data management system called Language Change Database is introduced with a data model that caters for research field specific requirements for re-use. Also, LCD data re-use is demonstrated with a novel meta-analysis tool.