Tietokoneavusteinen tekstiplagioinnin tunnistus

Tässä tutkielmassa tarkasteltiin plagioinnin tietokoneavusteisessa tunnistuksessa käytettäviä tapoja, tekniikoita ja menetelmiä sekä haasteita, joita niihin liittyy. Tutkielman johtopäätöksenä on, että kirjaimellisen tai yksinkertaisen plagioinnin tunnistus toimii suhteellisen hyvin, mutta älykkään...

Täydet tiedot

Bibliografiset tiedot
Päätekijä: Karttunen, Petteri
Muut tekijät: Informaatioteknologian tiedekunta, Faculty of Information Technology, Informaatioteknologia, Information Technology, Jyväskylän yliopisto, University of Jyväskylä
Aineistotyyppi: Kandityö
Kieli:fin
Julkaistu: 2020
Aiheet:
Linkit: https://jyx.jyu.fi/handle/123456789/68330
Kuvaus
Yhteenveto:Tässä tutkielmassa tarkasteltiin plagioinnin tietokoneavusteisessa tunnistuksessa käytettäviä tapoja, tekniikoita ja menetelmiä sekä haasteita, joita niihin liittyy. Tutkielman johtopäätöksenä on, että kirjaimellisen tai yksinkertaisen plagioinnin tunnistus toimii suhteellisen hyvin, mutta älykkään plagioinnin tunnistuksessa on vielä suuria haasteita. Viime vuosina älykkään plagioinnin tunnistuksessa on tapahtunut edistystä erityisesti semanttisten ja koneoppivien menetelmien myötä ja niihin kohdistuukin odotuksia tarkkuuden parantamiseksi entisestään. Tutkielmassa havaittiin, että tiettyjen menetelmien toimivuus voi olennaisesti riippua kohdekielestä ja että plagioinnin tunnistusta suomen kielessä ei ole juurikaan vielä tutkittu. This study explored techniques, methods and task of computer assisted detection of plagiarism as well as challenges involved. The thesis concludes that recognizing literal or simple plagiarism works relatively well, but there are still major challenges in detecting intelligent plagiarism. In recent years, progress has been made in detecting intelligent plagiarism, particularly using semantic and machine learning methods. They are expected to further improve accuracy in the future. It was also found that the effectiveness of certain detection methods can highly depend on the target text language. More research on the detection in the Finnish language is needed.