Konekääntämisen menetelmät englanti–suomi-konekäännöksessä

Tämä kirjallisuuskatsauksena toteutettu kandidaatintutkielma tarkastelee kolmea keskeistä konekääntämisen menetelmää sääntöpohjainen, tilastollinen ja neuroverkkokonekääntäminen ja niiden tarjoamien englanti–suomi-konekäännösten kehitystä ja ominaisuuksia. Neuroverkkokonekääntäminen vaikuttaa olevan...

Täydet tiedot

Bibliografiset tiedot
Päätekijä: Kalenius, Konsta
Muut tekijät: Informaatioteknologian tiedekunta, Faculty of Information Technology, Informaatioteknologia, Information Technology, Jyväskylän yliopisto, University of Jyväskylä
Aineistotyyppi: Kandityö
Kieli:fin
Julkaistu: 2020
Aiheet:
Linkit: https://jyx.jyu.fi/handle/123456789/71545
_version_ 1828193208952160256
author Kalenius, Konsta
author2 Informaatioteknologian tiedekunta Faculty of Information Technology Informaatioteknologia Information Technology Jyväskylän yliopisto University of Jyväskylä
author_facet Kalenius, Konsta Informaatioteknologian tiedekunta Faculty of Information Technology Informaatioteknologia Information Technology Jyväskylän yliopisto University of Jyväskylä Kalenius, Konsta Informaatioteknologian tiedekunta Faculty of Information Technology Informaatioteknologia Information Technology Jyväskylän yliopisto University of Jyväskylä
author_sort Kalenius, Konsta
datasource_str_mv jyx
description Tämä kirjallisuuskatsauksena toteutettu kandidaatintutkielma tarkastelee kolmea keskeistä konekääntämisen menetelmää sääntöpohjainen, tilastollinen ja neuroverkkokonekääntäminen ja niiden tarjoamien englanti–suomi-konekäännösten kehitystä ja ominaisuuksia. Neuroverkkokonekääntäminen vaikuttaa olevan kirjallisuuskatsauksen perusteella nopeasti kehittyvä menetelmä, joka tarjoaa yhä laadukkaampia englanti–suomi-kieliparin konekäännöksiä. Toisaalta Suomessa on vahvat perinteet kieliparin sääntöpohjaisen konekäännöksen kehittämisessä ja menetelmä on yhä relevantti englanti–suomi-konekääntämisessä. Tutkielman tarkastelemien tutkimusten valossa näyttääkin siltä, että neuroverkkokonekääntämisen ja sääntöpohjaisen konekääntämisen vahvuudet yhdistävä hybridikonekäännin olisi ihanteellinen menetelmä ratkaisemaan suomen kieliopin ja sanaston ja englanti–suomi-rinnakkaiskorpusten puutteiden aiheuttamia englanti–suomi-konekääntämisen ongelmia. This Bachelor's Thesis carried out as a literature review focuses on three essential machine translation methods rule-based, statistical and neural machine translation and machine translations from English to Finnish made with these methods and the chronological development and properties of the methods and translations. The literature review shows that neural machine translation is a fast-developing, state-of-the-art method, which offers ever-improving machine translations from English to Finnish. On the other hand, the long-term development of rule-based machine translation from English to Finnish (and vice versa) in Finland means that this older method is still relevant to the language pair. In fact, in the light of the studies reviewed in this thesis it seems that the ideal solution for machine translation from English to Finnish would be a hybrid method which combined the strengths of neural and rule-based machine translation in order to deal with the problems caused by the grammar and vocabulary of Finnish and the deficiencies in English–Finnish parallel corpora.
first_indexed 2020-08-31T20:00:44Z
format Kandityö
free_online_boolean 1
fullrecord [{"key": "dc.contributor.advisor", "value": "Clements, Kati", "language": "", "element": "contributor", "qualifier": "advisor", "schema": "dc"}, {"key": "dc.contributor.author", "value": "Kalenius, Konsta", "language": "", "element": "contributor", "qualifier": "author", "schema": "dc"}, {"key": "dc.date.accessioned", "value": "2020-08-31T05:54:25Z", "language": null, "element": "date", "qualifier": "accessioned", "schema": "dc"}, {"key": "dc.date.available", "value": "2020-08-31T05:54:25Z", "language": null, "element": "date", "qualifier": "available", "schema": "dc"}, {"key": "dc.date.issued", "value": "2020", "language": "", "element": "date", "qualifier": "issued", "schema": "dc"}, {"key": "dc.identifier.uri", "value": "https://jyx.jyu.fi/handle/123456789/71545", "language": null, "element": "identifier", "qualifier": "uri", "schema": "dc"}, {"key": "dc.description.abstract", "value": "T\u00e4m\u00e4 kirjallisuuskatsauksena toteutettu kandidaatintutkielma tarkastelee kolmea keskeist\u00e4 konek\u00e4\u00e4nt\u00e4misen menetelm\u00e4\u00e4 s\u00e4\u00e4nt\u00f6pohjainen, tilastollinen ja neuroverkkokonek\u00e4\u00e4nt\u00e4minen ja niiden tarjoamien englanti\u2013suomi-konek\u00e4\u00e4nn\u00f6sten kehityst\u00e4 ja ominaisuuksia. Neuroverkkokonek\u00e4\u00e4nt\u00e4minen vaikuttaa olevan kirjallisuuskatsauksen perusteella nopeasti kehittyv\u00e4 menetelm\u00e4, joka tarjoaa yh\u00e4 laadukkaampia englanti\u2013suomi-kieliparin konek\u00e4\u00e4nn\u00f6ksi\u00e4. Toisaalta Suomessa on vahvat perinteet kieliparin s\u00e4\u00e4nt\u00f6pohjaisen konek\u00e4\u00e4nn\u00f6ksen kehitt\u00e4misess\u00e4 ja menetelm\u00e4 on yh\u00e4 relevantti englanti\u2013suomi-konek\u00e4\u00e4nt\u00e4misess\u00e4. Tutkielman tarkastelemien tutkimusten valossa n\u00e4ytt\u00e4\u00e4kin silt\u00e4, ett\u00e4 neuroverkkokonek\u00e4\u00e4nt\u00e4misen ja s\u00e4\u00e4nt\u00f6pohjaisen konek\u00e4\u00e4nt\u00e4misen vahvuudet yhdist\u00e4v\u00e4 hybridikonek\u00e4\u00e4nnin olisi ihanteellinen menetelm\u00e4 ratkaisemaan suomen kieliopin ja sanaston ja englanti\u2013suomi-rinnakkaiskorpusten puutteiden aiheuttamia englanti\u2013suomi-konek\u00e4\u00e4nt\u00e4misen ongelmia.", "language": "fi", "element": "description", "qualifier": "abstract", "schema": "dc"}, {"key": "dc.description.abstract", "value": "This Bachelor's Thesis carried out as a literature review focuses on three essential machine translation methods rule-based, statistical and neural machine translation and machine translations from English to Finnish made with these methods and the chronological development and properties of the methods and translations. The literature review shows that neural machine translation is a fast-developing, state-of-the-art method, which offers ever-improving machine translations from English to Finnish. On the other hand, the long-term development of rule-based machine translation from English to Finnish (and vice versa) in Finland means that this older method is still relevant to the language pair. In fact, in the light of the studies reviewed in this thesis it seems that the ideal solution for machine translation from English to Finnish would be a hybrid method which combined the strengths of neural and rule-based machine translation in order to deal with the problems caused by the grammar and vocabulary of Finnish and the deficiencies in English\u2013Finnish parallel corpora.", "language": "en", "element": "description", "qualifier": "abstract", "schema": "dc"}, {"key": "dc.description.provenance", "value": "Submitted by Paivi Vuorio (paelvuor@jyu.fi) on 2020-08-31T05:54:25Z\nNo. of bitstreams: 0", "language": "en", "element": "description", "qualifier": "provenance", "schema": "dc"}, {"key": "dc.description.provenance", "value": "Made available in DSpace on 2020-08-31T05:54:25Z (GMT). No. of bitstreams: 0\n Previous issue date: 2020", "language": "en", "element": "description", "qualifier": "provenance", "schema": "dc"}, {"key": "dc.format.extent", "value": "40", "language": "", "element": "format", "qualifier": "extent", "schema": "dc"}, {"key": "dc.language.iso", "value": "fin", "language": null, "element": "language", "qualifier": "iso", "schema": "dc"}, {"key": "dc.rights", "value": "In Copyright", "language": "en", "element": "rights", "qualifier": null, "schema": "dc"}, {"key": "dc.subject.other", "value": "s\u00e4\u00e4nt\u00f6pohjainen konek\u00e4\u00e4nt\u00e4minen", "language": "", "element": "subject", "qualifier": "other", "schema": "dc"}, {"key": "dc.subject.other", "value": "tilastollinen konek\u00e4\u00e4nt\u00e4minen", "language": "", "element": "subject", "qualifier": "other", "schema": "dc"}, {"key": "dc.subject.other", "value": "neuroverkkokonek\u00e4\u00e4nt\u00e4minen", "language": "", "element": "subject", "qualifier": "other", "schema": "dc"}, {"key": "dc.subject.other", "value": "englanti\u2013suomi-konek\u00e4\u00e4nn\u00f6s", "language": "", "element": "subject", "qualifier": "other", "schema": "dc"}, {"key": "dc.subject.other", "value": "rule-based machine translation", "language": "", "element": "subject", "qualifier": "other", "schema": "dc"}, {"key": "dc.subject.other", "value": "statistical machine translation", "language": "", "element": "subject", "qualifier": "other", "schema": "dc"}, {"key": "dc.subject.other", "value": "neural machine translation", "language": "", "element": "subject", "qualifier": "other", "schema": "dc"}, {"key": "dc.subject.other", "value": "machine translation from English to Finnish", "language": "", "element": "subject", "qualifier": "other", "schema": "dc"}, {"key": "dc.title", "value": "Konek\u00e4\u00e4nt\u00e4misen menetelm\u00e4t englanti\u2013suomi-konek\u00e4\u00e4nn\u00f6ksess\u00e4", "language": "", "element": "title", "qualifier": null, "schema": "dc"}, {"key": "dc.type", "value": "bachelor thesis", "language": null, "element": "type", "qualifier": null, "schema": "dc"}, {"key": "dc.identifier.urn", "value": "URN:NBN:fi:jyu-202008315675", "language": "", "element": "identifier", "qualifier": "urn", "schema": "dc"}, {"key": "dc.type.ontasot", "value": "Bachelor's thesis", "language": "en", "element": "type", "qualifier": "ontasot", "schema": "dc"}, {"key": "dc.type.ontasot", "value": "Kandidaatinty\u00f6", "language": "fi", "element": "type", "qualifier": "ontasot", "schema": "dc"}, {"key": "dc.contributor.faculty", "value": "Informaatioteknologian tiedekunta", "language": "fi", "element": "contributor", "qualifier": "faculty", "schema": "dc"}, {"key": "dc.contributor.faculty", "value": "Faculty of Information Technology", "language": "en", "element": "contributor", "qualifier": "faculty", "schema": "dc"}, {"key": "dc.contributor.department", "value": "Informaatioteknologia", "language": "fi", "element": "contributor", "qualifier": "department", "schema": "dc"}, {"key": "dc.contributor.department", "value": "Information Technology", "language": "en", "element": "contributor", "qualifier": "department", "schema": "dc"}, {"key": "dc.contributor.organization", "value": "Jyv\u00e4skyl\u00e4n yliopisto", "language": "fi", "element": "contributor", "qualifier": "organization", "schema": "dc"}, {"key": "dc.contributor.organization", "value": "University of Jyv\u00e4skyl\u00e4", "language": "en", "element": "contributor", "qualifier": "organization", "schema": "dc"}, {"key": "dc.subject.discipline", "value": "Tietoj\u00e4rjestelm\u00e4tiede", "language": "fi", "element": "subject", "qualifier": "discipline", "schema": "dc"}, {"key": "dc.subject.discipline", "value": "Information Systems Science", "language": "en", "element": "subject", "qualifier": "discipline", "schema": "dc"}, {"key": "yvv.contractresearch.funding", "value": "0", "language": "", "element": "contractresearch", "qualifier": "funding", "schema": "yvv"}, {"key": "dc.type.coar", "value": "http://purl.org/coar/resource_type/c_7a1f", "language": null, "element": "type", "qualifier": "coar", "schema": "dc"}, {"key": "dc.rights.accesslevel", "value": "openAccess", "language": null, "element": "rights", "qualifier": "accesslevel", "schema": "dc"}, {"key": "dc.type.publication", "value": "bachelorThesis", "language": null, "element": "type", "qualifier": "publication", "schema": "dc"}, {"key": "dc.subject.oppiainekoodi", "value": "601", "language": "", "element": "subject", "qualifier": "oppiainekoodi", "schema": "dc"}, {"key": "dc.subject.yso", "value": "k\u00e4\u00e4nt\u00e4minen", "language": null, "element": "subject", "qualifier": "yso", "schema": "dc"}, {"key": "dc.subject.yso", "value": "tietokoneavusteinen k\u00e4\u00e4nt\u00e4minen", "language": null, "element": "subject", "qualifier": "yso", "schema": "dc"}, {"key": "dc.subject.yso", "value": "tietokonelingvistiikka", "language": null, "element": "subject", "qualifier": "yso", "schema": "dc"}, {"key": "dc.rights.url", "value": "https://rightsstatements.org/page/InC/1.0/", "language": null, "element": "rights", "qualifier": "url", "schema": "dc"}]
id jyx.123456789_71545
language fin
last_indexed 2025-03-31T20:01:58Z
main_date 2020-01-01T00:00:00Z
main_date_str 2020
online_boolean 1
online_urls_str_mv {"url":"https:\/\/jyx.jyu.fi\/bitstreams\/af0637f0-1b81-48b8-9f30-8bc5378550cd\/download","text":"URN:NBN:fi:jyu-202008315675.pdf","source":"jyx","mediaType":"application\/pdf"}
publishDate 2020
record_format qdc
source_str_mv jyx
spellingShingle Kalenius, Konsta Konekääntämisen menetelmät englanti–suomi-konekäännöksessä sääntöpohjainen konekääntäminen tilastollinen konekääntäminen neuroverkkokonekääntäminen englanti–suomi-konekäännös rule-based machine translation statistical machine translation neural machine translation machine translation from English to Finnish Tietojärjestelmätiede Information Systems Science 601 kääntäminen tietokoneavusteinen kääntäminen tietokonelingvistiikka
title Konekääntämisen menetelmät englanti–suomi-konekäännöksessä
title_full Konekääntämisen menetelmät englanti–suomi-konekäännöksessä
title_fullStr Konekääntämisen menetelmät englanti–suomi-konekäännöksessä Konekääntämisen menetelmät englanti–suomi-konekäännöksessä
title_full_unstemmed Konekääntämisen menetelmät englanti–suomi-konekäännöksessä Konekääntämisen menetelmät englanti–suomi-konekäännöksessä
title_short Konekääntämisen menetelmät englanti–suomi-konekäännöksessä
title_sort konekääntämisen menetelmät englanti suomi konekäännöksessä
title_txtP Konekääntämisen menetelmät englanti–suomi-konekäännöksessä
topic sääntöpohjainen konekääntäminen tilastollinen konekääntäminen neuroverkkokonekääntäminen englanti–suomi-konekäännös rule-based machine translation statistical machine translation neural machine translation machine translation from English to Finnish Tietojärjestelmätiede Information Systems Science 601 kääntäminen tietokoneavusteinen kääntäminen tietokonelingvistiikka
topic_facet 601 Information Systems Science Tietojärjestelmätiede englanti–suomi-konekäännös kääntäminen machine translation from English to Finnish neural machine translation neuroverkkokonekääntäminen rule-based machine translation statistical machine translation sääntöpohjainen konekääntäminen tietokoneavusteinen kääntäminen tietokonelingvistiikka tilastollinen konekääntäminen
url https://jyx.jyu.fi/handle/123456789/71545 http://www.urn.fi/URN:NBN:fi:jyu-202008315675
work_keys_str_mv AT kaleniuskonsta konekääntämisenmenetelmätenglantisuomikonekäännöksessä