Puhujariippuvainen puhekomentojentunnistus neuroverkoilla

Tässä tutkimuksessa etsittiin puhekomennontunnistusmallia, joka voitaisiin kouluttaa pienellä määrällä äänitteitä tunnistamaan muutamia ennalta määrättyjä tietyn henkilön komentoja. Kolmea puhujariippuvaisella datalla koulutettua neuroverkkomallia vertailtiin muun muassa tunnistustarkkuuden ja tunni...

Full description

Bibliographic Details
Main Author: Nummelin, Panu
Other Authors: Informaatioteknologian tiedekunta, Faculty of Information Technology, Informaatioteknologia, Information Technology, Jyväskylän yliopisto, University of Jyväskylä
Format: Master's thesis
Language:fin
Published: 2021
Subjects:
Online Access: https://jyx.jyu.fi/handle/123456789/76696
Description
Summary:Tässä tutkimuksessa etsittiin puhekomennontunnistusmallia, joka voitaisiin kouluttaa pienellä määrällä äänitteitä tunnistamaan muutamia ennalta määrättyjä tietyn henkilön komentoja. Kolmea puhujariippuvaisella datalla koulutettua neuroverkkomallia vertailtiin muun muassa tunnistustarkkuuden ja tunnistusnopeuden suhteen. Tutkimuksessa parhaitenkin suoriutunut malli todettiin liian epäluotettavaksi käytännön käyttöön. Mahdollisiksi tavoiksi parantaa mallia esitettiin muuksi kuin komennoiksi luokiteltavan äänidatan ottaminen osaksi koulutusta ja data-augmentaatio. In this study a speech command recognition model that could be trained with small amount of data to recognize a few predefined commands spoken by a specific person was sought. Three neural network models trained with speaker-dependent data were compared by their recognition accuracy and inference speed among other metrics. Even the best performing model of the study was deemed to be unsuitable for practical application. Integrating non-command speech data into the training process and data-augmentation were brought up as possible ways to improve the model's performance.