Needleman–Wunsch-algoritmi biosekvenssien rinnastuksessa

Jatkuvasti kasvava biologisen datan määrä asettaa uusia vaatimuksia biosekvenssien rinnastusalgoritmeille bioinformatiikan alalla. Tässä kandidaatintutkielmassa on aihetta käsittelevän lähdekirjallisuuden avulla kartoitettu bioinformatiikan ja molekyylibiologisten tietokantojen nykytilannetta, ja ta...

Täydet tiedot

Bibliografiset tiedot
Päätekijä: Riikonen, Juha
Muut tekijät: Informaatioteknologian tiedekunta, Faculty of Information Technology, Informaatioteknologia, Information Technology, Jyväskylän yliopisto, University of Jyväskylä
Aineistotyyppi: Kandityö
Kieli:fin
Julkaistu: 2019
Aiheet:
Linkit: https://jyx.jyu.fi/handle/123456789/64387
Kuvaus
Yhteenveto:Jatkuvasti kasvava biologisen datan määrä asettaa uusia vaatimuksia biosekvenssien rinnastusalgoritmeille bioinformatiikan alalla. Tässä kandidaatintutkielmassa on aihetta käsittelevän lähdekirjallisuuden avulla kartoitettu bioinformatiikan ja molekyylibiologisten tietokantojen nykytilannetta, ja tarkasteltu biosekvenssien rinnastuksessa käytetyn Needleman–Wunsch-algoritmin toimintaa ja tehokkuutta.Aikoinaan uraauurtava Needleman– Wunsch-algoritmi vaatii kuitenkin kohtuuttoman paljon laskenta-aikaa suurissa tietokantahauissa, joita mielekäs biologisen datan käsittely nykypäivänä vaatii. Tässä kohtaa kuvioihin astuvat tulosten optimaalisuudessa joustavat heuristiset rinnastusalgoritmit, joiden avulla usean pitkänkin sekvenssin samanaikainen rinnastus on mahdollista kohtuullisessa ajassa. The constantly increasing amount of biological data is setting new standards for the efficiency of biosequence alignment algorithms in the field of bioinformatics. In this literature review we survey the current state of bioinformatics and biological databases, and focus on the Needleman–Wunsch algorithm used in biosequence alignment. However, the once groundbreaking algorithm proves to be too time consuming in performing large database queries, which are required to efficiently utilize the data in existing biological databases. This is where heuristic alignment algorithms step in, which are able to align multple long sequences simultaneously in a reasonble time at the cost of specificity.