Requirements for artificial intelligence used for the diagnosis of the COVID-19 from chest X-rays

Viime aikoina on julkaistu useita tekoälymalleja COVID-19 diagnosoimiseen keuhkoröntgenkuvista. Valitettavasti useiden arvioiden perusteella niissä on ongelmia jotka tekevät ne käyttökelvottomiksi kliinisessä työssä. Tässä työssä on kerätty eri lähteistä tietoa siitä mitä tekoälymallilta vaaditaan j...

Full description

Bibliographic Details
Main Author: Kalliokoski, Tuomo
Other Authors: Informaatioteknologian tiedekunta, Faculty of Information Technology, Informaatioteknologia, Information Technology, Jyväskylän yliopisto, University of Jyväskylä
Format: Master's thesis
Language:eng
Published: 2022
Subjects:
Online Access: https://jyx.jyu.fi/handle/123456789/80093
Description
Summary:Viime aikoina on julkaistu useita tekoälymalleja COVID-19 diagnosoimiseen keuhkoröntgenkuvista. Valitettavasti useiden arvioiden perusteella niissä on ongelmia jotka tekevät ne käyttökelvottomiksi kliinisessä työssä. Tässä työssä on kerätty eri lähteistä tietoa siitä mitä tekoälymallilta vaaditaan jotta sitä voi käyttää diagnosoimiseen. Tärkeimmät vaatimukset ovat tuloksen selitettävyys, käytetyn datan vääristymien korjaaminen (esimerkiksi ikäjakaumat voivat olla hyvin erilaiset eri lähteissä), tarkka dokumentaatio prosessista ja perinpohjainen tilastollinen analyysi mallin toimivuudesta. Työn heikkoutena voidaan pitää käytettyjen metodien rajoittumista aikaisempien julkaisujen tutkimiseen ja sitä että käytössä ei ollut lääketieteellistä asiantuntemusta. Mahdolliset lisävaatimukset eivät kuitenkaan kumoa tässä työssä löydettyjä vaatimuksia. There has been multiple publications with artificial intelligence (AI) models for COVID-19 diagnosis using chest X-ray images. Unfortunately according to multiple reviews the suggested models have issues making them unusable for clinical application. This work has collected the requirements for a diagnostic AI model using various sources. The most important requirements are: explainability, bias corrections (for example age distribution can have significant differences between datasets), precise documentation and thorough statistical analysis of the performance of the proposed model. The main weaknesses in this work are the choice of methods used, as they are limited to study of previous publications, and lack of available clinical expertise. This is not critical issue as possible additional requirements will not be in conflict with the requirements found in this work.