Multimodal medical data analysis for improved disease diagnosis and treatment outcome prediction Multimodal Medical Data Analysis

Terveydenhuollon suurten tietomassojen kasvu ja monimodaalisen lääketieteellisen datan jatkuva kertyminen ovat tehneet erilaisten tietolähteiden tehokkaasta yhdistämisestä keskeisen haasteen älykkäässä terveydenhuollossa. Monimodaalinen data – kuten kliiniset potilastiedot, lääketieteelliset kuvanta...

Täydet tiedot

Bibliografiset tiedot
Päätekijä: Hao, Xinyu
Muut tekijät: Informaatioteknologian tiedekunta, Faculty of Information Technology
Aineistotyyppi: Väitöskirja
Julkaistu: 2025
Linkit: https://jyx.jyu.fi/handle/123456789/102937
Kuvaus
Yhteenveto:Terveydenhuollon suurten tietomassojen kasvu ja monimodaalisen lääketieteellisen datan jatkuva kertyminen ovat tehneet erilaisten tietolähteiden tehokkaasta yhdistämisestä keskeisen haasteen älykkäässä terveydenhuollossa. Monimodaalinen data – kuten kliiniset potilastiedot, lääketieteelliset kuvantamiset, genomiinformaatio ja tekstimuotoiset lausunnot – tarjoaa toisiaan täydentäviä näkökulmia potilaan terveydentilasta. Näiden yhdistäminen analyysissä voi merkittävästi parantaa diagnostiikan ja hoitotulosten tarkkuutta ja selitettävyyttä. Haasteita aiheuttavat kuitenkin edelleen esimerkiksi rajoitettu määrä merkittyä dataa, puutteelliset tietueet, sairauden ajallinen dynamiikka ja vaikeus mallintaa kudosleikkeiden alueellista yhteistoimintaa. Tässä väitöskirjassa tutkitaan syväoppimismenetelmiä monimodaalisen lääketieteellisen datan analysointiin, tavoitteenaan parantaa sairauden diagnosointia ja hoitovasteen ennustamista. Artikkeleissa I ja II kehitettiin vaiheittaisia koneoppimismalleja raskauden aikaisen riskin reaaliaikaiseen ennustamiseen pitkittäisten kliinisten tietojen perusteella. Artikkelit III ja IV esittivät hybridikehyksen, joka yhdistää heikosti ja osittain valvotun oppimisen rintasyövän patologisen hoitovasteen ennustamiseksi moniparametrisestä MRI-datasta, vähentäen pikselitason annotaatioiden tarvetta. Artikkelissa V esiteltiin ajalliseen kontrastioppimiseen perustuva malli kasvaimen dynamiikan mallintamiseksi pitkittäisen MRI:n avulla. Artikkelissa VI kehitettiin monimodaalinen syklinen piirreluontiverkko, joka oppii patologian ja genomiikan yhteisiä esityksiä koulutuksessa, mahdollistaen ennustamisen pelkän patologian perusteella käyttöhetkellä. Lopuksi artikkelissa VII parannettiin eturauhassyövän Gleason-luokitusta tuomalla esiin mallin, joka hyödyntää valikoivaa piirrekoostamista ja alueiden välistä yhteistyötä digitaalisissa kudosleikkeissä. Yhteenvetona väitöskirja esittelee innovatiivisia menetelmiä, jotka liittyvät monimodaaliseen tietofuusioon, heikosti valvottuun oppimiseen, ajalliseen mallintamiseen ja asiantuntijatietoon perustuvaan analyysiin. Menetelmiä on validoitu laajasti julkisissa ja kliinisissä aineistoissa, ja ne ovat saavuttaneet erinomaisia tuloksia syöpätutkimuksen eri tehtävissä. Tulokset tukevat tarkkuuslääketieteen edistämistä älykkäiden, dataohjattujen ratkaisujen avulla. With the rapid advancement of healthcare big data and the increasing availability of multimodal medical data, the effective integration and analysis of heterogeneous data sources have emerged as critical challenges in intelligent healthcare. Multimodal medical data, such as structured clinical records, medical imaging including MRI and digital pathology, genomic information, and textual medical reports, provide complementary perspectives on a patient’s health status. Joint analysis of these modalities can substantially enhance the accuracy, robustness, and interpretability of disease diagnosis and treatment outcome prediction. However, several technical challenges persist, including limited labeled data, incomplete records, the temporal complexity of disease progression, and the absence of collaborative modeling across spatial regions in digital pathology slides. This dissertation explores deep learning methods for multimodal medical data analysis to improve disease diagnosis and treatment response prediction. In Articles I & II, we developed stage-wise machine learning models for realtime pregnancy risk prediction using longitudinal clinical data. Articles III & IV proposed a hybrid weakly and semi-supervised framework for predicting pathological complete response in breast cancer using multi-parametric MRI, reducing reliance on pixel-level annotations. In Article V, we introduced a temporal contrastive learning model to capture dynamic tumor evolution using longitudinal MRI. Article VI presents a multimodal cyclic generation network that learns joint pathology-genomics representations during training, enabling single-pathology input for prognosis prediction at inference. Finally, Article VII enhances prostate cancer Gleason grading by introducing a pattern-aware feature aggregation strategy to model collaborative regional features in whole slide images. Collectively, this dissertation contributes a series of innovations across multimodal data fusion, weak/semi-supervised learning, temporal modeling, and domain-informed feature aggregation. The proposed methods have been extensively validated on public datasets and clinical cohorts, achieving state-of-the-art performance in multiple cancer-related tasks. The findings offer a solid foundation for advancing precision medicine through intelligent data-driven solutions.