Summary: | Terveydenhuollon suurten tietomassojen kasvu ja monimodaalisen lääketieteellisen
datan jatkuva kertyminen ovat tehneet erilaisten tietolähteiden tehokkaasta
yhdistämisestä keskeisen haasteen älykkäässä terveydenhuollossa. Monimodaalinen
data – kuten kliiniset potilastiedot, lääketieteelliset kuvantamiset, genomiinformaatio
ja tekstimuotoiset lausunnot – tarjoaa toisiaan täydentäviä näkökulmia
potilaan terveydentilasta. Näiden yhdistäminen analyysissä voi merkittävästi
parantaa diagnostiikan ja hoitotulosten tarkkuutta ja selitettävyyttä. Haasteita
aiheuttavat kuitenkin edelleen esimerkiksi rajoitettu määrä merkittyä dataa,
puutteelliset tietueet, sairauden ajallinen dynamiikka ja vaikeus mallintaa kudosleikkeiden
alueellista yhteistoimintaa.
Tässä väitöskirjassa tutkitaan syväoppimismenetelmiä monimodaalisen lääketieteellisen
datan analysointiin, tavoitteenaan parantaa sairauden diagnosointia
ja hoitovasteen ennustamista. Artikkeleissa I ja II kehitettiin vaiheittaisia koneoppimismalleja
raskauden aikaisen riskin reaaliaikaiseen ennustamiseen pitkittäisten
kliinisten tietojen perusteella. Artikkelit III ja IV esittivät hybridikehyksen,
joka yhdistää heikosti ja osittain valvotun oppimisen rintasyövän patologisen
hoitovasteen ennustamiseksi moniparametrisestä MRI-datasta, vähentäen
pikselitason annotaatioiden tarvetta. Artikkelissa V esiteltiin ajalliseen kontrastioppimiseen
perustuva malli kasvaimen dynamiikan mallintamiseksi pitkittäisen
MRI:n avulla. Artikkelissa VI kehitettiin monimodaalinen syklinen piirreluontiverkko,
joka oppii patologian ja genomiikan yhteisiä esityksiä koulutuksessa,
mahdollistaen ennustamisen pelkän patologian perusteella käyttöhetkellä.
Lopuksi artikkelissa VII parannettiin eturauhassyövän Gleason-luokitusta tuomalla
esiin mallin, joka hyödyntää valikoivaa piirrekoostamista ja alueiden välistä
yhteistyötä digitaalisissa kudosleikkeissä.
Yhteenvetona väitöskirja esittelee innovatiivisia menetelmiä, jotka liittyvät
monimodaaliseen tietofuusioon, heikosti valvottuun oppimiseen, ajalliseen mallintamiseen
ja asiantuntijatietoon perustuvaan analyysiin. Menetelmiä on validoitu
laajasti julkisissa ja kliinisissä aineistoissa, ja ne ovat saavuttaneet erinomaisia
tuloksia syöpätutkimuksen eri tehtävissä. Tulokset tukevat tarkkuuslääketieteen
edistämistä älykkäiden, dataohjattujen ratkaisujen avulla.
With the rapid advancement of healthcare big data and the increasing availability
of multimodal medical data, the effective integration and analysis of heterogeneous
data sources have emerged as critical challenges in intelligent healthcare.
Multimodal medical data, such as structured clinical records, medical imaging
including MRI and digital pathology, genomic information, and textual medical
reports, provide complementary perspectives on a patient’s health status.
Joint analysis of these modalities can substantially enhance the accuracy, robustness,
and interpretability of disease diagnosis and treatment outcome prediction.
However, several technical challenges persist, including limited labeled data, incomplete
records, the temporal complexity of disease progression, and the absence
of collaborative modeling across spatial regions in digital pathology slides.
This dissertation explores deep learning methods for multimodal medical
data analysis to improve disease diagnosis and treatment response prediction.
In Articles I & II, we developed stage-wise machine learning models for realtime
pregnancy risk prediction using longitudinal clinical data. Articles III & IV
proposed a hybrid weakly and semi-supervised framework for predicting pathological
complete response in breast cancer using multi-parametric MRI, reducing
reliance on pixel-level annotations. In Article V, we introduced a temporal contrastive
learning model to capture dynamic tumor evolution using longitudinal
MRI. Article VI presents a multimodal cyclic generation network that learns joint
pathology-genomics representations during training, enabling single-pathology
input for prognosis prediction at inference. Finally, Article VII enhances prostate
cancer Gleason grading by introducing a pattern-aware feature aggregation strategy
to model collaborative regional features in whole slide images.
Collectively, this dissertation contributes a series of innovations across multimodal
data fusion, weak/semi-supervised learning, temporal modeling, and
domain-informed feature aggregation. The proposed methods have been extensively
validated on public datasets and clinical cohorts, achieving state-of-the-art
performance in multiple cancer-related tasks. The findings offer a solid foundation
for advancing precision medicine through intelligent data-driven solutions.
|