Machine learning for neuroimaging using a very large scale clinical datawarehouse - INRIA - Institut National de Recherche en Informatique et en Automatique Accéder directement au contenu
Thèse Année : 2022

Machine learning for neuroimaging using a very large scale clinical datawarehouse

Apprentissage automatique pour la neuro-imagerie à l'aide d'un entrêpot de données cliniques à très grande échelle

Résumé

Machine learning (ML) and deep learning (DL) have been widely used for the computer-aided diagnosis (CAD) of neurodegenerative diseases The main limitation of these tools is that they have been mostly validated using research data sets that are very different from clinical routine ones. Clinical data warehouses (CDW) allow access to such clinical data.This PhD work consisted in applying ML/DL algorithms to data originating from the CDW of the Greater Paris area to validate CAD of neurodegenerative diseases.We developed, thanks to the manual annotation of 5500 images, an automatic approach for the quality control (QC) of T1-weighted (T1w) brain magnetic resonance images (MRI) from a clinical data set. QC is fundamental as insufficient image quality can prevent CAD systems from working properly. In the second work, we focused on the homogenization of T1w brain MRIs from a CDW. We proposed to homogenize such large clinical data set by converting images acquired after the injection of gadolinium into non-contrast-enhanced images. Lastly, we assessed whether ML/DL algorithms could detect dementia in a CDW using T1w brain MRI. We identified the population of interest using ICD-10 codes. We studied how the imbalance of the training sets may bias the results and we proposed strategies to attenuate these biases.
L'apprentissage automatique et l'apprentissage profond ont été utilisés pour le diagnostic assisté par ordinateur des maladies neurodégénératives. Leur limite est la validation en utilisant des données de recherche, très différentes des données de routine clinique. Les entrepôts de données de santé (EDS) permettent d'accéder à ces données. Cette thèse a consisté à appliquer des algorithmes d'apprentissage automatique à des données provenant de l'EDS de l'Assistance Publique-Hôpitaux de Paris pour valider les outils pour le diagnostic assisté par ordinateur de maladies neurodégénératives. Nous avons développé, grâce à l'annotation manuelle de 5500 images, une approche automatique pour le contrôle qualité des images par résonance magnétique cérébrales pondérées en T1 (T1w-IRM) d'un EDS. Dans le second travail, nous avons travaillé sur l'homogénéisation des T1w-IRM provenant d'un EDS. Nous avons proposé d'homogénéiser ces données cliniques en convertissant les images acquises après l'injection de gadolinium en images sans contraste. Enfin, nous avons évalué si les algorithmes pouvaient détecter la démence dans un EDS en utilisant les T1w-IRM. En identifiant la population d'intérêt grâce aux codes CIM-10, nous avons étudié comment le déséquilibre des ensembles d'entraînement peuvent biaiser les résultats et nous avons proposé des stratégies pour atténuer ces biais.
Fichier principal
Vignette du fichier
BOTTANI_Simona_these_2022.pdf (7.26 Mo) Télécharger le fichier
Origine : Version validée par le jury (STAR)

Dates et versions

tel-03671129 , version 1 (18-05-2022)
tel-03671129 , version 2 (19-07-2022)

Identifiants

  • HAL Id : tel-03671129 , version 2

Citer

Simona Bottani. Machine learning for neuroimaging using a very large scale clinical datawarehouse. Artificial Intelligence [cs.AI]. Sorbonne Université, 2022. English. ⟨NNT : 2022SORUS110⟩. ⟨tel-03671129v2⟩
378 Consultations
132 Téléchargements

Partager

Gmail Facebook X LinkedIn More