Machine Learning on Population Imaging for Mental Health

Kamalaker Dadi

Résumé

Mental disorders display a vast heterogeneity across individuals. A fundamental challenge to studying their manifestations or risk factors is that the diagnosis of mental pathological conditions are seldom available in large public health cohorts. Here, we seek to develop brain signatures, biomarkers, of mental disorders. For this, we use ma-chine learning to predict mental-health outcomes through population imaging i. e. with brain imaging (Magnetic Resonance Imaging ( MRI )).Given behavioral or clinical assessments, population imaging can relate unique features of the brain variations to these non-brain self-reported measures based on questionnaires. These non-brain measurements carry a unique description of each individual’s psychological differences which can be linked to psychopathology using statistical methods. This PhD thesis investigates the potential of learning such imaging-based outcomes to analyze mental health. Using machine-learning methods, we conduct an evaluation, both a comprehensive and robust, of population measures to guide high-quality predictions of health outcomes. This thesis is organized into three main parts: first, we present an in-depth study of connectome biomarkers, second, we propose a meaningful data reduction which facilitates large-scale population imaging studies, and finally we introduce proxy measures for mental health. We first set up a thorough benchmark for imaging-connectomes to predict clinical phenotypes. With the rise in the high-quality brain images acquired without tasks, there is an increasing demand in evaluation of existing models for predictions. We performed systematic comparisons relating these images to clinical assessments across many cohorts to evaluate the robustness of population imaging methods for mental health. Our benchmarks emphasize the need for solid foundations in building brain networks across individuals. They outline clear methodological choices. Then, we contribute a new generation of brain functional atlases to facilitate high-quality predictions for mental health. Brain functional atlases are indeed the main bottleneck for prediction. These atlases are built by analyzing large-scale functional brain volumes using scalable statistical algorithm, to have better grounding for outcome prediction. After comparing them with state-of-the-art methods, we show their usefulness to mitigate large-scale data handling problems. The last main contribution is to investigate the potential surrogate measures for health outcomes. We consider large-scale model comparisons using brain measurements with behavioral assessments in an imaging epidemiological cohort, the United Kingdom ( UK ) Biobank. On this complex dataset, the challenge lies in finding the appropriate covariates and relating them to well-chosen outcomes. This is challenging, as there are very few available pathological outcomes. After careful model selection and evaluation, we identify proxy measures that display distinct links to socio-demographics and may correlate with non-pathological conditions like the condition of sleep, alcohol consumption and physical fitness activity. These can be indirectly useful for the epidemiological study of mental health.

Les troubles mentaux présentent une grande hétérogénéité entre les individus. Une difficulté fondamentale pour étudier leurs manifestations ou leurs facteurs de risque est que le diagnostic des conditions mentales pathologiques est rarement disponible dans les grandes cohortes de santé publique. Ici, nous cherchons à développer des biomarqueurs, signatures cérébrales de troubles mentaux. Pour cela, nous utilisons l'apprentissage automatique pour prédire les résultats de santé mentale grâce à l'imagerie de population, en se basant sur l’imagerie cérébrale (imagerie par résonance magnétique (IRM)). Compte tenu des évaluations comportementales ou cliniques, l'imagerie de population peut relier les caractéristiques uniques des variations cérébrales à ces mesures autodéclarées non cérébrales basées sur des questionnaires. Ces mesures non cérébrales fournissent une description unique des différences psychologiques de chaque individu qui peuvent être liées à la psychopathologie à l'aide de méthodes statistiques. Cette thèse de doctorat examine le potentiel d'apprentissage de tels résultats basés sur l'imagerie pour analyser la santé mentale. En utilisant des méthodes d'apprentissage automatique, nous effectuons une évaluation, à la fois complète et robuste, des mesures de population pour guider des prévisions de haute qualité des résultats pour la santé. Cette thèse est organisée en trois parties principales: premièrement, nous présentons une étude approfondie des biomarqueurs du connectome, deuxièmement, nous proposons une réduction significative des données qui facilite les études d'imagerie de population à grande échelle, et enfin nous introduisons des mesures indirectes pour la santé mentale. Nous avons d'abord mis en place une étude approfondie des connectomes d'imagerie afin de prédire les phénotypes cliniques. Avec l'augmentation des images cérébrales de haute qualité acquises en l’absence de tâche explicite, il y a une demande croissante d'évaluation des modèles prédictifs existants. Nous avons effectué des comparaisons systématiques reliant ces images aux évaluations cliniques dans de nombreuses cohortes pour évaluer la robustesse des méthodes d'imagerie des populations pour la santé mentale. Nos résultats soulignent la nécessité de fondations solides dans la construction de réseaux cérébraux entre les individus. Ils décrivent des choix méthodologiques clairs. Ensuite, nous contribuons à une nouvelle génération d'atlas fonctionnels du cerveau pour faciliter des prédictions de haute qualité pour la santé mentale. Les atlas fonctionnels du cerveau sont en effet le principal goulot d'étranglement pour la qualité de la prédiction. Ces atlas sont construits en analysant des volumes cérébraux fonctionnels à grande échelle à l'aide d'un algorithme statistique évolutif, afin d'avoir une meilleure base pour la prédiction des résultats. Après les avoir comparés avec des méthodes de pointe, nous montrons leur utilité pour atténuer les problèmes de traitement des données à grande échelle. La dernière contribution principale est d'étudier les mesures de substitution potentielles pour les résultats pour la santé. Nous considérons des comparaisons de modèles à grande échelle utilisant des mesures du cerveau avec des évaluations comportementales dans une cohorte épidémiologique d'imagerie, le UK Biobank. Dans cet ensemble de données complexe, le défi consiste à trouver les covariables appropriées et à les relier à des cibles bien choisies. Cela est difficile, car il y a très peu de cibles pathologiques fiables. Après une sélection et une évaluation minutieuses du modèle, nous identifions des mesures indirectes qui sont en corrélation avec des conditions non pathologiques comme l'état de sommeil, la consommation d'alcool et l'activité physique. Ceux-ci peuvent être indirectement utiles pour l'étude épidémiologique de la santé mentale.

Machine Learning on Population Imaging for Mental Health

Apprentissage statistique sur l'imagerie de population pour la santé mentale

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager