Deep generative learning for medical data processing, analysis and modeling : application to cochlea CT imaging

Zihao Wang

Résumé

This thesis aims to expose several applications of artificial intelligence (AI) for medical data processing and understanding. Medical imaging is a domain generating massive data, which thus requires more and more time for clinicians to process and analyze them. In this manuscript, we show how generative learning can help in many aspects of the processing, understanding, and modeling of CT images of the inner ear. First, we develop a deep generative model to solve a commonly encountered problem in CT imaging: the presence of metal artifacts. This model may allow clinicians to better assess the quality of cochlea implant (CI) positioning with a reduced presence of artifacts. To this end, a generative adversarial neural network (GAN) framework equipped with a specially designed loss function is proposed. That network was trained on a synthetic CT volume dataset resulting from the application of X-ray physics simulations. Second, since many deep learning segmentation methods fail to cope with explicit shape representations, we propose a Bayesian generative framework that addresses the issues of shape model inference in 3D images. We focus on the balance between shape and appearance through an Expectation-Maximisation (EM) approach. The method is applied to the segmentation of more than 200 patient CT volumes. The results show performances that are comparable to supervised methods and better than previously proposed unsupervised ones. Besides, we show how the proposed framework can estimate the uncertainty in the shape parameters. Third, we tackle the issue of the compact representation of CT images through a novel flow-based deep generative network. Generative models can create an implicit distribution of the imaging dataset from which one can generate samples. For a better representation, we proposed a Quasi-symplectic Langevin Variational Autoencoder (Langevin-VAE) that improves the current gradients, flow-based generative models. Finally, we propose an online framework for medical landmarks detection that can cope with the difficulty to manually position landmarks in volumetric images. The one shot training framework includes an offline step that only requires a single annotated image for training and is applied to the annotation of hundreds of images.

Cette thèse vise à exposer plusieurs applications de l'intelligence artificielle (IA) pour le traitement et la compréhension des données médicales. L'imagerie médicale est un domaine générant des données massives, qui nécessitent donc de plus en plus de temps aux cliniciens pour être traitées et analysées. Dans ce manuscrit, nous montrons comment l'apprentissage génératif peut aider dans de nombreux aspects pour le traitement, la compréhension et la modélisation des images scanner de l'oreille interne. Tout d'abord, nous développons un modèle génératif profond pour résoudre un problème couramment rencontré en imagerie CT : la présence d'artefacts métalliques. Ce modèle peut permettre aux cliniciens de mieux évaluer la qualité du positionnement des électrodes d'un implant cochléaire avec une présence réduite d'artefacts. Pour cela, un réseau de neurones antagoniste et génératif (GAN) est proposé intégrant une fonction de perte spécifique. Ce réseau a été entrainé sur un ensemble d'images volumiques scanner synthétiques résultant de l'application de simulations de la physique des rayons X. Deuxièmement, étant donné que de nombreuses méthodes de segmentation d'apprentissage profond ne parviennent pas à gérer explicitement les modèles de forme, nous proposons un cadre génératif bayésien qui aborde les problèmes d'inférence de modèle de forme dans les images médicales 3D. Notre approche permet de faire un compromis entre les informations de forme et d'apparence issus de l'image à travers une approche d'espérance-maximisation (EM). Celle-ci est appliquée à la segmentation de plus de 200 volumes tomodensitométriques de patients. Les résultats indiquent des performances comparables aux méthodes supervisées et meilleures que les méthodes non supervisées proposées précédemment. En outre, nous montrons comment ce cadre méthodologique proposé peut estimer l'incertitude dans les paramètres de forme. Troisièmement, nous abordons le problème de la représentation compacte des images scanner à travers un nouveau réseau génératif profond basé sur les flux. Les modèles génératifs peuvent créer une distribution implicite de l'ensemble de données d'imagerie à partir duquel on peut générer des échantillons. Pour une meilleure représentation, nous avons proposé un Auto-encodeur Variationnel Quasi-symplectique avec une dynamique de Langevin (Langevin-VAE) qui améliore les gradients actuels des modèles génératifs basés sur les flux. Enfin, nous proposons une méthode pour la détection de points caractéristiques qui permet de s'affranchir de la difficulté de positionner manuellement ces points dans des images volumiques. Cette approche comprend une étape préalable d'apprentissage ne nécessitant qu'une seule image annotée pour l'entrainement. Elle est appliquée à l'annotation de centaines d'images scanner de l'oreille interne.

Deep generative learning for medical data processing, analysis and modeling : application to cochlea CT imaging

Apprentissage génératif pour le traitement, l'analyse et la modélisation des données médicales : application à l'imagerie CT de la cochlée

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager