Détection de gènes coadaptés par analyse pangénomique de signatures de sélection épistatique : application chez la légumineuse modèle Medicago truncatula - Laboratoire de Recherche en Sciences Végétales Accéder directement au contenu
Thèse Année : 2020

Detection of coadapted genes by genome-wide analysis of epistatic selection signatures : application in the model legume Medicago truncatula

Détection de gènes coadaptés par analyse pangénomique de signatures de sélection épistatique : application chez la légumineuse modèle Medicago truncatula

Résumé

Adaptation by natural selection is central to the evolution of species. By targeting differences in survival and/or reproduction of individuals according to changes in the environment, selection filters genetic variants in populations. Extremely conserved genes are subjected to purifying selection which eliminates deleterious mutations, while other more polymorphic genes will carry positively selected mutations in a certain environmental context. For more than 20 years, modeling in population genetics and the emergence of sequencing technologies allowing the identification of genetic variants at the genome level (e.g. Single Nucleotide Polymorphisms - SNP) have allowed the development of numerous statistical methods analyzing polymorphism to identify genes or regions of the genome presenting selection signatures, while taking into account the other evolutionary forces (genetic drift, gene flow) influencing this polymorphism. However, they test the selection hypothesis independently at each locus and do not allow the interaction between the alleles of genes to be explored as a potential target for epistatic selection. Still, quantitative genetics and modern biology unquestionably show that genes are not functionally independent entities, but that they are interacting elements in larger networks allowing the expression of biological characteristics. The purpose of this thesis is to propose a new statistical test which makes it possible to identify epistatic selection signatures, therefore coadapted genes, on the basis of linkage disequilibrium (DL) using SNP markers. In the first part, we describe the proposed statistics, Trv and TcorPC1v, which compare pairs of SNPs or genomic regions. They are based on recent work showing that the correlation coefficient (r), strongly influenced by the genetic structure of populations and the degree of genetic similarity between individuals, must be corrected (rv) by the relationship matrix between individuals (V). Coupled with intensive calculations, simulations of genome-wide SNP data in structured populations have made it possible to demonstrate that Trv and TcorPC1v follow a Student distribution t(n-2), greatly reduce noisy DL background generated by non-selective evolutionary forces, and show good detection power. In a second part, we use the "Genome-Wide Epistatic Selection Scan" (GWESS) approach in the model plant Medicago truncatula, where a candidate gene is used as bait to calculate its correlation with all the other genes in the genome. Following the identification of an epistatic selection signature between MtSUNN and MtCLE02, coding respectively for a receptor and a signaling peptide, a proof of concept is provided by the experimental demonstration (collaboration) that MtCLE02 has a MtSUNN-dependent negative role on nodulation. The GWESS approach applied to SNP data in humans shows an epistatic selection signature between the SLC24A5 and EDAR genes, involved in skin pigmentation and the development of ectodermal organs (hair, teeth).[...]
L'adaptation par sélection naturelle est centrale dans l'évolution des espèces. En ciblant les différences de survie et/ou de reproduction des individus en fonction des changements de l'environnement, la sélection filtre les variants génétiques dans les populations. Les gènes extrêmement conservés sont soumis à la sélection purifiante qui élimine les mutations délétères, alors que d'autres gènes plus polymorphes porteront des mutations positivement sélectionnées dans un certain contexte environnemental. Depuis plus de 20 ans, la modélisation en génétique des populations et l'émergence de technologies de séquençage accélérant l'identification de variants génétiques à l'échelle du génome (e.g. les Single Nucleotide Polymorphisms - SNP) ont permis le développement de nombreuses méthodes statistiques analysant le polymorphisme pour identifier des gènes ou régions du génome présentant des signatures de sélection, tout en tenant compte des autres forces évolutives (dérive génétique, flux géniques) influençant ce polymorphisme. Cependant, elles testent l'hypothèse de sélection indépendamment sur chaque locus et ne permettent pas d'explorer l'interaction entre les allèles des gènes comme cible potentielle de la sélection épistatique. Or, la génétique quantitative et la biologie moderne montrent indiscutablement que les gènes ne sont pas des entités fonctionnellement indépendantes, mais qu'ils sont des éléments interagissant dans des réseaux plus vastes permettant l'expression des caractéristiques biologiques. Cette thèse a pour objectif de proposer un nouveau test statistique qui permet d'identifier des signatures de sélection épistatique, donc des gènes coadaptés, sur la base du déséquilibre de liaison (DL) à l'aide de marqueurs SNP. Dans une première partie, nous décrivons les statistiques proposées, Trv et TcorPC1v, qui comparent des paires de SNP ou de régions génomiques. Elles sont basées sur des travaux récents montrant que le coefficient de corrélation (r), fortement influencé par la structuration génétique des populations et l'apparentement des individus, doit être corrigé (rv) par la matrice d'apparentement entre les individus (V). Couplées à des calculs intensifs, des simulations de données SNP pangénomiques en populations structurées ont permis de démontrer que Trv et TcorPC1v suivent une distribution de Student t(n-2), réduisent fortement le bruit de fond de DL généré par les forces évolutives non sélectives, et ont une bonne puissance de détection. Dans une deuxième partie, nous utilisons l'approche de " Genome-Wide Epistatic Selection Scan " (GWESS) chez la plante modèle Medicago truncatula, où un gène candidat est utilisé comme appât pour calculer sa corrélation avec tous les autres gènes du génome. Suite à l'identification d'une signature de sélection épistatique entre MtSUNN et MtCLE02, codant respectivement pour un récepteur et un peptide de signalisation, une preuve de concept est apportée par la démonstration expérimentale (collaboration) que MtCLE02 a un rôle négatif sur la nodulation et dépendant de MtSUNN.[...]
Fichier principal
Vignette du fichier
2020TOU30224a.pdf (9.83 Mo) Télécharger le fichier
Origine : Version validée par le jury (STAR)

Dates et versions

tel-03209335 , version 1 (27-04-2021)

Identifiants

  • HAL Id : tel-03209335 , version 1

Citer

Léa Boyrie. Détection de gènes coadaptés par analyse pangénomique de signatures de sélection épistatique : application chez la légumineuse modèle Medicago truncatula. Biologie végétale. Université Paul Sabatier - Toulouse III, 2020. Français. ⟨NNT : 2020TOU30224⟩. ⟨tel-03209335⟩
144 Consultations
106 Téléchargements

Partager

Gmail Facebook X LinkedIn More