Alignements locaux pour la reconnaissance de repliements des protéines par programmation linéaire en nombres entiers - INRIA - Institut National de Recherche en Informatique et en Automatique Accéder directement au contenu
Thèse Année : 2010

Protein Fold Recognition by Mixed Integer Programming

Alignements locaux pour la reconnaissance de repliements des protéines par programmation linéaire en nombres entiers

Résumé

Detecting similarities and homologies between proteins is a key step during the annotation process. To find such homologies, multiple sequence alignments are widely used. These methods provide global to local alignment features. Nevertheless, in the so called "Twilight Zone", one must relies on fold recognition methods to find homologous proteins. In this field, the Protein Threading Problem (PTP) uses pairwise parameters to globaly align a protein sequence with a protein structure. As far as we know, no local alignment method using pairwise parameters exists. Based on the PTP, we proposed 5 mathematical formulations of such local alignments. These formulations have been implemented and tested with CPLEX 10.0 package. Then, we developed an efficient dedicated algorithm to solve local alignments. Our algorithm uses well-known techniques from Operational Research: Branch & Bound, Subgradient Descent and Lagrangian Relaxation. We show that, despite greater complexity, local alignments using pairwise parameters are feasible and improve the quality of the alignments.
Détecter des similarités et des homologies entre protéines est une étape cruciale du processus d'annotation des génomes. Afin de détecter des homologies, les alignements de séquences, globaux ou locaux, sont couramment utilisés. Néanmoins, dans la "zone d'ombre", nous devons utiliser les méthodes de reconnaissance de repliements. Dans ce domaine, le problème du "Protein Threading" (PTP) utilise des paramètres pairés pour aligner globalement une séquence de protéine avec une structure de protéine. À notre connaissance, il n'existe pas de méthode d'alignement local utilisant des paramètres pairés. À partir du PTP, nous proposons cinq modélisations mathématiques de ces alignements locaux qui ont été implémentées et testées grâce au logiciel CPLEX 10.0. Nous avons ensuite développé un algorithme dédié permettant de résoudre un de ces modèles. Cet algorithme utilise des techniques connues en recherche opérationnelle : la séparation-évaluation, la descente de sous-gradient et la relaxation lagrangienne. Bien que les alignements locaux soient d'une plus grande complexité, nous montrons qu'ils sont réalisables et qu'ils améliorent la qualité des alignements.
Fichier principal
Vignette du fichier
manuscrit_GC.pdf (942.89 Ko) Télécharger le fichier

Dates et versions

tel-00512725 , version 1 (31-08-2010)

Identifiants

  • HAL Id : tel-00512725 , version 1

Citer

Guillaume Collet. Alignements locaux pour la reconnaissance de repliements des protéines par programmation linéaire en nombres entiers. Modélisation et simulation. Université Rennes 1, 2010. Français. ⟨NNT : ⟩. ⟨tel-00512725⟩
297 Consultations
158 Téléchargements

Partager

Gmail Facebook X LinkedIn More