Greedy Geometric Optimization Algorithms for Collection of Balls - INRIA - Institut National de Recherche en Informatique et en Automatique Accéder directement au contenu
Rapport (Rapport De Recherche) Année : 2013

Greedy Geometric Optimization Algorithms for Collection of Balls

Frédéric Cazals
Tom Dreyfus
  • Fonction : Auteur
  • PersonId : 912791
Sushant Sachdeva
  • Fonction : Auteur
  • PersonId : 935552

Résumé

Modeling 3D objects with balls is routine for two reasons: on the one hand, the medial axis transform allows representing a solid object as a union of medial balls; on the other hand, selected shapes, and molecules in particular, are naturally represented by collections of balls. Yet, the problem of choosing which balls are best suited to approximate a given shape is a non trivial one. This paper addresses two problems in this realm. The first one, conformational diversity selection, consists of choosing $k$ molecular conformations amidst $n$, so as to maximize the geometric diversity of the $k$ conformers. The second one, inner approximation, consists of approximating a molecule of $n$ balls with $k$ balls. On the theoretical side, we demonstrate that for both problems, a geometric generalization of max $k$-cover applies, with weights depending on the cells of a surface or volumetric arrangement. Tackling these problems with greedy strategies, it is shown that the $1-1/e$ bound known in combinatorial optimization applies in some cases but not all. On the applied side, we present a robust and effective implementation of the greedy algorithm for the inner approximation problem, which incorporates the calculation of the exact Delaunay triangulation of a points whose coordinates are degree two algebraic number, of the medial axis of a union of balls, and of a certified estimate of the volume of a union of balls. In particular, we show that the inner approximation of complex molecules yields accurate coarse-grain models with a number of balls 100 times smaller than the number of atoms, a key requirement to simulate crowded protein environments.
Les boules jouent un rôle central en modélisation géométrique pour deux raisons: d'une part la transformée associée à l'axe médian permet de représenter un objet solide comme une union in nie de boules; d'autre part, certaines formes, et les modèles moléculaires de van der Waals en particulier, sont dé nies par une union de boules. Néanmoins, la question de savoir quel ensemble de boules utiliser pour approximer une forme est non trivial, de telle sorte que ce travail aborde deux problèmes liés. Pour les présenter, par conformation moléculaire, nous entendons un modèle dé ni par un ensemble ni de boules. La premier problème, ou selection de diversité géométrique, consiste à choisir k conformations moléculaires parmi n, de façon à maximiser la diversité de l'ensemble choisi. Le second, ou approximation par défaut, consiste à approximer une molécule de n boules par k < n boules. Du point de vue théorique, nous montrons que les deux problèmes peuvent être traités avec une variante géométrique de max k-cover, les poids dépendant de la géométrie d'un arrangement surfacique ou volumique de sphères. La résolution de ces problèmes par un algorithme glouton permet d'avoir un facteur d'approximation borné inférieurement par 1 1=e dans certains cas. D'un point de vue appliqué, nous présentons une implémentation robuste de l'algorithme glouton pour l'approximation par défaut, laquelle incorpore (i) le calcul exact d'une triangulation de Delaunay dont les points ont des coordonnées qui sont des nombres algébriques de degré deux, (ii) le calcul exact de l'axe médian d'une union de boules, et (iii) une approximation certi ée du volume d'une union de boules. En particulier, nous montrons que des approximations précises de modèles moléculaires peuvent être obtenues en utilisant un nombre de boules 100 fois inférieur au nombre d'atomes, une propriété particulièrement séduisante pour la simulation d'environnement protéique dense.
Fichier principal
Vignette du fichier
RR-8205-greedy.pdf (999.86 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-00777892 , version 1 (18-01-2013)

Identifiants

  • HAL Id : hal-00777892 , version 1

Citer

Frédéric Cazals, Tom Dreyfus, Sushant Sachdeva, Shah Nisarg. Greedy Geometric Optimization Algorithms for Collection of Balls. [Research Report] RR-8205, INRIA. 2013, pp.26. ⟨hal-00777892⟩
288 Consultations
348 Téléchargements

Partager

Gmail Facebook X LinkedIn More