Snooze: A Scalable and Autonomic Cloud Management System - INRIA - Institut National de Recherche en Informatique et en Automatique Accéder directement au contenu
Rapport (Rapport De Recherche) Année : 2014

Snooze: A Scalable and Autonomic Cloud Management System

Résumé

With the advent of cloud computing and the need to satisfy growing customers resource demands, cloud providers now operate increasing amounts of large data centers. In order to ease the creation of private clouds, several open source and commercial Infrastructure-as-a- Service cloud management frameworks have been proposed during the past years. However, all these systems are either highly centralized or have limited fault tolerance support. Consequently, they all share common drawbacks: scalability and Single Point of Failure. In this paper, we present the design, implementation and evaluation of a novel scalable and autonomic virtual machine (VM) management framework called Snooze. For scalability the system utilizes a self-configuring hierarchical architecture and performs distributed VM management. Moreover, fault tolerance is provided at all levels of the hierarchy, thus allowing the system to self-heal in the event of failures. Our large-scale evaluation conducted across multiple geographically distributed clusters of the Grid’5000 experimentation testbed shows that the system scales to over ten thousand system services and can easily manage hundreds of VMs. Moreover, it is robust enough to automatically recover the hierarchy in the event of thousands of concurrent system services failures.
Avec l’avènement des nuages informatiques et le besoin de satisfaire les demandes de ressources croissantes des utilisateurs, les fournisseurs de nuages gèrent désormais un nombre croissant de grands centres de données. Afin de faciliter la création de nuages privés, plusieurs systèmes de gestion de nuages offrant des services d’infrastructure, open source et commerciaux, ont été proposés ces dernières années. Cependant, tous ces systèmes sont très centralisés ou offre un support limité pour la tolérance aux fautes. Par conséquent, ils partagent plusieurs incon- vénients : faible extensibilité et point unique de défaillance. Dans cet article, nous présentons la conception, la mise en oeuvre et l’évaluation d’un nouveau système de gestion de machines virtuelles extensible et autonome appelé Snooze. A des fins d’extensibilité, le système utilise une architecture hiérarchique auto-configurable et gère les machines virtuelles de manière distribuée. En outre, la tolérance aux fautes est assurée à tous les niveaux de la hiérarchie, permettant au système de s’auto-réparer en cas de défaillance. L’évaluation à grande échelle nous avons conduite sur des grappes géographiquement distribuées de la plate-forme d’expérimentation Grid’5000 montre que le système passe à l’échelle avec plus de 10 000 services système et peut facilement gérer des centaines de machines virtuelles. De plus, il est suffisamment robuste pour rétablir la hiérarchie dans le cas de milliers de défaillances simultanées.
Fichier principal
Vignette du fichier
RR-8649.pdf (921.02 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-01091755 , version 1 (08-12-2014)

Identifiants

  • HAL Id : hal-01091755 , version 1

Citer

Eugen Feller, Matthieu Simonin, Yvon Jégou, Anne-Cécile Orgerie, David Margery, et al.. Snooze: A Scalable and Autonomic Cloud Management System. [Research Report] RR-8649, Inria Rennes; INRIA. 2014, pp.31. ⟨hal-01091755⟩
258 Consultations
261 Téléchargements

Partager

Gmail Facebook X LinkedIn More