Tolérance aux pannes pour objets actifs asynchrones : modèle, protocole et expérimentations - INRIA - Institut National de Recherche en Informatique et en Automatique Accéder directement au contenu
Thèse Année : 2007

Fault tolerance for asynchronous active objects : protocol, model and experiments

Tolérance aux pannes pour objets actifs asynchrones : modèle, protocole et expérimentations

Résumé

The main goal of this thesis is to define a rollback-recovery fault tolerance protocol for the asynchronous communicating active objects model ASP (Asynchronous Sequential Processes), and its Java implementation ProActive. This work generalises the problem raised by the development of this protocol: we study the recovery of a distributed execution from an inconsistent global state. We then propose a checkpointing protocol and its implementation that does not rely on consistent global states. We demonstrate the model efficiency through realistic experiments using communicating distributed applications that this solution is efficient in practice. Another more general contribution to the problematic of recovering from a inconsistent global state by formally is the definition of the P-consistency, a new recoverability condition based on the concept of promised event. This definition is part of an event-based formalism which can be applied to any system. In particular, by applying this formalism to the ASP model, we are able to prove the correctness of our protocol by showing that every global state created during the execution is a recoverable state. Finally, we propose an extension of our protocol and an implementation adapted to the context of grid computing. This extension relies on the constitution of recovery groups during the deployment of the application. It allows to independently distribute stable storage and to limit the effects of a failure to the concerned group.
L'objectif premier de cette thèse est de proposer un protocole de tolérance aux pannes par recouvrement arrière pour le modèle à objets actifs asynchrones communicants ASP (Asynchronous Sequential Processes) et son implémentation en Java ProActive. Cette thèse généralise la problématique soulevée par le développement de ce protocole : nous étudions le recouvrement d'une application répartie depuis un état global non cohérent. Nous proposons donc dans un premier temps un protocole par points de reprise et son implémentation ne supposant pas que les états globaux soient cohérents. Nous montrons à travers des expérimentations réalistes utilisant des applications réparties communicantes que notre solution et son implémentation présentent de bonnes performances. Nous contribuons aussi de manière plus générale à l'étude du recouvrement depuis un état global non cohérent en définissant formellement une nouvelle condition de recouvrabilité, la P-cohérence, basée sur la notion de promesse d'évènement. Cette définition s'intègre dans un formalisme événementiel capable de prendre en compte la sémantique de n'importe quel système ; elle est donc applicable dans un cadre général. En particulier, en appliquant ce formalisme au modèle ASP, nous prouvons la correction de notre protocole en montrant que les états globaux formés durant l'exécution sont toujours recouvrables. Enfin, nous contribuons plus spécifiquement au domaine des grilles de calcul en proposant une extension de notre protocole et son implémentation adaptée à ce contexte. Cette extension se base sur la constitution automatique de groupes de recouvrement au déploiement de l'application. Elle permet une répartition indépendante des mémoires stables et un confinement des effets d'une panne au seul groupe concerné.
Fichier principal
Vignette du fichier
These_Delbe.pdf (1.59 Mo) Télécharger le fichier
Loading...

Dates et versions

tel-00207953 , version 1 (18-01-2008)

Identifiants

  • HAL Id : tel-00207953 , version 1

Citer

Delbé Christian. Tolérance aux pannes pour objets actifs asynchrones : modèle, protocole et expérimentations. Réseaux et télécommunications [cs.NI]. Université Nice Sophia Antipolis, 2007. Français. ⟨NNT : ⟩. ⟨tel-00207953⟩
244 Consultations
867 Téléchargements

Partager

Gmail Facebook X LinkedIn More