Data Replication in P2P Systems - INRIA - Institut National de Recherche en Informatique et en Automatique Accéder directement au contenu
Thèse Année : 2007

Data Replication in P2P Systems

Résumé

This thesis addresses data replication in P2P systems. Its approach is motivated by the advances in distributed collaborative applications and their specific needs in terms of data replication, data consistency, scalability, and high availability. Using the example of a P2P Wiki application, we show that the replication requirements of collaborative applications are: high-level of autonomy, multi-master replication, semantic conflict detection and resolution, eventual consistency among replicas, weak network assumptions, and data type independence. Although optimistic replication addresses most of these requirements, existing solutions are unsuitable for P2P networks since they are either centralized or do not take into account the network limitations. On the other hand, existing P2P replication solutions do not satisfy all such requirements simultaneously. In particular, none of them provide eventual consistency among replicas along with weak network assumptions. This thesis aims to provide a scalable and highly available reconciliation solution for P2P collaborative applications by developing a reconciliation protocol that assures eventual consistency among replicas and takes into account data access costs. This goal is accomplished in five steps. First, we present existing optimistic replication solutions and P2P replication strategies and analyze their advantages and disadvantages. This analysis allows us to identify the functionalities and properties that our solution should provide. Second, we design a replication service for APPA (Atlas Peer-to-Peer Architecture). In a third step, we elaborate an algorithm for distributed semantic reconciliation called DSR, which can be executed in different distributed environments (e.g. cluster, Grid, P2P). A fourth step is to turn DSR into a reconciliation protocol for P2P networks called P2P-reconciler. Finally, the fifth step produces a new version of P2P-reconciler, called P2P-reconciler-TA, which exploits topology-aware P2P networks in order to improve reconciliation performance. We validated our solutions and evaluated their performance through experimentation and simulation. The results showed that our replication solution yields high availability, excellent scalability, with acceptable performance and limited overhead.
Cette thèse porte sur la réplication de données dans les systèmes pair-à-pair (P2P). Elle est motivée par l'importance croissante des applications de collaboration répartie et leurs besoins spécifiques en termes de réplication de données, cohérence de données, passage à l'échelle, et haute disponibilité. En employant comme exemple un Wiki P2P, nous montrons que les besoins de réplication pour les applications collaborative sont : haut niveau d'autonomie, réplication multi-maître, détection et résolution de conflit basé sur sémantique, cohérence éventuelle parmi des répliques, hypothèses faibles de réseau, et indépendance des types de données. Bien que la réplication optimiste adresse la plupart de ces besoins, les solutions existantes sont peu applicables aux réseaux P2P puisqu'elles sont centralisées ou ne tiennent pas compte des limitations de réseau. D'autre part, les solutions existantes de réplication P2P ne répondent pas à toutes ces exigences simultanément. En particulier, aucune d'elles ne fournit la cohérence éventuelle parmi des répliques avec des hypothèses faibles de réseau. Cette thèse vise à fournir une solution de réconciliation fortement disponible et qui passe à l'échelle pour des applications de collaboration P2P en développant un protocole de réconciliation qui assure la cohérence éventuelle parmi des répliques et tient compte des coûts d'accès aux données. Cet objectif est accompli en cinq étapes. D'abord, nous présentons des solutions existantes pour la réplication optimiste et des stratégies de réplication P2P et nous analysons leurs avantages et inconvénients. Cette analyse nous permet d'identifier les fonctionnalités et les propriétés que notre solution doit fournir. Dans une deuxième étape, nous concevons un service de réplication pour le système APPA (en anglais, Atlas Peer-to-Peer Architecture). Troisièmement, nous élaborons un algorithme pour la réconciliation sémantique répartie appelée DSR, qui peut être exécuté dans différents environnements répartis (par ex. grappe, grille, ou P2P). Dans une quatrième étape, nous faisons évoluer DSR en protocole de réconciliation pour des réseaux P2P appelé P2P-reconciler. Finalement, la cinquième étape produit une nouvelle version de P2P-reconciler, appelée P2P-reconciler-TA, qui exploite les réseaux P2P conscients de leur topologie (en anglais, topology-aware) afin d'améliorer les performances de la réconciliation. Nous avons validé nos solutions et évalué leurs performances par l'expérimentation et la simulation. Les résultats ont montré que notre solution de réplication apporte haute disponibilité, excellent passage à l'échelle, avec des performances acceptables et surcharge limitée.
Fichier principal
Vignette du fichier
Thesis_Vidal.pdf (1.89 Mo) Télécharger le fichier
Loading...

Dates et versions

tel-00481828 , version 1 (07-05-2010)

Identifiants

  • HAL Id : tel-00481828 , version 1

Citer

Vidal Martins. Data Replication in P2P Systems. Réseaux et télécommunications [cs.NI]. Université de Nantes, 2007. Français. ⟨NNT : ⟩. ⟨tel-00481828⟩
346 Consultations
1822 Téléchargements

Partager

Gmail Facebook X LinkedIn More