Simultaneous Scheduling of Replication and Computation for Data-Intensive Applications on the Grid - INRIA - Institut National de Recherche en Informatique et en Automatique Accéder directement au contenu
Rapport (Rapport De Recherche) Année : 2005

Simultaneous Scheduling of Replication and Computation for Data-Intensive Applications on the Grid

Résumé

One of the first motivations of using grids comes from applications managing large data sets like for example in High Energy Physic or Life Sciences. To improve the global throughput of software environments, replicas are usually put at wisely selected sites. Moreover, computation requests have to be scheduled among the available resources. To get the best performance, scheduling and data replication have to be tightly coupled which is not always the case in existing approaches. This paper presents an algorithm that combines data management and scheduling at the same time using a steady-state approach. Our theoretical results are validated using simulation and logs from a large life science application (ACI GRID GriPPS).
L'une des principales motivations pour utiliser les grilles de calcul vient des applications utilisant de larges ensembles de données comme, par exemple, en Physique des Hautes Energies ou en Science de la Vie. Pour améliorer le rendement global des environnements logiciels utilisées pour porter ces applications sur les grilles, des réplicats des données sont déposées sur différents sites sélectionnés. De plus es requêtes de calcul doivent être ordonnancées en tenant compte des ressources disponibles. Pour obtenir de meilleures performances, l'ordonnancement des requêtes et la réplication des données doivent être étroitement couplés ce qui n'est généralement pas le cas dans les approches existantes. Cet article présente un algorithme qui combine la gestion des données et l'ordonnancement en utilisant une approche en régime permanent. Nos résultats théoriques sont validés par simulations et par l'utilisation des traces d'un serveur de calcul d'application de Sciences de la Vie(ACIGRIDGRIPPS).
Fichier principal
Vignette du fichier
RR-5460.pdf (219.37 Ko) Télécharger le fichier
RR2005-01.pdf (387.91 Ko) Télécharger le fichier
Loading...

Dates et versions

inria-00070546 , version 1 (19-05-2006)

Identifiants

  • HAL Id : inria-00070546 , version 1

Citer

Frédéric Desprez, Antoine Vernois. Simultaneous Scheduling of Replication and Computation for Data-Intensive Applications on the Grid. [Research Report] RR-5460, LIP RR-2005-01, INRIA, LIP. 2005, pp.19. ⟨inria-00070546⟩
196 Consultations
170 Téléchargements

Partager

Gmail Facebook X LinkedIn More