A study of shared-memory parallelism in a multifrontal solver

Jean-Yves L'Excellent; Wissam M. Sid-Lakhdar

doi:10.1016/j.parco.2014.02.003

Article Dans Une Revue Parallel Computing Année : 2014

A study of shared-memory parallelism in a multifrontal solver

(1, 2) , (1, 2)

1
2

Jean-Yves L'Excellent

Fonction : Auteur
PersonId : 10316
IdHAL : jean-yves-lexcellent
ORCID : 0000-0001-5804-993X
IdRef : 078828031

Laboratoire de l'Informatique du Parallélisme

Optimisation des ressources : modèles, algorithmes et ordonnancement

Wissam M. Sid-Lakhdar

Fonction : Auteur

Laboratoire de l'Informatique du Parallélisme

Optimisation des ressources : modèles, algorithmes et ordonnancement

Résumé

We introduce shared-memory parallelism in a parallel distributed-memory solver, targeting multi-core architectures. Our concern in this paper is pure shared-memory parallelism, although the work will also impact distributed-memory parallelism. Our approach avoids a deep redesign and fully benefits from the numerical kernels and features of the original code. We use performance models to exploit coarse-grain parallelism in an OpenMP environment while, at the same time, also relying on third-party optimized multithreaded libraries. In this context, we propose simple approaches to take advantage of NUMA architectures, and original optimizations to limit thread synchronization costs. The performance gains are analyzed in detail on test problems from various application areas. Although the studied code is a direct solver for sparse systems of linear equations, the contributions of this paper are more general and could be useful in a wider range of situations.

Dans ce rapport, nous étudions l'adaptation d'un code parallèle à mémoire distribuée en un code visant les architectures à mémoire partagée de type multi-c{\oe}urs. L'intérêt d'adapter un code existant plutôt que d'en concevoir un nouveau est de pouvoir bénéficier directement de toute la richesse de ses fonctionnalités numériques ainsi que de ses caractéristiques internes. Même si le code sur lequel porte l'étude est un solveur direct multifrontale pour systèmes linéaires creux, les algorithmes et techniques discutés sont générales et peuvent s'appliquer à des domaines d'application plus généraux. Nous montrons comment des algorithmes parallèles existant peuvent être adaptés à un environnement OpenMP tout en exploitant au mieux des librairies existantes optimisées. Nous présentons des approches simples pour tirer parti des spécificités des architectures NUMA, ainsi que des optimisations originales permettant de limiter les coûts de synchronisation dans le modèle fork-join que l'on utilise. Pour chacun de ces points, les gains en performance sont analysés sur des cas tests provenant de domaines d'applications variés.

Mots clés

shared-memory multi-core NUMA LU factorization sparse matrix multifrontal method

Domaines

Logiciel mathématique [cs.MS]

Equipe Roma : Connectez-vous pour contacter le contributeur

https://inria.hal.science/hal-01060322

Soumis le : mercredi 3 septembre 2014-14:04:07

Dernière modification le : jeudi 15 février 2024-03:31:05

Dates et versions

hal-01060322 , version 1 (03-09-2014)

Identifiants

HAL Id : hal-01060322 , version 1
DOI : 10.1016/j.parco.2014.02.003

Citer

Jean-Yves L'Excellent, Wissam M. Sid-Lakhdar. A study of shared-memory parallelism in a multifrontal solver. Parallel Computing, 2014, 40 (3-4), pp.34-46. ⟨10.1016/j.parco.2014.02.003⟩. ⟨hal-01060322⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

ENS-LYON UNIV-RENNES1 CNRS INRIA UNIV-LYON1 IRISA INRIA2 UR1-MATH-STIC UR1-UFR-ISTIC UNIV-RENNES UDL UR1-MATH-NUM

187 Consultations

0 Téléchargements

A study of shared-memory parallelism in a multifrontal solver

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Altmetric

Partager