Fault tolerance through self-configuration in the future nanoscale multiprocessors - Université Toulouse III - Paul Sabatier - Toulouse INP Accéder directement au contenu
Thèse Année : 2008

Fault tolerance through self-configuration in the future nanoscale multiprocessors

Résumé

This thesis is a contribution at the architectural level to the improvement of fault-tolerance in massively defective multi-core chips fabricated using nanometer transistors. The main idea of this work is that a chip should be organized in a replicated architecture and become as autonomous as possible to increase its resilience against both permanent defects and transient faults occurring at runtime. Therefore, we introduce a new chip self-configuration methodology, which allows detecting and isolating the defective cores, deactivating the isolated cores, configuring the communications and managing the allocation and execution of tasks. The efficiency of the methods is studied as a function of the fraction of defective cores, of defective interconnects and soft error rate.
Cette thèse est une contribution au niveau architectural à l'amélioration de la tolérance aux fautes dans les puces multi-coeurs massivement défectueuses fabriquées à partir de transistors nanométriques. L'idée principale de ce travail est qu'une puce devrait être organisée en une architecture réplicative et devenir aussi autonome que possible pour augmenter sa résilience contre les défauts permanents et les erreurs transitoires apparaissant en opération. C'est pourquoi nous introduisons une nouvelle méthodologie d'autoconfiguration de la puce qui permet de détecter et isoler les coeurs défectueux, de désactiver les coeurs isolés, de configurer les communications et de diriger l'allocation et l'exécution des tâches. L'efficacité des méthodes est étudiée en fonction de la fraction de coeurs ou d'interconnections défectueux et du taux d'erreurs transitoires.
Fichier principal
Vignette du fichier
Zajac.PhDThesis.pdf (1.87 Mo) Télécharger le fichier
Loading...

Dates et versions

tel-00340508 , version 1 (21-11-2008)

Identifiants

  • HAL Id : tel-00340508 , version 1

Citer

Piotr Zajac. Fault tolerance through self-configuration in the future nanoscale multiprocessors. Réseaux et télécommunications [cs.NI]. INSA de Toulouse, 2008. Français. ⟨NNT : ⟩. ⟨tel-00340508⟩
174 Consultations
485 Téléchargements

Partager

Gmail Facebook X LinkedIn More