Políticas de encaminamiento tolerantes a fallos
Zarza, Gonzalo (Universitat Autònoma de Barcelona. Departament d'Arquitectura de Computadors i Sistemes Operatius)
Franco Puntes, Daniel, dir. (Universitat Autònoma de Barcelona. Departament d'Arquitectura de Computadors i Sistemes Operatius)
Universitat Autònoma de Barcelona. Departament d'Arquitectura de Computadors i Sistemes Operatius
Universitat Autònoma de Barcelona. Escola d'Enginyeria

Data: 2008
Descripció: 151 p.
Resum: El uso intensivo y prolongado de computadores de altas prestaciones para ejecutar aplicaciones computacionalmente intensivas, sumado al elevado número de elementos que los componen, incrementan drásticamente la probabilidad de ocurrencia de fallos durante su funcionamiento. El objetivo del trabajo es resolver el problema de tolerancia a fallos para redes de interconexión de altas prestaciones, partiendo del diseño de polí­ticas de encaminamiento tolerantes a fallos. Buscamos resolver una determinada cantidad de fallos de enlaces y nodos, considerando sus factores de impacto y probabilidad de aparición. Para ello aprovechamos la redundancia de caminos de comunicación existentes, partiendo desde enfoques de encaminamiento adaptativos capaces de cumplir con las cuatro fases de la tolerancia a fallos: detección del error, contención del daño, recuperación del error, y tratamiento del fallo y continuidad del servicio. La experimentación muestra una degradación de prestaciones menor al 5%. En el futuro, se tratará la pérdida de información en tránsito.
Resum: L'ús intensiu i perllongat de computadors d'altes prestacions per a executar aplicacions computacionalment intensives, sumat a l'elevat nombre d'elements que els componen, incrementen dràsticament la probabilitat d'ocurrència de fallades durant el seu funcionament. L'objectiu del treball és resoldre el problema de tolerància a fallades per a xarxes d'interconnexió d'altes prestacions, partint del disseny de polítiques d'encaminament tolerants a fallades. Busquem resoldre una determinada quantitat de fallades d'enllaços i nodes, considerant els seus factors d'impacte, probabilitat d'aparició. Per a això s'aprofita la redundància de camins de comunicació existents, partint des d'enfocaments d'encaminament adaptatius capaços de complir amb les quatre fases de la tolerància a fallades: detecció de l'error, contenció del dany, recuperació de l'error, i tractament de la fallada i continuïtat del servei. L'experimentació mostra una degradació de prestacions menor al 5%. En el futur, es tractarà la pèrdua d'informació en trànsit.
Resum: The intensive and continous use of high-performance computers to execute computationally intensive applications, coupled with the large number of elements that make them up, dramatically increase the likelihood of failures during their operation. This works focuses on solving the problem of fault tolerance for high speed interconnection networks by means of designing fault tolerant routing policies. The goal is to solve a determined number of link and node failures, considering its impact factor and occurrence probability. To acomplish this task we take advantage of the communication path redundancy, through adaptive routing approaches that fulfils with the four phases of the fault tolerance: error detection, damage confinement and assessment, error recovery, fault treatment and continuous service. The experiments shows performance’s degradation under 5%. In the future, we’ll treat the loose of information in transit.
Drets: Aquest document està subjecte a una llicència d'ús de Creative Commons, amb la qual es permet copiar, distribuir i comunicar públicament l'obra sempre que se'n citin l'autor original, la universitat i el departament i no se'n faci cap ús comercial ni obra derivada, tal com queda estipulat en la llicència d'ús Creative Commons
Llengua: Castellà
Titulació: Còmput d'Altes Prestacions, Teoria de la Informació i Seguretat / High Performance Computing, Information Theory and Security [4313133]
Col·lecció: Escola d'Enginyeria. Treballs de màster i postgrau. Màster en Computació d'Altes Prestacions
Document: Treball de fi de postgrau
Matèria: Ordinadors ; Fiabilitat



151 p, 2.9 MB

El registre apareix a les col·leccions:
Documents de recerca > Treballs de recerca i projectes de final de carrera > Enginyeria. TFM

 Registre creat el 2009-07-14, darrera modificació el 2022-08-20



   Favorit i Compartir