MAT569 - Fundamentos de Tolerância a Falhas

Ementa: Conceitos Básicos e Definições; Detecção de erros e recuperação. Técnicas de TF de hardware e Software; e Disponibilidade; Fundamentos de Tolerância a Falhas em Sistemas Distribuídos; Acordo Bizantino; Sincronização de Relógios. Armazenamento Estável; Sistemas de Diagnóstico; Replicação de Dados e Programas.
 
Bibliografia:
1.Birman, K. P., “Building Secure and Reliable Network Applications”, Manning Publications Co., (1996);
2.Coulouris, G., Dollimore, J., Kindberg, T., “Distributed Systems, Concepts and Design”, Addison Wesley, (1994);
3.Jalote, P., “Fault-Tolerance in Distributed Systems”, Prentice Hall, (1994);
4.Veríssimo, P., Rodrigues, L., “Distributed Systems for System Architects”, Kluwer Academic Publishers, (2001);
5.Amorim, C. L., Barbosa, V. C. et alli, “Uma introduçao a computaçao paralela e distribuída”, 258 p., Campinas, UNICAMP, (1988);
6.Garfinkel, S., “PGP: pretty good privacy”, Cambridge: O'Reilly & Associates, 393 p. (1995);