fault tolerance, tolerância a falhas

A capacidade de um computador ou de um sistema operacional para responder a uma falha ou evento catastrófico, como um problema no fornecimento de energia ou uma falha no hardware, de forma a garantir que não haja dados perdidos e que a tarefa em andamento não seja danificada. Isso pode ser obtido através de uma fonte alimentada por baterias, de um hardware de backup, de provisões no sistema operacional ou de qualquer outra combinação desses elementos. Em uma rede tolerante a falhas, o sistema tem a possibilidade de continuar a operação do sistema sem perda de dados ou de desativar o sistema e reinicializá-lo, recuperando todas as tarefas que estavam sendo processadas quando a falha ocorreu.