Википедия
Отказоустойчивость — свойство технической системы сохранять свою работоспособность после отказа одного или нескольких составных компонентов. Отказоустойчивость определяется количеством любых последовательных единичных отказов компонентов, после которого сохраняется работоспособность системы в целом. Базовый уровень отказоустойчивости подразумевает защиту от отказа одного любого элемента — исключение единой точки отказа. Основной способ повышения отказоустойчивости — избыточность . Наиболее эффективный метод избыточности — аппаратная избыточность, которая достигается путём резервирования . В ряде приложений отказоустойчивость путём резервирования является обязательным требованием, предъявляемым государственными надзорными органами к техническим системам.
Отказоустойчивость следует отличать от отказобезопасности — способности системы при отказе некоторых частей переходить в режим работы, не представляющий опасности для людей, окружающей среды или материальных ценностей. Однако в реальных системах эти два требования могут выступать совместно.
Отказоустойчивость связана со следующими техническими характеристиками систем:
- коэффициент готовности , который показывает, какую долю времени от общего времени службы система находится в рабочем состоянии;
- надёжность системы, которая определяется, например, как вероятность отказа в единицу времени.
Отказоустойчивая архитектура с точки зрения инженерии — это метод проектирования отказоустойчивых систем, которые способны продолжать выполнение запланированных операций при отказе их компонентов. Термин часто используется для описания компьютерных систем, спроектированных продолжать работу в той или иной степени, с возможным уменьшением пропускной способности или увеличением времени отклика , в случае отказа части системы. Это означает, что система в целом не прекратит свою работу при возникновении проблем с аппаратной или программной частью . Пример из другой области: структура, способная сохранять свою целостность при повреждении от коррозии или усталости материала , наличия производственных дефектов или столкновения с каким-либо объектом.