Page 223 - 6111
P. 223
Лекція № 21
ОСНОВНІ ПОНЯТТЯ ВІДМОВОСТІЙКОСТІ
КОМП’ЮТЕРНИХ СИСТЕМ
Відмовостійкість - це здатність обчислювальної системи
продовжувати дії, задані програмою, після виникнення
несправностей. Введення відмовостійкості вимагає надмірного
апаратного і програмного забезпечення. Напрями, пов'язані із
запобіганням несправностям і з відмовостійкістю, - основні для
забезпечення надійності. Концепції паралельності і
відмовостійкості обчислювальних систем природним чином
зв'язані між собою, оскільки в обох випадках потрібні додаткові
функціональні компоненти. Тому на паралельних обчислювальних
системах досягається як найбільш висока продуктивність, так і, у
багатьох випадках, дуже висока надійність. Наявні ресурси
надмірності в паралельних системах можуть гнучко
використовуватися як для підвищення продуктивності, так і для
підвищення надійності. Структура багатопроцесорних і
багатомашинних систем пристосована до автоматичної
реконфігурації і забезпечує можливість продовження роботи
системи після виникнення несправностей.
Відновлення після помилок у відмовостійких системах можна
характеризувати як прогін (roll-forward) або відкат (roll-back).
Коли система визначила, що сталася помилка, відновлення
прогоном випраляє поточний стан системи до можливості
продовження роботи. Відкат повертає стан системи до деякої
попередньої, вірної версії, наприклад, із використанням
контрольних точок, і продовжує виконання звідти. Деякі системи
використовують обидва підходи для різних помилок або для ріних
частин однієї помилки.
В межах окремої системи, відмовостійкість може бути
досягнута очікуванням виняткових умов і побудовою системи, що
могла б упоратись із ними, і, загалом, метою для самостабілізації є
система, що сходиться в напрямку до стану без помилок. Однак,
якщо наслідки збоїв системи є катастрофічними, або ціна побудови
достатньо надійної системи занадто висока, кращим рішенням може
бути деяка форма дублювання. В будь-якому випадку, якщо
наслідки збою катастрофічні, система має бути спроможною
використати реверсію, щоб повернутися до безпечного стану. Це
подібно до відкочування, але може бути зроблене людиною, якщо
вона присутня в процесі.
222