Page 223 - 6111
P. 223

Лекція № 21

                                     ОСНОВНІ ПОНЯТТЯ ВІДМОВОСТІЙКОСТІ
                                             КОМП’ЮТЕРНИХ СИСТЕМ

                                Відмовостійкість  -  це  здатність  обчислювальної  системи
                            продовжувати     дії,   задані   програмою,   після   виникнення
                            несправностей.  Введення  відмовостійкості  вимагає  надмірного
                            апаратного  і  програмного  забезпечення.  Напрями,  пов'язані  із
                            запобіганням  несправностям  і  з  відмовостійкістю,  -  основні  для
                            забезпечення     надійності.     Концепції    паралельності     і
                            відмовостійкості  обчислювальних  систем  природним  чином
                            зв'язані  між  собою,  оскільки  в  обох  випадках  потрібні  додаткові
                            функціональні компоненти. Тому на паралельних обчислювальних
                            системах  досягається  як  найбільш  висока  продуктивність,  так  і,  у
                            багатьох  випадках,  дуже  висока  надійність.  Наявні  ресурси
                            надмірності    в    паралельних    системах     можуть    гнучко
                            використовуватися  як  для  підвищення  продуктивності,  так  і  для
                            підвищення     надійності.   Структура    багатопроцесорних     і
                            багатомашинних      систем    пристосована    до    автоматичної
                            реконфігурації  і  забезпечує  можливість  продовження  роботи
                            системи після виникнення несправностей.
                                Відновлення  після  помилок  у  відмовостійких  системах  можна
                            характеризувати  як  прогін  (roll-forward)  або  відкат  (roll-back).
                            Коли  система  визначила,  що  сталася  помилка,  відновлення
                            прогоном  випраляє  поточний  стан  системи  до  можливості
                            продовження  роботи.  Відкат  повертає  стан  системи  до  деякої
                            попередньої,   вірної   версії,   наприклад,   із   використанням
                            контрольних  точок,  і  продовжує  виконання  звідти.  Деякі  системи
                            використовують обидва підходи для різних помилок або для ріних
                            частин однієї помилки.
                                В  межах  окремої  системи,  відмовостійкість  може  бути
                            досягнута очікуванням виняткових умов і побудовою системи, що
                            могла б упоратись із ними, і, загалом, метою для самостабілізації є
                            система,  що  сходиться  в  напрямку  до  стану  без  помилок.  Однак,
                            якщо наслідки збоїв системи є катастрофічними, або ціна побудови
                            достатньо надійної системи занадто висока, кращим рішенням може
                            бути  деяка  форма  дублювання.  В  будь-якому  випадку,  якщо
                            наслідки  збою  катастрофічні,  система  має  бути  спроможною
                            використати  реверсію,  щоб  повернутися  до  безпечного  стану.  Це
                            подібно до відкочування, але може бути зроблене людиною, якщо
                            вона присутня в процесі.
                                                             222
   218   219   220   221   222   223   224   225   226   227   228