Page 33 - 4190
P. 33

витися виконувати певну послугу, виконати її помилково або зруйну-
            вати якісь дані. Вочевидь, для другої і третьої з перелічених реакцій
            неможливо передбачити наслідки, тоді як для першої можна докласти
            певних  зусиль,  щоб  відновити  працездатність  системи,  наприклад,

            виконати один з наведених нижче варіантів робіт:
                   відновити попередній стан системи (що передував винятковій си-

            туації) і спробувати застосувати іншу стратегію виконання послуги;
                   відновити попередній стан системи, внести необхідні коректи-
            ви і повторити виконання послуги із старою стратегією;

                   відновити попередній стан системи, сформувати повідомлення
            про помилку й зупинити систему в очікуванні реакції користувача.
                  Ми бачимо, що забезпечення надійності системи вимагає для ко-

            жної її послуги передбачення виняткових ситуацій, аналізу їхніх при-
            чин та наслідків, побудови механізму відтворення попереднього ста-
            ну  (для  чого  необхідна  певна  стратегія  запам’ятовування  поточного
            стану системи) та виправлення ситуації. Для забезпечення таких дій

            застосовують типові засоби:
                   подвійне обчислення й порівняння результатів або їхніх конт-

            рольних сум, у тому числі виконаних на різних процесорах;
                   таймери,  що  визначають  часові  інтервали  фіксації  поточного
            стану;

                   додаткові  перевірки  коректності  даних,  які  передають  актори
            чи зовнішні системи або окремі компоненти однієї системи.
                  Усі зазначені вище дії втілюються в додаткових компонентах проек-

            ту і призводять до додаткових витрат на певні надмірні перестороги, які
            є ціною за надійність функціонування системи. Доцільність таких витрат
            визначається виключно специфікою систем. Якщо наслідки помилок не-
            зворотні, наприклад, як у систем підвищеного ризику (космічні та ядерні

            системи,  моніторинг  хворих,  керування  реальними  об’єктами),  дово-
            диться йти на дублювання процесів і додаткові перевірки. Іноді навіть
            використовують паралельну роботу кількох команд або взаємну переві-

            рку комп’ютерів, що працюють паралельно, коли один з них здійснює
            моніторинг іншого. Так, кажуть, що для керування системою ШАТЛ сім
            комп’ютерів дублюють один одного.
                  Переносимість системи (system portability). Під таким терміном

            розуміють можливість змінювати певні використовувані сервісні сис-
            теми (операційні системи, системи комунікацій у мережах, СУБД то-

            що) шляхом локального настроювання відповідних модулів. Зазвичай
            йдеться про переносимість щодо конкретного типу сервісних систем,
                                                              33
   28   29   30   31   32   33   34   35   36   37   38