Page 229 - 6111
P. 229
але й до ускладнення процесу моніторингу й, як наслідок, до більш
складного розподілу ресурсів і керуванню ними. Ці фактори, у свою
чергу, ведуть до необхідності підвищення кваліфікації
обслуговуючого персоналу, впровадження спеціалізованого ПЗ, що
неминуче веде до збільшення експлуатаційних витрат і вартості
володіння.
Засоби відмовостійкості дозволяють скоротити час простою до
п'яти хвилин у рік або навіть менше. Відмовостійкість
забезпечується надлишковістю на фізичному рівні, де в кожному з
компонентів може виникнути збій і ніхто цього не помітить.
У підсумку всі системи в відмовостійкій конфігурації
відрізняються високим рівнем апаратної надлишковості,
обслуговуваності й можливостей віддаленого керування. Всі
основні апаратні елементи, такі як процесори, пам'ять і диски,
дублюються. Всі надлишкові компоненти виконують будь-який
процес всі разом.
Репліковані компоненти виконують ті самі команди одночасно,
тому навіть якщо на одному з компонентів виникне помилка,
додаток буде працювати без змін. У результаті адміністратори
можуть нарощувати систему, здійснювати повсякденну підтримку й
видаляти компоненти, на яких виник збій, без відключення всієї
системи.
У серверах використовується концепція, що одержала назву
“пари процесів”. Суть її в тому, що основний процес і резервний
процес виконуються на різних вузлах. Резервний процес
відзеркалює всю інформацію з основного вузла й здатний у будь-
який момент “підмінити” основний процес у випадку виникнення в
ньому помилки.
Надмірність доповнюють високонадійні операційні системи,
вбудовані інструментальні засоби діагностики й різноманітне
програмне забезпечення керування потоками робіт.
Крім усього іншого, таке відмовостійке програмне
забезпечення покликане запобігти втраті даних у випадку
виникнення збою й управляти виконанням таких завдань, як
примусове перемикання із системи, де виник збій. Мета полягає в
тому, щоб виявити апаратні проблеми, які можуть призвести до
відключення системи, і швидко перерозподілити робоче
навантаження на інші системи.
У систему повинні бути заздалегідь встановлені або
сконфігуровані запасні модулі, так що при відмові одного з модулів
запасний модуль може замінити його практично негайно. Модуль,
що відмовив, може ремонтуватися автономно, тоді як система
продовжує працювати.
228