Page 65 - 5637
P. 65
При = 0 і = 0, якщо > 0, то < 0. Тоді як оптимальний процес можна
записати функцію
⁄
( ) = − 1 − .
4.3. Метод динамічного програмування
Динамічне програмування – спеціальний обчислювальний метод вирішення
завдань оптимізації управління динамічних систем, що дозволяє представити процес
оптимізації у вигляді послідовності окремих етапів (кроків). Основу цього методу
складає принцип оптимальності, що стверджує, що яка б не була дорога досягнення
деякого стану системи, подальші рішення повинні належати оптимальній траєкторії
для частини дороги, що залишилася, починається з цього стану. Вживання цього
принципу дозволяє отримати всі використовувані в динамічному програмуванні
функціональні рекурентні співвідношення. Метод динамічного програмування
придатний для вирішення завдань синтезу оптимального управління як безперервних,
так і дискретних систем. Особливостями методу є хороші алгоритмізуємість і
можливість ефективного використання сучасних засобівобчислювальної техніки.
Хай рух безперервної системи описується диференціальним векторним рівнянням
= ( , , ), ≤ ≤ ,
к
з граничною умовою [ ( ), ] = 0.
к
к
Критерій якості управління системою визначається співвідношенням
к
= [ ( ), ] + [ ( ), ( ), ]
к
к
( слід мінімізувати). Позначимо через опт ( , ), оптимальне значення критерію за
умови, що початкова точка є ( , ). Розглянемо рух з точки ( , ) в близьку точку
( , ) = [ + ( , , )∆ , + ∆ ] протягом проміжку часу ∆ . Передбачимо, що
управління ( ) при русі з точки ( , ) оптимальне. Якщо функція опт
діфференцируєма по ( , ), то за допомогою розкладання опт легко отримати наступну
нерівність:
опт ( , ) = опт [ + ( , , )∆ , + ∆ ] + ( , , )∆ .