Page 66 - 5637
P. 66
При цьому знак рівності досягається лише у тому випадку, коли на відрізку часу
( , ) використовувалося оптимальне управління. Цю умову можна записати за
допомогою співвідношення
опт ( , ) = min{ опт [ + ( , , )∆ , + ∆ ] + ( , , )∆ } (3.9)
або (розкладаючи праву частину (4.9) у ряд і спрямовуючи ∆ до нуля) за
допомогою нелінійного диференціального рівняння в приватних похідних
першого порядку (рівняння Беллмана)
опт опт
= min ( , , ) + ( , , ) . (4.10)
Загальна схема вживання цього рівняння для знаходження оптимального
управління наступна.
Спочатку вирішується завдання мінімізації по при кожному фіксованому і
правої частини рівняння (4.10). Таким чином, управління ( ) визначається як функція
від опт ( , ). Після підстановки ( ) в праву частину (4.10) отримаємо рівняння в
приватних похідних для безпосереднього знаходження функції опт ( , ). При цьому
використовується природна гранична умова опт ( , ) = ( , ). Після того, як
к
к
визначена функція опт ( , ), відразу ж обчислюється і оптимальне управління
опт ( , ), що мінімізує праву частину (4.10).
Оптимальне керування системою опт ( ), яке відповідає її початкового стану
[ ( ), ], визначається співвідношенням опт ( ) = опт ( ( ), ), де ( ) є рішення
векторного диференціального рівняння.
̇ = [ , опт ( , ), ] ( ) = ( ) .
Нехай дискретна система описується за допомогою рекурентних рівнянь
( + 1) = [ ( ), ( )],
де = 0, 1, … , − 1, (0) задано. Метою управління є мінімізація функціоналу
= [ ( ), ( )],
де – скалярна функція. Природно, що мінімальне значення функціонала залежить
від початкового стану (0) (яке некероване). Позначимо цей мінімум через [ (0)].
Неважко бачити, що справедливі наступні співвідношення:
[ (0)] = min min. . . min { [ (0), (0)] + [ (1), (1)]+. ..
( ) ( ) ( )