Page 66 - 5637

P. 66

При цьому знак рівності досягається лише у тому випадку, коли на відрізку часу

( , ) використовувалося оптимальне управління. Цю умову можна записати за

допомогою співвідношення

опт ( , ) = min{ опт [ + ( , , )∆ , + ∆ ] + ( , , )∆ } (3.9)

або (розкладаючи праву частину (4.9) у ряд і спрямовуючи ∆ до нуля) за

допомогою нелінійного диференціального рівняння в приватних похідних

першого порядку (рівняння Беллмана)

опт опт
= min ( , , ) + ( , , ) . (4.10)

Загальна схема вживання цього рівняння для знаходження оптимального

управління наступна.

Спочатку вирішується завдання мінімізації по при кожному фіксованому і

правої частини рівняння (4.10). Таким чином, управління ( ) визначається як функція

від опт ( , ). Після підстановки ( ) в праву частину (4.10) отримаємо рівняння в

приватних похідних для безпосереднього знаходження функції опт ( , ). При цьому

використовується природна гранична умова опт ( , ) = ( , ). Після того, як
к
к
визначена функція опт ( , ), відразу ж обчислюється і оптимальне управління
опт ( , ), що мінімізує праву частину (4.10).

Оптимальне керування системою опт ( ), яке відповідає її початкового стану
[ ( ), ], визначається співвідношенням опт ( ) = опт ( ( ), ), де ( ) є рішення

векторного диференціального рівняння.

̇ = [ , опт ( , ), ] ( ) = ( ) .

Нехай дискретна система описується за допомогою рекурентних рівнянь

( + 1) = [ ( ), ( )],

де = 0, 1, … , − 1, (0) задано. Метою управління є мінімізація функціоналу

= [ ( ), ( )],

де – скалярна функція. Природно, що мінімальне значення функціонала залежить

від початкового стану (0) (яке некероване). Позначимо цей мінімум через [ (0)].

Неважко бачити, що справедливі наступні співвідношення:

[ (0)] = min min. . . min { [ (0), (0)] + [ (1), (1)]+. ..

( ) ( ) ( )

61 62 63 64 65 66 67 68 69 70 71