Page 29 - 4818
P. 29
1.5 Метод динамічного програмування
Розглядається задача про оптимальне стабілізуюче
управління.
Нехай дано об’єкт управління, що описується рівняннями:
x (, , )xu t . (1.5.1)
Необхідно знайти закон управління:
u r (, )x t , (1.5.2)
щоб на рухах системи (1.5.1), (1.5.2), збуджених довільними
початковими відхиленнями, мінімізувався функціонал:
t 1
0
I (, , )xu t dt . (1.5.3)
t 0
При цьому на управління (1.5.2) накладено обмеження
uU . Для визначеності будемо вважати, що:
u u k ()t u , (1.5.4)
k
k
де u – задані числа.
k
Це – варіаційна задача з вільним правим кінцем та
фіксованим t .
1
Нехай n (по x), m 1 (по u ). Тоді (1.5.1), (1.5.2)
2
приймають вигляд:
x 1 (xx u t ) ; x 2 (x x u t ; (1.5.5)
)
1
1
2
1
2
2
u ( r x x t . (1.5.6)
)
2
1
Переходячи до принципу оптимальності, допустимо, що
оптимальне управління (1.5.2) знайдено.
Цьому управлінню відповідає оптимальна траєкторія
x 1 (),tx 2 ( )t , одержана як розв’язок (1.5.1) при оптимальному
управлінню (1.5.2) за деяких початкових умов.
Зобразимо траєкторію (рис. 1.5.1), позначення якої:
x (0) (), ( )xt 0 x t 0 ;
2
1
x (1) x t 1 x t 1 (), ( ) ;
1
2
x x t 1 x t 2 (), ( ) .
29