Page 29 - 4818
P. 29

1.5 Метод динамічного програмування


                        Розглядається  задача  про  оптимальне  стабілізуюче
               управління.
                        Нехай дано об’єкт управління, що описується рівняннями:
                                                  x   (, , )xu t .                             (1.5.1)
                                                  
                        Необхідно знайти закон управління:
                                                 u   r (, )x t ,                                (1.5.2)

               щоб  на  рухах  системи (1.5.1), (1.5.2),  збуджених  довільними
               початковими відхиленнями, мінімізувався функціонал:

                                                      t 1
                                                         0 
                                                  I      (, , )xu t dt .                       (1.5.3)
                                                      t 0
                        При  цьому  на  управління (1.5.2)  накладено  обмеження
               uU . Для визначеності будемо вважати, що:

                                                                    
                                                    u     u k ()t   u ,                      (1.5.4)
                                                                    k
                                                     k
                     
               де u  – задані числа.
                     k
                        Це –  варіаційна  задача  з  вільним  правим  кінцем  та
               фіксованим t .
                                 1
                        Нехай n    (по  x),  m              1  (по  u ).  Тоді (1.5.1), (1.5.2)
                                       2
               приймають вигляд:
                                    x     1   (xx u t ) ; x     2   (x x u t ;             (1.5.5)
                                                                                )
                                              1
                                          1
                                                                    2
                                                                       1
                                                 2
                                                                           2
                                                 u     ( r x x t .                              (1.5.6)
                                                                 )
                                                              2
                                                          1
                        Переходячи  до  принципу  оптимальності,  допустимо,  що
               оптимальне управління (1.5.2) знайдено.
                        Цьому  управлінню  відповідає  оптимальна  траєкторія
                x 1 (),tx 2 ( )t ,  одержана  як  розв’язок (1.5.1)  при  оптимальному
               управлінню (1.5.2) за деяких початкових умов.
                        Зобразимо траєкторію (рис. 1.5.1), позначення якої:
                                                x (0)    (), ( )xt 0  x t 0  ;
                                                                  2
                                                          1
                                                x (1)     x t 1  x t 1   (), ( ) ;
                                                         1
                                                                 2
                                                x     x t   1  x t  2   (), ( ) .





                                                             29
   24   25   26   27   28   29   30   31   32   33   34