Page 66 - 5637
P. 66

При цьому знак рівності досягається лише у тому випадку, коли на відрізку часу

        ( ,   )  використовувалося  оптимальне  управління.  Цю  умову  можна  записати  за

        допомогою співвідношення

                                      опт ( ,  ) = min{  опт [  +  ( ,  ,  )∆ ,   + ∆ ] +  ( ,  ,  )∆ } (3.9)


        або (розкладаючи праву частину  (4.9)  у  ряд  і  спрямовуючи  ∆   до  нуля)  за

        допомогою нелінійного диференціального                   рівняння       в    приватних        похідних

        першого порядку (рівняння Беллмана)

                                        опт                           опт
                                            = min   ( ,  ,  ) +            ( ,  ,  ) .                               (4.10)


              Загальна  схема  вживання  цього  рівняння  для  знаходження  оптимального

        управління наступна.

              Спочатку вирішується завдання мінімізації по   при кожному фіксованому   і

        правої частини рівняння (4.10). Таким чином, управління  ( ) визначається як функція

        від    опт ( ,  ).  Після  підстановки   ( )  в  праву  частину  (4.10)  отримаємо  рівняння  в

        приватних  похідних  для  безпосереднього  знаходження  функції                 опт ( ,  ).  При  цьому


        використовується  природна  гранична  умова                опт ( ,   ) =   ( ,   ).  Після  того,  як
                                                                                         к
                                                                            к
        визначена  функція         опт ( ,  ),  відразу  ж  обчислюється  і  оптимальне  управління
          опт ( ,  ), що мінімізує праву частину (4.10).


              Оптимальне  керування  системою              опт ( ),  яке  відповідає  її  початкового  стану
        [ (  ),   ],  визначається  співвідношенням            опт ( ) =   опт (  ( ),  ),  де    ( )  є  рішення


        векторного диференціального рівняння.

                                        ̇ =  [ ,   опт ( ,  ),  ]   (  ) =  (  ) .


              Нехай дискретна система описується за допомогою рекурентних рівнянь

                                            (  + 1) =          [ ( ),  ( )],

        де   = 0, 1, … ,   − 1,  (0) задано. Метою управління є мінімізація функціоналу



                                                  =    [ ( ),  ( )],

        де   – скалярна функція. Природно, що мінімальне значення функціонала   залежить


        від початкового стану  (0) (яке некероване). Позначимо цей мінімум через   [ (0)].

        Неважко бачити, що справедливі наступні співвідношення:


                          [ (0)] = min min. . . min { [ (0),  (0)] +  [ (1),  (1)]+. ..

                                       ( )  ( )    (   )
   61   62   63   64   65   66   67   68   69   70   71