Page 66 - 5637
        P. 66
     При цьому знак рівності досягається лише у тому випадку, коли на відрізку часу
        ( ,   )  використовувалося  оптимальне  управління.  Цю  умову  можна  записати  за
        допомогою співвідношення
                                      опт ( ,  ) = min{  опт [  +  ( ,  ,  )∆ ,   + ∆ ] +  ( ,  ,  )∆ } (3.9)
        або (розкладаючи праву частину  (4.9)  у  ряд  і  спрямовуючи  ∆   до  нуля)  за
        допомогою нелінійного диференціального                   рівняння       в    приватних        похідних
        першого порядку (рівняння Беллмана)
                                        опт                           опт
                                            = min   ( ,  ,  ) +            ( ,  ,  ) .                               (4.10)
              Загальна  схема  вживання  цього  рівняння  для  знаходження  оптимального
        управління наступна.
              Спочатку вирішується завдання мінімізації по   при кожному фіксованому   і
        правої частини рівняння (4.10). Таким чином, управління  ( ) визначається як функція
        від    опт ( ,  ).  Після  підстановки   ( )  в  праву  частину  (4.10)  отримаємо  рівняння  в
        приватних  похідних  для  безпосереднього  знаходження  функції                 опт ( ,  ).  При  цьому
        використовується  природна  гранична  умова                опт ( ,   ) =   ( ,   ).  Після  того,  як
                                                                                         к
                                                                            к
        визначена  функція         опт ( ,  ),  відразу  ж  обчислюється  і  оптимальне  управління
          опт ( ,  ), що мінімізує праву частину (4.10).
              Оптимальне  керування  системою              опт ( ),  яке  відповідає  її  початкового  стану
        [ (  ),   ],  визначається  співвідношенням            опт ( ) =   опт (  ( ),  ),  де    ( )  є  рішення
        векторного диференціального рівняння.
                                        ̇ =  [ ,   опт ( ,  ),  ]   (  ) =  (  ) .
              Нехай дискретна система описується за допомогою рекурентних рівнянь
                                            (  + 1) =          [ ( ),  ( )],
        де   = 0, 1, … ,   − 1,  (0) задано. Метою управління є мінімізація функціоналу
                                                  =    [ ( ),  ( )],
        де   – скалярна функція. Природно, що мінімальне значення функціонала   залежить
        від початкового стану  (0) (яке некероване). Позначимо цей мінімум через   [ (0)].
        Неважко бачити, що справедливі наступні співвідношення:
                          [ (0)] = min min. . . min { [ (0),  (0)] +  [ (1),  (1)]+. ..
                                       ( )  ( )    (   )
     	
