Page 65 - 5637
        P. 65
     При    = 0 і   = 0, якщо   > 0, то   < 0. Тоді як оптимальний процес можна
        записати функцію
                                                                         ⁄
                                             ( ) = −            1 −         .
              4.3. Метод динамічного програмування
              Динамічне  програмування  –  спеціальний  обчислювальний  метод  вирішення
        завдань оптимізації управління динамічних систем, що дозволяє представити процес
        оптимізації  у  вигляді  послідовності  окремих  етапів  (кроків).  Основу  цього  методу
        складає принцип оптимальності, що стверджує, що яка б не була дорога досягнення
        деякого  стану  системи,  подальші  рішення  повинні  належати  оптимальній  траєкторії
        для  частини  дороги,  що  залишилася,  починається  з  цього  стану.  Вживання  цього
        принципу  дозволяє  отримати  всі  використовувані  в  динамічному  програмуванні
        функціональні  рекурентні  співвідношення.  Метод  динамічного  програмування
        придатний для вирішення завдань синтезу оптимального управління як безперервних,
        так  і  дискретних  систем.  Особливостями  методу  є  хороші  алгоритмізуємість  і
        можливість ефективного використання сучасних засобівобчислювальної техніки.
              Хай рух безперервної системи описується диференціальним векторним рівнянням
                                             =  ( ,  ,  ),         ≤   ≤   ,
                                                                             к
        з граничною умовою  [ (  ),   ] = 0.
                                         к
                                             к
              Критерій якості управління системою визначається співвідношенням
                                                              к
                                       =   [ (  ),   ] +     [ ( ),  ( ),  ]
                                                      к
                                                 к
        (   слід  мінімізувати).  Позначимо  через         опт ( ,  ),  оптимальне  значення  критерію  за
        умови,  що  початкова  точка  є  ( ,  ).  Розглянемо  рух  з  точки  ( ,  )  в  близьку  точку
        (  ,   ) = [  +  ( ,  ,  )∆ ,   + ∆ ]  протягом  проміжку  часу  ∆ .  Передбачимо,  що
        управління   ( )  при  русі  з  точки  (  ,   )  оптимальне.  Якщо  функція                          опт
        діфференцируєма по ( ,  ), то за допомогою розкладання                 опт  легко отримати наступну
        нерівність:
                              опт ( ,  ) =   опт [  +  ( ,  ,  )∆ ,   + ∆ ] +  ( ,  ,  )∆ .
     	
