Page 65 - 5637
P. 65

При    = 0 і   = 0, якщо   > 0, то   < 0. Тоді як оптимальний процес можна


        записати функцію

                                                                         ⁄
                                             ( ) = −            1 −         .


              4.3. Метод динамічного програмування

              Динамічне  програмування  –  спеціальний  обчислювальний  метод  вирішення

        завдань оптимізації управління динамічних систем, що дозволяє представити процес

        оптимізації  у  вигляді  послідовності  окремих  етапів  (кроків).  Основу  цього  методу


        складає принцип оптимальності, що стверджує, що яка б не була дорога досягнення
        деякого  стану  системи,  подальші  рішення  повинні  належати  оптимальній  траєкторії


        для  частини  дороги,  що  залишилася,  починається  з  цього  стану.  Вживання  цього
        принципу  дозволяє  отримати  всі  використовувані  в  динамічному  програмуванні


        функціональні  рекурентні  співвідношення.  Метод  динамічного  програмування
        придатний для вирішення завдань синтезу оптимального управління як безперервних,


        так  і  дискретних  систем.  Особливостями  методу  є  хороші  алгоритмізуємість  і

        можливість ефективного використання сучасних засобівобчислювальної техніки.

              Хай рух безперервної системи описується диференціальним векторним рівнянням
                                             =  ( ,  ,  ),         ≤   ≤   ,

                                                                             к
        з граничною умовою  [ (  ),   ] = 0.
                                         к
                                             к
              Критерій якості управління системою визначається співвідношенням

                                                              к

                                       =   [ (  ),   ] +     [ ( ),  ( ),  ]
                                                      к
                                                 к

        (   слід  мінімізувати).  Позначимо  через         опт ( ,  ),  оптимальне  значення  критерію  за

        умови,  що  початкова  точка  є  ( ,  ).  Розглянемо  рух  з  точки  ( ,  )  в  близьку  точку

        (  ,   ) = [  +  ( ,  ,  )∆ ,   + ∆ ]  протягом  проміжку  часу  ∆ .  Передбачимо,  що


        управління   ( )  при  русі  з  точки  (  ,   )  оптимальне.  Якщо  функція                          опт


        діфференцируєма по ( ,  ), то за допомогою розкладання                 опт  легко отримати наступну

        нерівність:

                              опт ( ,  ) =   опт [  +  ( ,  ,  )∆ ,   + ∆ ] +  ( ,  ,  )∆ .
   60   61   62   63   64   65   66   67   68   69   70