Page 83 - 4512
P. 83

n                 n           n
                                      2
                        R 
                                                              2
                      Q      y ˆ  y  ,  Q  y    y   y   y n  2 .
                                           y
                                                              i
                                                   i
                                 i
                            i 1              i 1        i 1
                                   2
                Величина R      R    r  є оцінкою кореляції між резуль-
                                         y ˆ y
           татами спостережень y  та значеннями y ˆ , які прогнозовані ре-
                                   i
                                                     i
                                                                 2
           гресійною  залежністю.  Коефіцієнт  детермінації  R дорівнює
           долі загальної мінливості результатів спостережень, яка пояс-
           нюється заданою моделлю лінійної регресії, тобто є характери-
           стикою адекватності моделі.
                Це значення безпосередньо інтерпретується таким чином.
                    2
           Якщо  R рівний 0.4, то мінливість значень змінної Y біля лінії
           регресії  становить  1-0.4  від  вихідної  дисперсії;  іншими  сло-
           вами, 40 % від початкової мінливості можуть бути пояснені, а
           60 % залишкової мінливості залишаються непоясненими. В іде-
           алі бажано мати пояснення якщо не для всієї, то хоча б  для бі-
           льшої частини вихідної мінливості.
                             2
                Значення  R  є індикатором  ступеня підгонки моделі до
                              2
           даних (значення R  близьке до 1.0 показує, що модель пояснює
           майже всю мінливість відповідних змінних).
                Передбачені значення і залишки. Лінія регресії висловлює
           найкраще  прогнозування  залежною  змінною  (У)  по  незалеж-
           ним змінним (X). Однак зазвичай є істотний розкид спостере-
           жуваних точок навколо підігнаної лінії регресії (як це було по-
           казано раніше на діаграмі розсіювання ). Відхилення окремої
           точки  від  лінії  регресії  (від  передбаченого  значення)  назива-
           ється залишком.


                Приклад  13.1. Розглянемо рішення задачі  апроксимації
           гравітаційного поля лінійною множинною регресією, в якій не-
           залежними змінними виступають координати X,Y точок спос-
           тережень.
                Запускаємо програму Statisticа, створюємо файл даних






                                             82
   78   79   80   81   82   83   84   85   86   87   88