Page 83 - 4512
P. 83
n n n
2
R
2
Q y ˆ y , Q y y y y n 2 .
y
i
i
i
i 1 i 1 i 1
2
Величина R R r є оцінкою кореляції між резуль-
y ˆ y
татами спостережень y та значеннями y ˆ , які прогнозовані ре-
i
i
2
гресійною залежністю. Коефіцієнт детермінації R дорівнює
долі загальної мінливості результатів спостережень, яка пояс-
нюється заданою моделлю лінійної регресії, тобто є характери-
стикою адекватності моделі.
Це значення безпосередньо інтерпретується таким чином.
2
Якщо R рівний 0.4, то мінливість значень змінної Y біля лінії
регресії становить 1-0.4 від вихідної дисперсії; іншими сло-
вами, 40 % від початкової мінливості можуть бути пояснені, а
60 % залишкової мінливості залишаються непоясненими. В іде-
алі бажано мати пояснення якщо не для всієї, то хоча б для бі-
льшої частини вихідної мінливості.
2
Значення R є індикатором ступеня підгонки моделі до
2
даних (значення R близьке до 1.0 показує, що модель пояснює
майже всю мінливість відповідних змінних).
Передбачені значення і залишки. Лінія регресії висловлює
найкраще прогнозування залежною змінною (У) по незалеж-
ним змінним (X). Однак зазвичай є істотний розкид спостере-
жуваних точок навколо підігнаної лінії регресії (як це було по-
казано раніше на діаграмі розсіювання ). Відхилення окремої
точки від лінії регресії (від передбаченого значення) назива-
ється залишком.
Приклад 13.1. Розглянемо рішення задачі апроксимації
гравітаційного поля лінійною множинною регресією, в якій не-
залежними змінними виступають координати X,Y точок спос-
тережень.
Запускаємо програму Statisticа, створюємо файл даних
82