Page 48 - 6832

P. 48

Перша складова у правій час тині характеризує розсіяння впливу вхідної величини, що
~
досліджується, тобто є дисперсією, «що пояснюється», оскільки (y  y ) залежить від рівняння
i i
~
регресії і, відповідно, зумовлено регресійним зв’язком. Відхилення (y  y ) варіюються випадковим
i i
чином і не можуть бути пояснені моделлю, тобто ці відхилення відображають вплив випадкових
факторів. До випадкових в даному випадку відносяться невраховані фактори, а також високі ступені
або комбінації врахованих факторів.
Із наведеної трактовки випливає, що дисперсія умовного математичного очікування може
служити характеристикою ступеня зв’язку між вхідною і вихідними змінними, а умовна дисперсія
характеристичного ступеня невизначеності, неідентичності, кількісно характеризується
неадекватністю даної моделі через неврахування інших факторів моделі, крім х.
Коефіцієнт детермінації регрес ії визначиться як відношення суми квадратів пояснимих
відхилень (дисперсії умовною математичного очікування) до всієї суми квадратів відхилень
(дисперсії вихідної величини) виразу, тобто
N N N N
y (
y (
y (
R 2   ~  y ) 2 /  ~  y ) 2  1[   ~  y ) 2 /  ~  y ) 2 ]
y (
y i i i i i
x  i 1  i 1  i 1  i 1
2
Із аналізу ос таннього виразу випливає , що R прагне до одиниці, коли
y
x
N
2
 ~ i  y ) прагне до 0. Це свідчить про те , що величини, які досліджуються, пов’язані
y (
i
 i 1
функціональним зв’язком, а розкид вихідних величин yі пов’язаний, наприклад, із випадковою
похибкою їх вимірювання.
Із цього ж виразу виходить, що коефіцієнт детермінації буде дорівнювати нулю тільки в тому
разі, коли
N N
2
 ~ i  y ) 2   ~ i  y )
y (
y (
i
 i 1  i 1
тобто коли розсіяння біля лінії регресії ŷі дорівнюють розсіянням біля загального середнього у
при будь-якому х і. Це може бути, якщо вхідна і вихідна величини незалежні.
2
Із цього випливає, що R  0 якщо вхідна і вихідна величини об’єкта що осліджується,
y
x
незалежні, проте отримане твердження не завжди буде вірним. У загальному випадку коефіцієнт
детермінації регресії лежить в межах
0  R 2  1
y
x
і інтерпретує кількісну характеристику міри невизначеності випадкової величини У за
значеннями випадкової величини Х. На відміну від коефіцієнта кореляції, коефіцієнт детермінації
2
несиметричний по відношенню до змінних, що досліджуються, тобто R 2  R . У регресіях з
y x ,y
x
детермінованими незалежними змінними коефіцієнт детермінації необхідно трактувати тільки як
показник, що відображає, наскільки модель регресії краще моделі середнього.
Взаємозв’язок між коефіцієнтами кореляції і детермінації залишається таким:
r 2 R 2 (3.10)
x ,y y
x
Рівність тут виконується лише в тому випадку, коли є строга лінійна залежність У на Х, тобто ŷ
= М [У/х]. Із нерівності виходить, що кількіснахарактеристика стохастичного зв’язку Х і У, виміряна
коефіцієнтом детермінації, може бути більше нуля у випадку нульового коефіцієнта кореляції.
Відомо, що коефіцієнт кореляції при двомірному нормальному розподілу має сенс тільки при
лінійному зв’язку. Тому можна використовувати співвідношення між коефіцієнтами кореляції і
детермінації, щоб оцінити правильність вибору лінійної моделі.
Розглянемо статис тику [С.А. Айвазян. Статистические исследования зависимости.-М.:
Металлургия, 1968.-182с.]

43 44 45 46 47 48 49 50 51 52 53