Page 256 - 4195
P. 256
Оскільки YX - максимум кореляції між Y і дові-
льними функціями X , а r YX - максимум кореляції між
Y і лінійними функціями X , то 2 r 2 . Для лінійної
YX YX
2
регресії ці величини співпадають, а різниця 2 YX r YX
може слугувати показником відхилення регресії від ліній-
2
ності. Надалі для запису величин 2 YX і r YX будемо ви-
користовувати позначення
2 2 2 2
YX 0 ...1 p ; r YX r 0 ...1 p
В практичних застосуваннях точний вид залежності
між X і Y в більшості випадків невідомий. Тому оцінки
відповідних характеристик (для побудови лінійних пре-
дикторів це перші і другі моменти сумісного розподілу)
отримують з вибіркових даних за результатами минулих
вимірювань X і Y . Зробивши заміну теоретичних хара-
ктеристик їх оцінками, будуть емпіричний предиктор,
який слугує для передбачення Y по X .
3.3.3 Вибір комплексу ознак для прогнозування
В ряді випадків необхідно дослідити, як збільшу-
ється точність прогнозу із збільшенням числа прогнозу-
ючих змінних X . Це можна зробити за допомогою сере-
дньої квадратичної похибки прогнозу 2 XY . Прогноз
величини Y за величинами
X X 1 ,..., X p
виконується з похибкою
2 XY 2 y 1 2 ...1 p ,
0
а за величинами
p
X X 1 ,..., X p , X p 1 ,..., X k , k
1
похибка становить
256