Page 251 - 4195
P. 251
M XY f y dyxy , (3.34)
що має назву функції регресії Y на X 1 ,..., X .
p
Оптимальним (в середньому квадратичному) нази-
вається предиктор X , який задовольняє умові
2
M Y X inf M Y X 2 .
Відповідь на питання існування і виду оптимального
предиктору дає наступне твердження.
Теорема. Оптимальний предиктор X існує і
має вигляд MX XY .
Тобто оптимальним предиктором являється функція
регресії Y на X , визначена рівністю (3.34). Мінімальну
помилку передбачення можна записати у вигляді
2 2
M M Y M XY MX D XY XY ,
(3.35)
що відповідає середньому значенню умовної дисперсії
D XY величини Y при заданому X . Для неперервних
розподілів умовна дисперсія обчислюється за формулою
2 2
D XY M Y M XY X x y M XY XYf dy
.
Оптимальний предиктор MX XY має важ-
ливу властивість: він має максимальну кореляцію з Y
серед усіх предикторів. Для доведення цього факту по-
значимо A M XY і для довільного предиктору
X знайдемо
251