Page 67 - 4268
P. 67
На цьому графіку чітко видно відсутність будь-якої
залежності між значеннями, що спостерігаються і передбаченими
. Еліпс, розташований зліва містить точки з абсцисою 0 і різними
ординатами. Через еліпс, розташований праворуч, неможливо
провести пряму лінію однозначним чином. Це так само свідчить
на користь відсутності залежності.
Таким чином, за допомогою побудованої нейронної мережі,
нам вдалося пояснити лише частину досліджуваного фізичного
процесу (область більших значень відгуків процесу z). В області
малих значень відгуку процесу і області нуля, нам не вдалося
побудувати точної нейромережевої моделі.
На перший погляд може здатися, що ми отримали результат,
що суперечить теоремі Колмогорова про повноту. Однак, як ми
вже згадували раніше, теорема працює тільки з безперервними
функціями. У нашому ж випадку, є серйозні підстави вважати,
що функція досліджуваного фізичного процесу не є
безперервною. Про це можна судити як за графіком залежності z
групи змінних, так і за графіком спостережуваних - передбачених
значень.
Судячи з отриманих результатів, серед безлічі даних є й
"острівці стабільності". Інакше кажучи, можна з великою
часткою впевненості припустити, що в деяких областях простору
незалежних змінних функція процесу веде себе безперервно.
Наприклад, такою областю може бути область незалежних
предикторів, що дають великі значення z. Для нас вкрай бажано
такі області локалізувати. Для цього здійснимо розбиття даних на
однорідні групи, або проведемо кластеризацію.
Кластеризація даних
Сформулюємо задачу кластерного аналізу. У нашому
розпорядженні є 200 об'єктів (за кількістю доступних для
побудови моделей спостережень) в 4х-мірному просторі (x, y,
factor1, factor2). П'яту змінну z ми відкинули з огляду на те, що
вона залежить від всіх інших і свідомо не вплине на якість
кластеризації. Необхідно ефективно розбити ці об'єкти на ряд
груп, таким чином, що Всередині групи об'єкти максимально
схожі між собою Групи максимально між собою різняться.
Якщо таке розбиття здійсненно, то, швидше за все, зважаючи
однорідності, усередині кожного кластера залежність z = f (x, y,
67