Page 7 - 4721
P. 7

1 ПІДГОТОВКА ДАНИХ. МЕТОДИ ВИДОБУВАННЯ
                                                        ДАНИХ

                                Мета роботи: ознайомитися з методами підготовки даних
                            для аналізу та методами аналізу даних.

                                                     Теоретичні відомості

                                Отримання  даних  (англ.  Data  Mining)—  виявлення
                            прихованих закономірностей або взаємозв’язків між змінними
                            у  великих  масивах  необроблених  даних.  Як  правило,
                            поділяється  на  задачі  класифікації,  моделювання  та
                            прогнозування.
                                На сучасних підприємствах, в дослідницьких проектах або
                            в  інтернеті  утворюються  великі  обсяги  даних.  Добування
                            даних  дає  можливість  автоматичного  аналізу  цих  даних
                            шляхом  застосування  методів  математичної  статистики,
                            штучних  нейронних  мереж,  теорії  нечітких  множин  або
                            генетичних алгоритмів. Метою аналізу є виявлення правил та
                            закономірностей,  наприклад,  статистичних  подій.  Так,
                            наприклад, можуть виявлятись зміни у поведінці клієнтів або
                            груп клієнтів для покращення політики підприємства.
                                Слід  виділити  такі  етапи  роботи  з  даними  на  етапі
                            видобування даних (data mining):
                                -  збереження  “сирих”  даних  (raw  data)  з  урахуванням
                            моменту часу, в який вони були зняті (data timestamp);
                                -  загальна  підготовка  даних  для  подальшої  обробки
                            (фільтрація, систематизація, стискання);
                                -  специфічна  підготовка  даних  до  обробки  окремими
                            методами  видобування  інформації,  компоновка  масивів  та
                            матриць  даних  для  їх  передачі  як  аргументів  функціям,  що
                            програмно реалізують пропоновані методи обробки.
                                                            6
   2   3   4   5   6   7   8   9   10   11   12