Page 7 - 4721
P. 7
1 ПІДГОТОВКА ДАНИХ. МЕТОДИ ВИДОБУВАННЯ
ДАНИХ
Мета роботи: ознайомитися з методами підготовки даних
для аналізу та методами аналізу даних.
Теоретичні відомості
Отримання даних (англ. Data Mining)— виявлення
прихованих закономірностей або взаємозв’язків між змінними
у великих масивах необроблених даних. Як правило,
поділяється на задачі класифікації, моделювання та
прогнозування.
На сучасних підприємствах, в дослідницьких проектах або
в інтернеті утворюються великі обсяги даних. Добування
даних дає можливість автоматичного аналізу цих даних
шляхом застосування методів математичної статистики,
штучних нейронних мереж, теорії нечітких множин або
генетичних алгоритмів. Метою аналізу є виявлення правил та
закономірностей, наприклад, статистичних подій. Так,
наприклад, можуть виявлятись зміни у поведінці клієнтів або
груп клієнтів для покращення політики підприємства.
Слід виділити такі етапи роботи з даними на етапі
видобування даних (data mining):
- збереження “сирих” даних (raw data) з урахуванням
моменту часу, в який вони були зняті (data timestamp);
- загальна підготовка даних для подальшої обробки
(фільтрація, систематизація, стискання);
- специфічна підготовка даних до обробки окремими
методами видобування інформації, компоновка масивів та
матриць даних для їх передачі як аргументів функціям, що
програмно реалізують пропоновані методи обробки.
6