Page 182 - 6734
P. 182

Рисунок 42 – Результати кластеризації

                                pandas – аналіз даних

               pandas  (http://pandas.pydata.org)  –  бібліотека,  яка  базується  на
           NumPy  і  містить  високопродуктивні  та  зручні  у  використанні
           структури даних та інструменти обробки і аналізу даних [4, 44, 55].
           За функціональністю pandas подібна на табличний процесор Excel.
           Основними  структурами  даних  є  Series  (одновимірний  масив
           ndarray з мітками осі) та DataFrame (таблиця з мітками осей (рядків
           і стовпців)). Приклад описує основні можливості pandas 0.20.3.

           import numpy as np
           import matplotlib.pyplot as plt
           import pandas as pd
           _='\n'
           x1 = [0, 2, 2, 3, 9]
           x2 = [12, 12, None, 20, 31]
           dataSet = zip(x1,x2) # підготувати дані
           df = pd.DataFrame(data = dataSet, columns=['X1',
           'X2']) # об'єкт DataFrame
           sr = pd.Series([1,3,np.nan,7,9]) # об'єкт Series
           print df,_ # вивести таблицю

                                         181
   177   178   179   180   181   182   183   184   185   186   187