Page 182 - 6734
P. 182
Рисунок 42 – Результати кластеризації
pandas – аналіз даних
pandas (http://pandas.pydata.org) – бібліотека, яка базується на
NumPy і містить високопродуктивні та зручні у використанні
структури даних та інструменти обробки і аналізу даних [4, 44, 55].
За функціональністю pandas подібна на табличний процесор Excel.
Основними структурами даних є Series (одновимірний масив
ndarray з мітками осі) та DataFrame (таблиця з мітками осей (рядків
і стовпців)). Приклад описує основні можливості pandas 0.20.3.
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
_='\n'
x1 = [0, 2, 2, 3, 9]
x2 = [12, 12, None, 20, 31]
dataSet = zip(x1,x2) # підготувати дані
df = pd.DataFrame(data = dataSet, columns=['X1',
'X2']) # об'єкт DataFrame
sr = pd.Series([1,3,np.nan,7,9]) # об'єкт Series
print df,_ # вивести таблицю
181