Page 183 - 6734
P. 183
#print df.head() # вивести початок таблиці
#df.to_csv('rodStats.csv',index=False,header=False) #
зберегти у файл csv
#df = pd.read_csv('rodStats.csv',names=['X1', 'X2'])
# прочитати з файлу csv
print df.dtypes,_ # типи даних колонок
print df.X1,_ # вміст колонки (Series)
#df['X1'] # або
print df['X1'].unique(),_ # унікальні значення
колонки
df[0:2] # перші 2 рядка (DataFrame)
print df.loc[:,'X1'],_ # індексування (Series містить
тільки X1)
#df[['X1']] # або (DataFrame містить тільки X1)
print df[df['X1'] == 0],_ # умовне індексування
(DataFrame)
# або:
df[(df['X1'] == 0) & (df['X2'] > 0)] # | - or, & -
and, ~ - not
df['X2'][df['X1'] == 0] # (Series)
print df['X1'].values,_ # конвертація в numpy.ndarray
df.dropna() # відкинути рядки з відсутніми даними
(None) (див. також fillna)
df.sort_index(axis=1) # сортувати за колонками (1)
або рядками (0)
df.sort_values(['X1'], ascending=False) # сортувати
за X1 (за спаданням)
df['X3'] = np.sqrt(df['X1']**2+df['X2']**2) # додати
нову колонку
print df['X3'].map(lambda x: x+1),_ # застосувати
функцію для кожного елемента Series (див. також apply
і applymap для DataFrame)
print df.groupby(df['X1']).mean(),_ # групувати за X1
182