Page 183 - 6734
P. 183

#print df.head() # вивести початок таблиці
           #df.to_csv('rodStats.csv',index=False,header=False) #
           зберегти у файл csv
           #df = pd.read_csv('rodStats.csv',names=['X1', 'X2'])
           # прочитати з файлу csv

           print df.dtypes,_ # типи даних колонок
           print df.X1,_ # вміст колонки (Series)
           #df['X1'] # або
           print df['X1'].unique(),_ # унікальні значення
           колонки
           df[0:2] # перші 2 рядка (DataFrame)
           print df.loc[:,'X1'],_ # індексування (Series містить
           тільки X1)
           #df[['X1']] # або (DataFrame містить тільки X1)
           print df[df['X1'] == 0],_ # умовне індексування
           (DataFrame)
           # або:
           df[(df['X1'] == 0) & (df['X2'] > 0)] # | - or, & -
           and, ~ - not
           df['X2'][df['X1'] == 0] # (Series)

           print df['X1'].values,_ # конвертація в numpy.ndarray
           df.dropna() # відкинути рядки з відсутніми даними
           (None) (див. також fillna)
           df.sort_index(axis=1) # сортувати за колонками (1)
           або рядками (0)
           df.sort_values(['X1'], ascending=False) # сортувати
           за X1 (за спаданням)
           df['X3'] = np.sqrt(df['X1']**2+df['X2']**2) # додати
           нову колонку
           print df['X3'].map(lambda x: x+1),_ # застосувати
           функцію для кожного елемента Series (див. також apply
           і applymap для DataFrame)
           print df.groupby(df['X1']).mean(),_ # групувати за X1
                                         182
   178   179   180   181   182   183   184   185   186   187   188