Page 175 - 6734
P. 175

scipy.stats.kde – ядрова оцінка густини розподілу
               Ядрова оцінка густини розподілу – це непараметричний метод
           оцінки  функції  густини  випадкової  величини  за  вибіркою  [2,  17].
           Задається формулою





           де     –  значення  незалежних  і  однаково-розподілених  випадкових
           величин;  h  –  параметр  згладжування;  K  –  статистичне  ядро  –
           симетрична,  але  не  обов’язково  додатна  функція  з  інтегралом
           рівним одиниці. У прикладі використовується Гаусове ядро:




           import numpy as np
           from scipy.stats import kde
           import matplotlib.pyplot as plt
           x1 = np.random.normal(0, 3, 50) # вибірка з
           нормального розподілу розміром 50, m=0, std=3
           x2 = np.random.normal(4, 1, 50) # вибірка з
           нормального розподілу розміром 50, m=4, std=1
           x = np.concatenate([x1,x2]) # об'єднати дані
           density = kde.gaussian_kde(x, bw_method=None) #
           функція щільності. Можна також визначити свій метод
           згладжування bw_method. Може бути багатовимірна.
           xgrid = np.linspace(x.min(), x.max(), 100)
           plt.hist(x, bins=8, normed=True, color='y') #
           гістограма
           plt.plot(xgrid, density(xgrid), 'k-') # функція
           щільності
           plt.xlabel('x');plt.ylabel('y');plt.grid();plt.show()




                                         174
   170   171   172   173   174   175   176   177   178   179   180