Page 237 - 6734
P. 237

Dask.Distributed – розподілені обчислення
               Розподілені  обчислення  –  це  вид  паралельних  обчислень  за
           допомогою  множини  комп’ютерів,  які  об’єднані  в  мережу.
           Dask.Distributed   (http://distributed.readthedocs.io)   –   це   легка
           бібліотека для розподілених  обчислень на  Python. Вона розширює
           API  concurrent.futures  і  Dask  (бібліотека  паралельних
           обчислень  на  чистій  Python)  для  невеликих  кластерів.  Для
           виконання  прикладу  необхідно  установити  Dask  повністю  на
           кожній Windows машині:
           pip install "dask[complete]"

               Або на Linux-машині:

           sudo pip2 install "dask[complete]"

               На  одній  машині  (наприклад  192.168.1.33)  запустити
           планувальник:

           dask-scheduler

               На  кожній  машині  запустити  виконавців,  які  виконують
           завдання  планувальника  за  допомогою        ThreadPool.  Якщо
           обчислення  вивільняють  GIL  (наприклад  NumPy  або  Pandas),
           введіть:

           dask-worker 192.168.1.33:8786

               Або, якщо обчислення не вивільняють GIL:

           dask-worker 192.168.1.33:8786 --nprocs 4 --nthreads 1

               Виконати програму клієнта:
           python main.py

               Переглянути  статус  виконання  можна  в  браузері  (потрібен
           установлений Bokeh):
                                         236
   232   233   234   235   236   237   238   239   240   241   242