Page 237 - 6734
P. 237
Dask.Distributed – розподілені обчислення
Розподілені обчислення – це вид паралельних обчислень за
допомогою множини комп’ютерів, які об’єднані в мережу.
Dask.Distributed (http://distributed.readthedocs.io) – це легка
бібліотека для розподілених обчислень на Python. Вона розширює
API concurrent.futures і Dask (бібліотека паралельних
обчислень на чистій Python) для невеликих кластерів. Для
виконання прикладу необхідно установити Dask повністю на
кожній Windows машині:
pip install "dask[complete]"
Або на Linux-машині:
sudo pip2 install "dask[complete]"
На одній машині (наприклад 192.168.1.33) запустити
планувальник:
dask-scheduler
На кожній машині запустити виконавців, які виконують
завдання планувальника за допомогою ThreadPool. Якщо
обчислення вивільняють GIL (наприклад NumPy або Pandas),
введіть:
dask-worker 192.168.1.33:8786
Або, якщо обчислення не вивільняють GIL:
dask-worker 192.168.1.33:8786 --nprocs 4 --nthreads 1
Виконати програму клієнта:
python main.py
Переглянути статус виконання можна в браузері (потрібен
установлений Bokeh):
236