Autori:
- Luca Gregori
- Alessandro Wood
- docker
- nvidia-docker: Abilita l'uso della scheda video per i container docker. Guida all'installazione al seguente link.
Lo script init-ssh.sh
crea le chiavi SSH necessarie all'autenticazione tra i nodi del cluster senza prompt.
chmod +x init-ssh.sh
./init-ssh.sh
docker compose up
horovodrun -np 3 -H horovod-master:1,horovod-worker-1:1,horovod-worker-2:1 -p 12345 python /horovod/examples/pytorch/pytorch_mnist.py
dove -np 3
indica il numero di processi totali, e horovod-master:1,horovod-worker-1:1,horovod-worker-2:1
la lista dei nodi del cluster (nome-cluster:num_proc
).
volumes:
- ./tmp/.ssh/:/root/.ssh
mapping della cartella .ssh
per installare le chiavi SSH dentro ogni nodo del cluster.