Este notebook presenta un resumen del capítulo 4 de Learning Spark Lightning-Fast Data Analytics, presentado para la comunidad de Apache Spark Latam.
- Ir al directorio donde quieres hacer clone.
git clone https://github.com/SantiagoJejen/tutorial_spark_C04.git
- Lanzar el contenedor de Docker
docker run -it --rm -p 8888:8888 -p 4040-4050:4040-4050 -v "$PWD":/home/jovyan/work jupyter/pyspark-notebook