Coder Social home page Coder Social logo

workshop's Introduction

Tutorial introductorio al análisis de datos en Python

¡Bienvenid@s a este tutorial introductorio de análisis de datos en Python.

El propósito de este tutorial es mostrar las posibilidades que permite el análisis de datos en Python.

Diapositivas

Si estás interesado en una visión muy breve de las posibilidades que ofrece el análisis de datos, en el directorio slides/ encontrarás una breve presentación para poder hacerte una idea.

Datos

En este tutorial, analizaremos un dataset público de avistamientos de ardillas en Central Park que puedes descargar aquí. Si lo prefieres, podrás encontrar una copia de estos datos en el directorio data/.

Instalación

Para poder tener una copia de todo el material en tu ordernador, abre una Terminal en Linux/MacOS ó bien un Anaconda prompt en Windows dentro del y escribe:

git clone https://github.com/isg75/Workshop
cd Workshop

Creación de un entorno de trabajo

Es muy aconsejable que crees un entorno de trabajo para poder instalar las librerías que necesitarás para este tutorial sin que sea necesario reemplazar las que ya possees en tu ordenador. Para crear un entorno, abre una Terminal en Linux/MacOS ó bien un Anaconda prompt en Windows dentro del directorio del tutorial y escribe:

# En Linux/MacOS
python -m venv tutorial

# En Windows
python -m venv tutorial

de esta manera podrás tener distintas versiones de las librerías en el entorno tutorial a las que ya tengas instaladas en tu ordenador sin que se reemplacen las ya existentes.

Activatión del entorno de trabajo

Verás que el comando anterior genera un directorio llamado tutorial que será el entorno de trabajo. Sin embargo, este entorno no estará activo y deberás activarlo. Para activar el entorno, en la Terminal de Linux/MacOS ó bien en el Anaconda prompt de Windows escribe:

# En Linux/MacOs
source tutorial/bin/activate

# En Windows
tutorial\scripts\activate.bat

Tras ello, deberías ver que al principio de la línea en la terminal aparece la palabra tutorial indicando que estás en el entorno tutorial en lugar del entorno por defecto.

Notebook

Para este tutorial, utilizaré un jupyter notebook que puedes encontrar en el directorio notebooks/ en donde trataremos de responder a distintas preguntas que podemos hacernos sobre las ardillas de Central Park.

En el directorio notebooks/ encontrarás un fichero llamado requirements.txt que contiene todas las librerías (y sus versiones) que son necesarias para poder ejecutar el notebook. Para poder instalar las librerías necesarias en el entorno tutorial, en la Terminal de Linux/MacOS ó bien en el Anaconda prompt de Windows escribe:

cd notebooks
pip install -r requirements.txt

y espera a que termine el proceso (lleva tiempo).

Si no dispones de una instalación adecuada de Python y jupyter y no te quieres complicar, puedes ejecutar el notebook haciendo click en el botón inferior:

Binder

(esto llevará unos minutos, pero no tendrás que preocuparte de nada).

Si prefieres abrir el notebook en tu ordenador, en la Terminal de Linux/MacOS ó bien en el Anaconda prompt de Windows escribe:

jupyterlab notebook-ardillas.ipynb

esto abrirá una pestaña en tu navegador por defecto con el notebook abierto.

Aplicación

Finalmente, también veremos cómo podemos crear una simple aplicación en Python para explorar los datos haciendo uso de la librería streamlit.

En el directorio app/ encontrarás otro fichero llamado requirements.txt que contiene todas las librerías (y sus versiones) que son necesarias para poder ejecutar la aplicación. Para poder instalar las librerías necesarias en el entorno tutorial creado anteriormente abre una Terminal en Linux/MacOS ó bien un Anaconda prompt en Windows dentro del directorio app y escribe:

# En Linux/MacOS
cd ../app
pip install -r requirements.txt

# En Windows
cd ..\app
pip install -r requirements.txt

y espera a que termine el proceso (debería llevar algo menos de tiempo ya que ya tienes unas cuantas librerías instaladas).

Para poder ejecutar la aplicación, abre una Terminal en Linux/MacOS ó bien un Anaconda prompt en Windows dentro del directorio app y escribe:

streamlit run app.py

Tras unos segundos, se abrirá una nueva pestaña en tu navegador por defecto con la aplicación.

Espero que lo disfrutes y te motive a entrar en el interesante mundo del análisis de datos con Python.

Desactivación del entorno de trabajo

Puedes desactivar el entorno de trabajo tutorial al terminar. Para ello, abre una Terminal en Linux/MacOS ó bien un Anaconda prompt en Windows dentro del directorio del proyecto y escribe:

deactivate

workshop's People

Stargazers

Jordi Borràs i Vivó avatar

Watchers

Ignacio avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.