Coder Social home page Coder Social logo

libretas-curso's Introduction

Material de apoyo

Curso de procesamiento de lenguaje natural

Maestría en Tecnologías de la Información

Universidad Nacional de Misiones

Las libretas del curso están pensadas como un recurso didáctico para explicar algunos de los temas vistos en el curso, y al mismo tiempo mostrar como se pueden hacer estas cosas en python, haciendo uso de las librerías especializadas.

Es por esta razón que en las libretas no es necesario hacer nada, ya todo viene listo para ejecutarse y funcionar (dado lo reducido del tiempo frente a grupo).

Como cargar las libretas del curso con el comando git

La manera más fácil de acceder a las carpetas es clonar el proyecto en github donde se encuentran. Para esto, recomiendo que se instale un contenedor de docker diseñado exclusivamente para el curso. Las instrucciones para instalar el contenedor se pueden encontrar aqui.

Los pasos son los siguientes:

  1. Si ya tienes instalado el contenedor, pero no estás dentro, entrar con
$ docker start -i curso-pln
  1. Ir al punto de montaje para que las libretas (y lo que generas con ellas) lo puedas ver fuera de tu contenedor.
~# cd curso-pln
  1. Clonar el proyecto de github con las libretas en tu repositorio.
~/curso-pln# git clone https://github.com/unam-pln/libretas-curso.git

Sin embargo, no fue posible cargar un modelo de semántica distribuida, ya que el tamaño del archivo era muy grande para github. Por esto hay que hacer los siguientes pasos adicionales.

  1. Ir a las libretas y crear un directorio modelo
~/curso-pln# cd libretas-curso/
~/curso-pln/libretas-curso# mkdir modelos
~/curso-pln/libretas-curso# cd modelos

y ya en la carpeta de modelos descargar el archivo con wget.

~/curso-pln/libretas-curso/modelos# wget -O fasttext-sbwc.vec.gz http://dcc.uchile.cl/%7Ejperez/word-embeddings/fasttext-sbwc.3.6.e20.vec.gz

La descarga es de unos 840MB, por lo que tarda su tiempo. Si se va a instalar en multples máquinas, es mejor copiar el archivo en una memoria USB y copiarlo en esta carpeta en cada máquina.

Listo, ya puedes usarlas solamente hay que ejecutar en el contenedor

~/curso-pln/libretas-curso/modelos# cd
~/curso-pln# run_notebook

Recomiendo y pido a todos los participantes en el curso que abran y realicen los ejercicios que se piden en las dos libretas preliminares. Estas libretas no las veremos en el curso pero dan una idea de como utilizar las libretas así como los módulos de python numpy, matplotlib y pandasaunque sea de manera superficial. Las libretas preliminares (y el orden en que recomiendo las desarrollen) son:

  1. Preliminar- numpy.ipynb
  2. Preliminar- pandas.ipynb

Si quieres saber algo más sobre jupyter y como funciona, aquí hay una pequeña presentación de jupyter hecha en jupyter.

libretas-curso's People

Contributors

juliowaissman avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.