Documento Final para PAPII Otoño 2015
Este proyecto integrador es desarrollado como documento del Proyecto de Aplicación Profesional, actividad donde se incluye la realización del servicio social y la opción de titulación para programas de licenciatura en la universidad ITESO (Instituto Tecnológico y de Estudios Superiores de Occidente). Es realizado por un alumno de la licenciatura Ingeniería Financiera.
Este Proyecto de Aplicación Profesional es en base a programación estadística y el área del conocimiento conocida como Machine Learning o Aprendizaje Computacional. Esto consiste en utilizar la estadística y programación para construir modelos matemáticos, algunos de forma cerrada (clasificados como analíticos) y otros de forma abierta (clasificados como computacionales o de métodos iterativos numéricos). En este proyecto se abordaron particularmente 4 que son: Support Vector Machines, Arboles de decisión y variantes, Random Forest y Procesamiento de Lenguaje Natural. Como apoyo se utilizó el sistema de control de versiones GIT, y como plataforma de almacenamiento en la nube se recurrió a GITHUB, un sitio gratuito y ampliamente conocido por su interfáz intuitiva e integración con Markdown, un lenguaje de escritura cientítica y de contenido de estructura simple. Es importante destacar que el uso del sistema operativo Linux y en concreto su distribución Ubuntu 14.04 lts ayudó a simplificar el manejo de los lenguajes de programación y el repositorio creado en GITHUB, así como la instalación de algunas paqueterías de R. También mencionar que los recursos físicos computacionales se utilizaron a un nivel mejorado, en el sentido que para las operaciones demandantes de memoria o procesamiento se utilizó una librería-API de conexión remota a un cluster para programación en paralelo, H2O.
Además de las herramientas computacionales mencionadas anteriormente, se incluye la teoría y análisis de casos para 3 metodologías citadas, Boosted Trees con aplicación al problema PonPare, Random Forest para resolver el problema de clasificación de variables en el problema de Rossman, también se presenta el caso de análisis de texto en lenguaje natural y la metodología Word2Vec. De igual forma y a manera de trabajo libre se presenta la estrategia de trading o inversión en el mercado FOREX, en esta \'ultima es donde se generó en su mayoría el conocimiento aplicado de Machine Learning en el área de finanzas bursátiles utilizando ingeniería financiera.
Finalmente se presentan los documentos y materiales anexos como el código genérico para la traducción del japonés al espa~nol necesario en el problema de Ponpare, así como la bibliografía académica y sitios de interés utilizados como referencia.
- GITHUB
- LINUX
- R
- Python