Este repositorio almacena los archivos que se estarán generando durante la clase. No buscan ser un análisis profundo para el combate a la corrupción, sino más bien un ejemplo sobre cómo puede suceder la evolución desde una pregunta interesante hasta la comunicación de los resultados.
Ricardo Daniel Alanís, Head de Data Science en Nowports
- README.md - Este archivo
- LICENSE.md - Licencia
- .gitignore - Ignore file para el proyecto y quitar elementos no deseados
- 12_DICIEMBRE_2020.xlsx - Archivo base para el proyecto
- notebooks/1_limpieza_y_carga.ipynb - Notebook de preparación de datos
- notebooks/2_exploracion.ipynb - Notebook que cubre el análisis básico de datos
- notebooks/3_enriquecimiento.ipynb - Notebook que busca ejemplificar formas para enriquecer a un dataset
- notebooks/4_modelacion_conclusiones.ipynb - Notebook con la exploración de varios frentes de aprendizaje automático para acercarse a la respuesta
- notebooks/data/* - Datos intermedios, o de enriquecimiento usados durante el proceso.
Tengoo un especial interés por el combate a la corrupción, la pregunta de la que parte este proyecto usando datos es: ¿Existen anomalías interesantes a investigar en las compras del municipio de monterrey durante diciembre del 2020?
Este trabajo no busca reemplazar el esfuerzo peroidistico, muy necesario para validar los resultados del análisis y buscar, mediante una investigación imparcial y objetiva, la detección de corrupción.