El presente proyecto surgió en contexto de la Hackaton de la Diplomatura Universitaria en Ciencia de Datos que realicé, desde Agosto de 2022 a Marzo de 2023. La temática resultó de especial interés debido a lo actual del asunto, y por presentarse particularmente para el sector y para toda persona perteneciente al mismo, como también por aquellos que desean ser parte.
El objetivo de esta instancia era poder analizar el conjunto de datos, describir lo que los datos nos contaban y tratar de implementar un modelo de Machine Learning que se ajustara al caso.
A lo largo del proyecto fueron surgiendo una serie de dificultades planteadas principalmente por las característica del conjunto de datos:
- Tamaño muy pequeño del set de datos (Aproximadamente unos 489 registros)
- Problemas con la dimensionalidad de los datos (Al ser pocos registros, el hecho de tener 29 columnas no ayudaba)
- Presenciar de valores extremos (Lo cual no es necesariamente negativo, pero hace preciso analizar con más detenimiento y cambiar el enfoque del análisis).
Al finalizar el proyecto, se planteó necesario, también, poder analizar lo que ocurre a nivel de las contrataciones en el sector, dado que estudiar sólo un lado del asunto nos da una miarada parcial y sesgada de la problemática en todo su contexto. Se concluyó, entonces, que sería interesante poder realizar un análisis exhaustivo de la temática, contemplando las dos caras de la problemática.