El desafío: desarrollar un modelo que prediga que clientes van a cambiar su dispositivo móvil (terminal)
El área comercial a este tipo de acción le dice CATER (CAmbio TERminal).
Partiendo de las información de un conjunto de usuarios de Personal correspondientes 5 meses del 2020 y un mes 2021, el desafío consiste en predecir que clientes son mas propensos a cambiar su terminal.
El CATER puede darse por la compra de una terminal en nuestras tiendas (SELL OUT) o bien por un cambio o compra en otro tipo de tiendas (cambio de emei), por lo que identificamos a ambos casos como CATER para el desarrollo del modelo. El universo son clientes del segmento ABONOS: Pospago y Cuentas Claras, Individuos y soho.
Para el desarrollo del modelo, se proveen los siguientes conjuntos de datos:
- cater_muestra.csv
- cater_validaciones.csv
- metadata.csv
Estos archivos pueden ser descargados desde aquí.
Target=1 se considera a los clientes que hayan realizado un CATER a los dos meses posteriores subsiguientes desde el momento de sacar la foto de la información, por ejemplo para la foto de informacion del mes de agosto 2020 se considera 1 al cliente que realizó un cater durante Octubre 2020.
La distribución del target para los distintos periodos es
Este dataset contiene los features correspondiente a una muestra aleatoria de más de 170 mil clientes y su correspondiente target.
Este dataset contiene los features correspondiente a una muestra aleatoria de más de 30 mil clientes, pero las columnas target y sus asociadas están vacías.
El diccionario de variables está en metadata.xlsx, con dos hojas, "variables" con la descripcion de los feautures ,"detalle_mediador" con los conceptos de las variables del mediador de la red movil
Se deberá entregar el listado clientes de la base cater_validaciones.csv con un valor de probabilidad/score que represente a la chance de realizar un CATER.
- Los valores del target del set de test es privado, lo cual significa que los participantes no tendrán acceso a él.
Las predicciones serán evaluadas utilizando la métrica de ** precision_al 10% **
Las recomendaciones deben enviarse en un archivo csv con la siguiente estructura:
- Una columna que identifica a cada perfil con su código de identificación (cliente_id).
- Otra columna con el valor de probabilidad/score
Los valores del csv deberán estar separados por comas, y las variables no deben tener encabezado. Para garantizar la concordancia de las predicciones con el set de testeo