Coder Social home page Coder Social logo

datosgobar / analytics Goto Github PK

View Code? Open in Web Editor NEW
1.0 1.0 3.0 8.11 MB

Exploración y análisis específicos de los analytics de los productos digitales de la Dirección Nacional de Datos e Información Pública.

Home Page: https://datosgobar.github.io/analytics/

Jupyter Notebook 44.87% Python 0.22% Makefile 0.08% HTML 54.77% Smarty 0.07%
analytics

analytics's People

Contributors

abenassi avatar

Stargazers

 avatar

Watchers

 avatar  avatar

analytics's Issues

Población según cantidad de llamadas

En la distribución de IPs según la cantidad de llamadas se ven N grupos, estos grupos se diferencian por alguna otra cosa?

  • días en las que operan
  • horas del día en la que operan (grupo, e ips)
  • dispersión de las horas en las que operan (grupo, e ips)
  • variedad de series que consultan (grupo, e ips)

Crear nuevo notebook de analytics de series: generación de features

En el notebook series-generacion-features-usuarios.ipynb buscamos generar una tabla reproducible de características de los usuarios de la API de series (definidos por 1 usuario = 1 IP).

La idea es interpretar el análisis del notebook exploratorio en busca de features útiles para describir a los usuarios de la API, e implementarlas de forma tal que la generación de cada una esté encapsulada en una función que pueda ser ejecutada independientemente contra el input original, y agregue una nueva columna, con una nueva característica.

  • La función debe documentar en su docstring la "definición" del indicador / característica que se calcula.
  • Los nombres de las funciones tienen que seguir una consistencia entre ellas (van a ser muchas) y arrancar con un prefijo que permita identificarlas como "esta es una función que genera una feature / indicador / característica del usuario" (después más adelante vamos a usar esto para documentar automáticamente aparte todos los indicadores generados
  • Todas las funciones deben aplicarse al final del notebook contra el input, generando un dataframe con todas las features, que se guarda en CSV
  • No se debe guardar ningún CSV en Github que tenga una IP hay que anonimizarlas de entrada cuando se toma el input, si es que no están ya anonimizadas.

Población de IPs según Horario

Segmentar la población según el porcentaje de llamadas que hace de 8 a 21hs:

  • evaluar dispersión de los IDs que consulta
  • cantidad de llamadas que realiza

Crear nuevo notebook para presentar al owner de las series

MVP

Notebook prolijo que extrae el crudo de analytics, parsea y agrega columnas relevantes y las utiliza para generar el informe.

  • Armar un makefile para descargar los analytics (series/Makefile)
  • Hacer el primer notebook de informe series/series-informe-bcra.ipynb

Estructura

  1. Carga y normalización de analytics
  • Generación de columnas auxiliares
  • Normalización y parseo
  • DFs filtrados para BCRA
  1. Resumen ejecutivo
  • Generación de números globales
  • Informe breve de los números globales
  1. Sección de cantidad de llamadas
  • Perfil semanal de consulta de las series del BCRA
  • Evolución (diaria, semanal, mensual) de consulta de las series del BCRA
  1. Sección de cantidad de "usuarios"
  • Comportamiento de usuarios segmentados por tipo de consumo (grupos de cantidad)

Notas

  • Siempre calcular el número global total de hits, ips, etc a series del BCRA primero y mostrar evolución después.
  • Agregar al crudo de analytics las columnas auxiliares que parezcan útiles / necesarias para explotar los datos más fácilmente en secciones más adelante.

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.