Coder Social home page Coder Social logo

v-amorim / proconectados Goto Github PK

View Code? Open in Web Editor NEW
1.0 1.0 0.0 68 KB

Python development challenge, focusing on public brazillian data from Procon for data analysis presentation, issued by Alpha EdTech.

License: MIT License

Python 26.89% HTML 73.11%

proconectados's Introduction

Alpha EdTech

Desafio Engenharia de Dados - Proconectados

Requisitos do desafio

Neste desafio, proposto pelo programa Alpha EdTech, os grupos são criados pelos professores e deverá ser realizado os processos de "coleta", 'limpeza", "análise" e "visualização" de dados da Administração Pública brasileira tendo como requisitos:

  • Uso das informações coletadas de um site da administração pública:
    • Uso da biblioteca Pandas;
    • Este processo poderá estático, isto é, a coleta pode ser feita em apenas uma etapa sem a necessidade de processamento dinâmico de informações;
    • A coleta normalmente será realizada processando-se um arquivo do tipo CSV por meio do uso do Pandas;
    • Deve-se realizar um tratamento para remover os dados não relevantes para o fim da aplicação ("limpeza").
    • Links de referências (não se restringindo a apenas estes):
  • Uso de banco de dados relacional:
    • Uso do Postgres;
    • Mínimo de 5 tabelas;
    • As tabelas principais devem ter no mínimo 10 mil registros cada;
    • Não há a necessidade de uso de Spark, bastando o uso de Pandas;
    • Utilizar comandos SQL para o cruzamento das informações.
  • Implementar e detalhar um processamento segmentado em no mínimo 3 zonas:
    • raw (dado cru);
    • curated (dado limpo); e
    • analytics (dado analisado).
  • Montagem do data warehouse com as informações das tabelas:
    • Devem utilizar algoritmos que demonstram a habilidade em estrutura de dados e complexidade de algoritmos.
  • Visualização dos dados analisados usando Flask;
  • Uso da análise estatística dos dados usando Plotly:
    • Uso de estatística básica;
    • Não é necessário o uso de regressões.

Objetivo

O tema escolhido foi o de explorar as informações coletadas do site do ministério da justiça em relação aos atendimentos do Procon, para análise de dados.

Tecnologias

Dependências

Referências

Licença

Esse repositório está licenciado pela Mit License. Para mais informações detalhadas, leia o arquivo License contido nesse repositório.

Equipe

Vinicius Amorim
Vinicius Amorim

🚀
Geverson Araujo Fernandes
Geverson Araujo Fernandes

🚀

proconectados's People

Contributors

v-amorim avatar

Stargazers

Paulo Marcotti avatar

Watchers

 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.