Este repositório contém o código que gerei durante as aulas da semana de imersão de dados da Alura.
- Foram 5 aulas durante a semana de 19 a 23 de outubro de 2020.
- Aula introdutória, utilizamos uma amostra dos dados do ENEM.
- Usamos o Google Colab
- http://inep.gov.br/web/guest/microdados
- Amostra utilizada: https://github.com/alura-cursos/imersao-dados-2-2020/blob/master/MICRODADOS_ENEM_2019_SAMPLE_43278.csv
- Dicionário de dados: https://github.com/alura-cursos/imersao-dados-2-2020/tree/master/DICION%C3%81RIO
- Análise exploratória
- https://pandas.pydata.org/
- https://matplotlib.org/
- Distribuições e correlações
- https://seaborn.pydata.org/
- https://en.wikipedia.org/wiki/Pearson_correlation_coefficient
- https://seaborn.pydata.org/examples/many_pairwise_correlations.html
- Machine learning
- https://machinelearningmastery.com/types-of-classification-in-machine-learning/
- https://www.simplilearn.com/classification-machine-learning-tutorial#:~:text=Classification%20is%20a%20type%20of,an%20input%20variable%20as%20well.
- https://scikit-learn.org/stable/
- Validação do modelo