Usar a ferrramenta do databricks para desenvolver aplicações das áreas de engenharia Ciência de Dados e Machine Learning através das linguagens de programação; Python, PySpark e SQL.
O Azure Databricks é uma plataforma unificada de open analytics para criar, implantar, compartilhar e manter soluções de dados de nível empresarial, analytics e IA em escala. A Plataforma Azure Databricks Lakehouse integra-se ao armazenamento em nuvem e à segurança em sua conta de nuvem e gerencia e implanta a infraestrutura de nuvem em seu nome.
🎯1 - Extração dos dados através de uma API Publica e aplicar o devido tratamento dos dados.
Iniciei com as extrações das bases de dados e renomei as colunas para cada dataframes que por agora estão de forma separadas e a ideia futura e unir após o tratamento.
🎲 - circuits.csv
🎲 - constructor_results.csv
🎲 - constructor_standings.csv
🎲 - construtors.csv
🎲 - driver_standings.csv
🎲 - drivers.csv
🎲 - lap_times.csv
🎲 - pit_stops.csv
🎲 - quanlifying.csv
🎲 - races.csv
🎲 - results.csv
🎲 - seasons.csv
🎲 - sprint_results.csv
🎲 -status.csv
- Juntei todos os Dataframes para criar que nas próximas etapas de análise exploratória esteja mais facilitado manipular toda base de dados.
🎯2 - Desenvolver análise exploratória e descritiva dos dados.
🎯3 - Criar Visualização dos dados através da integração com o Power BI.
🎯4 - Desenvolver Modelos de Machine Learning.