Coder Social home page Coder Social logo

banner


Portfólio 📋

A seguir, os projetos centrais de destaque no meu perfil!

1. Processo de ETL: Carregamento, Transformação e Análise de Dados Financeiros pelo Power BI

Link > https://github.com/JoSEPHDev2022/Dash_Financeiro_Power_BI

O objetivo central desse projeto foi de desenvolver minhas capacidades de extração de dados, transformação desses registros utilizando a linguagem DAX do Power BI, engenharia de atributos e criação de medidas na plataforma de dashboards, assim como também criar um dashboard com um design intuitivo e amigável, com cores e padronizações especificas para cada empresa e seu respectivo relatório.

2. Análise Exploratória Descritiva-Estatistica de Dados: Site de Filmes Pirateados

Link > https://github.com/JoSEPHDev2022/EDA_Pirated_Movies

Este projeto tem como objetivo servir de aprimoramento em minhas capacidades de análise de dados utilizando estatística descritiva, gráficos e plots com Python, manipulação de dados com Pandas entre outras coisas. Como toda Análise Exploratória que realizo, esse projeto segue um caminho definido de etapas (esse caminho está descrito mais abaixo neste README). Por se tratar de um projeto bem detalhado e com várias etapas, ele ainda encontra-se em produção, porém deixo em destaque por se tratar do meu projeto mais recente e avançado de EDA.

3. Machine-Learning com Power BI: Utilizando o Power BI em Conjunto com Python Para Criar Visualizações

Link > https://github.com/JoSEPHDev2022/Dash_Machine_Learning

Nesse projeto, utilizei de técnicas de Machine Learning para realizar a Clusterização de Clientes de um dataset fictício. Após isso, foi criado um Dashboard pelo próprio Jupyter, Dash que foi publicado para o Power BI Service para poder ser aberto no Power BI Desktop para manipulação final.

Mas afinal, quem sou eu? 📰

Olá! me chamo José Luiz, um brasileiro residente do estado de São Paulo que está em busca de um constante aprimoramento profissional na área de Dados! Para uma visão mais holistica sobre mim, recomendo uma passadinha em meu LinkedIn! Mas para dar alguns bullet-points:

  • 👨‍💻 Atualmente estou focando em aprimorar minhas habilidades com Python, focando em me especializar ainda mais em Data Analytics, principalmente com Análise Exploratória de Dados usando estatística;

  • 🔭 Atualmente trabalho como professor assistente na mesma instituição em que estudei análise de dados! Resília Educação. Lá eu ensino e ajudo os alunos a aprender e crescer usando a linguagem Python para fazer projetos incríveis de análise de dados;

  • Gosto de jogar games, codar, fazer projetos paralelos como análise exploratória de dados em vários conjuntos de dados, ouvir música metal (banda favorita: Bolt Thrower 🎧 🤘) e dar muito carinho nas minhas gatinhas ❤️🐱;

  • 💬 Adoro conversar com as pessoas e compartilhar histórias.

  • ⚡ Curiosidade: sou formado em História e desenvolvi um projeto de pesquisa acadêmica na área, antes de vir para a área de Data Analysis!

Por aqui você encontrará uma gama de repositórios, alguns pertencentes ao meu período de estudante na Resilia Educação, onde esses projetos geralmente consistem em programação em Python e conceitos mais simples, contendo código escrito por um iniciante em Python! Por mais que esses projetos estejam desatualizados e eu já tenha ultrapassado as habilidades apresentadas neles, sempre acho legal deixá-los amostra para demonstrar minha evolução na área!

Os projetos centrais são de Análise Exploratória de Dados, algo que amo fazer em todo tipo de Dataset. Cheque a seção de "Portfólio" para entrar em contato com os mais recentes e avançados.

Tecnologias que Utilizo Diariamente 💻

Python Pandas NumPy | Seaborn |Matplotlib Postgres Jupyter NotebookPower Bi | Tableau |

Etapas do Processo de Criação de uma EDA: Um Guia Detalhado 📊

1. Compreendendo os Dados

Nesta primeira etapa, após coletar e importar os dados, trabalho para obter uma ideia geral do Dataset e, para isso, utilizo os seguintes métodos do Pandas:

data.describe()    # Descrição estatística das variáveis.
data.info()        # Informações gerais sobre as variáveis, como dtypes e uso de memória.
data.isna()        # Contagem do total de pontos de dados nulos.
data.shape()       # As dimensões do conjunto de dados (quantas linhas e colunas).

2. Preparando e Transformando os Dados

Esta etapa é muito importante, pois é onde manipulo o conjunto de dados, alterando tipos de dados, nomes de variáveis ​​e também projetando novos recursos para o conjunto de dados, ou seja, crio novas variáveis ​​com base nas existentes para aumentar ainda mais minhas capacidades de análise. Em outras palavras, essa etapa consiste em:

  • Eliminar variáveis ​​inúteis ou indesejáveis;

  • Renomear as variáveis, se necessário;

  • Lidar com valores ausentes;

  • Alterar tipos de dados;

  • Lidar com duplicatas;

  • Adicionar novos recursos ao conjunto de dados (engenharia de recursos).

3. Análise Univariada

Aqui começo minha avaliação em busca de outliers e, para isso, uso principalmente os seguintes recursos:

data.hist()            # Histograma para visualizar a distribuição dos dados.
data.value_counts()    # Determine quais pontos de dados estão ocorrendo mais vezes na variável.
data.skew()            # Determine a assimetria dos dados.
data.kurt()            # Determine a Curtose dos dados.

Para referência, é assim que determinamos assimetria:

skew_graph

E, para a Curtose:

kurt_graph

4. Análise multivariada

É aqui que analiso a correlação entre as diferentes variáveis ​​do Dataset, para isso, utilizo os heatmaps, pairplots e boxplots da biblioteca seaborn.

5. Perguntas, percepções e respostas

Como etapa final, faço várias perguntas relevantes após a análise dos dados, buscando descobrir os insights mais relevantes para aquele conjunto de dados específico.

Contatos 📫

Gostou do que viu por aqui? Tem feedbakcs para me dar? Quer bater um papo sobre meus projetos e ideias? Entre em contato por:

LinkedIn

Outlook

[email protected]

LuizFdev's Projects

_projetom3 icon _projetom3

Projeto do final do módulo 3 do curso de Data Analytics da Resilia Educação.

contratado_todo4 icon contratado_todo4

Um programa voltado para filtragem e seleção de candidatos para processos seletivos de vagas da empresa. Leia o README para mais informações.

dash_financeiro_power_bi icon dash_financeiro_power_bi

Um projeto de ETL feito completamente pelo POWER BI, onde coletei os dados das ações de diferentes empresas Big Tech, transformei os dados utilizando Power Query e linguagem DAX e carreguei os dados em reports paginados do Power Bi.

dash_machine_learning icon dash_machine_learning

Nesse projeto, utilizei de técnicas de Machine Learning para realizar a Clusterização de Clientes de um dataset fictício. Após isso, foi criado um Dashboard pelo próprio Jupyter, Dash que foi publicado para o Power BI Service para poder ser aberto no Power BI Desktop para manipulação final.

deu_match_todo3 icon deu_match_todo3

"Deu match!" é um projeto desenvolvido individualmente. Leia o README para informações completas.

eda_pirated_movies icon eda_pirated_movies

A comprehensive Exploratory Data Analysis project focused on developing and showing my skills as a Data Analyst. This project is still in the works, because it is very detailed.

estudos_sql icon estudos_sql

<<LEIA O README!!>> Repositório que contém dois bancos de dados e queries SQL de análise respondendo algumas perguntas. O objetivo desse repositório, é compartilhar meus estudos e desenvolvimento em PostgreSQL.

forest_fires_brazil icon forest_fires_brazil

Uma análise exploratória de um dataset contendo dados de uma série histórica de incêndios em florestas brasileiras. Leia o README para mais informações.

mental_health_x_music icon mental_health_x_music

Uma análise exploratória de um dataset contendo informações de uma pesquisa realizada com diversas pessoas, tentando estabelecer paralelos entre gêneros musicais e condições mentais.

metacritc_scores_video_games icon metacritc_scores_video_games

Nesse repositório, está presente uma análise exploratória descritiva de dados de um Dataset que contém notas e avaliações fornecidas pelo Metacritic acerca de Video Games.

meu_bot icon meu_bot

O projeto consiste em um bot de informações profissionais que fornece aos usuários detalhes sobre mim, como minhas habilidades, experiências e informações de contato. O bot apresenta opções de menu para visualizar minhas informações profissionais, entrar em contato comigo e abrir meu portfólio de projetos.

netflix_movies_analise icon netflix_movies_analise

Uma análise exploratória de um dataset que contém informações acerca de séries e filmes no catálogo da Netflix.

projeto-m1 icon projeto-m1

Um simples projeto de desenvolvimento de um bot de informações. Simples, mas eficaz. #MenosÉMais

projetom2-resilia icon projetom2-resilia

Nosso time recebeu uma solicitação de projeto - dessa vez vamos desenvolver uma pesquisa digital com a população de várias cidades do Brasil e armazenar os dados dessa pesquisa em um arquivo .csv para utilização em análises futuras.

ufo_sightings_eda icon ufo_sightings_eda

Este repositório contém uma análise exploratória de um dateset contendo relatos de avistamentos de Objetos Voadores Não Identificados. Utilizando Jupyter Notebook, Python e bibliotecas de Limpeza e Tratamento de Dados e Power BI para construção de Dashboards.

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.