Coder Social home page Coder Social logo

dados-covid-sp's People

Contributors

leobarone avatar lgelape avatar lumardi avatar valmiraranha avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

dados-covid-sp's Issues

CSV com dados repetidos

O arquivo csv disponibilizado repete os dados inúmeras vezes.
Sempre que a lista de cidades acaba, a lista recomeça com os mesmos dados, mesmo dia (mês como NA) e mesmos números de casos e mortes.
Deveriam ser os dados de dias anteriores?

Casos acumulados e óbitos em São Paulo em 30/05

Estou pegando os dados diretamente do site federal https://covid.saude.gov.br/.
Vi que para a cidade de São Paulo o número de casos acumulados está em 114.360.
O mesmo ocorre para o número de óbitos na cidade: 8.355.
Ao baixar o arquivo e fazer os filtros encontrei esses números acima.
Capturar

No painel do estado o número parece estar correto.

Dados por bairros

Bom dia,

Primeiramente gostaria de agradecer pela disponibilização dos dados, é bem importante termos essa transparência nesse momento.

Gostaria de saber se existe alguma fonte de dados que indiquem os casos por bairro ou o mais próximo disso. Teria?

Agradeço desde já.

CASOS DE Óbitos e doenças pré-existentes (Arquivo incompleto)

Olá, Parece que o arquivo casos_obitos_doencas_preexistentes.csv.zip (23/04/2021) veio incompleto dessa vez.

Além do formato da data ter sido alterado (antes aaaa-mm-dd e agora aaaa-dd-mm), as datas vão somente até o dia 12 de cada mês a partir do mês... Eu acredito que isso aconteceu pela confusão com a troca do formato da data.

Comorbidades com status IGNORADO

Boa noite,
O arquivo casos_obitos_doencas_preexistentes.csv possui muitas linhas com a informação "IGNORADO" nas colunas de comorbidades. Como deve ser interpretado isso? Vi que um número enorme de linhas está com essas informações. Vendo o excel deu a entender que o ideal seria ser preenchido com "SIM" ou "NÃO" para podermos afirmar com total certeza se havia ou não a comorbidade. Alguns registros de linha está com todas comorbidades com "IGNORADO" mas apenas uma coluna com "SIM", isso acaba me levando a entender que o agente que inseriu o dado no sistema apenas marcou a comorbidade no caso em que há, e as outras que não há acabou deixando vazio e consequentemente aparece como IGNORADO. Também há casos em que todas comorbidades está com "IGNORADO", poderia me levar a inferir que o agente deixou o campo em branco ao preencher no sistema e consequentemente seria uma pessoa sem comorbidades? Acredito que possa haver uma falta de padronização nos procedimentos de inserção de dados nos sistemas.
Agradeço muito se conseguir algum esclarecimento, pois, com tantos casos com o status "IGNORADO" fica difícil de fazer uma análise dos dados.

Casos, óbitos e doenças pré-existentes: colunas com todas as observações IGNORADO

Prezados, boa tarde,
Na data de hoje, 22/09/2021, ao trabalhar com o banco de dados "Casos, óbitos e doenças pré-existentes" notei que as as colunas asma, doenca_hematologica, doenca_hepatica, doenca_neurologica, obesidade, outros_fatores_de_risco, pneumopatia, puerpera e sindrome_de_down estão vindo com todas as observações como IGNORADO, acredito que seja um erro pois já utilizei as mesmas para ajustar um modelo em Maio de 2021.

Colaborar

Boa noite, gostaria de ser um colaborador do projeto.

Como eu poderia ajudar este respositorio e me tornar um dos manteiners?

arquivo casos obitos e doenças pre-existentes: linhas faltantes?

O número de linha do arquivo casos_obitos_doencas_preexistentes.csv, que estava na ordem de 1,5 milhão, passou para menos de metade disto a partir do dia 16/01/2021.

Último commit com número acima de um milhão parece ser o 89c35a9 de 15/01/2021 (1.542.382 linhas ). O master de hoje (21/01/2021) tem 607.354 linhas.

como criar a visualização em Power BI

olá! encontrei esssa visualização e vi que foi feita em power bi e é justamente esse tipo de modelo que preciso aplicar na minha empresa, poderia me informar como ele foi construido? ajudaria muito pois pretendo usar esse modelo como base
meu email: [email protected]

Isolamento social

Olá!

Vocês poderiam adicionar às bases o isolamento social também? Não achei nos dados.
Estou montando um estudo de causalidade e precisava dessas informações.

Obrigado!

Clarificação de licença de reuso

Caros,

Primeiramente, parabéns pelo trabalho.

Gostaria de reutilizar os dados em outros projetos. Em especial, iniciei e tento manter atualizada a página da Wikipédia sobre a pandemia no Estado:

https://pt.wikipedia.org/wiki/Pandemia_de_COVID-19_no_estado_de_S%C3%A3o_Paulo

Os dados daqui poderiam ser automaticamente integrados ao Wikidata (https://www.wikidata.org/wiki/Wikidata:WikiProject_COVID-19), onde eles são disponibilizados em domínio público.

Os dados aqui disponibilizados estão em domínio público? Posso utilizá-los à vontade?

Obrigado!

Abraços,

Tiago

Casos Mogi-mirim

De acordo com os prints dos boletin epidemiologico da secretaria, todos diferem dos dados demonstrados.
dia 08/06 - 75 confirmados
dia 18/06 - 120 confirmados
dia 09/07 - 303 confirmados

nos dados, acumuladamente até o dia 06/07 tinham somente 49 casos, então no dia 07/07 reportaram 207 casos.
parece que fizeram um catado e informaram os dados agrupados, o que gera um crescimento semanal espantoso, quando na verdade não houve.

Cidade Faltante no Relatório Dados Covid

Boa tarde, parabéns pelo trabalho.

Apenas gostaria de alertar alem dos casos IGNORADOS nos 3 relatórios dados_covid-sp faltam uma cidade São Luis do Paratinga

E desculpa pela minha ignorância, mas não pude entender o cálculo para as colunas casos_mm7d e obitos_mm7d.

Muito obrigado.
Sidney Pino

Dicionário para o arquivo de Casos, óbitos e doenças pré-existentes

Bom dia, tudo bom?

Primeiramente, parabéns pelo trabalho! Estes dados estão me ajudando bastante no meu TCC :)

Gostaria de saber se é possível inserir uma coluna nova neste conjunto contendo a “data de óbito”, pois neste conjunto só possui a “data de início de sintomas” e, eu gostaria dessa data de óbito para elaborar um gráfico de linha temporal.

Eu vi que vocês possuem um conjunto somente com óbitos, mas este conjunto só apresenta a somatória de óbitos por município, e eu precisaria de óbito por indivíduo.

Ocupação de UTIs ao longo do tempo

Parabens pelo trabalho fantastico com os paineis.

Estou precisando de informações de ocupação de UTIs no estado e região metropolitana de SP ao longo do tempo, diariamente. Não consegui achar essa base. Vocês teriam esses dados disponíveis?

Muito obrigado desde já!

Atualização 15.jul e Série Histórica para Ocupação de UTIs

@leobarone parabéns pelo trabalho de vocês, ajuda bastante nas projeções.
Tenho duas dúvidas:

  1. o que houve com a atualização de 15/07? Há previsão para a disponibilidade?
  2. onde posso obter a série histórica com os dados diários de "Ocupação Leitos Covid" por regional de saúde (DRS)?

Obrigado desde já pelo apoio.

semana epidemiológica

Olá! Os dados referentes as semanas epidemiológicas, no arquivo csv, estão apresentando informações indefinidas a partir da virada do ano. Desde já agradeço,
Luiz

Casos confirmados: somente por RT-PCR, por sorológico ou ambos?

Olá, Leo Barone!

Tudo bem? Estou trabalhando com algumas tabelas de sua (muito boa) base de dados, porém estou com algumas dúvidas em alguns pontos; um deles é na tabela "casos_obitos_doencas_preexistentes.csv". Essa tabela, em tese, abriga somente casos confirmados de COVID-19. Como se deu essa confirmação? Através de RT-PCR, de teste sorológico (rápido ou não), uma mistura dos dois ou essa informação é ignorada? Muito obrigado pela atenção!

[]s,

Marcelo

Error in tolower(munic) : object 'munic' not found

Prezados, sabem me dizer o motivo deste erro? Ocorre ao rodar a função

info_munic <- read.csv2('data/informacoes_municipais_seade.csv') %>%
mutate(munic = tolower(munic),
munic = remove_acentos(munic),
munic = trimws(munic),
munic = str_replace_all(munic, '-', ' '))

Já coloquei os 3 arquivos na pasta corretamente mas o problema persiste.

Att,

Henrique

Novos casos/óbitos por dia

Olá. Gostaria de saber se não há possibilidade de disponibilizar os dados referentes aos casos novos e óbitos por dia, por município, como é disponibilizado no SEADE. Como ele unifica essa informação de todos os municípios do estado seria de grande ajuda, porém não disponibiliza isso em .csv ou .tsv.

Ocupação UTI / Idade

Diante do cenário de mudança epidemiológica da população mais afetada, seria possível incluir dados de ocupação de uti por faixa etária ?

Arquivo csv com dado incorreto

Na linha 1018 do arquivo csv há uma entrada para a cidade de São Paulo no dia 09/04 fora da ordem alfabética e com a contagem muito diferente das outras.
E há uma outra entrada para cidade na mesma data n linha 1035.

A da linha 1018 é um erro, não?
Vocês poderiam removê-la?

Leitos e internações por MUNICÍPIO

Boa tarde.
Poderia passar a disponibilizar uma base semelhante à "plano_sp_leitos_internacoes_serie_nova_variacao_semanal.csv", mas por município ao invés de DRS?
Grato.

Divergência de dados Seade x prefeitura de SP

Olá, Leo, tudo bom?
Primeiro parabéns pelo repositório de dados de Covid-19, é muito útil para nossas análises.
Gostaria de entender porque os dados de casos (esus+sivep), especificamente, filtrados por data de notificação de 1 a 11 de janeiro, e por confirmação laboratorial para Covid, estão inferiores aos extraídos pela prefeitura da capital nos mesmos sistemas com os mesmos filtros. Pode estar havendo algum tipo de extração incompleta dos sistemas e-sus e/ou sivep que faça com que os dados extraídos por vocês nesses dias seja inferior aos extraídos pela prefeitura? O que pode estar motivando?
Obrigada!

Dados de ocupação de UTI

Primeiramente, parabéns pela iniciativa de publicação dos dados!

Issue:
O painel apresenta o dado de ocupação das UTIs, mas os arquivos de dados aparentemente não tem a informação da quantidade de UTIs ocupadas. Também não há dados sobre leitos de enfermaria ocupados ou totais.

image

Seria possível disponibilizar também estes dados para acompanhamento da série histórica?

Outro comentário referente ao mesmo assunto:
A descrição da coluna "total_covid_uti" (Total de Leitos de UTI Destinados para COVID-19 no dia) não deixa claro se é o número de UTIs que foram "destinadas à pacientes de COVID naquele dia" (ou seja, foram efetivamente ocupadas por pacientes de COVID), ou se são "reservadas" para pacientes de covid (e portanto incluiriam todos os leitos de UTI, incluindo ocupados e não ocupados).
Meu entendimento foi de que se trata do total reservado (incluindo ocupados e não ocupados).
Porém este dado não está batendo com o relatório do Plano São Paulo de 3/6 que apresenta na penúltima página 4693 leitos destinados à COVID no estado. A base de dados tem o número 7192 neste dia. Gostaria de confirmar a informação.

image

'data_inicio_sintomas': datas faltando (dias superiores a 12)

Ao verificar a quantidade de datas diferentes no campo 'data_inicio_sintomas' dos dados em https://github.com/seade-R/dados-covid-sp/blob/master/data/casos_obitos_doencas_preexistentes.csv.zip, notei que existem apenas 179 datas diferentes, muito inferior aos ~400 dias de pandemia.

Notei também que não tem nenhum dia superior a 12.

Até uns 4 dias atrás, eu usei os dados e esse erro não ocorria.

Código em Python para reproduzir:

import pandas as pd
fileurl = 'https://github.com/seade-R/dados-covid-sp/blob/master/data/casos_obitos_doencas_preexistentes.csv.zip?raw=true'
df = pd.read_csv(fileurl, encoding='ISO-8859-1', sep=';', compression='zip')
df[['data_inicio_sintomas']].value_counts().sort_index().head(30)

Saída do código:

2020-01-03                337
2020-01-04               1914
2020-01-05               4541
2020-01-06               9471
2020-01-07              11896
2020-01-08               9655
2020-01-09               7386
2020-01-10               4945
2020-01-11               4939
2020-01-12               9715
2020-02-03                104
2020-02-04               1196
2020-02-05               2766
2020-02-06               5952
2020-02-07               8876
2020-02-08               6539
2020-02-09               6160
2020-02-10               3877
2020-02-11               4246
2020-02-12               7559
2020-03-03                125
2020-03-04               1203
2020-03-05               2752
2020-03-06               5805
2020-03-07               9497
2020-03-08               8873
2020-03-09               5775
2020-03-10               3062
2020-03-11               4876
2020-03-12               7579

(Parece que as datas estão no formato ano-dia-mês)

Tentando com a versão de 30 de abril, as datas aparecem normal:

fileurl = 'https://github.com/seade-R/dados-covid-sp/blob/d6bd4c2d1160bba0136e99c69a08899034d05045/data/casos_obitos_doencas_preexistentes.csv.zip?raw=true'
df = pd.read_csv(fileurl, encoding='ISO-8859-1', sep=';', compression='zip')
df[['data_inicio_sintomas']].value_counts().sort_index().head(30)
2020-02-04               32
2020-02-05               41
2020-02-06               27
2020-02-07               14
2020-02-08               28
2020-02-09               17
2020-02-10               36
2020-02-11               24
2020-02-12               37
2020-02-13               21
2020-02-14               28
2020-02-15               53
2020-02-16               15
2020-02-17               30

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.