seade-r / dados-covid-sp Goto Github PK
View Code? Open in Web Editor NEWRepositório de dados sobre SARS-COV-2 em municípios paulistas
Repositório de dados sobre SARS-COV-2 em municípios paulistas
@leobarone parabéns pelo trabalho, uma grande ajuda nos projetos.
Gostaria de calcular a fase das regiões de são paulo, mas não estou conseguindo pegar todas as variáveis, gostaria de ver se há possibilidade de incluir no arquivo "plano_sp_leitos_internacoes.csv" esse dado;
segue a formula para cacular a fase:
O arquivo csv disponibilizado repete os dados inúmeras vezes.
Sempre que a lista de cidades acaba, a lista recomeça com os mesmos dados, mesmo dia (mês como NA) e mesmos números de casos e mortes.
Deveriam ser os dados de dias anteriores?
Estou pegando os dados diretamente do site federal https://covid.saude.gov.br/.
Vi que para a cidade de São Paulo o número de casos acumulados está em 114.360.
O mesmo ocorre para o número de óbitos na cidade: 8.355.
Ao baixar o arquivo e fazer os filtros encontrei esses números acima.
No painel do estado o número parece estar correto.
Bom dia,
Primeiramente gostaria de agradecer pela disponibilização dos dados, é bem importante termos essa transparência nesse momento.
Gostaria de saber se existe alguma fonte de dados que indiquem os casos por bairro ou o mais próximo disso. Teria?
Agradeço desde já.
Olá, Parece que o arquivo casos_obitos_doencas_preexistentes.csv.zip (23/04/2021) veio incompleto dessa vez.
Além do formato da data ter sido alterado (antes aaaa-mm-dd e agora aaaa-dd-mm), as datas vão somente até o dia 12 de cada mês a partir do mês... Eu acredito que isso aconteceu pela confusão com a troca do formato da data.
Boa noite,
O arquivo casos_obitos_doencas_preexistentes.csv possui muitas linhas com a informação "IGNORADO" nas colunas de comorbidades. Como deve ser interpretado isso? Vi que um número enorme de linhas está com essas informações. Vendo o excel deu a entender que o ideal seria ser preenchido com "SIM" ou "NÃO" para podermos afirmar com total certeza se havia ou não a comorbidade. Alguns registros de linha está com todas comorbidades com "IGNORADO" mas apenas uma coluna com "SIM", isso acaba me levando a entender que o agente que inseriu o dado no sistema apenas marcou a comorbidade no caso em que há, e as outras que não há acabou deixando vazio e consequentemente aparece como IGNORADO. Também há casos em que todas comorbidades está com "IGNORADO", poderia me levar a inferir que o agente deixou o campo em branco ao preencher no sistema e consequentemente seria uma pessoa sem comorbidades? Acredito que possa haver uma falta de padronização nos procedimentos de inserção de dados nos sistemas.
Agradeço muito se conseguir algum esclarecimento, pois, com tantos casos com o status "IGNORADO" fica difícil de fazer uma análise dos dados.
Prezados, boa tarde,
Na data de hoje, 22/09/2021, ao trabalhar com o banco de dados "Casos, óbitos e doenças pré-existentes" notei que as as colunas asma, doenca_hematologica, doenca_hepatica, doenca_neurologica, obesidade, outros_fatores_de_risco, pneumopatia, puerpera e sindrome_de_down estão vindo com todas as observações como IGNORADO, acredito que seja um erro pois já utilizei as mesmas para ajustar um modelo em Maio de 2021.
Boa noite, gostaria de ser um colaborador do projeto.
Como eu poderia ajudar este respositorio e me tornar um dos manteiners?
Existe a possibilidade de disponibilizar estes dados?
O número de linha do arquivo casos_obitos_doencas_preexistentes.csv
, que estava na ordem de 1,5 milhão, passou para menos de metade disto a partir do dia 16/01/2021.
Último commit com número acima de um milhão parece ser o 89c35a9 de 15/01/2021 (1.542.382 linhas ). O master de hoje (21/01/2021) tem 607.354 linhas.
olá! encontrei esssa visualização e vi que foi feita em power bi e é justamente esse tipo de modelo que preciso aplicar na minha empresa, poderia me informar como ele foi construido? ajudaria muito pois pretendo usar esse modelo como base
meu email: [email protected]
Olá!
Vocês poderiam adicionar às bases o isolamento social também? Não achei nos dados.
Estou montando um estudo de causalidade e precisava dessas informações.
Obrigado!
Caros,
Primeiramente, parabéns pelo trabalho.
Gostaria de reutilizar os dados em outros projetos. Em especial, iniciei e tento manter atualizada a página da Wikipédia sobre a pandemia no Estado:
https://pt.wikipedia.org/wiki/Pandemia_de_COVID-19_no_estado_de_S%C3%A3o_Paulo
Os dados daqui poderiam ser automaticamente integrados ao Wikidata (https://www.wikidata.org/wiki/Wikidata:WikiProject_COVID-19), onde eles são disponibilizados em domínio público.
Os dados aqui disponibilizados estão em domínio público? Posso utilizá-los à vontade?
Obrigado!
Abraços,
Tiago
Os dados referentes a casos e óbitos foram descontinuados?
De acordo com os prints dos boletin epidemiologico da secretaria, todos diferem dos dados demonstrados.
dia 08/06 - 75 confirmados
dia 18/06 - 120 confirmados
dia 09/07 - 303 confirmados
nos dados, acumuladamente até o dia 06/07 tinham somente 49 casos, então no dia 07/07 reportaram 207 casos.
parece que fizeram um catado e informaram os dados agrupados, o que gera um crescimento semanal espantoso, quando na verdade não houve.
Boa tarde, parabéns pelo trabalho.
Apenas gostaria de alertar alem dos casos IGNORADOS nos 3 relatórios dados_covid-sp faltam uma cidade São Luis do Paratinga
E desculpa pela minha ignorância, mas não pude entender o cálculo para as colunas casos_mm7d e obitos_mm7d.
Muito obrigado.
Sidney Pino
Bom dia, tudo bom?
Primeiramente, parabéns pelo trabalho! Estes dados estão me ajudando bastante no meu TCC :)
Gostaria de saber se é possível inserir uma coluna nova neste conjunto contendo a “data de óbito”, pois neste conjunto só possui a “data de início de sintomas” e, eu gostaria dessa data de óbito para elaborar um gráfico de linha temporal.
Eu vi que vocês possuem um conjunto somente com óbitos, mas este conjunto só apresenta a somatória de óbitos por município, e eu precisaria de óbito por indivíduo.
Parabens pelo trabalho fantastico com os paineis.
Estou precisando de informações de ocupação de UTIs no estado e região metropolitana de SP ao longo do tempo, diariamente. Não consegui achar essa base. Vocês teriam esses dados disponíveis?
Muito obrigado desde já!
@leobarone parabéns pelo trabalho de vocês, ajuda bastante nas projeções.
Tenho duas dúvidas:
Obrigado desde já pelo apoio.
Olá! Os dados referentes as semanas epidemiológicas, no arquivo csv, estão apresentando informações indefinidas a partir da virada do ano. Desde já agradeço,
Luiz
Olá, Leo Barone!
Tudo bem? Estou trabalhando com algumas tabelas de sua (muito boa) base de dados, porém estou com algumas dúvidas em alguns pontos; um deles é na tabela "casos_obitos_doencas_preexistentes.csv". Essa tabela, em tese, abriga somente casos confirmados de COVID-19. Como se deu essa confirmação? Através de RT-PCR, de teste sorológico (rápido ou não), uma mistura dos dois ou essa informação é ignorada? Muito obrigado pela atenção!
[]s,
Marcelo
Prezados, sabem me dizer o motivo deste erro? Ocorre ao rodar a função
info_munic <- read.csv2('data/informacoes_municipais_seade.csv') %>%
mutate(munic = tolower(munic),
munic = remove_acentos(munic),
munic = trimws(munic),
munic = str_replace_all(munic, '-', ' '))
Já coloquei os 3 arquivos na pasta corretamente mas o problema persiste.
Att,
Henrique
Olá!
Estou com dúvida sobre o padrão que a variável cod_drs
do banco dados_covid_sp.csv segue.
Os números não batem com os códigos dos DRS do site da Secretaria de Estado da Saúde , http://www.saude.sp.gov.br/ses/institucional/departamentos-regionais-de-saude/regionais-de-saude.
Muito obrigada e parabéns pelo trabalho!
Olá. Gostaria de saber se não há possibilidade de disponibilizar os dados referentes aos casos novos e óbitos por dia, por município, como é disponibilizado no SEADE. Como ele unifica essa informação de todos os municípios do estado seria de grande ajuda, porém não disponibiliza isso em .csv ou .tsv.
Oi Pessoal,
A atualização desse arquivo casos_obitos_doencas_preexistentes.csv.zip foi descontinuada?
Senhores, desde o dia 28/maio/2021 que os dados não são atualizados... Alguém tem uma dica do que acontece pls?
Diante do cenário de mudança epidemiológica da população mais afetada, seria possível incluir dados de ocupação de uti por faixa etária ?
Na linha 1018 do arquivo csv há uma entrada para a cidade de São Paulo no dia 09/04 fora da ordem alfabética e com a contagem muito diferente das outras.
E há uma outra entrada para cidade na mesma data n linha 1035.
A da linha 1018 é um erro, não?
Vocês poderiam removê-la?
Boa tarde.
Poderia passar a disponibilizar uma base semelhante à "plano_sp_leitos_internacoes_serie_nova_variacao_semanal.csv", mas por município ao invés de DRS?
Grato.
Olá, Leo, tudo bom?
Primeiro parabéns pelo repositório de dados de Covid-19, é muito útil para nossas análises.
Gostaria de entender porque os dados de casos (esus+sivep), especificamente, filtrados por data de notificação de 1 a 11 de janeiro, e por confirmação laboratorial para Covid, estão inferiores aos extraídos pela prefeitura da capital nos mesmos sistemas com os mesmos filtros. Pode estar havendo algum tipo de extração incompleta dos sistemas e-sus e/ou sivep que faça com que os dados extraídos por vocês nesses dias seja inferior aos extraídos pela prefeitura? O que pode estar motivando?
Obrigada!
Primeiramente, parabéns pela iniciativa de publicação dos dados!
Issue:
O painel apresenta o dado de ocupação das UTIs, mas os arquivos de dados aparentemente não tem a informação da quantidade de UTIs ocupadas. Também não há dados sobre leitos de enfermaria ocupados ou totais.
Seria possível disponibilizar também estes dados para acompanhamento da série histórica?
Outro comentário referente ao mesmo assunto:
A descrição da coluna "total_covid_uti" (Total de Leitos de UTI Destinados para COVID-19 no dia) não deixa claro se é o número de UTIs que foram "destinadas à pacientes de COVID naquele dia" (ou seja, foram efetivamente ocupadas por pacientes de COVID), ou se são "reservadas" para pacientes de covid (e portanto incluiriam todos os leitos de UTI, incluindo ocupados e não ocupados).
Meu entendimento foi de que se trata do total reservado (incluindo ocupados e não ocupados).
Porém este dado não está batendo com o relatório do Plano São Paulo de 3/6 que apresenta na penúltima página 4693 leitos destinados à COVID no estado. A base de dados tem o número 7192 neste dia. Gostaria de confirmar a informação.
Ao verificar a quantidade de datas diferentes no campo 'data_inicio_sintomas' dos dados em https://github.com/seade-R/dados-covid-sp/blob/master/data/casos_obitos_doencas_preexistentes.csv.zip, notei que existem apenas 179 datas diferentes, muito inferior aos ~400 dias de pandemia.
Notei também que não tem nenhum dia superior a 12.
Até uns 4 dias atrás, eu usei os dados e esse erro não ocorria.
Código em Python para reproduzir:
import pandas as pd
fileurl = 'https://github.com/seade-R/dados-covid-sp/blob/master/data/casos_obitos_doencas_preexistentes.csv.zip?raw=true'
df = pd.read_csv(fileurl, encoding='ISO-8859-1', sep=';', compression='zip')
df[['data_inicio_sintomas']].value_counts().sort_index().head(30)
Saída do código:
2020-01-03 337
2020-01-04 1914
2020-01-05 4541
2020-01-06 9471
2020-01-07 11896
2020-01-08 9655
2020-01-09 7386
2020-01-10 4945
2020-01-11 4939
2020-01-12 9715
2020-02-03 104
2020-02-04 1196
2020-02-05 2766
2020-02-06 5952
2020-02-07 8876
2020-02-08 6539
2020-02-09 6160
2020-02-10 3877
2020-02-11 4246
2020-02-12 7559
2020-03-03 125
2020-03-04 1203
2020-03-05 2752
2020-03-06 5805
2020-03-07 9497
2020-03-08 8873
2020-03-09 5775
2020-03-10 3062
2020-03-11 4876
2020-03-12 7579
(Parece que as datas estão no formato ano-dia-mês)
Tentando com a versão de 30 de abril, as datas aparecem normal:
fileurl = 'https://github.com/seade-R/dados-covid-sp/blob/d6bd4c2d1160bba0136e99c69a08899034d05045/data/casos_obitos_doencas_preexistentes.csv.zip?raw=true'
df = pd.read_csv(fileurl, encoding='ISO-8859-1', sep=';', compression='zip')
df[['data_inicio_sintomas']].value_counts().sort_index().head(30)
2020-02-04 32
2020-02-05 41
2020-02-06 27
2020-02-07 14
2020-02-08 28
2020-02-09 17
2020-02-10 36
2020-02-11 24
2020-02-12 37
2020-02-13 21
2020-02-14 28
2020-02-15 53
2020-02-16 15
2020-02-17 30
Hello,
Your dataset was added to CoronaWhy (https://www.coronawhy.org/) Data Lake on Dataverse as a piece of common COVID-19 data frame http://datasets.coronawhy.org/dataset.xhtml?persistentId=doi:10.5072/FK2/GVGE94
Would you be willing to help with the maintenance of your dataset in Dataverse, e.g. adding the relevant metadata and keeping the dataset up-to-date? That will help to make the dataset findable and accessible for the medical science community.
A declarative, efficient, and flexible JavaScript library for building user interfaces.
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
An Open Source Machine Learning Framework for Everyone
The Web framework for perfectionists with deadlines.
A PHP framework for web artisans
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
Some thing interesting about web. New door for the world.
A server is a program made to process requests and deliver data to clients.
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
Some thing interesting about visualization, use data art
Some thing interesting about game, make everyone happy.
We are working to build community through open source technology. NB: members must have two-factor auth.
Open source projects and samples from Microsoft.
Google ❤️ Open Source for everyone.
Alibaba Open Source for everyone
Data-Driven Documents codes.
China tencent open source team.