Exploração de dados de números Covid

Imagem do título da história

Hoje eu quero entrar um pouco nos dados do Covid, porque vejo que há definitivamente alguma confusão.

A principal razão pela qual comecei este projecto foi para dizer que as medidas de encerramento estavam ligadas ao "valor R" e os cientistas da imprensa pública disseram que o valor R só podia ser estimado - inacreditável para mim. Então vamos ver o que podemos descobrir.

Que dados temos à nossa disposição?

Eu vou levarDados da John's Hopkins University pois parecem ter dados mais precisos e rápidos até agora. Os dois valores mais importantes que temos são o número total de infectados e as pessoas actualmente infectadas. A partir destas duas métricas, vamos gerar tudo.

a foto mostra chats de pessoas totalmente infectadas e atualmente infectadas

Não parece muito - ainda - mas vamos encontrar algumas coisas simples para tirar de lá:

Preparação dos dados

A figura mostra uma tabela de excelência com alguns números

Primeiro de tudo, precisamos de algo com o qual possamos trabalhar facilmente. Para isso vou usar o Excel, porque é rápido e fácil. Programar algo com Python também poderia funcionar, mas para um projeto curto que pode ser muito trabalhoso.

Os dados que temos são inseridos em duas colunas, como mostrado acima. Cada fila representa um dia na pandemia. A pandemia começou na Suíça em 25 de Fevereiro.

Novas infecções diárias

Um valor que provavelmente será útil são as novas infecções. Não vou recolher estes dados na Universidade Johns Hopkins, mas vou extraí-los do total de infecções. Isto irá poupar tempo de cópia no futuro.

Só precisamos de subtrair o total de infecções do dia anterior das infecções do dia actual.

a imagem mostra novas infecções por dia e mediana 5d

O que podemos ver é um pequeno aumento das infecções nos últimos dias, mas mais sobre isso mais tarde.

Cicatrização total e duração média da infecção

A cura completa pode ser feita calculando o total de infecções menos as actualmente infectadas. Para fins de ilustração, eu contraste o gráfico com o total de infectados.

O gráfico mostra o total infectado e o total curado. Ambas as curvas parecem similares, exceto por um deslocamento horizontal.

Bem, isso pode não mostrar muito ainda, excepto que os nossos hospitais estão longe de estar cheios. Além disso, podemos ler o tempo de infecção a partir disto. Ao deslocar o total curado para a esquerda, devemos obter o tempo de infecção se eles se sobrepuserem. Para a Suíça são 16 dias, para a Alemanha são 15 dias. Isto parece estar dentro do intervalo de medição.

O gráfico mostra o número total de infectados e o número total de curados. Este tempo é deslocado pelo número de dias para que se sobreponham.

O tempo de infecção será mais tarde útil para o valor de R

Curado por dia

Captura da tela das estranhas descobertas

A partir do total curado, podemos gerar a cura diária. Semelhante às novas infecções diárias, subtraímos a cura total de ontem da cura total de hoje.

Foi aqui que recebi algumas perguntas sobre o método de recolha destes dados pela Universidade John Hopkins. Aparentemente, desde 16 de maio, os casos curados foram relatados em lotes de 100, o que me parece muito estranho:

Infelizmente, temos de assumir que os valores estão correctos, mas terei de usar o meio menos exacto em vez da mediana. Acho a mediana mais confiável, pois remove eficazmente os outliers. Mas como os nossos dados aqui consistem em outliers, temos de usar a média.

O gráfico mostra o número total de infectados e o número total de curados. Este tempo é deslocado pelo número de dias para que se sobreponham.

Além disso, agora podemos sobrepor os pacientes curados e infectados diariamente.

o gráfico mostra os pacientes curados diariamente versus os recém-infectados. os pacientes curados estão obviamente a ficar para trás dos infectados

O que podemos ver aqui claramente é que os pacientes recuperados eram consistentemente mais do que os recém-infectados a partir de ~1 de Abril. Isto significa basicamente que os hospitais tinham cada vez menos trabalho a partir daquele dia.

O místico valor R e o futuro

Para obter o valor R, é preciso conhecer primeiro a definição do valor R. A definição é a seguinte:

"Onúmero esperado de casos gerados directamente por um caso numa população em que todos os indivíduos sãovulnerável por infecção do vinho."

Como é que lá chegamos?

nós já temos a informação mais importante.

- Quanto tempo dura, em média, uma infecção? 16 dias

- Quantas pessoas infectadas existem actualmente?

- Quantas novas infecções existem por dia?

O valor R diário pode então ser calculado da seguinte forma:

(novas infecções * duração de uma infecção) / número actual de pessoas infectadas

Este é o resultado para a Suíça:

tabela do valor R

Além disso, criei a minha própria métrica para destacar se as coisas estão a piorar ou a melhorar. Mais verde do que ler significa que as coisas estão a melhorar. Mais vermelho do que verde significa que as coisas estão a piorar.

Quanto maior ou menor for o valor, mais intenso será o efeito.

o gráfico mostra uma métrica que eu pessoalmente achei mais útil do que o valor r

Uh oh - a segunda onda vai estar sobre nós!

mas lentamente, por agora. Vamos primeiro acessar essas duas métricas a partir da Alemanha também, com o valor R de Robert Koch Guesstimated R-Value como pano de fundo:

r valor Alemanha Desenvolvimento de infecções Alemanha

A Alemanha tem uma curva semelhante. O valor R em ascensão teve um pequeno galo. Além disso, o evento da infecção salta de um lado para o outro como uma loucura no final.

Porquê? Vamos olhar para os dados por volta de 15 de junho, pouco antes do pico:

Temos um total de 292 casos ativos e ~15 novos casos por dia na Suíça. Na verdade, o número é tão pequeno que um único ponto quente já vai derrubar drasticamente os valores. Um único pico curto não é, portanto, suficiente para prever que a segunda onda virá.

Como alguns podem suspeitar, um vírus não vem e depois desaparece para sempre. Por exemplo, casos de gripe suína foram recentemente detectados novamente.

Duvido que possamos erradicar completamente o vírus (o que estamos tentando fazer no momento). Em vez disso, vai evoluir para algo com que nós humanos teremos de viver. Haverá hotspots no futuro próximo.

No entanto, não espero ver uma segunda onda semelhante à primeira em breve. O que acontece no próximo ano, em Janeiro/Fevereiro, só o tempo o dirá.