Extracción de datos de los números Covid

Imagen del título de la historia

Hoy quiero profundizar un poco en los datos de Covid, porque veo que definitivamente hay una confusión.

La principal razón por la que comencé este proyecto fue para decir que las medidas de bloqueo estaban ligadas al "valor R" y los científicos de los medios públicos dijeron que el valor R sólo podía ser estimado, algo increíble para mí. Así que veamos qué podemos averiguar.

¿Qué datos tenemos a nuestra disposición en absoluto?

Voy a tomarLos datos de la Universidad John's Hopkins ya que parecen tener datos más precisos y rápidos hasta ahora. Los dos valores más importantes que tenemos son el número total de infectados y las personas actualmente infectadas. A partir de estas dos métricas generaremos todo.

la imagen muestra charlas de personas totalmente infectadas y actualmente infectadas

No parece mucho - todavía - pero vamos a encontrar algunas cosas sencillas para salir de allí:

Preparación de los datos

La imagen muestra una tabla de Excel con algunos números

En primer lugar, necesitamos algo con lo que podamos trabajar fácilmente. Para esto usaré Excel, porque es rápido y fácil. Programar algo con Python también podría funcionar, pero para un proyecto corto podría ser demasiado trabajo.

Los datos que tenemos se insertan en dos columnas como se muestra arriba. Cada fila representa un día de la pandemia. La pandemia comenzó en Suiza el 25 de febrero.

Nuevas infecciones diarias

Un valor que probablemente sea útil son las nuevas infecciones. No recogeré estos datos en la Universidad Johns Hopkins, sino que los extraeré de las infecciones totales. Esto ahorrará tiempo de copiado en el futuro.

Sólo tenemos que restar el total de las infecciones del día anterior de las del día actual.

la imagen muestra las nuevas infecciones por día y la mediana de 5d

Lo que podemos ver es un pequeño aumento de las infecciones en los últimos días, pero más adelante.

Curación total y duración media de la infección

La curación completa se puede tomar calculando el total de infecciones menos los infectados actualmente. A modo de ilustración, contrasto el gráfico con el total de infectados.

El gráfico muestra el total de infectados y el total de curados. Ambas curvas se ven similares excepto por un desplazamiento horizontal

Bueno, eso puede no mostrar mucho todavía, excepto que nuestros hospitales están lejos de estar llenos. Además, podemos leer el tiempo de infección a partir de esto. Desplazando el total curado hacia la izquierda, deberíamos obtener el tiempo de infección si se superponen. Para Suiza son 16 días, para Alemania 15 días. Esto parece estar dentro del rango de medición.

El gráfico muestra el número total de infectados y el número total de curados. Este tiempo se ha desplazado por el número de días de modo que se superponen

El tiempo de infección será útil más tarde para el valor R

Curado por día

Captura de pantalla de los extraños hallazgos

A partir del total curado, podemos generar el curado diario. Al igual que las nuevas infecciones diarias, restamos la curación total de ayer de la curación total de hoy.

Aquí es donde tengo algunos interrogantes sobre el método de recolección de estos datos por la Universidad John Hopkins. Aparentemente, desde el 16 de mayo, los casos curados se han reportado en lotes de 100, lo que me parece muy extraño:

Desafortunadamente, tenemos que asumir que los valores son correctos, pero tendré que usar la media menos precisa en lugar de la mediana. Encuentro que la mediana es más fiable ya que elimina eficazmente los valores atípicos. Pero como nuestros datos aquí son atípicos, tenemos que usar la media.

El gráfico muestra el número total de infectados y el número total de curados. Este tiempo se ha desplazado por el número de días de modo que se superponen

Además, ahora podemos superponer a los pacientes curados e infectados diariamente.

El gráfico muestra los pacientes curados diariamente frente a los recién infectados. Los pacientes curados están obviamente retrasados con respecto a los infectados.

Lo que podemos ver claramente aquí es que los pacientes recuperados fueron consistentemente más que los nuevos infectados a partir del 1 de abril. Esto significa básicamente que los hospitales tuvieron cada vez menos trabajo a partir de ese día.

El místico Valor-R y el futuro

Para obtener el valor R, uno debe conocer primero la definición del valor R. La definición es la siguiente:

"Elnúmero esperado de casos generados directamente por un caso en una población en la que todos los individuos sonvulnerable para la infección del vino".

¿Cómo llegamos allí?

ya tenemos la información más importante.

- ¿Cuánto tiempo dura una infección en promedio? 16 días

- ¿Cuántas personas infectadas hay actualmente?

- ¿Cuántas nuevas infecciones hay por día?

El valor R diario puede entonces ser calculado de la siguiente manera:

(nuevas infecciones * duración de una infección) / número actual de personas infectadas

Este es el resultado para Suiza:

tabla del valor R

Además, he creado mi propia métrica para destacar si las cosas están empeorando o mejorando. Más verde que leer significa que las cosas están mejorando. Más rojo que verde significa que las cosas están empeorando.

Cuanto más altos o bajos sean los valores, más intenso será el efecto.

el gráfico muestra una métrica que personalmente encontré más útil que el valor r

Uh oh - la segunda ola estará sobre nosotros!

pero lentamente por ahora. Accedamos primero a estas dos métricas de Alemania también, con el Valor-R Adivinado de Robert Koch en el fondo:

r valor Alemania desarrollo de infecciones Alemania

Alemania tiene una curva similar. El aumento del valor R sólo tuvo un pequeño bache. Además, el evento de la infección salta como una locura al final.

¿Por qué? Veamos los datos alrededor del 15 de junio, justo antes del pico:

Tenemos un total de 292 casos activos y ~15 nuevos casos por día en Suiza. De hecho, el número es tan pequeño que un solo punto caliente ya anulará drásticamente los valores. Por lo tanto, un solo pico corto no es suficiente para predecir que vendrá la segunda ola.

Como algunos podrían sospechar, un virus no viene y luego desaparece para siempre. Por ejemplo, recientemente se han vuelto a detectar casos de gripe porcina.

Dudo que podamos erradicar completamente el virus (lo que estamos intentando hacer actualmente). Más bien, se convertirá en algo con lo que los humanos tendremos que vivir. Habrá puntos calientes en un futuro próximo.

Sin embargo, no espero ver una nueva segunda ola similar a la primera en un futuro próximo. Lo que ocurra el próximo año en enero/febrero, sólo el tiempo lo dirá.