Estrazione dei dati dei numeri Covid

Immagine del titolo della storia

Oggi voglio approfondire un po' i dati di Covid, perché vedo che c'è sicuramente un po' di confusione.

Il motivo principale per cui ho iniziato questo progetto è stato quello di dire che le misure di blocco erano legate al "valore R" e gli scienziati dei media pubblici hanno detto che il valore R poteva solo essere stimato - incredibile per me. Vediamo cosa riusciamo a scoprire.

Quali dati abbiamo a disposizione?

PrenderòDati della John's Hopkins University in quanto sembrano avere dati più precisi e veloci finora. I due valori più importanti che abbiamo sono il numero totale di infetti e le persone attualmente infette. Da queste due metriche genereremo tutto.

la foto mostra le chat di persone totalmente infette e attualmente infette

Non sembra molto - ancora - ma troviamo alcune semplici cose da tirare fuori da lì:

Preparazione dei dati

L'immagine mostra la tabella excel con alcuni numeri

Prima di tutto, abbiamo bisogno di qualcosa con cui possiamo lavorare facilmente. Per questo userò Excel, perché è facile e veloce. Anche programmare qualcosa con Python potrebbe funzionare, ma per un progetto breve che potrebbe essere troppo impegnativo.

I dati che abbiamo sono inseriti in due colonne come mostrato sopra. Ogni riga rappresenta un giorno della pandemia. La pandemia è iniziata in Svizzera il 25 febbraio.

Ogni giorno nuove infezioni

Un valore che può essere utile è quello delle nuove infezioni. Non raccoglierò questi dati alla Johns Hopkins University, ma li estrarrò dal totale delle infezioni. In questo modo si risparmierà tempo per la copia in futuro.

Dobbiamo solo sottrarre il totale delle infezioni del giorno precedente da quelle del giorno corrente.

l'immagine mostra le nuove infezioni al giorno e la mediana 5d

Quello che possiamo vedere è un piccolo aumento delle infezioni negli ultimi giorni, ma di più in seguito.

Guarigioni totali e durata media dell'infezione

La guarigione completa può essere presa calcolando il totale delle infezioni meno le infezioni attualmente infette. A scopo illustrativo, contrappongo il grafico con il totale infetto.

Il grafico mostra il totale infetto e il totale guarito. Entrambe le curve sembrano simili, tranne che per un offset orizzontale

Beh, questo potrebbe non mostrare ancora molto, se non che i nostri ospedali sono tutt'altro che pieni. Inoltre, possiamo leggere il tempo di infezione da questo. Spostando il totale guarito a sinistra, dovremmo ottenere il tempo di infezione se si sovrappongono. Per la Svizzera si tratta di 16 giorni, per la Germania di 15 giorni. Questo sembra rientrare nel campo di misura.

Il grafico mostra il numero totale dei contagiati e il numero totale dei guariti. Questa volta spostata dal numero di giorni in modo che si sovrappongano

Il tempo di infezione si rivelerà in seguito utile per il valore R

Guarito al giorno

Schermata delle strane scoperte

Dal totale guarito, possiamo generare la guarigione quotidiana. Come per le nuove infezioni quotidiane, sottraiamo la guarigione totale di ieri alla guarigione totale di oggi.

È qui che ho ottenuto alcuni punti interrogativi sul metodo di raccolta di questi dati da parte della John Hopkins University. A quanto pare, dal 16 maggio, i casi curati sono stati segnalati in lotti di 100, il che mi sembra molto strano:

Purtroppo dobbiamo presumere che i valori siano corretti, ma dovrò usare la media meno accurata invece della mediana. Trovo che la mediana sia più affidabile in quanto rimuove efficacemente i valori anomali. Ma poiché i nostri dati qui sono costituiti da valori erratici, dobbiamo usare il mezzo.

Il grafico mostra il numero totale dei contagiati e il numero totale dei guariti. Questa volta spostata dal numero di giorni in modo che si sovrappongano

Inoltre, ora possiamo sovrapporre i pazienti curati e infettati quotidianamente.

il grafico mostra i pazienti guariti quotidianamente rispetto ai nuovi infetti. i pazienti guariti sono ovviamente in ritardo rispetto a quelli infetti

Ciò che possiamo chiaramente vedere qui è che i pazienti guariti erano costantemente più numerosi dei nuovi infetti a partire dal 1° aprile. Questo significa fondamentalmente che da quel giorno in poi gli ospedali hanno avuto sempre meno lavoro.

Il mistico R-Valore e il futuro

Per ottenere il valore R, bisogna prima conoscere la definizione del valore R. La definizione è la seguente:

"Ilnumero previsto di casi generati direttamente da un caso in una popolazione in cui tutti gli individui sonovulnerabile per l'infezione del vino".

come ci arriviamo?

abbiamo già le informazioni più importanti.

- Quanto dura in media un'infezione? 16 giorni

- Quante persone infette ci sono attualmente?

- Quante nuove infezioni ci sono al giorno?

Il valore R giornaliero può quindi essere calcolato come segue:

(nuove infezioni * durata di un'infezione) / numero attuale di persone infette

Questo è il risultato per la Svizzera:

grafico del valore R

Inoltre, ho creato la mia metrica personale per evidenziare se le cose stanno peggiorando o migliorando. Più verde che letto significa che le cose stanno migliorando. Più rosso che verde significa che le cose stanno peggiorando.

Più alti o bassi sono i valori, più intenso è l'effetto.

il grafico mostra una metrica che personalmente ho trovato più utile del valore r

Uh oh - la seconda ondata sarà su di noi!

ma lentamente, per ora. Accediamo prima di tutto a queste due metriche anche dalla Germania, con il Guesstimated R-Value di Robert Koch in sottofondo:

r valore Germania sviluppo delle infezioni Germania

La Germania ha una curva simile. Il valore R in aumento ha avuto solo un piccolo intoppo. Inoltre, l'evento dell'infezione salta come un matto alla fine.

Perché? Guardiamo i dati intorno al 15 giugno, poco prima del picco:

In Svizzera abbiamo un totale di 292 casi attivi e circa 15 nuovi casi al giorno. In realtà, il numero è così piccolo che un singolo punto caldo capovolgerà già drasticamente i valori. Un singolo picco corto non è quindi sufficiente per prevedere l'arrivo della seconda ondata.

Come alcuni potrebbero sospettare, un virus non arriva e poi scompare per sempre. Ad esempio, recentemente sono stati rilevati di nuovo casi di influenza suina.

Dubito che possiamo sradicare completamente il virus (cosa che stiamo cercando di fare). Piuttosto, si evolverà in qualcosa con cui noi umani dovremo convivere. Ci saranno dei punti caldi nel prossimo futuro.

Tuttavia, non mi aspetto di vedere una nuova seconda ondata simile alla prima a breve. Quello che succederà l'anno prossimo a gennaio/febbraio, solo il tempo lo dirà.