Eksploracja danych dotyczących numerów Covid

Tytułowy obrazek historyczny

Dzisiaj chcę się trochę zagłębić w dane Covida, bo widzę, że na pewno jest jakieś zamieszanie.

Głównym powodem, dla którego rozpocząłem ten projekt, było stwierdzenie, że środki blokujące były związane z "wartością R", a naukowcy w mediach publicznych powiedzieli, że wartość R można tylko oszacować - niewiarygodne dla mnie. Zobaczmy więc, czego możemy się dowiedzieć.

Jakie dane mamy w ogóle do dyspozycji?

Zamierzam wziąćDane z Uniwersytetu John'a Hopkins'a ponieważ jak dotąd wydają się mieć dokładniejsze i szybsze dane. Dwie najważniejsze wartości, jakie posiadamy, to całkowita liczba osób zakażonych i osób obecnie zakażonych. Z tych dwóch metryk wygenerujemy wszystko.

obrazek przedstawia czaty całkowicie zainfekowanych i obecnie zainfekowanych osób

Nie wygląda to jeszcze na wiele, ale znajdźmy kilka prostych rzeczy do wyciągnięcia:

Przygotowanie danych

Zdjęcie przedstawia tabelę excel z kilkoma numerami

Po pierwsze, potrzebujemy czegoś, z czym będziemy mogli łatwo pracować. Do tego użyję Excela, bo jest szybki i łatwy. Programowanie czegoś z Pythonem również mogłoby się udać, ale dla krótkiego projektu, który może być zbyt dużym nakładem pracy.

Dane, które posiadamy są umieszczone w dwóch kolumnach, jak pokazano powyżej. Każdy rząd reprezentuje dzień w pandemii. Pandemia rozpoczęła się w Szwajcarii 25 lutego.

Codziennie nowe infekcje

Jedną z wartości, która może być użyteczna, są nowe infekcje. Nie będę zbierał tych danych na Uniwersytecie Johnsa Hopkinsa, ale wydobędę je z całkowitych infekcji. Pozwoli to zaoszczędzić czas na kopiowanie w przyszłości.

Musimy tylko odjąć łączną liczbę infekcji z dnia poprzedniego od liczby infekcji z dnia bieżącego.

Obraz przedstawia nowe infekcje na dzień i medianę 5d

To, co widzimy, to niewielki wzrost infekcji w ciągu ostatnich kilku dni, ale więcej na ten temat później.

Całkowite wyleczenia i średni czas trwania zakażenia

Pełne wyleczenie można wykonać poprzez obliczenie całkowitej liczby infekcji minus aktualnie zainfekowana. Dla ilustracji, kontrastuję wykres z całkowitą liczbą zainfekowanych.

Wykres przedstawia całkowitą liczbę zakażonych i całkowitą liczbę wyleczonych. Obie krzywe wyglądają podobnie, z wyjątkiem odchylenia poziomego

Cóż, może to jeszcze nie dowodzi tak wiele, poza tym, że nasze szpitale są dalekie od zapełnienia. Dodatkowo, możemy z tego odczytać czas infekcji. Przesuwając wyleczoną całość w lewo, powinniśmy uzyskać czas infekcji, jeśli nachodzą na siebie. Dla Szwajcarii jest to 16 dni, dla Niemiec 15 dni. Wygląda na to, że jest to w zakresie pomiaru.

Wykres przedstawia całkowitą liczbę zakażonych i całkowitą liczbę wyleczonych. Czas ten został przesunięty o liczbę dni, tak że nakładają się one na siebie

Czas zakażenia okaże się później przydatny dla wartości R

Wyleczony na dzień

Zrzut ekranowy dziwnych odkryć

Z całkowitego wyleczenia, możemy wygenerować dzienne wyleczenie. Podobnie jak w przypadku codziennych nowych infekcji, odejmujemy wczorajsze całkowite uzdrowienie od dzisiejszego całkowitego uzdrowienia.

Tutaj mam kilka znaków zapytania co do sposobu zbierania tych danych przez Uniwersytet Johna Hopkinsa. Podobno od 16 maja wyleczone przypadki są zgłaszane w partiach po 100, co wydaje mi się bardzo dziwne:

Niestety, musimy założyć, że wartości są prawidłowe, ale będę musiał użyć mniej dokładnego środka zamiast mediany. Uważam, że mediana jest bardziej wiarygodna, ponieważ skutecznie usuwa obrzeża. Ale ponieważ nasze dane składają się tu z wartości odstających, musimy użyć tego środka.

Wykres przedstawia całkowitą liczbę zakażonych i całkowitą liczbę wyleczonych. Czas ten został przesunięty o liczbę dni, tak że nakładają się one na siebie

Ponadto, możemy teraz nakładać na siebie codziennie leczonych i codziennie zakażonych pacjentów.

Wykres pokazuje, że pacjenci wyleczeni są codziennie leczeni w porównaniu z nowo zarażonymi. pacjenci wyleczeni pozostają oczywiście w tyle za zarażonymi

To, co możemy wyraźnie zobaczyć tutaj jest to, że odzyskane pacjentów były konsekwentnie więcej niż nowo zakażonych od ~ 1 kwietnia. Zasadniczo oznacza to, że od tego dnia szpitale miały coraz mniej pracy.

Mistyczna wartość R i przyszłość

Aby uzyskać wartość R, należy najpierw znać definicję wartości R. Definicja jest następująca:

"Thespodziewana liczba przypadków generowanych bezpośrednio przez przypadek w populacji, w której wszystkie osoby sąBezbronny na zakażenie winem."

Jak się tam dostaniemy?

mamy już najważniejsze informacje.

- Jak długo trwa średnio infekcja? 16 dni

- Ile osób jest obecnie zarażonych?

- Ile jest nowych infekcji w ciągu dnia?

Dzienna wartość R może być następnie obliczona w następujący sposób:

(nowe zakażenia * czas trwania zakażenia) / aktualna liczba zakażonych osób

To jest wynik dla Szwajcarii:

wykres wartości R

Dodatkowo stworzyłem własną metrykę, aby podkreślić, czy sprawy mają się coraz gorzej czy lepiej. Bardziej zielony niż czytany oznacza, że sprawy mają się lepiej. Więcej czerwieni niż zieleni oznacza, że jest coraz gorzej.

Im wyższe lub niższe wartości, tym bardziej intensywny efekt.

wykres pokazuje metrykę, którą ja osobiście uznałem za bardziej użyteczną niż wartość r

Uh oh - druga fala będzie na nas!

ale na razie powoli. Najpierw przyjrzyjmy się tym dwóm metrykom z Niemiec, a w tle Guesstimated R-Value Roberta Kocha:

Wartość r Niemcy Rozwój infekcji Niemcy

Niemcy mają podobną krzywą. Wzrastająca wartość R miała tylko małe uderzenie. Poza tym infekcja skacze jak szalona na końcu.

Dlaczego tak jest? Spójrzmy na dane około 15 czerwca, tuż przed szczytem:

Mamy w sumie 292 aktywne sprawy i ~15 nowych spraw dziennie w Szwajcarii. W rzeczywistości liczba ta jest tak mała, że pojedynczy hotspot już teraz drastycznie przewróci te wartości. Pojedynczy krótki skok nie wystarczy więc do przewidzenia, że nadejdzie druga fala.

Jak niektórzy mogą podejrzewać, wirus nie przychodzi, a potem znika na zawsze. Na przykład, ostatnio ponownie wykryto przypadki świńskiej grypy.

Wątpię, czy jesteśmy w stanie całkowicie wyeliminować wirusa (co obecnie próbujemy zrobić). Raczej przekształci się w coś, z czym my ludzie będziemy musieli żyć. W najbliższej przyszłości pojawią się hotspoty.

Nie spodziewam się jednak, by wkrótce pojawiła się nowa 2. fala podobna do tej pierwszej. Co się stanie w przyszłym roku na przełomie stycznia i lutego, tylko czas pokaże.