refactoring

This commit is contained in:
frankknoll
2022-01-28 16:43:05 +01:00
parent f445a8b486
commit 906ec737ec
2 changed files with 122 additions and 760 deletions

View File

@@ -1,7 +1,14 @@
jupyter notebook
FK-TODO:
- Prüfe, ob die VAERS_ID wirklich eindeutig ist.
- "I would suggest that you filter the vax table first for just C19 vaccines, and for just first dose.
Then carry out the analysis as before.
Repeat for second dose and third dose separately. The cumulative effect will then appear.
It should be analysed separately anyway, because adverse reactions increase with each dose."
# 1. filter the vax table first for just C19 vaccines
# 2. and for just n-tn (n \in {1, 2, 3}) dose => VAERSDATA --> VAERSVAX ist 1:1-Beziehung statt 1:n und kann einfacher in eine einzige Tabelle gemergt werden
# 3. filter for manufacturer
- Prüfe, ob die VAERS_ID wirklich eindeutig ist. Antwort: VAERS_ID ist in der VAERSVAX-Tabelle nicht eindeutig, da es mehrere Impfungen pro Person geben kann.
- VAX_LOT-Spalte normalisieren, d.h. mindestens toUpperCase() darauf anwenden
- Format des jeweiligen Herstellers berücksichtigen und "verschmutzte" Einträge säubern, denn sie stellen alle dieselbe Charge dar:
039k20a