Files
HowBadIsMyBatch/help.txt
frankknoll f0f089fcea formating
2022-02-04 09:52:01 +01:00

36 lines
893 B
Plaintext

jupyter notebook
get VAERS data:
- download data (e.g. 2022VAERSData.zip) from https://vaers.hhs.gov/data/datasets.html and save and unzip in VAERS folder
FK-TODO:
- https://www.howbadismybatch.com/firstsecond.html nachprogrammieren
- VAX_LOT-Spalte normalisieren, d.h. mindestens toUpperCase() darauf anwenden
- handle VAX_DOSE_SERIES = 'UNK' or 'N/A' like '1'?
- Format des jeweiligen Herstellers berücksichtigen und "verschmutzte" Einträge säubern, denn sie stellen alle dieselbe Charge dar:
039k20a
MOD039K20A
#039K20A
039K20A-MODERNA
039K20A-2A (vielleicht nicht)
039K20A or 039L
Moderna/039K20A
MODERNA 039K20A
MODERNA039K20A
Modena 039k20A
L039K20A
M039K20A
MOD; 039K20A
m0039k20A
u039k20a
6/21 039K20A
2039K20A
013L20A 039K20A#039K20A
#039K
039K20A 12-31-
039K20A & 031M2
039K20A and 032
039K20A, 011L20
df[df.index.duplicated(False)].to_excel('results/pfizer_duplicates.xlsx')