import matplotlib.pyplot as plt
from seaborn import boxplot
import seaborn as sns
import pandas as pd
import numpy as np 
import pycountry
import os

import warnings
warnings.filterwarnings("ignore")


ROOT_DIR = os.path.abspath("")
DATA_DIR = os.path.join(ROOT_DIR, "data")

data_vaccinations = os.path.join(DATA_DIR, "data_covid_vaccination.csv")
data_daily_report = os.path.join(DATA_DIR, "data_daily_number_of_reported_covid.csv")


df_vaccinations = pd.read_csv(data_vaccinations)
df_daily_report = pd.read_csv(data_daily_report)


df_vaccinations.head(100)


df_daily_report.head(10)


df_vaccinations.shape

(33993, 12)


df_daily_report.shape

(2280, 11)


df_vaccinations.describe()


df_daily_report.describe()


for key,value in df_vaccinations.dtypes.iteritems():
        print(f' {key} - {value}')

 YearWeekISO - object
 FirstDose - int64
 FirstDoseRefused - float64
 SecondDose - int64
 UnknownDose - int64
 NumberDosesReceived - float64
 Region - object
 Population - int64
 ReportingCountry - object
 TargetGroup - object
 Vaccine - object
 Denominator - float64


for key,value in df_daily_report.dtypes.iteritems():
        print(f' {key} - {value}')

 dateRep - object
 day - int64
 month - int64
 year - int64
 cases - int64
 deaths - int64
 countriesAndTerritories - object
 geoId - object
 countryterritoryCode - object
 popData2020 - int64
 continentExp - object


for key,value in df_daily_report.isnull().sum().iteritems():
    if value > 0:
        print(f' {key} - {value}')


fig, ax = plt.subplots(figsize=(15,5))
sns.heatmap(df_daily_report.isnull(), cbar=False, vmin=0, vmax=0.7, cmap="YlGnBu", ax=ax)

<AxesSubplot:>


for key,value in df_vaccinations.isnull().sum().iteritems():
    if value > 0:
        print(f' {key} - {value}')

 FirstDoseRefused - 16267
 NumberDosesReceived - 26071
 Denominator - 7668


fig, ax = plt.subplots(figsize=(15,5))
sns.heatmap(df_vaccinations.isnull(), cbar=False, vmin=0, vmax=0.7, cmap="YlGnBu", ax=ax)

<AxesSubplot:>


def findCountry (codeISO):
    try:
        return pycountry.countries.get(alpha_2=codeISO).name
    except:
        return ("Other")


df_vaccinations['Country_name'] = df_vaccinations.apply(lambda row: findCountry(row.ReportingCountry) , axis = 1)


plt.figure(figsize=(15,7))
g = sns.barplot(x="YearWeekISO", y="NumberDosesReceived", ci=None ,data=df_vaccinations)
g.set_xticklabels(g.get_xticklabels(), 
                          rotation=90, 
                          horizontalalignment='right')
plt.title("Número de vacunados por semanas")

Text(0.5, 1.0, 'Número de vacunados por semanas')


plt.figure(figsize=(15,7))
sns.barplot(x="ReportingCountry", y="SecondDose", ci=None, data=df_vaccinations)
plt.title("Número de vacunados de la segunda dosis por país")

Text(0.5, 1.0, 'Número de vacunados de la segunda dosis por país')


plt.figure(figsize=(15,7))
sns.barplot(x="ReportingCountry", y="NumberDosesReceived",ci=None, data=df_vaccinations)
plt.title("Número de dosis recibidas por país")

Text(0.5, 1.0, 'Número de dosis recibidas por país')


df_vaccinations.Vaccine.unique()

array(['MOD', 'COM', 'JANSS', 'AZ', 'UNK', 'SPU', 'BECNBG'], dtype=object)


plt.figure(figsize=(15,7))
sns.barplot(x="Vaccine", y="NumberDosesReceived", ci=None, data=df_vaccinations)
plt.title("Número de dosis recibidas por tipo de vacunas")

Text(0.5, 1.0, 'Número de dosis recibidas por tipo de vacunas')


plt.figure(figsize=(15,7))
sns.barplot(x="TargetGroup", y="NumberDosesReceived", ci=None, data=df_vaccinations)
plt.title("Número de dosis recibidas por rango de edad")

Text(0.5, 1.0, 'Número de dosis recibidas por rango de edad')


print(df_daily_report.continentExp.unique())
print(df_daily_report.year.unique())

['Europe']
[2021]


plt.figure(figsize=(15,7))
sns.barplot(x="countryterritoryCode", y="cases", ci=None, data=df_daily_report)
plt.title("Casos de COVID reportados por país")

Text(0.5, 1.0, 'Casos de COVID reportados por país')


plt.figure(figsize=(15,7))
sns.barplot(x="countryterritoryCode", y="deaths", ci=None, data=df_daily_report)
plt.title("Muertes de COVID reportados por país")

Text(0.5, 1.0, 'Muertes de COVID reportados por país')


plt.figure(figsize=(15,7))
sns.barplot(x="month", y="cases", ci=None, data=df_daily_report)
plt.title("Casos de COVID reportados por mes")

Text(0.5, 1.0, 'Casos de COVID reportados por mes')


plt.figure(figsize=(15,7))
sns.barplot(x="month", y="deaths", ci=None, data=df_daily_report)
plt.title("Muertes de COVID reportados por mes")

Text(0.5, 1.0, 'Muertes de COVID reportados por mes')


df_vaccinations.to_csv(DATA_DIR+'vacunas_edit.csv')

	YearWeekISO	FirstDose	FirstDoseRefused	SecondDose	UnknownDose	NumberDosesReceived	Region	Population	ReportingCountry	TargetGroup	Vaccine	Denominator
0	2020-W53	0	0.0	0	0	0.0	AT	8901064	AT	1_Age60+	MOD	2259262.0
1	2020-W53	2659	0.0	0	0	61425.0	AT	8901064	AT	1_Age60+	COM	2259262.0
2	2020-W53	0	0.0	0	0	0.0	AT	8901064	AT	1_Age60+	JANSS	2259262.0
3	2020-W53	0	0.0	0	0	0.0	AT	8901064	AT	1_Age60+	AZ	2259262.0
4	2020-W53	0	0.0	0	0	0.0	AT	8901064	AT	1_Age<60	MOD	5099181.0
...	...	...	...	...	...	...	...	...	...	...	...	...
95	2021-W02	0	0.0	0	0	0.0	AT	8901064	AT	Age50_59	AZ	1396889.0
96	2021-W02	5	0.0	0	0	0.0	AT	8901064	AT	Age60_69	MOD	1016016.0
97	2021-W02	0	0.0	0	0	0.0	AT	8901064	AT	Age60_69	JANSS	1016016.0
98	2021-W02	8804	0.0	40	0	61425.0	AT	8901064	AT	Age60_69	COM	1016016.0
99	2021-W02	0	0.0	0	0	0.0	AT	8901064	AT	Age60_69	AZ	1016016.0

	dateRep	day	month	year	cases	deaths	countriesAndTerritories	geoId	countryterritoryCode	popData2020	continentExp
0	15/05/2021	15	5	2021	721	14	Austria	AT	AUT	8901064	Europe
1	14/05/2021	14	5	2021	1100	11	Austria	AT	AUT	8901064	Europe
2	13/05/2021	13	5	2021	1179	14	Austria	AT	AUT	8901064	Europe
3	12/05/2021	12	5	2021	968	19	Austria	AT	AUT	8901064	Europe
4	11/05/2021	11	5	2021	670	16	Austria	AT	AUT	8901064	Europe
5	10/05/2021	10	5	2021	1009	11	Austria	AT	AUT	8901064	Europe
6	09/05/2021	9	5	2021	1251	14	Austria	AT	AUT	8901064	Europe
7	08/05/2021	8	5	2021	1383	23	Austria	AT	AUT	8901064	Europe
8	07/05/2021	7	5	2021	1220	8	Austria	AT	AUT	8901064	Europe
9	06/05/2021	6	5	2021	1682	26	Austria	AT	AUT	8901064	Europe

	FirstDose	FirstDoseRefused	SecondDose	UnknownDose	NumberDosesReceived	Population	Denominator
count	3.399300e+04	17726.000000	3.399300e+04	33993.000000	7.922000e+03	3.399300e+04	2.632500e+04
mean	9.970950e+03	3.032438	4.090276e+03	125.554349	3.905829e+04	2.719751e+07	1.992831e+06
std	5.506290e+04	41.881449	2.680053e+04	4977.676721	1.655509e+05	2.139818e+07	6.073288e+06
min	0.000000e+00	0.000000	0.000000e+00	0.000000	0.000000e+00	3.874700e+04	0.000000e+00
25%	0.000000e+00	0.000000	0.000000e+00	0.000000	0.000000e+00	5.525292e+06	1.426160e+05
50%	1.940000e+02	0.000000	1.000000e+00	0.000000	0.000000e+00	3.795814e+07	4.110030e+05
75%	3.294000e+03	0.000000	5.010000e+02	0.000000	7.200000e+03	3.795814e+07	1.339737e+06
max	3.353980e+06	1570.000000	1.006088e+06	427807.000000	5.231070e+06	8.316671e+07	6.948881e+07

	day	month	year	cases	deaths	popData2020
count	2280.000000	2280.000000	2280.0	2.280000e+03	2280.000000	2.280000e+03
mean	14.229386	3.788158	2021.0	1.398081e+04	312.013158	1.510301e+07
std	8.693631	0.749632	0.0	1.433877e+05	3690.788200	2.121913e+07
min	1.000000	2.000000	2021.0	-2.001000e+03	-5.000000	3.874700e+04
25%	7.000000	3.000000	2021.0	4.010000e+02	2.000000	2.095861e+06
50%	13.000000	4.000000	2021.0	1.132000e+03	17.000000	6.387122e+06
75%	22.000000	4.000000	2021.0	4.962500e+03	94.000000	1.152244e+07
max	31.000000	5.000000	2021.0	3.755968e+06	97699.000000	8.316671e+07

Campo	Descripción	Tipo
dateRep	- Fecha que se ha reportado el caso “dd/mm/yyyy”	string
day	- Día del caso reportado	unit8
month	- Mes del caso reportado	unit8
year	- Año del caso reportado	unit8
cases	- Número de nuevos casos reportados	int64
deaths	- Número de casos de muertes reportados	int64
countriesAndterritories	- Nombre de los paísdes o territorio	string
geoId	- Código de geolocalización de dos carácteres	string
countriesAndterritoryCode	- Código ISO	string
popData2020	- Datos Eurostat 2020	int64
continentExp	- Nombre del continente reportado	string

PEC 3: Visualización interactiva¶

1. Descripción de los datos seleccionados¶

2. Los datos¶

Descripción de variables¶

2.1 Exploración¶

Campo	Descripción	Tipo
YearWeekISO	- Fecha que se ha administrado la vacuna	string
FirstDose	- Número de la primera dosis de vacuna administrada durante la semana reportada	int64
FirstDoseRefused	- Número de personas que rechazan la primera dosis de la vacuna.	float64
SecondDose	- Número de vacunas de segunda dosis administradas a individuos durante la semana del informe	int64
UnknownDose	- Número de dosis administradas durante la semana del informe en las que no se especificó el tipo de dosis	int64
NumberDosesReceived	- Número de dosis de vacunas distribuidas por los fabricantes en el país durante la semana del informe	float64
Region	- Como mínimo, los datos se comunican a nivel nacional (Región = código de país).	string
Population	- Población por edades del país	int64
ReportingCountry	- ISO 3166-1-alpha-2	string
TargetGroup	- Grupo objetivo de la vacunación	object
Vaccine	- Nombre de la vacuna. Se añadirán vacunas adicionales cuando se apruebe o se solicite	object
Denominator	- Denominadores de la población para los grupos objetivo	float64