import plotly.express as px
import pandas as pd
import seaborn as sns
from datetime import timedelta, date, datetime


df = pd.read_pickle("data/datos_covid_ene19.pkl")
df


df.CLASIFICACION_FINAL.unique()

array(['CASO SOSPECHOSO', 'CASO DE SARS-COV-2  CONFIRMADO',
       'NO REALIZADO POR LABORATORIO', 'NEGATIVO A SARS-COV-2',
       'CASO DE COVID-19 CONFIRMADO POR ASOCIACIÓN CLÍNICA EPIDEMIOLÓGICA',
       'INVÁLIDO POR LABORATORIO',
       'CASO DE COVID-19 CONFIRMADO POR COMITÉ DE  DICTAMINACIÓN'],
      dtype=object)


valores_confirmados = ['CASO DE COVID-19 CONFIRMADO POR ASOCIACIÓN CLÍNICA EPIDEMIOLÓGICA',
                       'CASO DE COVID-19 CONFIRMADO POR COMITÉ DE  DICTAMINACIÓN',
                       'CASO DE SARS-COV-2  CONFIRMADO']
confirmados = df.loc[df['CLASIFICACION_FINAL'].isin(valores_confirmados)]
confirmados.head()


confirmados = confirmados.set_index('FECHA_SINTOMAS')
confirmados.index

DatetimeIndex(['2020-09-23', '2020-12-18', '2020-04-20', '2020-10-06',
               '2020-09-03', '2020-10-16', '2020-12-22', '2020-03-03',
               '2020-03-03', '2020-03-03',
               ...
               '2021-09-07', '2021-09-02', '2021-09-21', '2021-09-28',
               '2021-10-06', '2021-10-01', '2021-10-02', '2021-10-03',
               '2021-10-03', '2021-10-03'],
              dtype='datetime64[ns]', name='FECHA_SINTOMAS', length=1109842, freq=None)


confirmados_diarios = (confirmados
                       .groupby(pd.Grouper(freq='D'))[['ID_REGISTRO']] # grupos por dia y seleccionamos 'ID_REGISTRO'
                       .size() # Calculamos el tamaño de cada grupo
                       .reset_index() # Convertimos el resultado (que es una serie) en DataFrame
                       .rename({0:'Confirmados'}, axis=1) # Le damos nombre a la columna que obtenemos
                       )
confirmados_diarios


fig = px.line(confirmados_diarios, x='FECHA_SINTOMAS', y="Confirmados")
fig.show()


confirmados_diarios['Media Móvil'] = confirmados_diarios.rolling(window=7).mean()
confirmados_diarios.head(10)


fig = px.line(confirmados_diarios, x='FECHA_SINTOMAS', y='Media Móvil')
fig.show()


 confirmados_diarios = confirmados_diarios.melt(id_vars=['FECHA_SINTOMAS'], value_vars=['Confirmados', 'Media Móvil'])
 confirmados_diarios


fig = px.line(confirmados_diarios, x='FECHA_SINTOMAS', y='value', color='variable')
fig.show()


defunciones = confirmados.loc[confirmados['FECHA_DEF'].notnull()] # Seleccionamos los casos con fecha de defunción
defunciones = defunciones.set_index('FECHA_DEF') # indexamos por fecha de defuncióón
defunciones_diarios = (defunciones
                       .groupby(pd.Grouper(freq='D'))[['ID_REGISTRO']] # grupos por dia y seleccionamos 'ID_REGISTRO'
                       .size() # Calculamos el tamaño de cada grupo
                       .reset_index() # Convertimos el resultado (que es una serie) en DataFrame
                       .rename({0:'Defunciones'}, axis=1) # Le damos nombre a la columna que obtenemos
                       )
defunciones_diarios['Media Móvil'] = defunciones_diarios.rolling(window=7).mean()
defunciones_diarios = defunciones_diarios.melt(id_vars=['FECHA_DEF'], value_vars=['Defunciones', 'Media Móvil'])
fig = px.line(defunciones_diarios, x='FECHA_DEF', y='value', color='variable')
fig.show()


defunciones_diarios['Tipo'] = 'Defunciones'
defunciones_diarios.loc[defunciones_diarios['variable'] == 'Defunciones', 'variable'] = 'Conteo'
defunciones_diarios = defunciones_diarios.rename({'FECHA_DEF': 'Fecha'}, axis=1)
confirmados_diarios['Tipo'] = 'Casos Confirmados'
confirmados_diarios.loc[confirmados_diarios['variable'] == 'Confirmados', 'variable'] = 'Conteo'
confirmados_diarios = confirmados_diarios.rename({'FECHA_SINTOMAS': 'Fecha'}, axis=1)
casos_defunciones = defunciones_diarios.append(confirmados_diarios)
casos_defunciones


fig = px.line(casos_defunciones, x='Fecha', y='value', color='variable', facet_col='Tipo', facet_col_wrap=1)
fig.update_yaxes(matches=None)
fig.show()


confirmados.TIPO_PACIENTE.unique()

array(['AMBULATORIO', 'HOSPITALIZADO'], dtype=object)


hospitalizados = confirmados[confirmados.TIPO_PACIENTE == 'HOSPITALIZADO']
hospitalizados_diarios = (hospitalizados
                          .groupby(pd.Grouper(freq='D'))[['ID_REGISTRO']] # grupos por dia y seleccionamos 'ID_REGISTRO'
                          .size() # Calculamos el tamaño de cada grupo
                          .reset_index() # Convertimos el resultado (que es una serie) en DataFrame
                          .rename({0:'Hospitalizaciones'}, axis=1) # Le damos nombre a la columna que obtenemos
                        )
hospitalizados_diarios['Media Móvil'] = hospitalizados_diarios.rolling(window=7).mean()
hospitalizados_diarios = hospitalizados_diarios.melt(id_vars=['FECHA_SINTOMAS'], value_vars=['Hospitalizaciones', 'Media Móvil'])
fig = px.line(hospitalizados_diarios, x='FECHA_SINTOMAS', y='value', color='variable')
fig.show()


hospitalizados_diarios['Tipo'] = 'Hospitalizaciones'
hospitalizados_diarios.loc[hospitalizados_diarios['variable'] == 'Hospitalizaciones', 'variable'] = 'Conteo'
hospitalizados_diarios = hospitalizados_diarios.rename({'FECHA_SINTOMAS': 'Fecha'}, axis=1)
casos_defunciones_hospitalizaciones = casos_defunciones.append(hospitalizados_diarios)
casos_defunciones_hospitalizaciones


fig = px.line(casos_defunciones_hospitalizaciones, x='Fecha', y='value', color='variable', facet_col='Tipo', facet_col_wrap=1)
fig.update_yaxes(matches=None)
fig.show()

	FECHA_ACTUALIZACION	ID_REGISTRO	ORIGEN	SECTOR	ENTIDAD_UM	SEXO	ENTIDAD_NAC	ENTIDAD_RES	MUNICIPIO_RES	TIPO_PACIENTE	...	TOMA_MUESTRA_ANTIGENO_BIN	MIGRANTE_BIN	UCI_BIN	DEFUNCION	AÑO_INGRESO	MES_INGRESO	DIA_SEMANA_INGRESO	SEMANA_AÑO_INGRESO	DIA_MES_INGRESO	DIA_AÑO_INGRESO
FECHA_INGRESO
2020-07-06	2022-01-18	z12d63	2	12	CIUDAD DE MÉXICO	2	CIUDAD DE MÉXICO	CIUDAD DE MÉXICO	VENUSTIANO CARRANZA	AMBULATORIO	...	0	0	0	0	2020	7	0	28	6	188
2020-09-23	2022-01-18	z13788	1	12	CIUDAD DE MÉXICO	1	CIUDAD DE MÉXICO	CIUDAD DE MÉXICO	CUAJIMALPA DE MORELOS	AMBULATORIO	...	0	0	0	0	2020	9	2	39	23	267
2020-06-15	2022-01-18	z2b144	2	12	CIUDAD DE MÉXICO	1	MÉXICO	CIUDAD DE MÉXICO	AZCAPOTZALCO	AMBULATORIO	...	0	0	0	0	2020	6	0	25	15	167
2020-12-21	2022-01-18	z526b3	2	12	CIUDAD DE MÉXICO	1	CIUDAD DE MÉXICO	CIUDAD DE MÉXICO	TLALPAN	AMBULATORIO	...	1	0	0	0	2020	12	0	52	21	356
2020-04-22	2022-01-18	z3d1e2	2	12	CIUDAD DE MÉXICO	1	CIUDAD DE MÉXICO	CIUDAD DE MÉXICO	GUSTAVO A. MADERO	AMBULATORIO	...	0	0	0	0	2020	4	2	17	22	113
...	...	...	...	...	...	...	...	...	...	...	...	...	...	...	...	...	...	...	...	...	...
2021-10-11	2022-01-18	m00073e	2	12	MÉXICO	2	NO ESPECIFICADO	CIUDAD DE MÉXICO	CUAUHTÉMOC	AMBULATORIO	...	1	0	0	0	2021	10	0	41	11	284
2021-10-13	2022-01-18	m030623	2	12	MÉXICO	2	MÉXICO	CIUDAD DE MÉXICO	TLÁHUAC	AMBULATORIO	...	1	0	0	0	2021	10	2	41	13	286
2021-10-13	2022-01-18	m049633	2	12	MÉXICO	1	CIUDAD DE MÉXICO	CIUDAD DE MÉXICO	GUSTAVO A. MADERO	AMBULATORIO	...	0	0	0	0	2021	10	2	41	13	286
2021-10-13	2022-01-18	m160d02	2	12	MÉXICO	2	CIUDAD DE MÉXICO	CIUDAD DE MÉXICO	GUSTAVO A. MADERO	AMBULATORIO	...	1	0	0	0	2021	10	2	41	13	286
2021-10-14	2022-01-18	m0da9ec	2	12	MÉXICO	1	CIUDAD DE MÉXICO	CIUDAD DE MÉXICO	GUSTAVO A. MADERO	AMBULATORIO	...	1	0	0	0	2021	10	3	41	14	287

	FECHA_ACTUALIZACION	ID_REGISTRO	ORIGEN	SECTOR	ENTIDAD_UM	SEXO	ENTIDAD_NAC	ENTIDAD_RES	MUNICIPIO_RES	TIPO_PACIENTE	...	TOMA_MUESTRA_ANTIGENO_BIN	MIGRANTE_BIN	UCI_BIN	DEFUNCION	AÑO_INGRESO	MES_INGRESO	DIA_SEMANA_INGRESO	SEMANA_AÑO_INGRESO	DIA_MES_INGRESO	DIA_AÑO_INGRESO
FECHA_INGRESO
2020-09-23	2022-01-18	z13788	1	12	CIUDAD DE MÉXICO	1	CIUDAD DE MÉXICO	CIUDAD DE MÉXICO	CUAJIMALPA DE MORELOS	AMBULATORIO	...	0	0	0	0	2020	9	2	39	23	267
2020-12-21	2022-01-18	z526b3	2	12	CIUDAD DE MÉXICO	1	CIUDAD DE MÉXICO	CIUDAD DE MÉXICO	TLALPAN	AMBULATORIO	...	1	0	0	0	2020	12	0	52	21	356
2020-04-22	2022-01-18	z3d1e2	2	12	CIUDAD DE MÉXICO	1	CIUDAD DE MÉXICO	CIUDAD DE MÉXICO	GUSTAVO A. MADERO	AMBULATORIO	...	0	0	0	0	2020	4	2	17	22	113
2020-10-07	2022-01-18	zz9079	2	12	CIUDAD DE MÉXICO	1	CIUDAD DE MÉXICO	CIUDAD DE MÉXICO	IZTAPALAPA	AMBULATORIO	...	0	0	0	0	2020	10	2	41	7	281
2020-09-08	2022-01-18	z2770b	1	12	CIUDAD DE MÉXICO	1	CIUDAD DE MÉXICO	CIUDAD DE MÉXICO	IZTACALCO	AMBULATORIO	...	0	0	0	0	2020	9	1	37	8	252

	FECHA_SINTOMAS	Confirmados
0	2020-02-22	1
1	2020-02-23	1
2	2020-02-24	0
3	2020-02-25	0
4	2020-02-26	0
...	...	...
691	2022-01-13	3829
692	2022-01-14	3068
693	2022-01-15	1860
694	2022-01-16	665
695	2022-01-17	1029

	FECHA_SINTOMAS	Confirmados	Media Móvil
0	2020-02-22	1	NaN
1	2020-02-23	1	NaN
2	2020-02-24	0	NaN
3	2020-02-25	0	NaN
4	2020-02-26	0	NaN
5	2020-02-27	0	NaN
6	2020-02-28	2	0.571429
7	2020-02-29	1	0.571429
8	2020-03-01	4	1.000000
9	2020-03-02	6	1.857143

	FECHA_SINTOMAS	variable	value
0	2020-02-22	Confirmados	1.000000
1	2020-02-23	Confirmados	1.000000
2	2020-02-24	Confirmados	0.000000
3	2020-02-25	Confirmados	0.000000
4	2020-02-26	Confirmados	0.000000
...	...	...	...
1387	2022-01-13	Media Móvil	6428.142857
1388	2022-01-14	Media Móvil	5812.142857
1389	2022-01-15	Media Móvil	5169.142857
1390	2022-01-16	Media Móvil	4368.000000
1391	2022-01-17	Media Móvil	3189.428571

Visualización¶

Curvas epidémicas¶

Curva de casos confirmados¶

Curva de defunciones¶

Combinando las dos¶

Hospitalizaciones¶

	Fecha	variable	value	Tipo
0	2020-03-22	Conteo	1.000000	Defunciones
1	2020-03-23	Conteo	1.000000	Defunciones
2	2020-03-24	Conteo	0.000000	Defunciones
3	2020-03-25	Conteo	1.000000	Defunciones
4	2020-03-26	Conteo	3.000000	Defunciones
...	...	...	...	...
1387	2022-01-13	Media Móvil	6428.142857	Casos Confirmados
1388	2022-01-14	Media Móvil	5812.142857	Casos Confirmados
1389	2022-01-15	Media Móvil	5169.142857	Casos Confirmados
1390	2022-01-16	Media Móvil	4368.000000	Casos Confirmados
1391	2022-01-17	Media Móvil	3189.428571	Casos Confirmados