Este artículo muestra la evolución de los casos de COVID-19 en España, con datos oficiales del Ministerio de Sanidad recogidos por el Datadista. Incluye gráficas básicas de evolución del case fatality rate, es decir, la relación entre el número de casos totales acumulado y el número de decesos acumulado.

Nota: estos son datos proporcionados por el ministerio y de fiabilidad dudosa. Se han eliminado todos los cálculos que usan como base el número de hospitalizados y de ingresos en la UCI, puesto que el Ministerio de Sanidad ha cometido un error sumando los datos de comunidades que comunican los que permanecen ingresados, con los datos de otras que comunican los ingresos totales desde el principio.

Este es el porcentaje de fallecimientos con respecto al número de casos reformados:

library(ggrepel)
ggplot(data,aes(x=Fecha,y=CFR))+geom_line()+theme_economist()+
  geom_label_repel(aes(label = sprintf("%.2f", CFR*100), hjust=0))

Según avanza la cuarentena, el número de fallecimientos (que se arrastra desde atrás, por contagios anteriores) aumenta con respecto al número de contagios (que disminuye). Por eso la tasa no deja de aumentar hasta los valores actuales.

Se habla de R0 como la relación de personas infectadas por cada una que tenga COVID-19. La estimación directa es imposible, pero de forma indirecta se puede estimar a partir del número nuevo de casos, comparando con el número total de casos del día anterior.

ggplot(data,aes(x=Fecha,y=R0))+geom_point()+geom_line()+theme_economist()

La tasa de resolución absoluta es la relación entre casos resueltos (positiva y negativamente) y casos totales. Dado que todos los datos en el mismo son inciertos, interesa más la dinámica que los valores absolutos:

ggplot(data,aes(x=Fecha,y=Tasa.Resolucion))+geom_point()+geom_line()+theme_economist()

Como el día 19 de mayo dejaron de dar oficialmente las altas, se quebró la serie temporal en ese momento. Quizás con la relativa (es decir, lo mismo calculado puntualmente para cada día con deltas desde el día anterior) el panorama sea un poco más claro:

ggplot(data,aes(x=Fecha,y=Tasa.Resolucion.R))+geom_point()+geom_line()+theme_economist()

En cualquiera de los casos las tasas estaban todavía por debajo de 1 hasta el día 14, pero ha superado este número en ese día. El problema es que no se reportan suficientes altas, y es probable que ya se haya alcanzado ese número. Pero mientras en el ministerio no se preocupen por la calidad de los datos que proporcionan, es imposible confiar en el pronto cambio de la situación.

Finalmente, la prevalencia teórica: el número de contagiados hace 14 días (la duración de la cuarentena) menos los fallecidos y curados hoy.

ggplot(data,aes(x=Fecha,y=Prevalencia))+geom_point()+geom_line()+theme_economist()

ggplot(data,aes(x=Fecha,y=Prevalencia7))+geom_point()+geom_line()+theme_economist()

Reconocimientos.

Este fichero está generado a partir de los datos elaborados por Datadista y tiene una licencia libre. Se puede generar con nuevos datos usando el script en este repositorio.