Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

La Rioja: ¿debemos tomar los datos de la actualización de Sanidad? #16

Open
5 of 7 tasks
pirio72 opened this issue Oct 12, 2020 · 0 comments
Open
5 of 7 tasks

Comments

@pirio72
Copy link
Collaborator

pirio72 commented Oct 12, 2020

Problema

La información oficial de Coronavirus del Gobierno de La Rioja apenas da acumulados (a 2020-10-08) de:

  • Número de casos
  • Número de fallecidos
  • Hospitalizados
  • UCI

Los dos primeros podrían servir (descontando del anterior día), pero no los dos últimos.

El sitio también da información desglosada sobre datos por municipios y otros detalles, pero no para todos los municipios (solo para los mayores de una población). Y además, no actualiza sus datos con frecuencia regular.

Por eso, se han estado tomando datos, desde mediados de agosto, del periódico La Rioja.com, pero resulta muy pesado encontrar la información.

Una alternativa: los informes del Ministerio de Sanidad

La posible alternativa sería tomar los datos directamente del informe diario del Ministerio de Sanidad, si bien lleve algo de retraso: por ejemplo, para los datos del 2020-10-07, hay que encontrar los datos en el informe del 2020-10-08.

Comparando los datos que tenemos para el 2020-10-07 con los del informe de Sanidad, tenemos: (se dan los datos del Ministerio de Sanidad, y se comparan con los que hemos obtenido):

  • PCR: 112 en Sanidad (pag. 1, columna 3, última fila), y teníamos 108.
  • Activos: no tenemos datos totales de activos en ningún momento en nuestros datos.
    • Tal vez podríamos calcularlo, dado que sí disponemos del acumulado de casos, podríamos calcular el acumulado de altas y disponemos del acumulado de fallecidos. Pero esto habría que pensarlo.
  • Hospitalizados: 81 en Sanidad (pag. 1, columna 2, última fila), pero hay que tener en cuenta que Sanidad da los datos de hospitalizados juntos. Si descontamos los PCR (16, ver pág. 4, columna 4, última fila), salen 65. En los datos que teníamos, eran 62.
  • UCI: 16 en Sanidad (pág. 4, columna 4, última fila), 17 en los datos que teníamos. Luego, también coinciden prácticamente.
  • Fallecidos: el acumulado es de 425 (pág. 2, columna 6, última fila), el mismo valor que teníamos (en la página del Gobierno de la Rioja)
  • Acumulados: los datos coinciden en todos los días de los que tenemos acumulados, tanto en Sanidad como en el Gobierno de La Rioja.
  • Recuperados: Sanidad da el número de altas en las últimas 24 horas: 13 (pág. 4, 7ª columna (última), última fila). La Rioja no ha dado el número acumulado de altas en la comunidad (o al menos, ¡¡no lo tenemos en ningún momento, en ninguna fila de La Rioja!!),
    • Luego, solo habría que ir sumando este valor al total de altas acumulado que se tengan del día anterior.
    • Para ello, eso sí, habría que obtener el total de altas de todos los días anteriores, eso sí (a partir de todos los informes de Sanidad).

Argumentos a favor

  1. Sanidad sí mantiene activas todas las actualizaciones: desde el 2020-03-10 https://www.mscbs.gob.es/profesionales/saludPublica/ccayes/alertasActual/nCov/documentos/Actualizacion_40_COVID-19.pdf (2020-03-10) hasta el 2020-10-12 (https://www.mscbs.gob.es/profesionales/saludPublica/ccayes/alertasActual/nCov/documentos/Actualizacion_226_COVID-19.pdf)

    • Solo hay que ir cambiando la numeración para acceder a los ficheros.
  2. La estructura es bastante similar en los últimos meses. Aunque se trata de un documento PDF, sería posible plantear escrapearlo para extraer los datos (de manera similar a cómo se obtienen los datos del documento que publica la Comunidad de Madrid)

  3. Aunque la información tendría un retraso de unas 18 horas, es mucho más asumible que usar, como hasta ahora, dos fuentes distintas, una de ellas, bastante dispersa (noticias de un periódico con formato muy distinto).

  4. Como mínimo, tendríamos la misma información que teníamos hasta ahora. Es posible que tengamos más.

Argumentos en contra

El Ministerio de Sanidad no actualiza en fines de semana, mientras que sí hemos dispuesto de datos en sábado y domingo, hasta ahora.

Propuesta

  1. Crear un script para escrapear la página diaria de Sanidad y extraer los contenidos de La Rioja
  2. O en su defecto, obtener los documentos de forma manual de la actualización diaria de Sanidad (teniendo en cuenta que los datos son siempre relativos al día anterior).
  • Duda: ¿fines de semana?
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

1 participant