-
Notifications
You must be signed in to change notification settings - Fork 23
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Problemas con codificación #35
Comments
Revisando las codificaciones (con git, usando el comando file * --mime-encoding) en la carpeta /covid19/data/original/spain, aparece:
vacunaciones.csv aparece con codificación Hay algunos ficheros que tienen codificaciones |
El problema de vacunaciones.csv parece solucionarse si:
por
¿Tendrán estos cambios alguna incidencia? |
Algunos ficheros que podrían dar problemas (a priori) por su codificación
|
Solucionados casi todos los problemas de codificaciónNo parece funcionar (pero se cambia por si acaso)
Sí parece funcionar:cambiando todos los casos de:
por
Y buena parte de los errores han desaparecido (aunque quedan algunos). |
Por si alguien lo duda, yo de R no tengo ni idea. Los ficheros us-ascii se pueden leer como utf-8 pues la correspondencia es directa desde us-ascii a utf-8. Obviamente NO en sentido contrario. En el resto de los casos, no estoy igual de seguro que si lees otros enconding como utf-8 los entienda correcto. En el caso de data/original/spain/vacunaciones.csv tiene datos de estas CCAA En resumen, vacunaciones.csv tenía todos los registros 'correctos' con sus acentos y todo bien. Hasta los datos del 25 de marzo. |
En Windows 10, al pasar el script (process_spain_provinces_data.R) que genera los ficheros de datos en Windows, se producen problemas de codificación con aquellos ficheros que tienen caracteres con acentos. Al menos, ocurren con:
Última fecha de actualización de datos
, con dos acentos.En el caso de vacunaciones.csv, el script indica que no reconoce ese campo y no procesa el fichero CSV.
Aparecen otros casos de error en otros ficheros, que probablemente también se deban a problemas de codificación.
Sospecha: se trata de un problema de codificación, que no sucede en Linux (cuando actualiza Pablo) pero sí en Windows (cuando actualiza David).
The text was updated successfully, but these errors were encountered: