Neil Cotie (trabajo individual)
Esta práctica se ha realizado por la asignatura Tipología y ciclo de vida de los datos, dentro del curso del Máster en Ciencia de Datos de la Universitat Oberta de Catalunya.
El ozono, aunque es esencial en la estratosfera, es un contaminante cuando se encuentra cerca de la superficie, en el troposfera, por su efecto fuerte oxidante. En humanos y mamíferos impacta los sistemas respiratoria, nerviosa y cardiovascular. Irrita los ojos y los pulmones, causa irregularidades cardíacas, y aumenta el riesgo de muerte para personas con condiciones respiratorias y cardíacas, como la asma.
Ciudades en latitudes bajas, con radiación solar fuerte y a la vez contaminantes precursores, tiendan a tener niveles de ozono altos, con altitud altos siendo también un factor de incremento.
Para investigar la posibilidad de mejorar predicciones de niveles excesivos de ozono con aprendizaje automatizado, seleccioné el conjunto de datos “Ozone Level Detection Dataset”. Está disponible en
https://www.kaggle.com/prashant111/ozone-level-detection
o en el en la página del UCI Machine Learning Repository en
https://archive.ics.uci.edu/ml/datasets/ozone+level+detection
El analisis hecho cubre los fases normales:
- Carga de datos
- Integración
- Reducción
- Conversión
- Limpieza
- Análisis Visual
- Análisis con Modelización
Cotie_DataLC_PRA2.html: el documento final
Cotie_DataLC_PRA2.Rmd: el fichero del proyecto en RMarkdown con código R
data_daily_vector.csv: los datos procesados (no incluyendo las columnas extras del apartado 5)
Los datos originales:
eighthr.data.csv
onehr.data.csv
eighthr.names.txt
onehr.names.txt