El Instituto Superior de Medio Ambiente lleva ya un año trabajando con Julia Chacón y conmigo ofreciendo cursos online de análisis de datos ambientales con el software gratuito de computación estadística R, una de las herramientas más potentes que tenemos a nuestro alcance como profesionales del medio ambiente. En noviembre os contábamos algunas de las ventajas del programa, sus posibilidades infinitas… pero, ¿en qué se trasladan esas posibilidades a los retos reales de analizar nuestros datos? Vamos a verlo con el desafío de procesar, manipular y analizar la información de la calidad de los ríos del País Vasco, disponible de manera pública.
Todos los años quedan disponibles las medidas físico-químicas y biológicas de las estaciones de medición de todos los ríos de la región, una información de valor incalculable para el seguimiento de la calidad ambiental de las aguas. Sin embargo, la información está estructurada de una manera realmente difícil de aglutinar para analizar los datos en su conjunto: cada río presenta su información en un archivo por separado, y cada uno de ellos presenta los datos de las medidas como si fuera una lista, ordenada de manera diferente en cada caso. Si tenemos que manipular esta información archivo a archivo para obtener una tabla, sería inasumible. Eso, sin tener en cuenta que disponemos de información de muchos años.
Una de las capacidades que conseguiréis en este curso es que tareas de manipulación de datos aparentemente muy complejas o tediosas se puedan resolver en cuestión de minutos. Podemos pedirle a R que lea toda la información de nuestros archivos, la manipule, y río a río, convierta la lista de medidas en una tabla que podemos analizar: mostrar tendencias en los parámetros de calidad del agua, diferenciar tipos de ríos por sus características, detectar valores alarmantes de algunos contaminantes… Por ejemplo, R nos permite visualizar muy rápidamente que las condiciones generales de las estaciones de medida se mantienen relativamente estables o que los niveles de mercurio fueron alarmantes en algunos puntos durante el año 2015.
Como también podemos incorporar de manera inmediata las coordenadas de las estaciones, podemos visualizar aquellos ríos que presentaron los problemas de contaminación, combinando otras fuentes de información geográfica.
De hecho, podemos incluso hacer de este mapa una herramienta interactiva y publicarlo en la red, pudiendo acceder a la información de cada punto de cada año. O incorporar herramientas de análisis interactivo.
Hacer que nuestro programa de estadística haga de manera automática la tarea de recopilar los archivos, bajándolos incluso de manera automática del portal de datos y descomprimiéndolos, y confeccionar nuestra tabla, nos llevará aproximadamente una hora de trabajo. Fabricar soluciones adaptadas a las necesidades de vuestros datos y vuestro trabajo está a vuestro alcance. Nos tenéis a vuestra disposición para aprender juntos. Puedes consultar más información sobre los cursos Introducción al Manejo y Análisis de Datos Ambientales en R y Visualización de Datos Ambientales en R: ggplot2 en la web de ISM.
Deja tu comentario