Dinámicas y predicción de precipitaciones extremas en Piura

Fig 1. Lluvias en la región Piura 2017 (Fuente: El Comercio)

Resumen traducido de Rau et al (2019)

El estudio del fenómeno El Niño Oscilación del Sur (ENOS) es fundamental para la gestión de riesgos en el Perú, particularmente en la región de Piura, en el norte del país. Este estudio se centra en cerrar la brecha entre la comprensión de las dinámicas a gran escala del Océano Pacífico y la predicción de sus impactos en las precipitaciones a nivel local. 

La zona de estudio es la Cuenca del Río Piura, un área caracterizada por una topografía compleja que varía desde los -10 (depresión topográfica) hasta los 3640 m.s.n.m (Andes), lo que influye directamente en los patrones de precipitación. El impacto socioeconómico de los eventos extremos asociados al ENSO es devastador; por ejemplo, se estiman pérdidas económicas de hasta 3,124 millones de dólares. A pesar de los avances científicos, persiste una falta de capacidad consistentes para predecir tanto los eventos oceánicos a gran escala como sus impactos específicos en Sudamérica.  Un caso crítico de estudio representa El Niño Costero del 2017, que subrayó la necesidad de mejorar los pronósticos de lluvia locales. La investigación aborda este problema mediante el enfoques de técnicas estadísticas y de machine learning.

1. Metodología

La metodología estadística emplea análisis tradicionales como: a) la correlación de Pearson entre las precipitaciones y diversos índices ENSO; b) el Clustering jerárquico; y c) Análisis de correlación canónica (CCA). A continuación se describen cada una de estas técnicas.

1.1. Correlación de Pearson y análisis de retardos (lags)

Es la técnica de análisis tradicional que sirvió como punto de partida. Teóricamente, el coeficiente de correlación de Pearson (r) mide la fuerza y la dirección de la relación lineal entre dos variables continuas. Se empleó para determinar qué tan estrechamente se vincula la precipitación en Piura con los índices de temperatura superficial del mar (SST) en diferentes zonas del Pacífico (como NIÑO1+2 o NIÑO3.4). Un valor cercano a 1 indica una relación positiva fuerte, mientras que valores cercanos a -1 indican una relación inversa. 

El concepto de lag, retardo o rezago se refiere al desfase temporal entre una señal precursora y su impacto resultante. En meteorología, esto es esencial para la predictibilidad. Consiste en calcular la correlación entre una variable independiente (ej. temperatura superficial del mar) en un tiempo t y una variable dependiente (ej. lluvia) en un tiempo futuro t+k. Este método permitió identificar "ventanas de predicción".

1.2. Clustering Jerárquico

Es un método de aprendizaje no supervisado que busca agrupar datos de tal manera que los elementos dentro de un grupo (cluster) sean más similares entre sí que con los de otros grupos. Los clusters se calcularon utilizando las anomalías de precipitación. El proceso implica la normalización de las variables (restando el promedio y dividiendo por la desviación estándar) para que todas tengan el mismo peso en el algoritmo. El algoritmo genera "composites" o patrones promedio para cada grupo, permitiendo clasificar los años históricos en escenarios de sequía, normalidad o eventos extremos como El Niño.

1.3. Correlación Canónica (CCA)

La CCA es una técnica estadística multivariada avanzada que describe la relación entre dos conjuntos de variables en lugar de solo dos variables individuales. Busca encontrar combinaciones lineales de los predictores (ej. presión, temperatura, altura geopotencial) que tengan la máxima correlación con combinaciones lineales de los predictandos (ej. lluvia en diferentes estaciones). La CCA emplea varios coeficientes críticos: 

Canonical Weight: Relación de una variable individual con el otro conjunto completo, ignorando la colinealidad.

Canonical Loading: Relación de una variable con su propio conjunto.

Canonical Cross-Loading: Relación de una variable con el conjunto opuesto, considerando la colinealidad.

La CCA permitió capturar patrones complejos de la atmósfera y el océano para generar un pronóstico de precipitación con una mayor habilidad (skill) que los métodos univariados simples. Se emplea el algoritmo desarrollado por Totz et al (2017).

2. Resultados

2.1. Del analisis correlacional

El análisis estadístico tradicional mediante la correlación de Pearson demuestra que la precipitación en Piura no responde de manera uniforme a todas las regiones del Pacífico. Existe una dependencia crítica de la zona NIÑO1+2 (frente a las costas de Perú y Ecuador). Los resultados muestran que las lluvias de verano (DEF) tienen una correlación positiva excepcionalmente alta con esta zona, alcanzando un 0.67 en la cuenca baja y un 0.66 en la cuenca media. Esto confirma que el calentamiento costero es el motor principal de los eventos extremos en la región.

En contraste, la zona Tropical West (TW) presenta correlaciones negativas (hasta -0.39 en la cuenca alta). Esta relación inversa sugiere que, mientras el Pacífico Oriental se calienta y favorece lluvias, el Pacífico Occidental experimenta dinámicas que podrían actuar como un freno o regulador, dependiendo de la intensidad del evento.

Un hallazgo fundamental para la gestión de riesgos es que las condiciones oceánicas del trimestre septiembre-octubre-noviembre (SON) actúan como precursores robustos de lo que ocurrirá en el verano (DEF). Esta ventana de predicción o llámese "memoria" del sistema oceánico permite establecer un sistema de alerta temprana con meses de anticipación.

Fig 2. Correlación espacial de las precipitaciones en la región Piura con la temperatura superficial del mar de las regiones TW (Tropical West) a la izquierda, NIÑO3.4 al centro y NIÑO1+2 en la derecha. El mejor lag resultado del predictor trimestral SON para las lluvias en el trimestres DEF.

2.2. De la clasificación por Clustering de Anomalías

Mediante el uso del Clustering Jerárquico aplicado a las anomalías de precipitación, se logró categorizar la variabilidad histórica de Piura en tres escenarios distintos, lo que permite una planificación basada en probabilidades de ocurrencia. 

Cluster 1 (Frecuencia 55.6%): Representa el escenario más común, caracterizado por condiciones normales o ligeramente secas. Más de la mitad de los años caen en esta categoría demostrando la naturaleza episódica y no persistente de las lluvias torrenciales.

Cluster 2 (Frecuencia 38.9%): Indica años con anomalías positivas moderadas a fuertes. Es el grupo donde la vigilancia debería ser constante, ya que representa una amenaza recurrente para la infraestructura local.

Cluster 3 (Frecuencia 5.6%): Es la categoría de eventos extremos (como los años 1983 y 1998). Aunque su frecuencia es baja, su impacto socioeconómico.

2.3. De la optimización del pronóstico mediante la Correlación Canónica (CCA)

El uso de la CCA representó un salto cualitativo sobre el análisis univariado, al permitir relacionar conjuntos de variables predictoras (SST, presión, temperatura troposférica) con la lluvia local. Los modelos fueron entrenados en Python, mostrando un skill predictivo de entre 0.51 y 0.54 para el trimestre diciembre-enero-febrero. En climatología, estos valores son significativos, indicando que el modelo captura más del 50% de la varianza histórica observada. Los mejores resultados se obtuvieron al combinar datos de la zona NIÑO1+2 con variables de la tropósfera y presión a nivel del mar (SLP).

Esto indica que no basta con observar la temperatura del mar; la respuesta de la atmósfera (presión y temperatura en altura) es la que finalmente "activa" las precipitaciones en la cuenca. Los gráficos de verificación muestran que el modelo de CCA sigue de cerca las fluctuaciones de los datos observados (PISCO-SENAMHI), demostrando una capacidad robusta para predecir años tanto excesivamente húmedos como secos.

Fig 3. Años representados en los 3 clusters (superior izq). Espacialización de la anomalia de precipitación para los clusters identificados (superior der). Anomalia de precipitacion DEF pronosticada en rojo y observada en azul con la mejor combinación de variables oceanicas y atmosfericas de la tabla inferior (inferior izq). Correlacion espacial a partir de las variables identificadas método de Clustering (inferior der).

3. Conclusiones

Los resultados estadísticos y de machine learning validan que la cuenca de Piura posee una firma hidroclimática única, altamente sensible a las variaciones térmicas de su costa adyacente (NIÑO1+2) . La capacidad de predecir impactos con un skill superior a 0.50 mediante modelos de CCA, junto con la clasificación de riesgos por clusters, ofrece una herramienta científica para mitigar desastres, permitiendo a los tomadores de decisiones anticipar si el próximo verano se presentaría la normalidad del Cluster 1 o la devastación del Cluster 3.

Referencias:

-Rau P, Castillon F, Obregon J, Horna D, Tziperman E. Statistical and Machine Learning Models as a Tool for Forecasting Extreme Summer Precipitation Driven by ENSO in the Northern Coast of Peru (1981-2018). AGU Fall Meeting Abstracts. 2019. USA.

-Totz, S., Tziperman, E., Coumou, D., Pfeiffer, K., & Cohen, J. (2017). Winter precipitation forecast in the European and Mediterranean regions using cluster analysis. Geophysical Research Letters, 44, 12,418–12,426. https://doi.org/10.1002/2017GL075674



No hay comentarios. :