Skip to content

Metodología de Análisis Ambiental

24/04/2026

Una metodología altamente granular diseñada para aislar los parámetros ambientales y microclimáticos responsables de las apariciones locales de medusas. Esta documentación describe la extracción de datos y los rigurosos procesos estadísticos de Meduseo.

Fase 1 Extracción de Datos Altamente Localizada

Recorte Espacial NetCDF

A diferencia de los modelos tradicionales que promedian los datos sobre grandes polígonos regionales, Meduseo utiliza archivos NetCDF sin procesar recortados dinámicamente mediante xarray.

Para cada ciudad, el sistema delimita dinámicamente la zona usando un radio espacial de 0.15°. Esto restringe la evaluación a un radio de aproximadamente 15 km alrededor de la costa, capturando los microclimas específicos de cada bahía.

Fuentes de Datos

Aprovechamos dos pilares principales de la suite científica Copernicus:

  • Reanálisis Atmosférico ERA5: Obtenido mediante la API CDS (resolución 0.25°), cubriendo Viento, Presión Atmosférica, Temperatura y Precipitaciones.
  • Copernicus Marine Environment (CMEMS): Extraído nativamente a 0.083°, incluyendo indicadores físicos como la SST, Salinidad, Corrientes superficiales y Olas.

Fase 2 Clasificaciones Estadísticas

Formulación del Objetivo: ¿Qué es un "Día de Medusas"?

Para cualquier ciudad, los usuarios de Meduseo envían reportes que van de 0 (Despejado) a 4 (Fuerte presencia). Para atribuir de manera confiable un perfil ambiental, el algoritmo calcula la media aritmética diaria de todos los informes vinculados a esas coordenadas GPS.

  • Medusas Presentes: Si la media es > 1.
  • Día Despejado: Si la media es ≤ 1.
  • Requisito de Umbral: Una ciudad se considera para el análisis solo si tiene un mínimo estricto de 10 días de reportes verificados durante la temporada de verano.

> 1

Umbral de Carga Medio


Fase 3 Pruebas Estadísticas Rigurosas

Prueba U de Mann-Whitney

Debido a que las variables meteorológicas suelen violar los supuestos de distribución normal, utilizamos la prueba no paramétrica de Mann-Whitney, comparando la suma de los rangos de valores observados en días despejados frente a los días con medusas.

d de Cohen (Efecto)

Mientras que un valor-p especifica si existe un efecto, la d de Cohen establece la magnitud del factor ambiental. Calculada mediante la diferencia de las medias con la desviación estándar agrupada, permite clasificar el impacto relativo de las variables.

Corrección FDR

Realizar pruebas simultáneas sobre 20+ variables aumenta masivamente el riesgo de falsos positivos. Lo gestionamos pasando todos los valores-p por una corrección FDR de Benjamini-Hochberg. Solo se conservan las métricas con q < 0.05.


Fase 4 Léxico de Variables Calculadas

Cada análisis evalúa el estado diario junto con los retrasos cronológicos (lags). Como la física marina implica inercia, el análisis de los desfases temporales (1 y 2 días) nos permite rastrear los mecanismos retrasados del transporte ambiental.

Código de Variable Nombre para Mostrar Unidad Fuente y Definición
sst Temperatura Superficial °C Extracción media diaria (Copernicus Marine).
msl_mean Presión Atmosférica hPa ERA5 reducido a nivel del mar. Indica actividades ciclónicas generales.
salinity Salinidad PSU Concentración de sal en superficie (~5m de profundidad).
current_speed Corriente Superficial m/s Magnitud derivada de coordenadas vectoriales.
wave_height Altura de las Olas m Altura media del 33% de las olas más altas (VHM0).
*_lag_1d / 2d Retrasos Temporales (Lags) - Seguimiento retrospectivo del estado ambiental a 24h y 48h.
*_direction Trayectorias Circulares ° Estadísticas evaluadas a través de medias circulares evitando saltos numéricos.