Métodos de Interpolación Espacial: Tipos, Aplicaciones y Validación

Métodos de Interpolación Espacial

Conceptos Básicos

La interpolación consiste en estimar los valores de una variable Z (por ejemplo, temperatura) en un conjunto de puntos (de interpolación) definidos por dos coordenadas (X, Y). Se parte de valores de Z medidos en una muestra de puntos en la misma área de estudio, denominados puntos de muestreo. La estimación de valores más allá de los puntos de muestreo se denomina extrapolación.

Clasificación de los Métodos de Interpolación

Los métodos de interpolación se pueden clasificar según varios criterios:

  1. Métodos mecánicos vs. probabilísticos:
    • Mecánicos: Se aplican sin necesidad de un estudio estadístico previo de la variabilidad de la variable.
    • Probabilísticos: Exigen una estimación previa de un conjunto de parámetros y que los datos de muestreo cumplan una serie de condiciones bastante estrictas.
  2. Métodos locales vs. globales:
    • Locales: Utilizan los puntos de muestreo más cercanos al punto en que queremos realizar la estimación.
    • Globales: Utilizan toda la muestra para estimar el valor en cada nuevo punto.
  3. Métodos exactos vs. aproximados:
    • Exactos: Obtendrán en los puntos de muestreo el mismo valor medido.
    • Aproximados: El valor estimado puede diferir del valor medido debido a un efecto de suavizado.
  4. Métodos deterministas vs. estocásticos:
    • Deterministas: Siempre se obtiene el mismo valor de estimación.
    • Estocásticos: Introducen un componente aleatorio que hace que los resultados puedan no ser iguales en dos ejecuciones sucesivas.
  5. Métodos convexos vs. no convexos:
    • Convexos: No permiten obtener predicciones fuera del rango de valores disponibles en los puntos de muestreo, por lo tanto, no se interpolarán correctamente los máximos o mínimos de la variable.
    • No convexos: Sí permiten obtener valores por encima o por debajo de los valores muestrales.
  6. Predicciones puntuales vs. de bloque:
    • En función de si las predicciones se asignan a un punto o se promedian en un bloque.

Siguiendo estos criterios, podemos agrupar los métodos de interpolación en tres grupos fundamentales:

  • Métodos de regresión (probabilísticos, globales y aproximados)
  • Métodos mecánicos de interpolación local (exactos)
  • Métodos probabilísticos de interpolación local (exactos)

Regresión a partir de Variables Ambientales

Implica un análisis de regresión del cual se genera un modelo de interpolación en el que la variable a interpolar se estima a partir de una o más variables auxiliares, a las cuales se les llama variables independientes, mientras que a la variable a interpolar se le denomina variable dependiente.

Diagnóstico del Modelo de Regresión

Consiste en analizar el modelo para comprobar si realmente se cumplen los supuestos:

  • Normalidad: Si los residuos de regresión tienen una distribución claramente no lineal, la eficiencia del procedimiento de mínimos cuadrados se ve comprometida y los valores de coeficientes, sus intervalos de confianza y los estadísticos de bondad de ajuste no son fiables.
  • Homocedasticidad: La varianza de los residuos debe ser la misma en todo el rango de valores de los mismos.
  • Linealidad: La relación entre las variables X e Y debe ser lineal (línea recta).
  • Independencia: Los valores de las variables en diferentes puntos de muestreo deben ser independientes unos de otros.
  • No deben existir valores muy influyentes que puedan hacer que el modelo cambie completamente si se eliminan.

Los gráficos que aparecen son:

  1. Gráfico de residuos contra valores predichos: Los residuos deben situarse simétricamente a ambos lados del valor 0 (normalidad) y el rango de los residuos debe ser similar para los diferentes valores ajustados (homocedasticidad). Tampoco debe aparecer una relación, ni lineal ni curva, entre valores predichos y residuos (linealidad e independencia).
  2. QQplot de los residuos: Si estos se alejan de la recta, no tienen una distribución normal.
  3. Raíz cuadrada de los residuales estandarizados contra valores predichos.
  4. Gráfico de observaciones influyentes: Las distancias de Cook mostradas como isolíneas rayadas en rojo. Una variable con una distancia de Cook superior a 1 o a n/4 es un valor extremo que además está alterando significativamente la posición de la recta. La mejor opción es eliminar este valor.

Métodos Mecánicos de Interpolación Local

Se basan en la utilización de los puntos de muestreo más cercanos a cada punto de interpolación para estimar la variable Z en este. Llamaremos al conjunto de puntos más cercanos conjunto de interpolación.

Métodos Locales Basados en Medias Ponderadas

Asumen autocorrelación espacial y estiman valores de Z como media ponderada de valores del conjunto de puntos de muestreo cercanos.

Exigen tomar una serie de decisiones:

  1. ¿Qué puntos cercanos van a formar parte del conjunto de interpolación? Dos criterios fundamentales:
    • Aquellos cuya distancia al punto de interpolación sea inferior a un valor umbral r.
    • Los n puntos más cercanos al punto de interpolación.
  2. ¿Cuál será el método de interpolación? Opciones:
    • Solución más simple: dar el valor del punto más cercano (método del vecino más próximo o de los polígonos de Thiessen).
    • Media aritmética de valores de puntos incluidos en el conjunto de interpolación.
    • Inverso de distancia elevado a un exponente (IDW): Cuanto más apartados estén dos puntos, más diferentes serán sus valores de Z. Para tener en cuenta este hecho, se usan medias ponderadas usando como factor de ponderación el inverso de la distancia elevado a algún exponente (R) que suele ser 2.

Splines

Ajusta funciones en las que las variables independientes son X e Y. Es similar a una interpolación global mediante regresión, pero ahora esta se hace localmente mediante polinomios de grado 3. Su ventaja es la posibilidad de modificar los parámetros en función del tipo de distribución espacial de la variable. La forma de la superficie final depende de un parámetro de tensión que hace que la superficie interpolada sea similar a una membrana que pasa por los puntos de observación. Al ser un método no convexo, reproduce mejor mínimos y máximos locales. El inconveniente es que pueden producir overshooting.

Red Irregular de Triángulos (TIN)

Surgen de valores puntuales tratando de conseguir triángulos que maximicen la relación área/perímetro; todos los triángulos forman un objeto geométrico denominado conjunto convexo. Usados para representar modelos de elevaciones, pero a la hora de integrarlos con el resto de la información ráster es necesario interpolar una capa ráster a partir de los triángulos. El conjunto convexo que se genera define el área razonable para interpolar dada la muestra de puntos disponible. Lo que quede fuera de este conjunto convexo sería un área de extrapolación. Funciona mejor en variables con rupturas de pendiente cuando se dispone de una elevada densidad de puntos de muestreo.

Métodos Estocásticos Locales: Krigeado

El krigeado supera la limitación de que los coeficientes de ponderación sean aplicados sin analizar la variabilidad de la variable, calculándose a partir del análisis de la estructura de variación espacial de la variable a interpolar. Para ello se usa un semivariograma que da una visión de cuál es la estructura de variabilidad espacial de una variable medida en un conjunto de puntos.

Cálculo del Semivariograma Experimental

  1. Determinar los posibles pares de puntos.
  2. Para cada par de puntos, anotar la distancia entre los puntos y el cuadrado de la diferencia de valores.
  3. Establecer valores críticos de distancia.
  4. Calcular para cada valor de h la función semivariograma.

Su interpretación utiliza tres conceptos:

  • Efecto pepita: Valor del semivariograma en el origen.
  • Meseta: Valor máximo que alcanza el semivariograma en distancias elevadas más allá de las cuales no hay autocorrelación espacial.
  • Rango: Distancia a la que se alcanza la meseta.

Semivariograma Teórico

Modelos teóricos definidos por ecuaciones cuyos parámetros son el efecto pepita, la meseta y el rango. Los más utilizados son:

  • Semivariograma esférico
  • Semivariograma exponencial
  • Semivariograma gaussiano

Para que sea un estadístico representativo de la variabilidad espacial, debe cumplirse que la variable interpolada siga una distribución normal. Nos da idea de:

  • El rango nos indica hasta qué distancia resulta adecuado tomar puntos en una interpolación de media ponderada.
  • Si el semivariograma no alcanza una meseta, significa que la variable no es estacionaria de primer orden, sino que presenta una deriva. En ese caso, es conveniente eliminar la deriva y repetir el cálculo del semivariograma.

Validación y Validación Cruzada

Para verificar la calidad de un mapa interpolado. Está formado por una serie de puntos de los que se conoce el valor real, pero no incluidos en el conjunto de interpolación. La diferencia entre el valor medido y el estimado es el error de estimación en este punto. El conjunto de errores debe tener:

  • Media de errores y media de errores al cuadrado próxima a cero.
  • Valores de error deben ser independientes de su localización en el espacio y no estar autocorrelacionados.
  • Función de distribución de errores debe aproximarse a una distribución normal.

Validación cruzada:

  1. Sacar un punto del conjunto de muestreo y convertirlo en punto de interpolación.
  2. Estimar la variable en este punto con el procedimiento de interpolación que queramos validar y obtener el correspondiente error.
  3. Reintroducir el punto en el conjunto de muestreo.

Combinación de Diferentes Métodos

La distribución espacial de una variable cuantitativa está condicionada por la suma de tres procesos:

  • Tendencia a escala global
  • Variación local autocorrelacionada
  • Conjunto de factores indeterminados y errores de medida que se agrupan en un término de error.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.