El Modelo de Datos Raster
Conceptualmente, los modelos raster son los más simples de todos los modelos existentes. El modelo de datos raster consiste básicamente de una estructura de malla (grid) – una matriz de celdas. El área que se estudia es dividida en celdas uniformes regulares que cubren el área total. Un único par coordenado de referencia, situado en una esquina o en el centroide, representa cada píxel. Generalmente fila tras fila desde la esquina superior izquierda. Los datos raster pueden visualizarse como una malla que cubre el terreno. Cada celda de la malla tiene un código almacenado en la base de datos que describe el terreno dentro de esa celda particular.
Celdas o Píxeles Raster
El modelo raster divide el área total de estudio en una malla de celdas regulares que siguen una secuencia específica: La secuencia convencional es fila tras fila desde la esquina superior izquierda. Cada celda contiene un valor simple. Un conjunto de píxeles y sus valores asociados constituye una “capa” de información. Pueden existir muchas “capas” en una base de datos, por ejemplo, tipo de suelo, alturas, usos del suelo, cobertura del suelo. Cada píxel tiene datos discretos de atributos asignados. Cada píxel en la malla tiene un valor que corresponde al tema geográfico que se está representando: Un objeto está representado por una celda o está conectado a un grupo de celdas. El SIG raster no registra límites precisos, solo registra la presencia o ausencia de una característica, o un rango de valores para una propiedad en una celda.
Representación *Grid* de los Datos
El modelo de datos raster puede representar puntos discretos, líneas y detalles areales. Un detalle puntual se representa como un valor en una única celda; un detalle lineal se representa como un conjunto de celdas conectadas que describen longitud; un detalle areal está descrito como un grupo de celdas conectadas que describen la forma.
Resolución
Resolución: La resolución de un raster es la distancia que un lado de la celda o píxel representa en el terreno. Esto es: La unidad más pequeña discernible. A mayor resolución – más pequeñas las celdas del grid, mayor precisión, pero mayores costos en almacenamiento de datos. La exactitud de un mapa depende de su escala. En el modelo raster la exactitud depende de la resolución, y por lo tanto la exactitud depende de la porción de área del mundo real representado por cada celda del grid. A mayor área representada, menor la resolución de los datos. A menor área cubierta por cada píxel, mayor la resolución y mayor exactitud de los detalles que se están representando.
Capas Temáticas
Cada celda puede tener un solo valor, de tal manera que a diferentes tipos de objetos se asignan diferentes capas raster. Si cada capa trata de un tema en el que atributos múltiples corresponden a cierto conjunto de objetos, entonces se deben usar capas múltiples. Por consiguiente, los modelos de datos raster tienen usualmente más capas que los modelos vectoriales. Las bases de datos raster, por lo tanto, pueden contener cientos de capas temáticas.
El Modelo Raster
Solo un valor de atributo se puede asignar a cada celda. Los objetos que tienen varios atributos se representan, por lo tanto, con varias capas raster, una por cada atributo.
Píxeles Mixtos
Un píxel mixto es un píxel o celda cuya porción de área correspondiente contiene más de una clase (tipo de clasificación). Si la mayoría de la celda contiene un detalle particular, entonces generalmente a la celda entera le será asignado un valor que representa ese detalle. En consecuencia, la resolución del análisis estará limitada por el tamaño de la celda. Estos píxeles mixtos pueden ser la causa principal de muchos problemas que se presentan con los datos raster. La próxima lámina muestra un ejemplo. La figura muestra una parte del contorno de un lago. En la primera vista, existe un solo tipo de cobertura del suelo, “gram», así todos los píxeles pertenecen a una clase. En la vista siguiente, existen dos tipos de atributos, agua y grama. Es difícil asignar cada píxel a una u otra categoría. Se puede crear la clase de “píxeles borde”, para aquellos que no pertenecen exclusivamente a una clase u otra. Finalmente, cuando varias clases están envueltas, tendremos que decidir reglas para la asignación, tal como asignar el píxel mixto a la clase que ocupa más área dentro de él, o tenemos que sufrir con los bordes y los píxeles mixtos.
Celdas Raster – Georreferenciación
Los datos raster se georreferencian especificando el sistema coordenado al cual está registrado, la posición en el mundo real del punto de referencia y el tamaño de la celda en distancias del mundo real. Generalmente se usa como punto de referencia la esquina superior izquierda o inferior izquierda de la malla. Esta posición del punto de referencia, junto con el tamaño de la celda, se usan para determinar la posición geográfica de cualquier celda dentro del conjunto de celdas del archivo raster.
¿Cómo el modelo raster representa las relaciones espaciales?
Dado que el modelo raster es una malla regular, las relaciones espaciales son implícitas. Por lo tanto, no se requiere el almacenamiento explícito de las relaciones espaciales como sí lo es en el modelo vectorial.
¿Cómo el modelo raster representa las superficies?
Para la representación de superficies, el valor de superficie (por ejemplo altura) se registra para cada celda. Este valor representa solo el punto central de la celda más que la celda entera. Este conjunto de puntos centrales de un grid se denomina lattice. El lattice proporciona cálculos de superficie muy exactos. Los tipos de cálculo de superficies usados en el análisis incluyen: pendiente (la cantidad de cambio en el valor en relación con la distancia), aspecto (dirección de la pendiente en cada punto).
Modelos Raster no rectangulares
En teoría, el plano puede estar cubierto por triángulos o hexágonos. En la práctica, sin embargo, se puede hacer muy poco uso de estas opciones:
- Son muy raras y dificultan el trabajo.
- Su geometría y topología son más complejas.
- Su enumeración e indexación es más compleja.
- Muchos aspectos de los sistemas digitales ya son rectangulares.
- El despliegue de imágenes consiste en celdas rectangulares.
- Los satélites de sensoramiento remoto usan arreglos rectangulares.
- La agregación no es simple.
- Los hexágonos no se agrupan naturalmente para formar hexágonos más grandes.
Almacenamiento de la información
Generalmente, los datos raster requieren menos procesamiento que los datos vectoriales, pero consumen más espacio de almacenamiento. Los datos se guardan generalmente en dos secciones:
- El número de la celda y el valor numérico de la celda.
- Una tabla de atributos que asigna atributos (características) del mundo real a cada uno de los valores numéricos.
Un número de línea y otro de columna definen la posición de la celda en los datos raster. Los datos se guardan entonces en una tabla donde se asigna el valor de atributo a cada celda. Por convención, los datos raster se guardan normalmente filas tras fila desde la esquina superior izquierda. Este es el orden de lectura Americano/Europeo. Es también el orden en que el escáner en un televisor lee las imágenes. Ejemplo: La imagen A A A A A B B B A A B B A A A B podría almacenarse en 16 posiciones de memoria, una para cada píxel, en la secuencia: A A A A A B B B A A B B A A A B.
¿Qué tipo de información almacenan los datos raster en cada píxel?
Algunos permiten solo enteros, en un rango fijo, por ejemplo. -127 a +127 (1 byte por píxel) o -32767 a +32767 (2 bytes por píxel). Otros permiten números enteros y reales (decimales) y mezclas de caracteres alfabéticos y números en cada píxel. En este caso es muy útil si el sistema tiene una herramienta para el registro del tipo de datos que almacena en cada capa y evita que el usuario realice análisis equivocados sobre los datos. Por ejemplo:
- Los datos de vegetación se registran como una clase en cada píxel.
- Los datos de elevación se registran como un número decimal (por ejemplo: 100 m).
Tipos de Datos Raster
- Ascii: se almacena como conjuntos de enteros o caracteres de punto flotante. Simple, leído por casi cualquier software pero ineficiente.
- Binario: almacenado en formato binario. No es tan transportable pero es muy eficiente. Los valores se pueden guardar como enteros o datos de punto flotante.
- Imágenes: Formato crudo de la imagen (raster). Datos binarios básicos organizados en arreglos, una fila por línea. Cada píxel es generalmente un byte (0-255), 0 es negro, 255 es blanco. Las imágenes pueden tener una o más bandas. Las bandas generalmente representan brillo en rangos de colores diferentes. Las imágenes a color verdadero tienen bandas roja, verde y azul. Otras pueden tener 7, 14, 225 bandas. El archivo de encabezamiento (header file) proporciona información muy importante acerca del tamaño y el sistema de Georreferenciación. Filas, columnas, bandas, coordenadas esquina superior izq., tamaño del píxel, proyección, etc.
Tipos de formatos de imágenes
- Archivos binarios (para bandas a, b y c):
- BIP (band interleaved by pixel).
- BIL (band interleaved by line).
- BSQ (band sequential).
- Formatos de imagen propietarios:
- Tiff.
- GIF.
- JPEG.
- Windows metafiles.
La mayoría de programas leen archivos binarios.
Compresión de datos raster
El formato raster puede verse como una manera muy ineficiente de representación de la variación geográfica. Cada píxel debe tener un valor asignado aun si no representa nada o si su contenido es idéntico al de sus vecinos. Para representar mejor los detalles se necesita usar píxeles muy pequeños. Se han realizado grandes esfuerzos para encontrar una manera eficiente de comprimir los datos raster. Maneras de almacenar la misma cantidad de información en espacios más pequeños. Todos los píxeles del grid tienen un valor, los archivos raster son casi siempre muy grandes. Cuando grandes secciones del archivo tienen el mismo valor, entonces existen muchos datos redundantes. Existen muchos tipos diferentes de compresión de datos, usados para limitar esta desventaja:
- Codificación exhaustiva o de longitud total.
- Codificación Run length (cadenas de longitud variable).
- Codificación Punto de Valor.
- Árboles Cuaternarios (Quadtrees).
Codificación de longitud total (exhaustiva)
Codificación de longitud total: Almacena todos y cada uno de los valores de los píxeles de manera individual.
Codificación *Run length*
Compresión de datos: este es el método usado para ahorrar espacio de almacenamiento, reduciendo una fila de píxeles del mismo valor a una simple unidad que tiene un valor y cantidad específica. No se almacena cada celda de la matriz. Cada componente almacena un valor y un conteo de los píxeles con ese valor. Si los píxeles en la fila tienen valores diferentes, entonces el espacio de almacenamiento se duplica, pero si hay 3 o más iguales en una fila entonces ahorra espacio. El archivo raster se ordena fila por fila comenzando en la esquina inferior izquierda. En vez de una lista de 56 valores comenzando 4,4,4,2,2,2… Crea pares de valores, el primer valor en cada par es el run length y el segundo el valor del píxel. La primera fila pasa a ser (3,4), (4,2), (1,3) – hay 26 pares. Esto se reduce si un run puede extenderse desde el final de una fila hasta el principio de otra (pero no en este caso). En este caso la compresión no es muy buena: 56 valores reemplazados por 26 pares. Pero en muchos casos si es, especialmente si el tamaño del píxel es pequeño relacionado al nivel de detalle en los datos. Si se reduce la dimensión de los píxeles a la mitad, resultan cuatro veces más píxeles.
Estructura de Datos Raster: *Representación por Árboles Cuaternarios*
Implica la compresión aplicada a filas y columnas. Lados del cuadrado del grid divididos en una base recursiva. Longitud disminuye a la mitad, # de áreas aumenta por cuatro, área disminuye ¼. Combina (por ejem. promedio) los cuatro valores de las celdas y almacena todas las capas. Aunque el almacenamiento aumenta, ahorra costos de procesamiento si algunas operaciones no requieren alta resolución. Para datos binarios o nominales puede ahorrar almacenamiento usando máxima representación de bloques. Todos los bloques con el mismo valor a cualquier nivel en el árbol se pueden almacenar como un valor simple.
Técnicas de Compresión Raster
La compresión ahorra espacio, pero requiere tiempo para guardar y extraer información. El éxito de la compresión varía con diferentes tipos de datos. Funciona mejor en datos con baja variabilidad espacial y limitados posibles valores. No es eficiente en datos con alta variabilidad espacial o superficies continuas. Así, la compresión puede en realidad aumentar el espacio de almacenamiento o el tiempo de acceso con algunos tipos de datos.
¿Por qué usar raster?
Una fortaleza del SIG raster es su habilidad para representar cambios continuos o ambientales. Esto no puede hacerse con un SIG vectorial. Los datos raster se pueden usar para representar cambios temporales, tales como en el uso del suelo. El formato raster se puede usar para monitorear cambios o “flujos” ambientales:
- Fuego – intensidad, frecuencia, ocurrencia y extensión.
- Distribución superficial del agua – ocurrencia, extensión, profundidad de los cuerpos de agua en inundaciones o sistemas de drenaje.
- Biomasa – mediciones de la masa vegetal relativa y la productividad primaria en relación con el impacto local debido a la conversión de bosques en pastos, cambio estacional o tendencias climáticas de periodo largo.
Una de las mayores ventajas del sistema raster es que los datos son un mapa en la memoria del computador. Una operación tal como la comparación de un píxel con sus vecinos, se puede realizar analizando todos los valores en la próxima o anterior fila y columna del píxel en cuestión. Sin embargo, el formato raster no es muy bueno representando líneas o puntos, ya que cada uno hace parte de un conjunto de píxeles en el grid. Las líneas se desconectan o se vuelven muy anchas si cruzan la malla a ángulos particulares.
¿Cuándo usar el formato raster?
Los archivos raster se usan más frecuentemente:
- Para representaciones digitales de fotografías aéreas, imágenes de satélite, mapas en papel escaneados y otras aplicaciones con imágenes muy detalladas.
- Cuando el mapa no requiere el análisis de detalles individuales.
Formatos de Datos Raster
Ciertos tipos de datos siempre vienen en formato raster:
- Modelos digitales de elevación.
- Imágenes de sensores remotos.
Para otros tipos de datos, el uso de la representación raster no tiene sentido. Por ejemplo, nunca use un raster para representar una red de aguas servidas, si la aplicación requiere exactitud de las conexiones. Código 1 en píxeles donde una toma está presente, 0 si no. Si dos celdas adyacentes tienen valor 1, esto no garantiza que las tomas que contienen están conectadas. Nunca use un raster para representar parcelas. Por definición, el límite entre dos puntos de medición es una línea recta. La apariencia con picos de la representación raster es inaceptable para este propósito. Los formatos raster han experimentado un auge en su uso, especialmente desde la aparición del networking (trabajo en redes), ya que muchas de estas aplicaciones tienen los mismos formatos que se usan para almacenar imágenes digitales y fotografías. Los formatos de imagen son fáciles de crear, y en consecuencia existen muchos. Algunos de estos formatos se han optimizado para pasar las imágenes a través de las redes, y estos formatos son ahora los más comunes.
- Tagged interchange format (TIF), el cual usa run length y otros esquemas de compresión de la imagen y tiene varias formas diferentes que están disponibles (por ejemplo GeoTIFF).
- Band Interleaved by Line (BIL).
- Band Interleaved by Pixel (BIP).
- Band Sequential (BSQ). BIL, BIP y BSQ son formatos producidos por los sistemas de sensoramiento remoto. La diferencia primaria entre ellos es la técnica usada para guardar los valores de brillo capturados simultáneamente en cada uno de los diferentes colores o bandas espectrales.
- Modelo digital de elevación (MDE). El MDE es un formato raster que se usa para registrar información de elevación o altura. A diferencia de otros formatos de archivos raster, los píxeles del MDE no representan valores de brillo sino alturas de puntos sobre la superficie terrestre.
- PC Paintbrush Exchange (PCX). PCX es un formato raster producido por la mayoría de escáneres y programas de dibujo para PC.
- Spatial Data Transfer Standard (SDTS). SDTS es un formato de propósito general diseñado para la transferencia de información geográfica. Formatos de imagen GIF, TIFF, JPG, etc.
Aplicaciones del formato raster
- Modelado de los ecosistemas.
- Modelado del terreno.
- Análisis de disponibilidad del suelo (especialmente cuando las variables son del tipo intervalo o de razón como la precipitación o la pendiente).
- Modelado del clima.
- Superficies climatológicas.
- Efectos del incremento en la temperatura o el dióxido de carbono.
- Modelado del aumento del nivel del mar.
- El despliegue de imágenes en una PC es un raster.
- La cámara digital usa formato raster.
- Las imágenes en Internet son raster.
Fuentes de datos raster
- Conversión desde datos vectoriales (rasterización). Casi siempre implica pérdida de resolución y precisión.
- Escaneo de mapas. Usualmente requiere algún procesamiento para asignar categorías. Especialmente problemático con imágenes de color debido a pequeñas variaciones del color en el mapa.
- Importar datos en formato raster. MDE. Datos de otros programas tales como GRASS, ERDAS, IDRISI, ERMapper, ENVI.
- Importar imágenes de otros formatos. Incluye fotografías aéreas, imágenes de satélite, datos de sensoramiento remoto.
Ventajas
- Es un modelo eficiente y conceptualmente simple.
- El procesamiento y los algoritmos de análisis son robustos.
- Alturas e imágenes de satélite son fuentes de datos muy útiles y abundantes para el análisis ambiental.
- La posición geográfica de cada píxel está implícita en su posición en la matriz de celdas. En consecuencia, no se almacenan coordenadas geográficas con excepción de la esquina superior izquierda, por ejemplo.
- Debido a la naturaleza de la técnica para el almacenamiento de datos, los análisis son generalmente fáciles y rápidos.
- La naturaleza inherente de los mapas raster, como la producción de capas de un atributo, se adapta idealmente al modelado matemático y al análisis cuantitativo.
- Los datos discretos, por ejemplo los rodales, se ajustan muy bien a los datos continuos, por ejemplo datos de elevación, y se facilita la integración de los dos tipos de datos.
Desventajas
- Estructura de datos rígida.
- Los datos originales no se mantienen cuando se interpolan a un grid espacialmente regulado.
- Los detalles lineales no están bien representados.
- El tamaño de la celda determina la resolución a la que los datos están representados.
- Es muy difícil representar detalles lineales, teniendo en cuenta el tamaño de la celda. Así, es difícil establecer la vinculación de redes.
- El procesamiento de datos de atributos puede ser engorrosa si existen muchos datos. Los mapas raster reflejan inherentemente solo un atributo o característica del área.
- Dado que la mayoría de los datos de entrada están en formato vectorial, se debe hacer una conversión vector-raster. Además del incremento en los requerimientos de procesamiento, esto puede introducir problemas de integridad de los datos debido a la generalización y escogencia de un tamaño de píxel inadecuado.