Fundamentos de la Compresión de Vídeo y Estándares MPEG
Secuencia de Procesamiento de Imágenes
- Secuencia Original (Or.) -> Separación de imágenes -> Nueva imagen -> Estimación de movimiento (imagen (n-r)) -> Actualización de imagen de referencia – Imagen Descompuesta.
| | |
Transformación – Cuantificación – Reconstrucción – Transformación Inversa | Imagen de predicción |
| MEMORIA |
Estimación de Movimiento en Televisión Digital (TDV)
La estimación de movimiento es uno de los principales problemas en TDV, ya que es una fuente de variaciones temporales. Si se conocen los movimientos 3D, se puede predecir el movimiento en el plano 2D.
Métodos de Estimación de Movimiento
- Ajuste de Bloques: Simple y con buenos resultados. Busca el bloque en la imagen actual que más se parece a un bloque en la imagen de referencia. Asume desplazamiento, lo que simplifica el proceso, aunque la realidad puede ser más compleja.
- Recursivos de píxel.
- Correlación de fases.
- Basados en modelos paramétricos.
- Estocásticos.
- Flujo óptico.
Ajuste de Bloques: Detalles y Consideraciones
Objetivo: Reducir el error de predicción. Se trabaja por bloques y con imágenes de referencia reconstruidas. Se utiliza en estándares MPEG 1/2/4.
Problema: Dificultad para manejar rotaciones y zooms.
- Bloques NxN: Se utilizan funciones para el área de búsqueda, la búsqueda en sí y el vector de movimiento.
- Tamaño de bloque:
- Pequeño: Menor error de predicción.
- Grande: Más rápido.
- Tamaño del área de búsqueda:
- Pequeño: Mayor velocidad, soluciones rápidas.
- Grande: Mayor facilidad para encontrar el mejor bloque.
- Precisión de cálculo: ½ o ¼ de píxel. Implica interpolaciones, mayor fiabilidad a costa de mayor cómputo.
Criterio de selección: Minimizar una función de coste.
Tipos de Búsqueda
- Exhaustiva: Más precisa, pero su coste depende del área. Cada píxel implica tres operaciones: diferencia, MSE o MAE, y suma.
- Rápida: Reduce el coste en al menos un orden, pero puede resultar en un óptimo local en lugar de global.
- Logarítmica: Reduce los orígenes de búsqueda. Ejemplos: DMD, TSS, OTS, Hexagonal, Diamante.
- TSS: Utiliza la función de coste MAE.
Métodos de Compensación y Sistemas de Contención
Los métodos de compensación más avanzados, que intentan modelar movimientos diferentes a la traslación, son más costosos.
Los sistemas de contención adaptan la velocidad de transmisión (que es fija para cada canal) controlando la etapa de cuantificación.
Errores de Transmisión
Se consideran los errores de transmisión entre el codificador (COD) y el decodificador (DESCOD). A partir del error, se actúa en cada lado para generar predicciones.
Tipos de Vídeo
- Vídeo en componentes: Tres componentes de color por separado.
- Analógico: RGB o YUV.
- Digital: RGB o YCrCb.
- Vídeo compuesto: RGB -> YUV.
- S-video: Y (luminancia) y C (crominancia).
Desde una cámara, la señal puede ser:
- Analógica: PAL, NTSC, SECAM (TV).
- Digital: Vídeo digital BT601 y compresión de vídeo (MPEG-X).
BT601
Conversión A/D: Muestreo, cuantificación uniforme y codificación binaria natural.
Conversión D/A: Decodificación, reconstrucción e interpolación.
Para vídeo compuesto, no ofrece ventajas. Para RGB, la velocidad binaria es excesiva. La luminancia se utiliza para compatibilidad (NTSC tiene más líneas que PAL).
Esquemas de muestreo: Estáticos y cosituados.
Posibilidades de codificación de componentes: R, G, B e Y, Cr, Cb.
La cuantificación a 8 bits es uniforme. La luminancia se reduce a 220 niveles, y las diferencias de color ocupan 225 niveles, siendo 128 el valor 0.
Existen estándares de jure o de facto (híbridos). Estructura GOPS (Group of Pictures).
Estándares MPEG
MPEG-1
Codificación de audio y vídeo hasta 1,5 Mb/s (CD, CD-ROM). Separación en macrobloques (MB) y bloques (bs), predicción, DCT, cuantificación mediante matriz de visibilidad, recorrido en zigzag, VLC. Resolución SIF.
Diferencias con H.261: Añade predicción bidireccional, GOPs flexibles, estimación de movimiento, matriz de visibilidad y restricción de algunos parámetros.
MPEG-2
Codificación genérica de audio y vídeo con calidad de distribución para TV digital y DVDs. Mismo esquema que MPEG-1, pero más flexible y complejo. Formatos de entrada: 4:2:0, 4:2:2, 4:4:4. Vídeo progresivo (a diferencia de MPEG-1). Cuantificación de 11 bits.
A partir de aquí, surgen diversas aplicaciones, creando subconjuntos de productos orientados a aplicaciones específicas y acordes al mercado.
- Perfil: Complejidad a nivel de herramienta.
- Nivel: A nivel de prestaciones.
MPEG-4
Codificación de objetos audiovisuales naturales y sintéticos. Codificación de vídeo basada en objetos.
Comparado con MPEG-2:
- Mayor complejidad: Más tipos de predicción, más codificación en la transformada, más codificación estadística.
- Mayor eficiencia: SD (20-30% más), HD (40-60% más).
MPEG-AVC (H.264)
No basado en objetos. Utilizado en Blu-ray y HD.
Características:
- Hasta 15 frames de referencia.
- Macrobloques (MB) de 16×16 y 16×8.
- Precisión de píxel de ½.
- Filtro de deblocking integrado.
- VLC (Huffman).
- El filtro de deblocking elimina los píxeles cuadrados (efecto de bloque).
- Tamaño de MB variable.
MPEG-H HEVC (H.265)
En desarrollo (estándar internacional en 2013). Reduce la tasa de bits en un 50% en comparación con AVC. Mayor complejidad, dependiente del hardware. Aspectos de AVC más avanzados: deblocking, macrobloques de 64×64.
MPEG-7
Contenido multimedia para material AV de búsqueda, filtros y acceso.