Calidad de Video en Redes IP: Factores, Degradación y Estimación
La transmisión de video y multimedia sobre redes de datos, particularmente redes IP, presenta desafíos específicos en relación con la calidad percibida por los usuarios (QoE, Quality of Experience). Diversos tipos de degradaciones pueden afectar a las señales de video transmitidas sobre redes de paquetes. El estudio en esta área es todavía un tema de investigación activo.
A continuación, se analizarán los factores que influyen en la calidad de video percibida y los métodos aceptados para medirla, tanto de forma subjetiva como objetiva.
Factores que Afectan la Calidad del Video sobre Redes de Paquetes
La transmisión de video sobre redes de paquetes, y en particular sobre Internet, presenta diferencias fundamentales en comparación con la difusión de televisión tradicional (radiofrecuencia, TV por cable). En las redes IP se utilizan anchos de banda variables, existe congestión y pérdida de paquetes, y, típicamente en aplicaciones corporativas, la visualización se realiza a distancias más cortas y en pantallas más pequeñas.
Esta sección describe conceptualmente los factores específicos de las redes IP que impactan la calidad del video.
Factor de Compresión
El proceso de digitalización de video emplea técnicas que transforman una secuencia de píxeles al dominio de la frecuencia espacial mediante la Transformada Coseno Discreta (DCT). Este proceso cuantifica valores, descarta componentes de alta frecuencia y utiliza técnicas de predicción y compensación de movimiento. Esto introduce «ruido de cuantificación», que puede degradar la imagen original hasta niveles perceptibles. Este «ruido de cuantificación» es el responsable de las degradaciones típicas observadas en imágenes y videos con alta compresión, incluyendo el conocido «efecto de bloques», que hace que la imagen aparezca como un conjunto de bloques pequeños.
Los algoritmos de compresión utilizados en la codificación digital de video introducen varios tipos de degradaciones, clasificables según sus características principales. Esta clasificación es útil para comprender las causas de las degradaciones y su impacto en la calidad percibida.
Dado el gran ancho de banda requerido para transmitir video sin comprimir, el uso de códecs con compresión es extremadamente común. Esto impone un límite a la calidad de la imagen recibida, independientemente del medio de transmisión.
Las principales degradaciones introducidas por la compresión son:
- Efecto de bloques (Blocking): Aparición de estructuras cuadradas en la imagen.
- Efecto de imagen de base (Basis Image): Componentes de la transformada DCT se hacen visibles.
- Borrosidad o falta de definición (Blurring): Pérdida de nitidez en la imagen.
- Color bleeding (Corrimiento del color): Los colores se extienden más allá de sus bordes.
- Efecto escalera y Ringing: Aparición de artefactos alrededor de bordes afilados.
- Patrones de mosaicos (Mosaic Patterns): Similares al efecto de bloques, pero con patrones más complejos.
- Contornos y bordes falsos: Aparición de bordes donde no deberían existir.
- Errores de Compensaciones de Movimiento (MC mismatch): Errores en la predicción del movimiento entre cuadros.
- Efecto mosquito: Ruido alrededor de bordes y áreas de alto contraste.
- Fluctuaciones en áreas estacionarias: Variaciones en áreas que deberían ser constantes.
- Errores de crominancia: Distorsiones en la información de color.
Pérdida de Paquetes
La pérdida de paquetes en las redes IP afecta significativamente la calidad percibida del video. La pérdida de un solo paquete puede propagarse, afectando no solo la información de video contenida en ese paquete, sino también a otras partes del mismo cuadro o incluso a cuadros diferentes. Dado que la codificación se realiza de forma diferencial (es decir, se codifican las diferencias entre cuadros), la pérdida de un paquete afectará típicamente a todos los bloques siguientes en la misma fila («slice»). Si el paquete perdido corresponde a un cuadro de referencia (cuadro I), también se verán afectados los cuadros predictivos (cuadros P y B) posteriores o anteriores, propagando el error en el tiempo.
Existen técnicas de ocultación de errores (Error Concealment) que intentan reconstruir la información perdida basándose en la información disponible. Por ejemplo, reemplazando los píxeles perdidos por los valores de cuadros anteriores o interpolando valores de píxeles adyacentes.
Se han realizado numerosos estudios sobre cómo la pérdida de paquetes afecta la calidad del video. Algunos proponen estimar el Error Cuadrático Medio (MSE) del video, considerando la pérdida de paquetes. Sin embargo, estos estimadores no se corresponden directamente con la calidad perceptual, ya que se basan en la predicción del MSE o la Relación Señal a Ruido Pico (PSNR), que no tienen una relación lineal directa con la Puntuación Media de Opinión (MOS), una medida subjetiva de la calidad.
Dado que las pérdidas de paquetes suelen ocurrir en ráfagas, la calidad puede degradarse considerablemente por la pérdida de varios paquetes consecutivos. Se han propuesto técnicas para mitigar este efecto, como la presentada en [45], que consiste en reorganizar los cuadros antes de enviarlos, creando un búfer en el codificador y difundiendo los paquetes perdidos entre varios cuadros separados en el tiempo. Sin embargo, el tema sigue siendo un área de investigación activa, sin estándares definitivos ni comparaciones sistemáticas de los diferentes modelos.
Demora y Jitter
El receptor debe recibir los paquetes a decodificar a intervalos constantes para regenerar adecuadamente la señal original. Dado que el jitter (variación en el retardo de llegada de los paquetes) es inevitable en las redes de paquetes, los receptores utilizan un búfer de entrada para suavizar el efecto de estas variaciones. Este búfer recibe los paquetes a intervalos variables y los entrega al decodificador a intervalos constantes.
Este búfer introduce una demora adicional al sistema, ya que debe retener paquetes para poder entregarlos a un ritmo constante. Cuanto mayor sea el jitter, mayor deberá ser el búfer y, por lo tanto, mayor será la demora introducida. Las demoras son indeseables y afectan directamente la experiencia del usuario, especialmente en contenidos en tiempo real (como la transmisión de eventos deportivos) y en aplicaciones conversacionales (videotelefonía, videoconferencias). Es crucial disponer de mecanismos que minimicen el tamaño de los búferes de jitter sin comprometer la calidad debido a la pérdida de paquetes que no llegan a tiempo.
Se han propuesto métodos dinámicos, como el AMP (Adaptive Media Playout), que ajustan la velocidad de reproducción del medio (video/audio) según las condiciones del canal de transmisión, reduciendo así el tamaño del búfer de jitter. Se ha demostrado que aumentar o disminuir la velocidad de ciertas partes del contenido hasta en un 25% es subjetivamente mejor que aumentar las demoras totales o tener interrupciones.
El proyecto Multimedia del VQEG (Video Quality Experts Group) propone realizar pruebas con demoras de entre 2 milisegundos y 5 segundos, y pérdidas de paquetes impulsivas en el rango de 0 a 50%.
Estimación de la Calidad de Video sobre Redes de Paquetes: ITU-T G.1070
La Unión Internacional de Telecomunicaciones (ITU-T) ha publicado un modelo de predicción de la calidad de video para aplicaciones de videotelefonía, basado en parámetros medibles de una red IP. Este modelo, conocido como ITU-T G.1070, es similar al E-Model utilizado para la evaluación de la calidad de audio. El G.1070 proporciona una estimación objetiva de la calidad de video, considerando los efectos combinados de la compresión, la pérdida de paquetes y el retardo.