Introducción al MPEG2

¿QUÉ ES MPEG-2?

¿Qué es MPEG? MPEG (Moving Picture Experts Group) es un estándar de compresión de audio, video y datos establecido por la Unión Internacional de Telecomunicaciones. Originariamente había 4 tipos diferentes MPEG-1, 2 ,3 y 4 que se diferencian en la calidad y ancho de banda utilizado.

Ofrece tres ventajas : compatibilidad mundial, gran compresión y poca degradación de la imagen. El estándar no especifica cómo se debe hacer la compresión. Los diferentes fabricantes luchan para determinar el mejor algoritmo, manteniendo siempre la compatibilidad.

Está pensado de manera que la descompresión sea relativamente sencilla y barata. Sin embargo, la compresión es realmente compleja y , hasta hace poco, cara.

Un cadena MPEG se compone de tres capas: audio, video y una capa a nivel de sistema. Esta última incluye información sobre sincronización, tiempo, calidad , etc.

MPEG-1

Establecido en 1991, se diseñó para introducir video en un CD-ROM. Por aquel entonces eran lentos, por lo que la velocidad de transferencia quedaba limitada a 1.5 Mbits y la resolución a 352 x 240. La calidad es similar al VHS. Se utiliza para videoconferencias, el CD-i, etc. Si es usado a mayor velocidad, es capaz de dar más calidad.

MPEG-2

Establecido en 1994 para cubrir una serie muy amplia de necesidades, desde ëcalidad VHSí hasta HDTV (hight definition TV), mediante diferentes perfiles de algoritmos y niveles de resolución de imágenes. Con velocidades de transferencia de datos entre 1,2 y 15 Mbits/seg., hay un interés muy grande en el uso de MPEG-2 para la transmisión digital de señales de televisión, incluyendo HDTV, aplicación para la que se concibió el sistema. La codificación de video es muy compleja, sobretodo porque es preciso que el sistema de descodificación en la recepción sea lo más simple, y por lo tanto, barato posible.

La compresión MPEG puede ofrecer imágenes de mejor calidad para relaciones elevadas de compresión que la JPEG pura, pero con la complejidad de la descodificación y en particular de la codificación y los grupos de imágenes de 12 fotogramas (GOP). No resulta un sistema de compresión ideal para la edición; si se utiliza algún cuadro P o B, entonces incluso un corte requerirá volver a utilizar codificación MPEG compleja (e imperfecta).

De los cinco perfiles y cuatro niveles que generan un conjunto de 20 combinaciones posibles, 11 ya han sido implementadas. Las variaciones que esto define son tantas que no sería práctico construir un codificador o decodificador universal. Actualmente el interés se centra en el "perfil principal" (Main profile), "nivel principal" (Main level), algunas veces designado como MP@ML, que cubre formatos de televisión broadcast de hasta 720 pixels x 576 líneas a 30 fotogramas/seg. Estas cifras se consideran máximas, así que también incluye 720 x 486 a 30 fotogramas y 720 x 576 a 25 fotogramas. Dado que el propósito de la codificación es la transmisión, se utiliza el muestreo 4:2:0, que resulta más económico.

Una reciente adición al MPEG-2 es su versión de estudio. Diseñado para el trabajo en estudio, su muestreo es 4:2:2. La configuración de estudio se denomina 422P@ML. Para mejorar la calidad de la imagen se utilizan velocidades de transferencia más altas. Las primeras aplicaciones para esto parecen ser en el campo de la producción electrónica de noticias (ENG), y en algunos servidores de video.

MPEG-3

Fue una propuesta de estándar para la TV de alta resolución, pero como se ha demostrado que MPEG-2 con mayor ancho de banda cumple con este cometido, se ha abandonado.

MPEG-4

Está en discusión. Se trata de un formato de muy bajo ancho de banda y resolución de 176 x 144, pensado para videoconferencias sobre internet, etc.

MPEG-7

El estándar de representación para la búsqueda de información en los entornos multimedia, sistemas de filtrado y proceso de datos (será aprobado en julio 2001).

JPEG

Joint Photographic Experts Group . Como su nombre indica es un sistema de compresión de fotografías. Muchos de los sistemas de compresión de video, tal como el M-JPEG ( motion JPEG ) Cinepak e Indeo, se basan en él. Consideran el video como una sucesión de fotografías. MPEG introduce la noción de movimiento de una manera mucho más compleja y agresiva que el M-JPEG.

MPEG-2

Bueno, vamos con él. La compresión intraframe ( no voy a traducir esta palabra ) trata cada fotograma como una foto independiente, mientras que la interframe , usada por MPEG, crea fotogramas de referencia para luego comparar los anteriores o posteriores con él. Sólo las diferencias son almacenadas. Por tanto el codec no tiene que almacenar cada fotograma, sino lo distintivo con el anterior.

En MPEG se distinguen tres tipos de fotogramas : I o intraframes, P o foto predecida y B o frames bidirecionales. Las I son los únicos fotogramas completos en una cadena MPEG. Contienen pues una información completa, lo que las convierte en posibles puntos de acceso aleatorio. La P es un frame basado en uno anterior pero conteniendo sólo las diferencias. Están

muy comprimidos. Las B se refieren tanto a una anterior como a una futura y son las que menos ocupan. Nunca se usan como referencia para otras.

Las técnicas de compresión son dos : Compensación de movimientos ( Motion Compensation ) y redundancia espacial. La primera determina cómo los frames P o B se relacionan con los fotogramas de referencias. El primer paso es dividir cada imagen en bloques de 16 x 16 pixels que se comparan con bloques equivalentes en otro fotograma. Si son similares se obtiene una buena compresión. Si se detecta movimiento en el bloque se almacena un "vector de movimiento".

El otro método, redundancia espacial, comprime aún más describiendo las diferencias entre bloques. Usando un proceso matemático llamado Discrete Cosine Transform ( DCT ), los macrobloques son divididos aún más en bloques de 8 x 8 que hacen un seguimiento de los cambios de color y brillo en el tiempo.

Se denomina GOP a la mínima cadena MPEG completamente decodificable por sí sola. Por tanto debe tener un frame I y sus referenciadas P o B. Este concepto es importante en el campo de la edición.

A la hora de codificar algo en formato MPEG-2 hay que mantener o utilizar originales de la máxima calidad. MPEG-2 no se lleva nada bien con vídeos o películas degradados y con ruido. Todo el mecanismo de predicción y compresión se vuelve loco. Incluso vídeos calidad S-VHS contienen suficiente ruido como para perturbar al codificador MPEG. Dado que el codificador está continuamente buscando cambios entre imágenes, verá un ligero ruido como un cambio, generando los correspondientes vectores de movimiento. Como dicen en la industria del MEPG : basura de entrada = megabasura de salida. Es importante usar filtros de entrada para mejorar fuentes ruidosas. A menudo, estos filtros son mucho más caros que el propio codificador MPEG. Si se dispone de fuentes digitales es mejor no pasarlas a cinta analógica, sino transcodificar directamente. De ahí la importancia de la salida Firewire de las cámaras DV.

Es importante también hacer una codificación de prueba de las escenas más difíciles de la película ( las de mayores cambios o acción ). Si los resultados no son buenos, se puede "suavizar" la fuente a expensas de perder un poco de detalle.

No todas las películas DVD están igual de bien codificadas. Existen en la red páginas dedicadas a valorar la calidad técnica de los títulos que van saliendo. Ha habido casos en que han tenido que volver a editar la película por la baja calidad del primer master.

Codificadores MPEG por software

Se puede realizar codificación MPEG-2 sin ningún hardware especial. Existen numerosos programas que lo hacen. Eso sí, se necesita un ordenador lo más potente posible. Se supone que el video ha sido digitalizado previamente ( quizás utilizando un sistema de captura M-JPEG). De los programas existente son cuatro los más conocidos. El más establecido es el de Xing Technology. Los otros tres son de Ulead Systems, CeQuadrant y Heuris Pulitzer. Dependiendo de la calidad de la fuente, son capaces de producir vídeos MPEG-2 que no tienen nada que envidiar a los realizados con un sistema hardware. El inconveniente es que no trabajan precisamente en "tiempo real". Pueden tardar 30 minutos en codificar 1 minuto de video. A la hora de elegir uno de ellos hay que pensar en si tienen filtros para reducir el ruido de las fuentes, si tienen un sistema flexible para controlar la velocidad de transferencia y elegir resoluciones, si soportan distintos tipos de gráficos, si soportan "telecine" , si se pueden controlar los puntos de inserción de frames I, etc. En general, el sistema de Heuris es el más potente y flexible costando unos 2000 $.

Codificadores MPEG por harware

Hay bastantes compañías que proporcionan sistemas de codificación MPEG-2. Hasta ahora eran sistemas profesionales con precios imposibles para nosotros. Pero las cosas están cambiando. Gracias a los nuevos chips sets de IBM, Sigma y sobre todo, C-Cube Microsystems, se beneficien de ellos. Los precios van a ser mucho más razonables en breve (menos de 50.000 ptas). Las mayores diferencias las vamos a encontrar en la parte analógica, es decir, la calidad de la conversión A/D y la cantidad de entradas y su tipo. Los sistemas domésticos dispondrán de entradas de video compuesto, S-vídeo y , quizás Firewire. Los profesionales deben añadir entradas balanceadas, video digital D-1 y toda una parafernalia de control en tiempo real. Para añadir algo más, nombrar los principales fabricantes de sistemas profesionales : Optibase, FutureTel, Minerva Systems, Sony y Philips. Los precios empiezan en los 20.000 $.

Los sistemas de codificación en tiempo real utilizados por las cadenas comerciales son el tope de la gama. Deben acomodar en un ancho de banda determinado (el que hayan contratado con la compañía explotadora del satélite, que suele ser de 34 Mbits), todos los canales que ofrecen la máxima calidad en cada momento. En tiempo real analizan los contenidos de los programas y la calidad real que se está obteniendo. En función de ello asignan dinámicamente un ancho de banda a las distintas cadenas. Por ejemplo, está claro que un partido de futbol necesita mayor ancho de banda que un programa de entrevistas con imágenes poco cambiantes.

Descodificadores MPEG por software

La descodificación es bastante más sencilla por lo que un Pentium/K6 300 la puede llevar a cabo sin problemas. Los programas más conocidos vienen de la mano de Xing T., Mediamatics, C-Cube , CompCore y Quadrant. Quizás la mejor solución sea un sistema "balanceado" en el que se tenga una cierta ayuda del hardware para realizar la descompresión. En este sentido, los principales fabricantes de chips aceleradores de video, empiezan a ofertar sus productos con el "motion compensation" implementado en hardware. La fase más compleja en la descodificación MPEG es precisamente la relacionada con el motion compensation. (digamos que es la expansión de los vectores de movimiento del formato MPEG). Tarjetas/Chips como el Savage 3D de S3 y la ATI Rage Fury 128 lo soportan también el "subpicture blending" , es decir, los subtítulos y demás información adicional. Por el momento no está del todo claro si los programas descodificadores sacan partido del "motion compensation" de estas tarjetas. Ambas incluyen también salida S-vídeo y video compuesto. En www.3dgaming.com/fps hay una buena comparativa de tarjetas preparadas para DVD. La conclusión es que la calidad de imagen obtenida a través de la salida de video compuesto o S-video no tiene nada que envidiar a la de un DVD doméstico. Un lector DVD-ROM se encuentra en las 20.000 ptas y una tarjeta basada en S3 Savage, unas 10.000 pts. (La ATI es bastante más cara). Además, ambas tienen un excelente rendimiento en 3D. El sonido se decodifica por software sin mucho problema. Si se quiere disfrutar del Dolby Digital con 5 salidas, habrá que tener una tarjeta de sonido que lo soporte.

Descodificadores MPEG por harware

Existen en el mercado kits que incluyen un lector DVD y una tarjeta descodificadora. Los tenemos de Creative Labs, de Diamond Multimedia, o de Sigma Desings, etc. La tarjeta suele incluir salida de video compuesto y S-vídeo y salidas de audio ( tanto analógicas como salida digital s-pdif). Por supuesto, encontramos descodificadores en "las cajas" que instala Via Digital y Canal Satélite, así como en los lectores DVD domésticos.