matemáticas en acción: Matemáticas y Televisión Digital


Ya sabemos que existe una fuerte y estrecha relación entre las matemáticas y las telecomunicaciones. Hoy he asistido a una conferencia más dentro del ciclo del taller de matemáticas de este curso académico organizado por el Departamento de Matemáticas, Estadística y Computación de la Universidad de Cantabria, que nos ha mostrado la relación entre la televisión digital y las matemáticas. La conferencia ha sido impartida por Constantino Pérez Vega, profesor del Departamento de Ingeniería de Comunicaciones (DICOM) de la Universidad de Cantabria.

La conferencia fue bastante completa en el repaso de los sistemas y procesos que intervienen en el servicio de televisión digital, que no es más que el proceso de captación de imágenes de vídeo, su digitalización, procesado (compresión y codificación), transmisión y recepción en destino mediante un sistema de comunicación digital.

La televisión digital terrestre o TDT es un tema candente en España, que está en proceso junto con el resto de Europa en la transición entre el sistema de televisión analógica actual al digital. La difusión de programas de televisión digital se realiza mediante un sistema de comunicaciones digital que puede tener como medio el cable, la fibra óptica o las microondas. La información que se transmite por un sistema de comunicación digital consiste en series de números codificados en 0s y 1s (sistema binario) que representan fielmente (bajo ciertas condiciones) a la señal de vídeo analógica original. La serie de números procede de la conversión de las imágenes que componen el programa de televisión, de naturaleza analógica, a dichos números mediante el proceso de digitalización. Las matemáticas intervienen en todo el proceso.

El sistema de comunicación digital de la televisión digital está compuesto, a groso modo, por varios subsistemas que permiten tratar la serie numérica que representa a la señal de vídeo digitalizada para ser transmitida de forma eficiente, segura y protegida por un canal de transmisión, que usualmente es la atmósfera, que resulta ser un canal con características muy variables que provocan perturbaciones y errores que deben ser evitados a toda costa si queremos que la imagen recibida tenga una calidad adecuada.

El sistema de transmisión consiste en colocar la serie numérica en una banda de frecuencias favorable para su transporte por el canal (la menos mala), proceso que se llama modulación digital. Antes de hacer esto, se suele procesar la señal digital (serie numérica) Para su transmisión eficiente se puede comprimir identificando los componentes más importantes que definen la señal de vídeo aprovechando un conocimiento profundo del sistema de percepción humana (la visión) y eliminando la información que el ojo no ve. Esto junto con un sistema de codificación óptimo (asignando secuencias numéricas cortas a los símbolos más frecuentes, por ejemplo, cosa que se hace en la codificación de huffman)

El sistema de protección contra estos errores es la codificación de canal. Consiste en introducir la redundancia necesaria (bits extra que no forman parte de la señal de vídeo digitalizada) para poder detectar y corregir los errores en el destino. Este procedimiento tiene una fuerte base matemática. El sistema de seguridad de la señal es la criptografía. Consiste en realizar transformaciones matemáticas de las series numéricas binarias mediante funciones matemáticas. La función se puede invertir para obtener la serie original pero solamente conociendo una clave no trivial (no se puede obtener directamente del conocimiento de la función de transformación o su obtención es cara en tiempo y espacio)

Puesto que el procesado de señal, en su proceso de compresión, tiene en cuenta la forma en que el ojo humano ve las imágenes, la conferencia comenzó viendo la estructura y funcionamiento del ojo humano, que es el instrumento de captación de imágenes del sistema de visión humana. El ojo capta la radiación electromagnética a la que es sensible (la luz visible) a través de la córnea. No toda la córnea funciona para la captación. La zona sensible es la fóvea. Está compuesta por dos grupos de células sensibles a la luz: los conos y loa bastones. Las primeras son sensibles al color, en concreto, a tres colores que se denominan primarios: azul, rojo y verde. Las segundas, más sensibles que las primeras, a las variaciones de brillo o intensidad de la luz. Los bastones nos permiten ver los bordes de los objetos incluso en condiciones de poca luz.

La señal de vídeo analógica está formada, siguiendo el modelo de captación humano por dos tipos de información: la información del color (crominancia) y la información de intensidad de la luz (la luminancia) También en consonancia con el sistema de visión humana, la información de luminancia tiene mayor peso que la de crominancia. En la conferencia se trató la teoría del color y su representación mediante intensidad y saturación, los espacios de color, sistema de representación de munsell, etc.

Las gráficas de la respuesta visual humana a los colores primarios (rojo, verde y azul) muestran que cada curva se solapa con la otra formando la curva de respuesta total típica de campana. La mezcla de colores puede ser aditiva (p.e fondo negro de pantalla) y substractiva (p.e fondo blanco en impresión de documentos) Cada una tiene diferentes colores primarios, que funcionan como los vectores generadores de un espacio de color. Por eso las imágenes en pantalla no son iguales a las impresas sino se realiza un proceso de conversión adecuada de un espacio de color a otro, que permite mantener la percepción del color por parte del sistema de visión humana.

La base matemática de la representación de la señal de vídeo está relacionada con su percepción y formado por tres integrales que tienen en cuenta la intensidad de la luz y un color primario (siento no poder dar más detalles, ya que o recuerdo exactamente las expresiones matemáticas, aunque tal vez la wikipedia pueda ayudarnos …)

Los sensores que se utilizan para captar las imágenes en las cámaras (los ojos digitales) captan las imágenes como conjuntos de puntos (pixels) con un valor de intensidad y color (cantidad de color de cada uno de los colores primarios) El paso de la señal captada a una serie de números (la imagen digital) conlleva un proceso de muestreo, cuantificación y codificación. Todo el proceso está estandarizado por parte de organizaciones internacionales de estándares. Existen diferentes estándares que determinan cómo se muestrea cada uno de los tres componentes (luminancia y crominancia) que se nombran como 4:4:4, 4:2:2, 4:2:0, dando lugar a diferentes regímenes binarios.

El ponente explicó las razones por las que se pasó de un formato analógico al formato digital en las empresas de producción y difusión de programas de televisión. En primer lugar la facilidad de introducir efectos especiales (muy compleja en vídeo analógico) En segundo lugar la capacidad de hacer copias totalmente fieles de forma ilimitada y a un coste prácticamente cero. Y finalmente para facilitar el intercambio de programas entre las empresas audiovisuales, situados en diferentes regiones del mundo con diferentes sistemas (PAL, SECAM, NTSC)

A la hora de explicar los sistemas de compresión de las imágenes digitales nos habló de las transformadas que se usan en el procesamiento de imágenes: DCT, Karhunen-Loewe, hadamard, hilbertno se usa la clásica transformación de Fourier. ¿Por qué? Pues porque la serie de fourier produce números complejos. Solamente se utilizan las que producen series de números reales, que son codificables y tratables de forma eficiente por los ordenadores (tenemos que procesar menos números)

¿Por qué se hacen las transformadas? Porque implican un cambio de dominio que de alguna manera compacta la información sobre la señal. En el nuevo dominio se pueden tener series de números (coeficientes) menores de los cuales se pueden coger los que representan la esencia de la señal, descartando el resto. Cada uno de los valores representan la energía de la señal. El ponente puso una analogía de la transformación al concepto de logaritmo que de alguna manera compacta la recta real. En el caso se las señales es la energía de la señal la que se compacta en una serie de coeficientes, de los cuales los primeros son los más significativos. Las señales de vídeo analógicas se transforman en números reales que representan el valor de la señal en un punto del tiempo y luego “se cambia de dominio” para obtener otra serie de números que representan el valor de la energía de la señal en la frecuencia o el espacio.

Cuando se procesan las imágenes digitales estas se dividen en bloques. Estos bloques son matrices de números a los que se aplica la transformación y después de les aplica una multiplicación, elemento a elmento, por una “matriz perceptual” que introduce el efecto del proceso de la visión humana. Tras esto se reducen enormemente los números significativos. Tras esto se lee la matriz siguiendo un camino en zig zag y sobre la serie resultante se aplica una codificación tipo huffman asignando valores de símbolos más pequeños a los valores más abundantes.

Además de la codificación estática (JPEG) también se vio la codificación dinámica (MPEG) de las series de imágenes (frames) del vídeo. Se basa en identificar objetos dentro de la imagen y predecir el vector de movimiento del objeto en las siguientes. Se obtienen así una serie de vectores, que debidamente codificados se mandan por el canal en lugar de los frames completos.

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s