ES2328802T3

ES2328802T3 - Matriz de cuantificacion para la codificacion de imagenes fijas y en movimiento.

Info

Publication number: ES2328802T3
Application number: ES03016667T
Authority: ES
Inventors: Sheng Mei Shen; Thiow Keng Tan
Original assignee: Panasonic Corp
Current assignee: Panasonic Corp
Priority date: 1997-02-08
Filing date: 1998-02-05
Publication date: 2009-11-18
Anticipated expiration: 2018-02-05
Also published as: EP0903042A1; BR9805978A; WO1998035503A1; CN1329439A; US7010035B2; ES2178142T3; CN1329440A; EP0903042B1; US6501793B2; CN1145363C; DE69813635T2; DE69829783T2; DE69813635D1; KR20000064840A; MY127668A; BR9805978B1; BR9805978B8; EP1113673A3; CN1198466C; US20010021222A1

Abstract

Un método de transmisión para transmitir coeficientes que representan datos de imagen, incluyendo el método de transmisión: transmitir coeficientes cuantificados codificados (VD) obtenidos codificando coeficientes cuantificados (COF) que se obtienen cuantificando dichos coeficientes usando una matriz de cuantificación completa (38); y transmitir una matriz de cuantificación codificada obtenida codificando una matriz de cuantificación truncada, donde la matriz de cuantificación truncada se genera truncando dicha matriz de cuantificación completa (38) que tiene una pluralidad de elementos de cuantificación.

Description

Matriz de cuantificación para la codificación de imágenes fijas y en movimiento.

Campo técnico

Esta invención es especialmente útil en la codificación de imágenes fijas y móviles a comprensión muy alta. Es adecuada para ser utilizada en aplicaciones de vídeo conferencia por líneas telefónicas estándar así como para otras aplicaciones que requieren alta compresión.

Antecedentes de la invención

En la mayoría de los algoritmos de compresión se espera alguna forma de pérdida en la imagen decodificada. Un método típico para la compresión que produce buenos resultados es introducir esta pérdida cuantificando la señal en el dominio de transformada en lugar del dominio de pixel. Ejemplos de tales transformadas son la Transformada Discreta del Coseno, DCT, la transformada de ondas pequeñas y los filtros de análisis de subbanda. En un algoritmo de compresión basado en transformada, la imagen se convierte en el dominio de transformada y se aplica un esquema de cuantificación a los coeficientes para reducir la cantidad de información. La transformación tiene el efecto de concentrar la energía en unos pocos coeficientes y se puede introducir ruido en estos coeficientes sin afectar a la calidad visual percibida de la imagen reconstruida.

Es sabido que alguna forma de sistema de percepción humana con diferente ponderación en la cuantificación en coeficientes diferentes puede mejorar la calidad visual percibida. En normas de codificación como la ISO/IEC JTC1/SC29/WG11 IS-13818-2(MPEG2), la cuantificación de los coeficientes DCT se pondera por la matriz de cuantificación. Se usa normalmente una matriz por defecto; sin embargo, el codificador puede optar por enviar nuevos valores de la matriz de cuantificación al decodificador. Esto se realiza mediante la señalización en la cabecera del tren de bits.

La técnica anterior sobre enviar una matriz de cuantificación en base a la norma vídeo MPEG-2, es enviar 64 valores fijos de 8 bits cada uno si la señalización de bit para usar una matriz de cuantificación especial se establece a "1".

Los valores de la matriz en la posición de banda de frecuencia más alta no se usan realmente, especialmente para codificación de tasa de bits muy baja donde se emplea un paso de cuantificación grande, o para un bloque de entrada con textura muy simple o con buena compensación de movimiento.

También se ha hallado que, en la técnica anterior indicada, para cualquier matriz de cuantificación utilizada en diferentes aplicaciones, el primer valor de la matriz de cuantificación siempre se pone a ocho, sin que importe si es codificación de tasa de bits baja o codificación de tasa de bits alta.

Un problema de este método es la cantidad de información que hay que enviar como parte de la matriz de cuantificación. En un caso típico se requieren los 64 coeficientes cada uno de 8 bits. Esto representa un total de 512 bits. Si se requieren tres matrices de cuantificación diferentes para tres bandas de información de color, los bits totales serán tres veces esa cantidad. Esto representa demasiados recursos para transmisiones de tasas de bits bajas. Da lugar a tiempo de establecimiento demasiado largo o latencia en las transmisiones si cambiase la matriz en el medio de la transmisión.

El segundo problema a resolver es el enmascaramiento espacial del sistema visual humano. El ruido en las regiones planas es más visible que el ruido en regiones texturadas. Por lo tanto, aplicar la misma matriz a todas las regiones no es una solución buena puesto que la matriz se optimiza globalmente pero no se ajusta localmente a la actividad de la región local.

El tercer problema a resolver es el ahorro de bits del valor de matriz de cuantificación variable para DC. El primer valor en la matriz de cuantificación se disminuye para una tasa de bits más alta y región plana y se incrementa para tasa de bits más baja y región texturada.

US-A-5535138 describe un método de codificación y decodificación para señales vídeo usando matrices de cuantificación generadas dinámicamente.

Para resolver el problema anterior con el fin de reducir los datos de transmisión, según la presente invención, se facilita un método de transmisión para transmitir coeficientes que representan datos de imagen, incluyendo el método de transmisión:

transmitir coeficientes cuantificados codificados (VD) obtenidos codificando coeficientes cuantificados (COF) que se obtienen cuantificando dichos coeficientes usando una matriz de cuantificación completa; y

transmitir una matriz de cuantificación codificada obtenida codificando una matriz de cuantificación truncada, donde la matriz de cuantificación truncada se genera truncando dicha matriz de cuantificación completa que tiene una pluralidad de elementos de cuantificación.

Breve descripción de los dibujos

La figura 1A muestra un diagrama de un ejemplo de una matriz de cuantificación por defecto.

La figura 1B muestra un diagrama de un ejemplo de una matriz de cuantificación particular.

La figura 2A muestra una matriz de cuantificación truncada según la presente invención.

La figura 2B muestra un diagrama de otro ejemplo de una matriz de cuantificación particular.

La figura 3 muestra un diagrama de un ejemplo de matriz de cuantificación sintetizada según la presente invención.

La figura 4 es un diagrama de bloques de un codificador según la presente invención.

La figura 5 es un diagrama de bloques de un decodificador según la presente invención.

La figura 6 es un diagrama de bloques que representa una de las formas de codificar la matriz de cuantificación truncada.

La figura 7 muestra un diagrama de un ejemplo de una matriz de cuantificación truncada de escala, que sirve para escalar el valor para DC solamente.

La figura 8 es un diagrama de flujo que representa el procedimiento de escala para coeficiente DC en una matriz de cuantificación truncada.

La figura 9 es un diagrama de bloques de un decodificador para decodificar la matriz de cuantificación truncada escalada.

Mejor modo de llevar a la práctica la invención

La realización corriente se divide en dos partes. La primera parte de la realización describe la matriz de cuantificación truncada. La segunda parte de la realización describe la operación de la escala de tamaño de paso de cuantificación adaptativa. Aunque la realización describe las operaciones como una unidad, ambos métodos se pueden aplicar independientemente para lograr el resultado deseado.

La figura 1A muestra un ejemplo de una matriz de cuantificación por defecto para codificación de trama intra Luminancia (Intra-Y), y la figura 1B muestra un ejemplo de matriz de cuantificación particular que cuantifica los coeficientes de alta frecuencia de forma más basta.

La figura 2A es un ejemplo de la matriz de cuantificación truncada propuesta por la presente invención. La clave de esta realización es que el número de valores en la matriz de cuantificación a transmitir puede ser inferior a 64. Esto es especialmente útil especialmente para codificación de tasa de bits muy baja, donde solamente se requieren los primeros 2 o 3 valores.

La figura 4 muestra un codificador, según la presente invención, usando la matriz de cuantificación para las imágenes fijas y móviles. El codificador incluye un convertidor DCT 32, un cuantificador 34, y una unidad de codificación de longitud variable 49. Un generador QP 36 para generar parámetros de cuantificación después de prever, por ejemplo, cada macrobloque. El parámetro de cuantificación se puede calcular usando una ecuación predeterminada después de cada macrobloque, o se puede seleccionar de una tabla de consulta. Los parámetros de cuantificación obtenidos se aplican al cuantificador 34 y también a un decodificador que se describirá con detalle más adelante en conexión con la figura 5.

En la figura 4, el codificador tiene además un generador QM particular 38 para generar elementos de cuantificación particulares alineados en un formato de matriz. Los elementos de cuantificación particulares en la matriz se generan después de cada capa de objetos vídeo (VOL) que consta de una pluralidad de capas. Ejemplos de los elementos de cuantificación particulares en matriz QM se muestran en la figura 1B y la figura 2B. En caso de que se envíen datos vídeo con menos cantidad de datos (tal como cuando la tasa de bits es baja, o cuando la imagen es simple), se utilizan los elementos de cuantificación particulares representados en la figura 1B en los que se utiliza gran cantidad de elementos de cuantificación, tal como 200, en la región de frecuencia alta. Los elementos de cuantificación particulares se pueden obtener por cálculo o utilizando una tabla de consulta adecuada. Se ha previsto un selector 37 para seleccionar parámetros utilizados en el cálculo, o elementos de cuantificación adecuados en la matriz de la tabla de consulta. El selector 37 puede ser operado manualmente por el usuario o automáticamente en base al tipo de la imagen (imagen real o imagen gráfica) o la calidad de la imagen.

Los elementos de cuantificación particulares en matriz QM se aplican a un truncador 40. El truncador 40 lee los elementos de cuantificación particulares en matriz QM en un formato en zigzag, controlado por una exploración en zigzag 48, desde un componente DC a componentes de frecuencia más alta, representados por líneas de trazos en la figura 2A. Cuando el truncador 40 lee un número preestablecido de elementos de cuantificación particulares en la matriz, se termina otra lectura en zigzag de la matriz QM del bloque 38. Después, un código de fin, tal como un cero, es añadido por un sumador de código de fin al final del número preestablecido de elementos de cuantificación particulares. El número preestablecido se determina por una unidad de establecimiento 39 operada manualmente por un usuario o automáticamente con relación al tipo o la calidad de la imagen. Según un ejemplo representado en la figura 2A, el número preestablecido es trece. Así, habrá trece elementos de cuantificación particulares leídos antes de la terminación de la lectura en zigzag. Estos elementos de cuantificación leídos se denominan elementos de cuantificación en la porción anterior, puesto que están en la porción anterior de la lectura en zigzag de los elementos de cuantificación particulares en matriz QM. Los elementos de cuantificación en la porción anterior se envían a un generador QM sintetizado 44, y se envían los mismos elementos de cuantificación más el código de fin a un decodificador representado en la figura 5. Una serie de estos elementos de cuantificación en la porción anterior seguidos del código de fin se denomina un QMt de datos simplificado.

Se ha previsto un generador QM por defecto 46 para almacenar elementos de cuantificación por defecto alineados en matriz, tal como se representa en la figura 1A. Estos elementos de cuantificación por defecto son leídos también en la forma de zigzag por el control de exploración en zigzag 48.

Se ha previsto un generador QM sintetizado 44 para generar elementos de cuantificación sintetizados en una forma de matriz. En el generador QM sintetizado 44 se sintetizan los elementos de cuantificación particulares en la porción anterior obtenidos del truncador 40, y los elementos de cuantificación por defecto en una porción posterior (una porción distinta de la porción anterior) del generador QM por defecto 46. Así, el generador QM sintetizado 44 usa los elementos de cuantificación particulares en la porción anterior y los elementos de cuantificación por defecto en esta última porción para sintetizar los elementos de cuantificación sintetizados en matriz.

La figura 3 muestra un ejemplo de unos elementos de cuantificación sintetizados en matriz en el que la porción anterior F está llena de los elementos de cuantificación particulares y esta última porción L está llena de los valores de cuantificación por defecto.

En el cuantificador 34, los coeficientes DCT COF en formato de matriz se cuantifican utilizando los elementos de cuantificación sintetizados en matriz del generador QM sintetizado 44, y el parámetro de cuantificación QP del generador QP 36. Entonces, el cuantificador 34 genera coeficientes DCT cuantificados COF' en formato de matriz. Los coeficientes COFij y COF'ij (i y j son enteros positivos entre 1 y 8, inclusive) tienen la relación siguiente.

1

Aquí, QMij representa elementos de cuantificación en matriz producidos por el generador QM sintetizado 44, QP representa un parámetro de cuantificación producido por el generador QP 36. Los coeficientes DCT cuantificados COF' también se codifican después en la unidad de codificación de longitud variable 49, y los datos vídeo comprimidos VD son enviados desde la unidad 49 y aplicados al decodificador representado en la figura 5.

La figura 5 muestra un decodificador, según la presente invención, usando la matriz de cuantificación para las imágenes fijas y móviles. El decodificador incluye una unidad decodificadora de longitud variable 50, un cuantificador inverso 52, un convertidor DCT inverso 62, un detector de código de fin 56, un generador QM sintetizado 54, un generador QM por defecto 58, y una exploración en zigzag 60.

El generador QM por defecto 58 guarda una matriz de cuantificación por defecto, como la representada en la figura 1A. Se hace notar que la matriz de cuantificación por defecto almacenada en el generador QM por defecto 58 es la misma que la almacenada en el generador QM por defecto 46 representado en la figura 4. El generador QM sintetizado 54 y la exploración en zigzag 60 son sustancialmente los mismos que el generador QM sintetizado 44 y la exploración en zigzag 48, respectivamente, representados en la figura 4.

Los datos vídeo VD transmitidos desde el codificador de la figura 4 se aplican a la unidad decodificadora de longitud variable 50. Igualmente, el parámetro cuantificado QP se aplica al cuantificador inverso 52, y el QMt de datos simplificado se aplica al detector de código de fin 56.

Como se ha descrito anteriormente, el QMt de datos simplificado incluye un elemento de cuantificación particular en la porción anterior en la matriz. Los elementos de cuantificación particulares son explorados en zigzag por la exploración en zigzag 60 y se almacenan en la porción anterior del generador QM sintetizado 54. Después, cuando el código de fin es detectado por el detector de código de fin 56, termina el suministro de los elementos de cuantificación particulares del detector de código de fin 56, y a su vez, los elementos de cuantificación por defecto del generador QM por defecto 58 explorados en zigzag en esta última porción del generador QM sintetizado 54.

Así, la matriz de cuantificación sintetizada generada en el generador QM sintetizado 54 en la figura 5 es la misma que la matriz de cuantificación sintetizada generada en el generador QM sintetizado 44 en la figura 4. Puesto que la matriz de cuantificación sintetizada puede ser reproducida usando el QMt de datos simplificado, es posible reproducir la imagen de alta calidad con menos datos a transmitir desde el codificador al decodificador.

La figura 6 muestra una de las formas de codificar y transmitir la matriz de cuantificación truncada.

Aquí, la unidad 1 es la matriz de cuantificación truncada determinada en la unidad 2 verificando diferentes tasas de bits de codificación, diferente tamaño de imagen de codificación, etc. x1, x2, x3, ..., en la unidad 1 son los valores de matriz de cuantificación no cero usados para cuantificar un bloque de 8x8 coeficientes DCT en la misma posición que x1, x2, x3, ... Otras partes de la matriz de cuantificación con valores cero en la unidad 1 significa que se utilizará el valor por defecto de la matriz de cuantificación. En el codificador, la misma parte de coeficientes DCT de un bloque 8x8 se pondrá a cero.

La unidad 3 explorará los valores no cero en la unidad 1 a un grupo de datos con valor más grande concentrados en la primera parte del grupo. La exploración en zigzag se representa aquí como ejemplo.

La unidad 4 muestra la parte opcional para codificar los datos explorados restando valores contiguos para obtener los valores de diferencia más pequeños, \Deltax1, \Deltax2, ..., como se representa en la figura 6, pueden ir seguidos por codificación Huffman u otros métodos de codificación por entropía.

Al mismo tiempo, el número de valores de matriz de cuantificación no cero también se codifica y transmite al decodificador, junto con los valores no cero. Hay formas diferentes de codificar esta información. El método más simple es codificar el número utilizando 8 bits fijos. Otro método es codificar el número utilizando una tabla de longitud variable diseñada para usar menos bits para manejar los casos más frecuentes.

Alternativamente, en lugar de codificar y transmitir el número de valores de matriz de cuantificación no cero, como se representa en la figura 6, después de codificar el último valor no cero, xN, o el último valor de diferencia, \DeltaxN (N=1, 2, 3, ...), se introduce un símbolo específico en el tren de bits para indicar la terminación de la codificación de matriz de cuantificación no cero. Este símbolo específico puede ser un valor que no se usa en la codificación de valor no cero tal como cero o un valor negativo.

La figura 7 es la matriz de cuantificación truncada con factor de escala S como ponderación para DC solamente. Este factor de escala se regula en base a la actividad del bloque individual. La información de actividad se puede obtener verificando el número de coeficientes AC que quedan después de la cuantificación. x1, x2, x3, ..., x9 son los valores no cero en la matriz de cuantificación truncada a usar para cuantificar el bloque de 8x8 coeficientes DCT, y S es la ponderación para escalar hacia arriba/hacia abajo el primer valor para regular el cuantificador para el coeficiente DC.

La figura 8 muestra los detalles acerca del procedimiento de escala para el primer valor en la matriz de cuantificación.

La unidad 5 cuantifica cada bloque 8x8 aplicando en primer lugar la matriz de cuantificación truncada, seguido del paso de cuantificación requerido en ese tiempo para dicho bloque. La unidad 6 verifica el número de coeficientes AC que quedan después de la cuantificación anterior, pasando a la unidad 7 para decidir si la ponderación S en la figura 7 se escala hacia arriba o hacia abajo. Si quedan más coeficientes AC después de la cuantificación realizada en la unidad 5, la ponderación S se puede escalar hacia arriba, representado en la unidad 8; de otro modo se escala hacia abajo, representado en la unidad 9. La unidad 10 escala la ponderación S para regular el primer valor en la matriz de cuantificación, y la unidad 11 recuantifica el coeficiente DC utilizando el valor nuevo ajustado para el bloque A y envía todos los coeficientes DC y AC al decodificador.

La escala hacia arriba y hacia abajo puede ser algún valor elegido relacionado con el paso de cuantificación presente o un valor fijo.

El ajuste de los otros valores de matriz de cuantificación para coeficientes AC puede seguirse de forma similar.

Un decodificador de la escala de tamaño de paso de cuantificación adaptativa y matriz de cuantificación truncada se representa en la figura 9.

En la figura 9, el tren de bits decodificado se introduce en el decodificador. La unidad 12 decodificará la matriz de cuantificación truncada, y la unidad 13 decodificará el paso de cuantificación para cada bloque. La unidad 14 decodificará todos los coeficientes DC y AC para cada bloque. La unidad 15 verificará el número de coeficientes AC que no son cero, y el factor de escala se puede determinar en la unidad 16 utilizando la información obtenida de la unidad 15 y siguiendo los mismos criterios que en el codificador. Todos los coeficientes DC y AC para cada bloque pueden ser cuantificados inversamente en la unidad 17 por la matriz de cuantificación de escala decodificada y la matriz de cuantificación decodificada. Finalmente todos los coeficientes cuantificados inversamente se pasan a una unidad de codificación de transformada DCT inversa para reconstruir la imagen.

\newpage

Se utilizan las fórmulas siguientes para la cuantificación y cuantificación inversa:

2

donde:

COF: es el coeficiente de transformación a cuantificar.

NIVEL: es el valor absoluto de la versión cuantificada del coeficiente de transformación.

COF': es el coeficiente de transformación reconstruido.

QP: es el tamaño de paso de cuantificación del bloque corriente.

QM: es el valor de la matriz de cuantificación correspondiente al coeficiente a cuantificar.

El valor por defecto de QM es 16.

La presente invención cambiará la matriz de cuantificación adaptativamente según la tasa de bits de codificación, el tamaño de codificación, así como el sistema visual humano, de manera que un lote de bits se puede guardar truncando y escalando la matriz de cuantificación y codificando diferencialmente los valores de la matriz. Por lo tanto, incrementará la eficiencia de la codificación, especialmente para codificación de tasa de bits muy baja.

Claims

1. Un método de transmisión para transmitir coeficientes que representan datos de imagen, incluyendo el método de transmisión:

transmitir coeficientes cuantificados codificados (VD) obtenidos codificando coeficientes cuantificados (COF) que se obtienen cuantificando dichos coeficientes usando una matriz de cuantificación completa (38); y

transmitir una matriz de cuantificación codificada obtenida codificando una matriz de cuantificación truncada, donde la matriz de cuantificación truncada se genera truncando dicha matriz de cuantificación completa (38) que tiene una pluralidad de elementos de cuantificación.

2. Un método de transmisión según la reivindicación 1, donde la matriz de cuantificación codificada tiene bits alineados en el orden de bits obtenidos codificando los elementos de cuantificación incluidos en la matriz de cuantificación truncada y bits obtenidos codificando un código de fin.

3. El método de transmisión según la reivindicación 2, donde el código de fin es un valor "0".