ES2328802T3 - Matriz de cuantificacion para la codificacion de imagenes fijas y en movimiento. - Google Patents

Matriz de cuantificacion para la codificacion de imagenes fijas y en movimiento. Download PDF

Info

Publication number
ES2328802T3
ES2328802T3 ES03016667T ES03016667T ES2328802T3 ES 2328802 T3 ES2328802 T3 ES 2328802T3 ES 03016667 T ES03016667 T ES 03016667T ES 03016667 T ES03016667 T ES 03016667T ES 2328802 T3 ES2328802 T3 ES 2328802T3
Authority
ES
Spain
Prior art keywords
quantification
matrix
coefficients
elements
truncated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
ES03016667T
Other languages
English (en)
Inventor
Sheng Mei Shen
Thiow Keng Tan
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Original Assignee
Panasonic Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp filed Critical Panasonic Corp
Application granted granted Critical
Publication of ES2328802T3 publication Critical patent/ES2328802T3/es
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • H04N19/126Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/154Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/162User input
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Un método de transmisión para transmitir coeficientes que representan datos de imagen, incluyendo el método de transmisión: transmitir coeficientes cuantificados codificados (VD) obtenidos codificando coeficientes cuantificados (COF) que se obtienen cuantificando dichos coeficientes usando una matriz de cuantificación completa (38); y transmitir una matriz de cuantificación codificada obtenida codificando una matriz de cuantificación truncada, donde la matriz de cuantificación truncada se genera truncando dicha matriz de cuantificación completa (38) que tiene una pluralidad de elementos de cuantificación.

Description

Matriz de cuantificación para la codificación de imágenes fijas y en movimiento.
Campo técnico
Esta invención es especialmente útil en la codificación de imágenes fijas y móviles a comprensión muy alta. Es adecuada para ser utilizada en aplicaciones de vídeo conferencia por líneas telefónicas estándar así como para otras aplicaciones que requieren alta compresión.
Antecedentes de la invención
En la mayoría de los algoritmos de compresión se espera alguna forma de pérdida en la imagen decodificada. Un método típico para la compresión que produce buenos resultados es introducir esta pérdida cuantificando la señal en el dominio de transformada en lugar del dominio de pixel. Ejemplos de tales transformadas son la Transformada Discreta del Coseno, DCT, la transformada de ondas pequeñas y los filtros de análisis de subbanda. En un algoritmo de compresión basado en transformada, la imagen se convierte en el dominio de transformada y se aplica un esquema de cuantificación a los coeficientes para reducir la cantidad de información. La transformación tiene el efecto de concentrar la energía en unos pocos coeficientes y se puede introducir ruido en estos coeficientes sin afectar a la calidad visual percibida de la imagen reconstruida.
Es sabido que alguna forma de sistema de percepción humana con diferente ponderación en la cuantificación en coeficientes diferentes puede mejorar la calidad visual percibida. En normas de codificación como la ISO/IEC JTC1/SC29/WG11 IS-13818-2(MPEG2), la cuantificación de los coeficientes DCT se pondera por la matriz de cuantificación. Se usa normalmente una matriz por defecto; sin embargo, el codificador puede optar por enviar nuevos valores de la matriz de cuantificación al decodificador. Esto se realiza mediante la señalización en la cabecera del tren de bits.
La técnica anterior sobre enviar una matriz de cuantificación en base a la norma vídeo MPEG-2, es enviar 64 valores fijos de 8 bits cada uno si la señalización de bit para usar una matriz de cuantificación especial se establece a "1".
Los valores de la matriz en la posición de banda de frecuencia más alta no se usan realmente, especialmente para codificación de tasa de bits muy baja donde se emplea un paso de cuantificación grande, o para un bloque de entrada con textura muy simple o con buena compensación de movimiento.
También se ha hallado que, en la técnica anterior indicada, para cualquier matriz de cuantificación utilizada en diferentes aplicaciones, el primer valor de la matriz de cuantificación siempre se pone a ocho, sin que importe si es codificación de tasa de bits baja o codificación de tasa de bits alta.
Un problema de este método es la cantidad de información que hay que enviar como parte de la matriz de cuantificación. En un caso típico se requieren los 64 coeficientes cada uno de 8 bits. Esto representa un total de 512 bits. Si se requieren tres matrices de cuantificación diferentes para tres bandas de información de color, los bits totales serán tres veces esa cantidad. Esto representa demasiados recursos para transmisiones de tasas de bits bajas. Da lugar a tiempo de establecimiento demasiado largo o latencia en las transmisiones si cambiase la matriz en el medio de la transmisión.
El segundo problema a resolver es el enmascaramiento espacial del sistema visual humano. El ruido en las regiones planas es más visible que el ruido en regiones texturadas. Por lo tanto, aplicar la misma matriz a todas las regiones no es una solución buena puesto que la matriz se optimiza globalmente pero no se ajusta localmente a la actividad de la región local.
El tercer problema a resolver es el ahorro de bits del valor de matriz de cuantificación variable para DC. El primer valor en la matriz de cuantificación se disminuye para una tasa de bits más alta y región plana y se incrementa para tasa de bits más baja y región texturada.
US-A-5535138 describe un método de codificación y decodificación para señales vídeo usando matrices de cuantificación generadas dinámicamente.
Para resolver el problema anterior con el fin de reducir los datos de transmisión, según la presente invención, se facilita un método de transmisión para transmitir coeficientes que representan datos de imagen, incluyendo el método de transmisión:
transmitir coeficientes cuantificados codificados (VD) obtenidos codificando coeficientes cuantificados (COF) que se obtienen cuantificando dichos coeficientes usando una matriz de cuantificación completa; y
transmitir una matriz de cuantificación codificada obtenida codificando una matriz de cuantificación truncada, donde la matriz de cuantificación truncada se genera truncando dicha matriz de cuantificación completa que tiene una pluralidad de elementos de cuantificación.
Breve descripción de los dibujos
La figura 1A muestra un diagrama de un ejemplo de una matriz de cuantificación por defecto.
La figura 1B muestra un diagrama de un ejemplo de una matriz de cuantificación particular.
La figura 2A muestra una matriz de cuantificación truncada según la presente invención.
La figura 2B muestra un diagrama de otro ejemplo de una matriz de cuantificación particular.
La figura 3 muestra un diagrama de un ejemplo de matriz de cuantificación sintetizada según la presente invención.
La figura 4 es un diagrama de bloques de un codificador según la presente invención.
La figura 5 es un diagrama de bloques de un decodificador según la presente invención.
La figura 6 es un diagrama de bloques que representa una de las formas de codificar la matriz de cuantificación truncada.
La figura 7 muestra un diagrama de un ejemplo de una matriz de cuantificación truncada de escala, que sirve para escalar el valor para DC solamente.
La figura 8 es un diagrama de flujo que representa el procedimiento de escala para coeficiente DC en una matriz de cuantificación truncada.
La figura 9 es un diagrama de bloques de un decodificador para decodificar la matriz de cuantificación truncada escalada.
Mejor modo de llevar a la práctica la invención
La realización corriente se divide en dos partes. La primera parte de la realización describe la matriz de cuantificación truncada. La segunda parte de la realización describe la operación de la escala de tamaño de paso de cuantificación adaptativa. Aunque la realización describe las operaciones como una unidad, ambos métodos se pueden aplicar independientemente para lograr el resultado deseado.
La figura 1A muestra un ejemplo de una matriz de cuantificación por defecto para codificación de trama intra Luminancia (Intra-Y), y la figura 1B muestra un ejemplo de matriz de cuantificación particular que cuantifica los coeficientes de alta frecuencia de forma más basta.
La figura 2A es un ejemplo de la matriz de cuantificación truncada propuesta por la presente invención. La clave de esta realización es que el número de valores en la matriz de cuantificación a transmitir puede ser inferior a 64. Esto es especialmente útil especialmente para codificación de tasa de bits muy baja, donde solamente se requieren los primeros 2 o 3 valores.
La figura 4 muestra un codificador, según la presente invención, usando la matriz de cuantificación para las imágenes fijas y móviles. El codificador incluye un convertidor DCT 32, un cuantificador 34, y una unidad de codificación de longitud variable 49. Un generador QP 36 para generar parámetros de cuantificación después de prever, por ejemplo, cada macrobloque. El parámetro de cuantificación se puede calcular usando una ecuación predeterminada después de cada macrobloque, o se puede seleccionar de una tabla de consulta. Los parámetros de cuantificación obtenidos se aplican al cuantificador 34 y también a un decodificador que se describirá con detalle más adelante en conexión con la figura 5.
En la figura 4, el codificador tiene además un generador QM particular 38 para generar elementos de cuantificación particulares alineados en un formato de matriz. Los elementos de cuantificación particulares en la matriz se generan después de cada capa de objetos vídeo (VOL) que consta de una pluralidad de capas. Ejemplos de los elementos de cuantificación particulares en matriz QM se muestran en la figura 1B y la figura 2B. En caso de que se envíen datos vídeo con menos cantidad de datos (tal como cuando la tasa de bits es baja, o cuando la imagen es simple), se utilizan los elementos de cuantificación particulares representados en la figura 1B en los que se utiliza gran cantidad de elementos de cuantificación, tal como 200, en la región de frecuencia alta. Los elementos de cuantificación particulares se pueden obtener por cálculo o utilizando una tabla de consulta adecuada. Se ha previsto un selector 37 para seleccionar parámetros utilizados en el cálculo, o elementos de cuantificación adecuados en la matriz de la tabla de consulta. El selector 37 puede ser operado manualmente por el usuario o automáticamente en base al tipo de la imagen (imagen real o imagen gráfica) o la calidad de la imagen.
Los elementos de cuantificación particulares en matriz QM se aplican a un truncador 40. El truncador 40 lee los elementos de cuantificación particulares en matriz QM en un formato en zigzag, controlado por una exploración en zigzag 48, desde un componente DC a componentes de frecuencia más alta, representados por líneas de trazos en la figura 2A. Cuando el truncador 40 lee un número preestablecido de elementos de cuantificación particulares en la matriz, se termina otra lectura en zigzag de la matriz QM del bloque 38. Después, un código de fin, tal como un cero, es añadido por un sumador de código de fin al final del número preestablecido de elementos de cuantificación particulares. El número preestablecido se determina por una unidad de establecimiento 39 operada manualmente por un usuario o automáticamente con relación al tipo o la calidad de la imagen. Según un ejemplo representado en la figura 2A, el número preestablecido es trece. Así, habrá trece elementos de cuantificación particulares leídos antes de la terminación de la lectura en zigzag. Estos elementos de cuantificación leídos se denominan elementos de cuantificación en la porción anterior, puesto que están en la porción anterior de la lectura en zigzag de los elementos de cuantificación particulares en matriz QM. Los elementos de cuantificación en la porción anterior se envían a un generador QM sintetizado 44, y se envían los mismos elementos de cuantificación más el código de fin a un decodificador representado en la figura 5. Una serie de estos elementos de cuantificación en la porción anterior seguidos del código de fin se denomina un QMt de datos simplificado.
Se ha previsto un generador QM por defecto 46 para almacenar elementos de cuantificación por defecto alineados en matriz, tal como se representa en la figura 1A. Estos elementos de cuantificación por defecto son leídos también en la forma de zigzag por el control de exploración en zigzag 48.
Se ha previsto un generador QM sintetizado 44 para generar elementos de cuantificación sintetizados en una forma de matriz. En el generador QM sintetizado 44 se sintetizan los elementos de cuantificación particulares en la porción anterior obtenidos del truncador 40, y los elementos de cuantificación por defecto en una porción posterior (una porción distinta de la porción anterior) del generador QM por defecto 46. Así, el generador QM sintetizado 44 usa los elementos de cuantificación particulares en la porción anterior y los elementos de cuantificación por defecto en esta última porción para sintetizar los elementos de cuantificación sintetizados en matriz.
La figura 3 muestra un ejemplo de unos elementos de cuantificación sintetizados en matriz en el que la porción anterior F está llena de los elementos de cuantificación particulares y esta última porción L está llena de los valores de cuantificación por defecto.
En el cuantificador 34, los coeficientes DCT COF en formato de matriz se cuantifican utilizando los elementos de cuantificación sintetizados en matriz del generador QM sintetizado 44, y el parámetro de cuantificación QP del generador QP 36. Entonces, el cuantificador 34 genera coeficientes DCT cuantificados COF' en formato de matriz. Los coeficientes COFij y COF'ij (i y j son enteros positivos entre 1 y 8, inclusive) tienen la relación siguiente.
1
Aquí, QMij representa elementos de cuantificación en matriz producidos por el generador QM sintetizado 44, QP representa un parámetro de cuantificación producido por el generador QP 36. Los coeficientes DCT cuantificados COF' también se codifican después en la unidad de codificación de longitud variable 49, y los datos vídeo comprimidos VD son enviados desde la unidad 49 y aplicados al decodificador representado en la figura 5.
La figura 5 muestra un decodificador, según la presente invención, usando la matriz de cuantificación para las imágenes fijas y móviles. El decodificador incluye una unidad decodificadora de longitud variable 50, un cuantificador inverso 52, un convertidor DCT inverso 62, un detector de código de fin 56, un generador QM sintetizado 54, un generador QM por defecto 58, y una exploración en zigzag 60.
El generador QM por defecto 58 guarda una matriz de cuantificación por defecto, como la representada en la figura 1A. Se hace notar que la matriz de cuantificación por defecto almacenada en el generador QM por defecto 58 es la misma que la almacenada en el generador QM por defecto 46 representado en la figura 4. El generador QM sintetizado 54 y la exploración en zigzag 60 son sustancialmente los mismos que el generador QM sintetizado 44 y la exploración en zigzag 48, respectivamente, representados en la figura 4.
Los datos vídeo VD transmitidos desde el codificador de la figura 4 se aplican a la unidad decodificadora de longitud variable 50. Igualmente, el parámetro cuantificado QP se aplica al cuantificador inverso 52, y el QMt de datos simplificado se aplica al detector de código de fin 56.
Como se ha descrito anteriormente, el QMt de datos simplificado incluye un elemento de cuantificación particular en la porción anterior en la matriz. Los elementos de cuantificación particulares son explorados en zigzag por la exploración en zigzag 60 y se almacenan en la porción anterior del generador QM sintetizado 54. Después, cuando el código de fin es detectado por el detector de código de fin 56, termina el suministro de los elementos de cuantificación particulares del detector de código de fin 56, y a su vez, los elementos de cuantificación por defecto del generador QM por defecto 58 explorados en zigzag en esta última porción del generador QM sintetizado 54.
Así, la matriz de cuantificación sintetizada generada en el generador QM sintetizado 54 en la figura 5 es la misma que la matriz de cuantificación sintetizada generada en el generador QM sintetizado 44 en la figura 4. Puesto que la matriz de cuantificación sintetizada puede ser reproducida usando el QMt de datos simplificado, es posible reproducir la imagen de alta calidad con menos datos a transmitir desde el codificador al decodificador.
La figura 6 muestra una de las formas de codificar y transmitir la matriz de cuantificación truncada.
Aquí, la unidad 1 es la matriz de cuantificación truncada determinada en la unidad 2 verificando diferentes tasas de bits de codificación, diferente tamaño de imagen de codificación, etc. x1, x2, x3, ..., en la unidad 1 son los valores de matriz de cuantificación no cero usados para cuantificar un bloque de 8x8 coeficientes DCT en la misma posición que x1, x2, x3, ... Otras partes de la matriz de cuantificación con valores cero en la unidad 1 significa que se utilizará el valor por defecto de la matriz de cuantificación. En el codificador, la misma parte de coeficientes DCT de un bloque 8x8 se pondrá a cero.
La unidad 3 explorará los valores no cero en la unidad 1 a un grupo de datos con valor más grande concentrados en la primera parte del grupo. La exploración en zigzag se representa aquí como ejemplo.
La unidad 4 muestra la parte opcional para codificar los datos explorados restando valores contiguos para obtener los valores de diferencia más pequeños, \Deltax1, \Deltax2, ..., como se representa en la figura 6, pueden ir seguidos por codificación Huffman u otros métodos de codificación por entropía.
Al mismo tiempo, el número de valores de matriz de cuantificación no cero también se codifica y transmite al decodificador, junto con los valores no cero. Hay formas diferentes de codificar esta información. El método más simple es codificar el número utilizando 8 bits fijos. Otro método es codificar el número utilizando una tabla de longitud variable diseñada para usar menos bits para manejar los casos más frecuentes.
Alternativamente, en lugar de codificar y transmitir el número de valores de matriz de cuantificación no cero, como se representa en la figura 6, después de codificar el último valor no cero, xN, o el último valor de diferencia, \DeltaxN (N=1, 2, 3, ...), se introduce un símbolo específico en el tren de bits para indicar la terminación de la codificación de matriz de cuantificación no cero. Este símbolo específico puede ser un valor que no se usa en la codificación de valor no cero tal como cero o un valor negativo.
La figura 7 es la matriz de cuantificación truncada con factor de escala S como ponderación para DC solamente. Este factor de escala se regula en base a la actividad del bloque individual. La información de actividad se puede obtener verificando el número de coeficientes AC que quedan después de la cuantificación. x1, x2, x3, ..., x9 son los valores no cero en la matriz de cuantificación truncada a usar para cuantificar el bloque de 8x8 coeficientes DCT, y S es la ponderación para escalar hacia arriba/hacia abajo el primer valor para regular el cuantificador para el coeficiente DC.
La figura 8 muestra los detalles acerca del procedimiento de escala para el primer valor en la matriz de cuantificación.
La unidad 5 cuantifica cada bloque 8x8 aplicando en primer lugar la matriz de cuantificación truncada, seguido del paso de cuantificación requerido en ese tiempo para dicho bloque. La unidad 6 verifica el número de coeficientes AC que quedan después de la cuantificación anterior, pasando a la unidad 7 para decidir si la ponderación S en la figura 7 se escala hacia arriba o hacia abajo. Si quedan más coeficientes AC después de la cuantificación realizada en la unidad 5, la ponderación S se puede escalar hacia arriba, representado en la unidad 8; de otro modo se escala hacia abajo, representado en la unidad 9. La unidad 10 escala la ponderación S para regular el primer valor en la matriz de cuantificación, y la unidad 11 recuantifica el coeficiente DC utilizando el valor nuevo ajustado para el bloque A y envía todos los coeficientes DC y AC al decodificador.
La escala hacia arriba y hacia abajo puede ser algún valor elegido relacionado con el paso de cuantificación presente o un valor fijo.
El ajuste de los otros valores de matriz de cuantificación para coeficientes AC puede seguirse de forma similar.
Un decodificador de la escala de tamaño de paso de cuantificación adaptativa y matriz de cuantificación truncada se representa en la figura 9.
En la figura 9, el tren de bits decodificado se introduce en el decodificador. La unidad 12 decodificará la matriz de cuantificación truncada, y la unidad 13 decodificará el paso de cuantificación para cada bloque. La unidad 14 decodificará todos los coeficientes DC y AC para cada bloque. La unidad 15 verificará el número de coeficientes AC que no son cero, y el factor de escala se puede determinar en la unidad 16 utilizando la información obtenida de la unidad 15 y siguiendo los mismos criterios que en el codificador. Todos los coeficientes DC y AC para cada bloque pueden ser cuantificados inversamente en la unidad 17 por la matriz de cuantificación de escala decodificada y la matriz de cuantificación decodificada. Finalmente todos los coeficientes cuantificados inversamente se pasan a una unidad de codificación de transformada DCT inversa para reconstruir la imagen.
\newpage
Se utilizan las fórmulas siguientes para la cuantificación y cuantificación inversa:
2
donde:
COF
es el coeficiente de transformación a cuantificar.
NIVEL
es el valor absoluto de la versión cuantificada del coeficiente de transformación.
COF'
es el coeficiente de transformación reconstruido.
QP
es el tamaño de paso de cuantificación del bloque corriente.
QM
es el valor de la matriz de cuantificación correspondiente al coeficiente a cuantificar.
El valor por defecto de QM es 16.
La presente invención cambiará la matriz de cuantificación adaptativamente según la tasa de bits de codificación, el tamaño de codificación, así como el sistema visual humano, de manera que un lote de bits se puede guardar truncando y escalando la matriz de cuantificación y codificando diferencialmente los valores de la matriz. Por lo tanto, incrementará la eficiencia de la codificación, especialmente para codificación de tasa de bits muy baja.

Claims (3)

1. Un método de transmisión para transmitir coeficientes que representan datos de imagen, incluyendo el método de transmisión:
transmitir coeficientes cuantificados codificados (VD) obtenidos codificando coeficientes cuantificados (COF) que se obtienen cuantificando dichos coeficientes usando una matriz de cuantificación completa (38); y
transmitir una matriz de cuantificación codificada obtenida codificando una matriz de cuantificación truncada, donde la matriz de cuantificación truncada se genera truncando dicha matriz de cuantificación completa (38) que tiene una pluralidad de elementos de cuantificación.
2. Un método de transmisión según la reivindicación 1, donde la matriz de cuantificación codificada tiene bits alineados en el orden de bits obtenidos codificando los elementos de cuantificación incluidos en la matriz de cuantificación truncada y bits obtenidos codificando un código de fin.
3. El método de transmisión según la reivindicación 2, donde el código de fin es un valor "0".
ES03016667T 1997-02-08 1998-02-05 Matriz de cuantificacion para la codificacion de imagenes fijas y en movimiento. Expired - Lifetime ES2328802T3 (es)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP6164797 1997-02-08
JP9-61647 1997-02-08
JP9-186437 1997-07-11
JP18643797 1997-07-11

Publications (1)

Publication Number Publication Date
ES2328802T3 true ES2328802T3 (es) 2009-11-18

Family

ID=26402699

Family Applications (4)

Application Number Title Priority Date Filing Date
ES03016667T Expired - Lifetime ES2328802T3 (es) 1997-02-08 1998-02-05 Matriz de cuantificacion para la codificacion de imagenes fijas y en movimiento.
ES01106448T Expired - Lifetime ES2195965T3 (es) 1997-02-08 1998-02-05 Matriz de cuantificacion para el decodificado de imagenes fijas y en movimiento.
ES01106445T Expired - Lifetime ES2240263T3 (es) 1997-02-08 1998-02-05 Matriz de cuantificacion para el codificado de imagenes fijas y en movimiento.
ES98901516T Expired - Lifetime ES2178142T3 (es) 1997-02-08 1998-02-05 Matriz de cuantificacion para la codificacion de imagenes fijas y en movimiento.

Family Applications After (3)

Application Number Title Priority Date Filing Date
ES01106448T Expired - Lifetime ES2195965T3 (es) 1997-02-08 1998-02-05 Matriz de cuantificacion para el decodificado de imagenes fijas y en movimiento.
ES01106445T Expired - Lifetime ES2240263T3 (es) 1997-02-08 1998-02-05 Matriz de cuantificacion para el codificado de imagenes fijas y en movimiento.
ES98901516T Expired - Lifetime ES2178142T3 (es) 1997-02-08 1998-02-05 Matriz de cuantificacion para la codificacion de imagenes fijas y en movimiento.

Country Status (11)

Country Link
US (4) US6445739B1 (es)
EP (4) EP0903042B1 (es)
KR (1) KR100303054B1 (es)
CN (3) CN1145363C (es)
BR (1) BR9805978B8 (es)
DE (4) DE69829783T2 (es)
ES (4) ES2328802T3 (es)
ID (1) ID20721A (es)
MY (1) MY127668A (es)
TW (1) TW441198B (es)
WO (1) WO1998035503A1 (es)

Families Citing this family (64)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4099682B2 (ja) 1998-09-18 2008-06-11 ソニー株式会社 画像処理装置および方法、並びに記録媒体
JP3335602B2 (ja) * 1999-11-26 2002-10-21 株式会社クリエイティブ・ブレインズ 思考系の解析方法および解析装置
JP2002027469A (ja) * 2000-07-05 2002-01-25 Matsushita Electric Ind Co Ltd ビットストリーム変換方法、ビットストリーム変換装置およびプログラム記録媒体
US6882685B2 (en) * 2001-09-18 2005-04-19 Microsoft Corporation Block transform and quantization for image and video coding
US7092578B2 (en) * 2001-10-23 2006-08-15 Agilent Technologies, Inc. Signaling adaptive-quantization matrices in JPEG using end-of-block codes
US7295609B2 (en) * 2001-11-30 2007-11-13 Sony Corporation Method and apparatus for coding image information, method and apparatus for decoding image information, method and apparatus for coding and decoding image information, and system of coding and transmitting image information
US7240001B2 (en) * 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US6934677B2 (en) * 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
JP2004007563A (ja) * 2002-04-19 2004-01-08 Matsushita Electric Ind Co Ltd 動画像符号化方法および動画像復号化方法
AU2003285850A1 (en) * 2002-04-23 2004-04-30 Nokia Corporation Method and device for indicating quantizer parameters in a video coding system
JP4676140B2 (ja) 2002-09-04 2011-04-27 マイクロソフト コーポレーション オーディオの量子化および逆量子化
US7299190B2 (en) * 2002-09-04 2007-11-20 Microsoft Corporation Quantization and inverse quantization for audio
US7502743B2 (en) 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
US7212681B1 (en) * 2003-01-15 2007-05-01 Cisco Technology, Inc. Extension of two-dimensional variable length coding for image compression
US7194137B2 (en) * 2003-05-16 2007-03-20 Cisco Technology, Inc. Variable length coding method and apparatus for video compression
CN1303822C (zh) * 2003-06-12 2007-03-07 矽统科技股份有限公司 改善影像品质的量化矩阵调整方法
JP4705921B2 (ja) 2004-01-20 2011-06-22 パナソニック株式会社 量子化マトリクスおよび動画像の復号化方法、復号化装置、プログラムおよび記録媒体
US7460990B2 (en) 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
JP2007535191A (ja) * 2004-01-30 2007-11-29 松下電器産業株式会社 画像符号化方法、画像復号化方法、画像符号化装置、画像復号化装置およびプログラム
WO2005076614A1 (en) * 2004-01-30 2005-08-18 Matsushita Electric Industrial Co., Ltd. Moving picture coding method and moving picture decoding method
US20050249278A1 (en) * 2004-04-28 2005-11-10 Matsushita Electric Industrial Co., Ltd. Moving image coding method, moving image decoding method, moving image coding device, moving image decoding device, moving image coding program and program product of the same
US7454073B2 (en) 2004-06-15 2008-11-18 Cisco Technology, Inc. Video compression using multiple variable length coding processes for multiple classes of transform coefficient blocks
US7492956B2 (en) * 2004-08-18 2009-02-17 Cisco Technology, Inc. Video coding using multi-dimensional amplitude coding and 2-D non-zero/zero cluster position coding
US7454076B2 (en) * 2004-06-15 2008-11-18 Cisco Technology, Inc. Hybrid variable length coding method for low bit rate video coding
US7471840B2 (en) * 2004-08-18 2008-12-30 Cisco Technology, Inc. Two-dimensional variable length coding of runs of zero and non-zero transform coefficients for image compression
US7499596B2 (en) 2004-08-18 2009-03-03 Cisco Technology, Inc. Amplitude coding for clustered transform coefficients
US7471841B2 (en) 2004-06-15 2008-12-30 Cisco Technology, Inc. Adaptive breakpoint for hybrid variable length coding
US7499595B2 (en) * 2004-08-18 2009-03-03 Cisco Technology, Inc. Joint amplitude and position coding for photographic image and video coding
US7680349B2 (en) * 2004-08-18 2010-03-16 Cisco Technology, Inc. Variable length coding for clustered transform coefficients in video compression
US7620258B2 (en) * 2004-08-18 2009-11-17 Cisco Technology, Inc. Extended amplitude coding for clustered transform coefficients
US20060133507A1 (en) * 2004-12-06 2006-06-22 Matsushita Electric Industrial Co., Ltd. Picture information decoding method and picture information encoding method
JP5123166B2 (ja) * 2005-04-04 2013-01-16 トムソン ライセンシング 量子化きざみを局所的に調整する方法
JP4856954B2 (ja) 2005-06-08 2012-01-18 パナソニック株式会社 画像符号化装置
KR100813258B1 (ko) * 2005-07-12 2008-03-13 삼성전자주식회사 화상 데이터 부호화 및 복호화 장치 및 방법
KR101045205B1 (ko) 2005-07-12 2011-06-30 삼성전자주식회사 화상 데이터 부호화 및 복호화 장치 및 방법
US7539612B2 (en) 2005-07-15 2009-05-26 Microsoft Corporation Coding and decoding scale factor information
CN100424654C (zh) * 2005-11-25 2008-10-08 杭州中天微系统有限公司 一种矩阵数据存取方法及其矩阵数据存储装置
US8190425B2 (en) * 2006-01-20 2012-05-29 Microsoft Corporation Complex cross-correlation parameters for multi-channel audio
US7831434B2 (en) 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
US7953604B2 (en) * 2006-01-20 2011-05-31 Microsoft Corporation Shape and scale parameters for extended-band frequency coding
US7242328B1 (en) * 2006-02-03 2007-07-10 Cisco Technology, Inc. Variable length coding for sparse coefficients
EP1995971B1 (en) * 2006-03-16 2016-11-16 Huawei Technologies Co., Ltd. A method and device for realizing quantization in coding-decoding
US20080253449A1 (en) * 2007-04-13 2008-10-16 Yoji Shimizu Information apparatus and method
MX2009009947A (es) * 2007-04-16 2009-09-24 Toshiba Kk Metodo y dispositivo de codificacion de imagenes y de descodificacion de imagenes.
EP2153403B1 (en) 2007-06-04 2013-04-03 Research In Motion Limited Method and device for down-sampling a dct image in the dct domain
US7995850B2 (en) * 2007-06-04 2011-08-09 Research In Motion Limited Method and device for selecting transform matrices for down-sampling DCT image using learning with forgetting algorithm
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
US8902972B2 (en) * 2008-04-11 2014-12-02 Qualcomm Incorporated Rate-distortion quantization for context-adaptive variable length coding (CAVLC)
US8270467B1 (en) 2008-05-13 2012-09-18 Marvell International Ltd. Encoding image data
CN101540610B (zh) * 2009-01-07 2011-12-28 湖南大学 一种二维非隔离位约束编解码方法及编解码器
AU2010312983B2 (en) * 2009-10-30 2015-10-29 Sun Patent Trust Image decoding method, image coding method, image decoding apparatus, image coding apparatus, program, and integrated circuit
KR20120016991A (ko) * 2010-08-17 2012-02-27 오수미 인터 프리딕션 방법
JP5410638B2 (ja) * 2011-03-10 2014-02-05 日本電信電話株式会社 量子化制御装置及び方法、及び量子化制御プログラム
CN103548350B (zh) * 2011-06-28 2017-03-01 日本电气株式会社 图像编码设备和图像解码设备
CA2836161C (en) 2011-08-23 2017-12-19 Mediatek Singapore Pte. Ltd. Method and system of transform block processing according to quantization matrix in video coding
JP5782989B2 (ja) * 2011-10-26 2015-09-24 アイコム株式会社 通信機および通信方法
US10277915B2 (en) * 2011-11-07 2019-04-30 Qualcomm Incorporated Signaling quantization matrices for video coding
US8982948B2 (en) 2011-12-21 2015-03-17 Sony Corporation Video system with quantization matrix coding mechanism and method of operation thereof
US20130188691A1 (en) 2012-01-20 2013-07-25 Sony Corporation Quantization matrix design for hevc standard
JP5727398B2 (ja) 2012-01-26 2015-06-03 日本電信電話株式会社 動画像符号化方法,動画像符号化装置および動画像符号化プログラム
US20130272391A1 (en) * 2012-04-16 2013-10-17 Futurewei Technologies, Inc. Method and Apparatus of Quantization Matrix Coding
RU2658174C1 (ru) * 2012-09-06 2018-06-19 Сан Пэтент Траст Способ кодирования изображений, способ декодирования изображений, устройство кодирования изображений, устройство декодирования изображений и устройство кодирования и декодирования изображений
US10863188B2 (en) * 2014-09-19 2020-12-08 Futurewei Technologies, Inc. Method and apparatus for non-uniform mapping for quantization matrix coefficients between different sizes of quantization matrices in image/video coding
WO2019189346A1 (ja) 2018-03-30 2019-10-03 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置、復号装置、符号化方法及び復号方法

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69133401T2 (de) * 1990-03-16 2005-01-13 Fujitsu Ltd., Kawasaki System zur Verarbeitung von Bilddaten
US5875266A (en) * 1990-07-31 1999-02-23 Fujitsu Limited Image data processing a method and apparatus
JPH0813138B2 (ja) * 1990-11-28 1996-02-07 松下電器産業株式会社 画像符号化装置
JP3012698B2 (ja) * 1991-01-29 2000-02-28 オリンパス光学工業株式会社 画像データの符号化装置および符号化方法
DE69222332T2 (de) * 1991-02-21 1998-01-29 Nec Corp Kodierungsgerät zur Kompression von bewegten Bilddaten
TW256010B (es) * 1991-04-18 1995-09-01 Ampex
EP0514663A3 (en) * 1991-05-24 1993-07-14 International Business Machines Corporation An apparatus and method for motion video encoding employing an adaptive quantizer
JPH05167998A (ja) * 1991-12-16 1993-07-02 Nippon Telegr & Teleph Corp <Ntt> 画像の符号化制御処理方法
JPH05316360A (ja) 1992-05-14 1993-11-26 Fuji Xerox Co Ltd 画像信号の符号化復号装置
CA2094524A1 (en) * 1992-07-30 1994-01-31 Ephraim Feig Digital image processor for color image compression
JP3348310B2 (ja) * 1992-09-28 2002-11-20 ソニー株式会社 動画像符号化方法および動画像符号化装置
US5493513A (en) 1993-11-24 1996-02-20 Intel Corporation Process, apparatus and system for encoding video signals using motion estimation
US5426512A (en) * 1994-01-25 1995-06-20 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration Image data compression having minimum perceptual error
JP3097437B2 (ja) 1994-03-14 2000-10-10 松下電器産業株式会社 圧縮動画像の記録方法と再生装置
US5500678A (en) * 1994-03-18 1996-03-19 At&T Corp. Optimized scanning of transform coefficients in video coding
JP3265818B2 (ja) 1994-04-14 2002-03-18 松下電器産業株式会社 動画符号化方法
JP3336754B2 (ja) * 1994-08-19 2002-10-21 ソニー株式会社 デジタルビデオ信号の記録方法及び記録装置
US5612742A (en) * 1994-10-19 1997-03-18 Imedia Corporation Method and apparatus for encoding and formatting data representing a video program to provide multiple overlapping presentations of the video program
US7356079B2 (en) * 2001-11-21 2008-04-08 Vixs Systems Inc. Method and system for rate control during video transcoding

Also Published As

Publication number Publication date
BR9805978B8 (pt) 2019-02-26
WO1998035503A1 (en) 1998-08-13
DE69813635T2 (de) 2004-03-25
CN1140130C (zh) 2004-02-25
KR20000064840A (ko) 2000-11-06
KR100303054B1 (ko) 2001-09-24
US20010021222A1 (en) 2001-09-13
US20030067980A1 (en) 2003-04-10
EP1113672A2 (en) 2001-07-04
EP1397006A1 (en) 2004-03-10
ES2178142T3 (es) 2002-12-16
CN1223057A (zh) 1999-07-14
TW441198B (en) 2001-06-16
CN1329440A (zh) 2002-01-02
BR9805978A (pt) 1999-08-31
CN1145363C (zh) 2004-04-07
CN1329439A (zh) 2002-01-02
DE69829783T2 (de) 2005-09-01
ES2240263T3 (es) 2005-10-16
US6501793B2 (en) 2002-12-31
DE69805583T2 (de) 2003-01-23
EP1113672A3 (en) 2001-07-18
EP1113673A3 (en) 2001-07-18
EP1113672B1 (en) 2005-04-13
BR9805978B1 (pt) 2012-06-12
EP1397006B1 (en) 2009-07-22
MY127668A (en) 2006-12-29
DE69805583D1 (de) 2002-07-04
EP1113673B1 (en) 2003-04-16
EP0903042A1 (en) 1999-03-24
CN1198466C (zh) 2005-04-20
ID20721A (id) 1999-02-18
ES2195965T3 (es) 2003-12-16
EP1113673A2 (en) 2001-07-04
US6445739B1 (en) 2002-09-03
DE69841007D1 (de) 2009-09-03
US7860159B2 (en) 2010-12-28
US7010035B2 (en) 2006-03-07
US20060171459A1 (en) 2006-08-03
EP0903042B1 (en) 2002-05-29
DE69813635D1 (de) 2003-05-22
DE69829783D1 (de) 2005-05-19

Similar Documents

Publication Publication Date Title
ES2328802T3 (es) Matriz de cuantificacion para la codificacion de imagenes fijas y en movimiento.
KR100788220B1 (ko) 품질기반 영상압축
JP5384696B2 (ja) 分散に基づいた適応性ブロックサイズdct画像圧縮
US20070189626A1 (en) Video encoding/decoding method and apparatus
JP2009272727A (ja) 予測誤差の方向性に基づく変換方法、画像符号化方法及び画像復号化方法
KR20030043612A (ko) 영상 화질 향상 인자를 이용한 지능형 파문 스캔 장치 및그 방법과 그를 이용한 영상 코딩/디코딩 장치 및 그 방법
KR0152015B1 (ko) 가변장 부호화/복호화방법 및 그 장치
KR100501815B1 (ko) 비트 플레인을 이용한 계층적 이산여현 변환방법
JPH099266A (ja) 画像符号化装置及び方法
KR100439419B1 (ko) 물체모양정보부호화에서교류(ac)계수예측부호화방법
MXPA98008298A (es) Matriz de cuantificacion para codificacion de imagenes fijas y en movimiento
Yang et al. Wavelet transform coding for MCP error images using quadtree decomposition and ECVQ