ES2392437T3 - Procedimiento de decodificación de vídeos que utiliza matrices de cuantificación adaptativas - Google Patents
Procedimiento de decodificación de vídeos que utiliza matrices de cuantificación adaptativas Download PDFInfo
- Publication number
- ES2392437T3 ES2392437T3 ES05712072T ES05712072T ES2392437T3 ES 2392437 T3 ES2392437 T3 ES 2392437T3 ES 05712072 T ES05712072 T ES 05712072T ES 05712072 T ES05712072 T ES 05712072T ES 2392437 T3 ES2392437 T3 ES 2392437T3
- Authority
- ES
- Spain
- Prior art keywords
- matrix
- quantization matrix
- image
- quantization
- quantification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/24—Systems for the transmission of television signals using pulse code modulation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/188—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a video data packet, e.g. a network abstraction layer [NAL] unit
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
- H04N19/126—Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
- H04N19/159—Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/186—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/236—Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
Procedimiento de decodificación de imágenes para decodificar cada una de una pluralidad de imágenescodificadas por bloque utilizando una matriz de cuantificación, comprendiendo dicho procedimiento las etapassiguientes:obtener, a partir de un flujo codificado, una matriz de cuantificación distinta de una matriz de cuantificaciónpredefinida y un ID de matriz para identificar la matriz de cuantificación, y reservar la matriz de cuantificación y elID de matriz;extraer, a partir del flujo continuo codificado, un ID de matriz que se añade a los datos generados codificandouna imagen actual y que se utiliza para identificar una matriz de cuantificación que se ha utilizado para codificarla imagen actual;identificar, a partir de las matrices de cuantificación reservadas en dicha etapa de reserva, una matriz decuantificación correspondiente al ID de matriz ydecodificar los datos de la imagen codificada actual utilizando la matriz de cuantificación identificada,componiéndose cada imagen de un componente luma, un primer componente croma y un segundo componentecroma, y estando el procedimiento de decodificación de imágenes caracterizado porque comprende las etapassiguientes:una primera etapa, en la que en caso de que exista una matriz de cuantificación para el componente luma,una matriz de cuantificación para el primer componente croma y una matriz de cuantificación para el segundocomponente croma, por separado, en la matriz de cuantificación identificada por el ID de matriz extraído, lamatriz de cuantificación para el componente luma se identifica como matriz de cuantificación para uncomponente luma de la imagen actual, la matriz de cuantificación para el primer componente croma seidentifica como matriz de cuantificación para un primer componente croma de la imagen actual, y la matriz decuantificación para el segundo componente croma se identifica como matriz de cuantificación para unsegundo componente croma de la imagen actual,una segunda etapa, en la que, en caso de que la matriz de cuantificación para el primer componente cromano esté presente y la matriz de cuantificación para el segundo componente croma esté presente en la matrizde cuantificación identificada por el ID de matriz extraído, se identifica la matriz de cuantificación para elsegundo componente croma, en lugar de la matriz de cuantificación predefinida, como matriz decuantificación para el primer componente croma de la imagen actual, yuna tercera etapa, en la que en caso de que tanto la matriz de cuantificación para el primer componentecroma y la matriz de cuantificación para el segundo componente croma no estén presentes en la matriz decuantificación identificada por el ID de matriz extraído, se identifica la matriz de cuantificación para elcomponente luma, en lugar de la matriz de cuantificación predefinida, como la matriz de cuantificación para elprimer componente croma de la imagen actual y el segundo componente croma de la imagen actual.
Description
Procedimiento de decodificación de vídeos que utiliza matrices de cuantificación adaptativas.
Campo técnico
La presente invención se refiere a un procedimiento de codificación de imágenes en movimiento para codificar imágenes en movimiento y generar flujos continuos, y a un procedimiento de decodificación de imágenes en movimiento para decodificar dichos flujos continuos codificados, así como los flujos continuos.
Antecedentes de la técnica
En la era de la multimedia que trata integralmente el audio, el vídeo y otros valores de píxeles, los medios informativos actuales, es decir, los periódicos, las revistas, la televisión, la radio, el teléfono y otro tipo de medios a través de los cuales se transmite información a las personas han sido englobados últimamente dentro del alcance de la multimedia. En general, el término multimedia se refiere a algo que se representa asociando no solo caracteres, sino también gráficos, audio y, en particular, imágenes y similares. No obstante, una condición previa para englobar los medios informativos disponibles mencionados anteriormente en el ámbito de la multimedia es la representación de dicha información en formato digital.
Sin embargo, cuando se calcula la cantidad de información contenida en cada uno de los medios informativos mencionados anteriormente como cantidad de información digital, mientras que la cantidad de información por carácter es de 1 a 2 bytes en el caso de los caracteres, la cantidad de información que se va a necesitar en el caso del audio (calidad telefónica) es de 64 Kbits por segundo y, en el caso de las imágenes en movimiento (calidad de recepción de televisión actual), de 100 Mbits por segundo. Por consiguiente, no resulta razonable que los medios informativos mencionados anteriormente manejen una cantidad de información tan enorme como la disponible en formato digital. Por ejemplo, aunque actualmente ya existen videoteléfonos que utilizan la red digital de servicios integrados (RDSI) que ofrece una velocidad de transmisión comprendida entre 64 Kbits/s y 1,5 Mbits/s, no resulta práctico transmitir vídeo de televisiones y cámaras directamente a través de la RDSI.
Desde este punto de vista, se ha planteado la necesidad de disponer de técnicas de compresión de información, y se han empleado técnicas de compresión de imágenes en movimiento que cumplen las normas H.261 y H.263 recomendadas por la UIT-T (Unión internacional de telecomunicaciones, sector de normalización de las telecomunicaciones) para videoteléfonos, por ejemplo. Además, según las técnicas de compresión de información que cumplen la norma MPEG-1, es posible almacenar información de imágenes en un CD (disco compacto) de música corriente junto con información de sonido.
El término MPEG (Grupo de expertos en imágenes en movimiento) se refiere a una norma internacional de compresión de señales de imágenes en movimiento normalizadas por ISO/IEC (Organismo internacional de normalización, Comisión electrotécnica internacional), y el término MPEG-1 se refiere a una norma para comprimir información de señales de televisión aproximadamente hasta una centésima parte, de tal forma que las señales de imágenes en movimiento puedan transmitirse a una velocidad de 1,5 Mbit/s. Además, puesto que la velocidad de transmisión alcanzada por la norma MPEG-1 es una velocidad de calidad media de alrededor de 1,5 Mbit/s, la norma MPEG-2 creada con miras a cumplir requisitos de mejor calidad de imagen permite una transmisión de datos equivalente en calidad a la radiodifusión de televisión, por medio de la cual las señales de imágenes en movimiento se transmiten a una velocidad de 2 a 15 Mbit/s. Por otra parte, el grupo de trabajo (ISO/IEC JTC1/SC29/WG11), promotor de las normas MPEG-1 y MPEG-2, creó la norma MPEG-4. La norma MPEG-4, que ofrece una tasa de compresión más alta que las normas MPEG-1 y MPEG-2 y que ofrece una codificación, una decodificación y un funcionamiento basados en el objeto, es capaz de aportar las nuevas funciones necesarias en la era de la multimedia. En la fase inicial de la normalización, la norma MPEG-4 tenía por objetivo ofrecer un procedimiento de codificación de baja velocidad binaria, pero posteriormente se ha ampliado para ser una norma que admite una codificación más general que procesa imágenes entrelazadas, así como una codificación de alta velocidad binaria. Actualmente, ISO/IEC y UIT-T han unido esfuerzos para la normalización de MPEG-4 AVC y UIT-T H.264 como procedimientos de codificación de imágenes de próxima generación que ofrecen una tasa de compresión más alta. A partir de agosto de 2002, se emite un proyecto de comité (CD) para un procedimiento de codificación de imágenes de próxima generación.
En general, en la codificación de una imagen en movimiento, la cantidad de información se comprime reduciendo las redundancias en las direcciones temporal y espacial. Por lo tanto, en la codificación de predicción interimagen que pretende reducir las redundancias temporales, se lleva a cabo la estimación del movimiento y la generación de una imagen predictiva de bloque en bloque con referencia a las imágenes progresivas o regresivas, y a continuación se aplica la codificación al valor de diferencia entre la imagen predictiva obtenida y una imagen de la imagen actual que se va a codificar. Aunque esta última hace referencia a una imagen, en el caso de una imagen progresiva "imagen" significa "trama", mientras que en el caso de una imagen entrelazada significa "trama" o "campos". En la presente memoria, una "imagen entrelazada" es una imagen de una trama que se compone de dos campos separados por el tiempo de captura. En la codificación y la decodificación de una imagen entrelazada, es posible tratar una trama
como una trama propiamente dicha, como dos campos o como una estructura de trama o una estructura de campo de bloque en bloque dentro de la trama.
La imagen que se va a codificar mediante predicción intraimagen sin referencia a ninguna imagen se denominará imagen I. La imagen que se va a codificar mediante predicción interimagen con referencia solo a una imagen se denominará imagen P. La imagen que se va a codificar mediante predicción interimagen con referencia a dos imágenes al mismo tiempo se denominará imagen B. Es posible que una imagen B se refiera a dos imágenes que pueden combinarse de forma arbitraria a partir de imágenes progresivas y regresivas por orden de presentación. Pueden determinarse imágenes de referencia para cada bloque que sirve como unidad de codificación/decodificación básica. Dichas imágenes de referencia pueden diferenciarse denominando "primera imagen de referencia" a una imagen de referencia que se describirá antes en un flujo de bits codificado, y denominando "segunda imagen de referencia" a una imagen de referencia que se describirá después en el flujo de bits. Debe tenerse en cuenta que una condición para codificar y decodificar estos tipos de imágenes es que las imágenes utilizadas como referencia deben estar ya codificadas y decodificadas.
Las imágenes P y B se codifican mediante predicción interimagen con compensación de movimiento. La codificación mediante predicción interimagen con compensación de movimiento es un procedimiento de codificación en el que se emplea compensación de movimiento en la codificación de predicción interimagen. A diferencia de un procedimiento para realizar la predicción basada simplemente en los valores de píxel de una imagen de referencia, la estimación de movimiento es una técnica capaz de aumentar la precisión de la predicción, así como reducir la cantidad de datos estimando la cantidad de movimiento (en lo sucesivo denominado "vector de movimiento") de cada parte de una imagen, y realizando además una predicción en la que se toma en consideración dicha cantidad de movimiento. Por ejemplo, es posible reducir la cantidad de datos a través de la compensación de movimiento estimando los vectores de movimiento de la imagen que se va a codificar actualmente y, a continuación, codificando los residuos de predicción entre los valores de predicción obtenidos cambiando solo la cantidad de los respectivos vectores de movimiento y la imagen que se va a codificar actualmente. En esta técnica, también se registran o transmiten vectores de movimiento en forma codificada, puesto que la información de los vectores de movimiento se necesita en el momento de la decodificación.
Se estiman los vectores del movimiento de cada macrobloque. De forma más particular, se fijará un macrobloque de la imagen que se va a codificar actualmente, para estimar los vectores de movimiento calculando la posición del bloque de referencia más similar de dicho macrobloque fijado dentro del área de búsqueda de una imagen de referencia.
La figura 1 es un diagrama que ilustra un ejemplo de estructura de datos de un flujo de bits. Como se representa en la figura 1, el flujo de bits presenta una estructura jerárquica como la indicada a continuación. El flujo de bits (flujo) está constituido por más de un grupo de imágenes (GOP). Utilizando los GOP como unidades de codificación básicas, resulta posible editar una imagen en movimiento, así como efectuar un acceso aleatorio. Cada GOP se compone de una pluralidad de imágenes, que pueden ser imágenes I, imágenes P e imágenes B. Cada imagen se compone además de una pluralidad de segmentos. Cada segmento, que es un área en forma de banda de cada imagen, se compone de una pluralidad de macrobloques. Por otra parte, cada flujo, GOP, imagen y segmento comprende una señal de sincronización (sync) para indicar el punto final de cada unidad y un encabezamiento (encabezamiento) que son datos comunes a cada una de dichas unidades.
Debe observarse que, cuando los datos no se transmiten en un flujo de bits que es una secuencia de flujos continuos, sino en un paquete o similar que es una unidad fragmentaria, el encabezamiento y la parte de datos, que es la parte que queda, pueden transmitirse por separado. En tal caso, el encabezamiento y la parte de datos no se integrarán en el mismo flujo de bits representado en la figura 1. En el caso de un paquete, sin embargo, aunque el encabezamiento y la parte de datos no se transmitan en secuencia, el encabezamiento correspondiente a la parte de datos simplemente se transmite en otro paquete. Por consiguiente, aunque el encabezamiento y la parte de datos no se integren en el mismo flujo de bits, el concepto de flujo de bits codificado descrito con referencia a la figura 1 también es aplicable a los paquetes.
En términos generales, el sentido de la vista de las personas es más sensible a los componentes de baja frecuencia que a los componentes de alta frecuencia. Además, puesto que la energía de los componentes de baja frecuencia de una señal de imagen es superior a la de los componentes de alta frecuencia, la codificación de imágenes se realiza por orden de menor a mayor frecuencia de los componentes. Como resultado de lo anterior, el número de bits necesario para codificar los componentes de baja frecuencia es más alto que el necesario para los componentes de alta frecuencia.
Teniendo en cuenta los puntos anteriores, los procedimientos de codificación disponibles utilizan, para los componentes de alta frecuencia, etapas de cuantificación más largas que las de los componentes de baja frecuencia cuando se cuantifican los coeficientes de transformación, que se obtienen mediante transformación ortogonal, de las respectivas frecuencias. Esta técnica ha permitido, a los procedimientos de codificación convencionales, lograr un gran incremento de la tasa de compresión con una pequeña pérdida de calidad de imagen desde el punto de vista del observador.
Mientras tanto, puesto que los tamaños de las etapas de cuantificación de los componentes de alta frecuencia con respecto a los componentes de baja frecuencia dependen de la señal de imagen, convencionalmente se ha empleado una técnica para cambiar los tamaños de las etapas de cuantificación para los respectivos componentes de frecuencia de cada imagen. Se utiliza una matriz de cuantificación para obtener las etapas de cuantificación de los respectivos componentes de frecuencia. La figura 2 representa un ejemplo de matriz de cuantificación. En este dibujo, el componente de la esquina superior izquierda es un componente de corriente continua, mientras que los componentes situados a la derecha son componentes de alta frecuencia horizontales y los componentes situados en sentido descendente son componentes de alta frecuencia verticales. La matriz de cuantificación de la figura 2 también indica que se aplican etapas de cuantificación más largas a los valores más altos. Habitualmente, es posible utilizar diferentes matrices de cuantificación para cada imagen, describiéndose la matriz que se va a utilizar en el encabezamiento de cada imagen. Por consiguiente, aunque se utilice la misma matriz de cuantificación para todas las imágenes, dicha matriz se describe en el encabezamiento de cada imagen y se transmite de forma individual.
Mientras tanto, la norma MPEG-4 AVC actual no comprende la matriz de cuantificación como sucede en las normas MPEG-2 y MPEG-4. Esto dificulta la consecución de una calidad subjetiva óptima en el sistema de codificación MPEG-4 AVC actual y otros sistemas que utilizan la cuantificación uniforme en todos los coeficientes DCT o tipo DCT. Cuando se introduce dicho sistema de matriz de cuantificación, debe permitirse que las disposiciones actuales de la norma MPEG-4 AVC u otras comprendan las matrices de cuantificación, por consideración a la compatibilidad con las normas existentes.
Además, debido al aumento de la eficacia de codificación, la norma MPEG-4 AVC ha sido capaz de ofrecer el potencial para utilizar en diversos dominios de aplicación. La versatilidad garantiza el uso de diferentes conjuntos de matrices de cuantificación para diferentes aplicaciones; diferentes conjuntos de matrices de cuantificación para diferentes canales de color, etc. Los codificadores pueden seleccionar diferentes matrices de cuantificación dependiendo de la aplicación o la imagen que se va a codificar. Por este motivo, es necesario elaborar una definición y un protocolo de carga de la matriz de cuantificación eficaces para facilitar una transmisión flexible aunque eficaz de la información de la matriz de cuantificación.
El artículo titulado "Quantization Tools for High Quality Video" publicado según las directrices de ISO/IEC JTC1/SC29/WG11 y UIT-T SG16 Q.6 indica que se ha propuesto ampliar la cuantificación, para que sea compatible con el vídeo de alta calidad, mediante una matriz de ponderación y una tabla de cuantificación ampliada. Un codificador utiliza adaptativamente una matriz de ponderación y la codifica en un flujo de bits. El rango de QP se amplía hasta -8 y se forman nuevas matrices de ponderación. Una matriz de ponderación se transmite mejor fuera de banda y a través de los conjuntos de parámetros de la capa NAL. Una matriz de ponderación debe cambiarse a una posición más alta que la capa de imagen. La ampliación de la tabla de cuantificación combinada con la matriz de cuantificación es necesaria para la codificación de vídeo de alta calidad.
El artículo titulado "New Quantization Tools" publicado en el marco de ISO/IEC JTC1/SC29/WG11 trata sobre un objeto similar e indica que, en un intento por normalizar la nueva tecnología de codificación de vídeo, se realizaron ensayos que demostraron, con respecto a la compatibilidad con la alta calidad de vídeo, que la cuantificación plantea diversos problemas.
El artículo titulado "Adaptive image compression using local pattern information", publicado en Pattern Recognition Letters 23 (2002), páginas 1837 a 1845, describe una nueva técnica de codificación adaptativa a la codificación de los coeficientes de transformada utilizados en los sistemas de compresión de imágenes basada en bloques. La presencia y orientación de la información de borde en un subbloque se utilizan para seleccionar tablas de cuantificación diferentes y vías de exploración en zigzag para cubrir el diseño de la imagen local. Las medidas de presencia de borde y orientación de borde en un subbloque se calculan fuera de sus coeficientes DCT, y cada subbloque puede clasificarse en cuatro diseños de borde diferentes. Los resultados experimentales demuestran que, comparado con la codificación JPEG y la codificación basada en el HVS mejorada, el nuevo sistema ha incrementado significativamente la tasa de compresión sin deteriorar la calidad de la imagen reconstruida.
Exposición de la invención
La presente invención se ha concebido teniendo en cuenta las circunstancias anteriores, siendo el objetivo de la presente invención ofrecer un procedimiento de decodificación de imágenes en movimiento que es capaz de reducir la cantidad de datos que se deben codificar y aumentar la eficacia de codificación.
El procedimiento de decodificación de imágenes en movimiento según la presente invención es un procedimiento de decodificación de imágenes según la reivindicación 1.
Según el procedimiento anterior, es posible decodificar un flujo continuo codificado, en el que solo se asigna el ID de matriz para identificar la matriz de cuantificación utilizada para la cuantificación a unidades predeterminadas, tales como las unidades de imagen, segmento, macrobloque o similares, mientras que la matriz de cuantificación se ha transmitido previamente por separado.
En el procedimiento anterior, cada imagen se compone de un componente luma y dos tipos de componentes croma, y en caso de que en la identificación no exista ninguna matriz de cuantificación para un tipo de componentes croma correspondiente a la decodificación actual en las matrices de cuantificación identificadas basándose en la información de identificación, puede identificarse una matriz de cuantificación de otro tipo de componentes croma para utilizarla como matriz de cuantificación.
Según el procedimiento anterior, es posible decodificar un flujo continuo codificado aunque no haya ninguna matriz de cuantificación para los componentes croma.
Como resulta obvio a partir de la descripción anterior, según el procedimiento de decodificación de imágenes en movimiento de la presente invención, es posible reducir la cantidad de datos que se van a codificar y ofrecer una codificación y decodificación eficaces.
Breve descripción de los dibujos
Estos y otros objetivos, ventajas y características de la presente invención se pondrán de manifiesto a partir de la siguiente descripción de los mismos, considerada conjuntamente con los dibujos adjuntos que ilustran una forma de realización particular de la presente invención. En los dibujos:
la figura 1 es un diagrama que ilustra un ejemplo de estructura de datos de un flujo de bits;
la figura 2 es un diagrama que representa un ejemplo de matriz de cuantificación;
la figura 3 es un diagrama de bloques que representa la estructura de un aparato de codificación de imágenes en movimiento que constituye una forma de realización del procedimiento de codificación de imágenes en movimiento según la presente invención;
la figura 4 es un diagrama que representa la correspondencia entre los conjuntos de parámetros de secuencia y los conjuntos de parámetros de imagen y las imágenes;
la figura 5 es un diagrama que representa una parte de una estructura de un conjunto de parámetros de secuencia;
la figura 6 es un diagrama que representa una parte de una estructura de un conjunto de parámetros de imagen;
la figura 7 es un diagrama que representa un ejemplo de descripción de las matrices de cuantificación de un conjunto de parámetros;
la figura 8 es un diagrama de flujo que representa las operaciones para asignar un ID de matriz;
la figura 9 es un diagrama de bloques que representa la estructura de un aparato de decodificación de imágenes en movimiento que constituye una forma de realización del procedimiento de decodificación de imágenes en movimiento según la presente invención;
la figura 10 es un diagrama de flujo que representa las operaciones para identificar una matriz de cuantificación;
la figura 11 es un diagrama de flujo que representa las operaciones para identificar una matriz de cuantificación para los componentes de croma;
la figura 12 es un diagrama que representa la correspondencia entre matrices de cuantificación transmitidas como datos separados y matrices de cuantificación para secuencias;
las figuras 13A a 13C son diagramas que ilustran unos medios de grabación en los que se almacena un programa para llevar a cabo, mediante un sistema informático, el procedimiento de decodificación de imágenes en movimiento según la forma de realización anterior, y particularmente la figura 13A es un diagrama que ilustra un ejemplo de formato físico de un disco flexible como cuerpo principal de unos medios de grabación, la figura 13B es el aspecto completo del disco flexible visto desde la parte delantera del mismo, una vista en sección transversal del mismo y el disco flexible en sí, y la figura 13C es un diagrama que ilustra una estructura para grabar en el disco flexible y reproducir a partir de este el programa anterior;
la figura 14 es un diagrama de bloques que representa una configuración general de un sistema de suministro de contenido que constituye una forma de realización de un servicio de distribución de contenido;
la figura 15 es un diagrama que representa un ejemplo de teléfono celular;
la figura 16 es un diagrama de bloques que representa la estructura interna del teléfono celular y
la figura 17 es un diagrama que representa la configuración global de un sistema de radiodifusión digital.
Mejor modo de poner en práctica la invención
Las formas de realización de la presente invención se describen con referencia a los diagramas.
[Primera forma de realización]
La figura 3 es un diagrama de bloques que representa la estructura de un aparato de codificación de imágenes en movimiento.
Un aparato de codificación de imágenes 1 es un aparato para realizar la codificación por compresión de una señal de imagen de entrada Vin y generar un flujo continuo codificado Str que se ha codificado como un flujo de bits aplicando codificación de longitud variable y similares. Como se representa en la figura 3, dicho aparato de codificación de imágenes 3 consiste en una unidad de estimación de movimiento 101, una unidad de compensación de movimiento 102, una unidad de sustracción 103, una unidad de transformación ortogonal 104, una unidad de cuantificación 105, una unidad de cuantificación inversa 106, una unidad de transformación ortogonal inversa 107, una unidad de adición 108, una memoria de imágenes 109, un interruptor 110, una unidad de codificación de longitud variable 111 y una unidad de reserva de matrices de cuantificación 112.
La señal de imagen Vin se transmite a la unidad de sustracción 103 y la unidad de estimación de movimiento 101. La unidad de la sustracción 103 calcula valores de píxel residuales entre cada imagen de la señal de imagen de entrada Vin y cada imagen predictiva, y transmite los valores de píxel residuales calculados a la unidad de transformación ortogonal 104. La unidad de transformación ortogonal 104 transforma los valores de píxel residuales en coeficientes de frecuencia y los transmite a la unidad de cuantificación 105. La unidad de cuantificación 105 cuantifica los coeficientes de frecuencia recibidos mediante la matriz de cuantificación WM recibida y transmite los valores cuantificados resultantes Qcoef a la unidad de codificación de longitud variable 111.
La unidad de cuantificación inversa 106 realiza la cuantificación inversa de los valores cuantificados Qcoef mediante la matriz de cuantificación WM recibida, para convertirlos en los coeficientes de frecuencia, y los transmite a la unidad de transformación ortogonal inversa 107. La unidad de transformación ortogonal inversa 107 realiza la transformación de frecuencia inversa de los coeficientes de frecuencia para transformarlos en valores de píxel residuales, y los transmite a la unidad de adición 108. La unidad de la adición 108 añade los valores de píxel residuales y cada imagen predictiva generada por la unidad de estimación de movimiento 102, para formar una imagen decodificada. El interruptor 110 se desactiva cuando se indica que dicha imagen decodificada debe almacenarse y que dicha imagen decodificada debe almacenarse en la memoria de imágenes 109.
Mientras tanto, la unidad de estimación de movimiento 101, que recibe la señal de imagen Vin de cada macrobloque, detecta el área de imagen más cercana a una señal de imagen en dicha señal de imagen Vin recibida dentro de una imagen decodificada almacenada en la memoria de imágenes 109, y determina uno o más vectores de movimiento MV que indican la posición de dicha área. Se estiman vectores de movimiento para cada bloque, que se obtiene todavía más un macrobloque. Una vez hecho esto, es posible utilizar más de una imagen como imágenes de referencia. En este caso, puesto que puede utilizarse una pluralidad de imágenes como imágenes de referencia, se necesitan números de identificación (índices de referencia Index) para identificar las respectivas imágenes de referencia de cada bloque. Utilizando los índices de referencia Index, es posible identificar cada imagen de referencia asociando cada imagen almacenada en la memoria de imágenes 109 con el número de imagen designado a cada una de dichas imágenes.
La unidad de la compensación de movimiento 102 selecciona, como imagen predictiva, el área de imagen más adecuada de las imágenes decodificadas almacenadas en la memoria de imágenes 109, utilizando los vectores de movimiento detectados en el procesamiento anterior y los índices de referencia Index.
La unidad de reserva de matrices de cuantificación 112 reserva la matriz de cuantificación WM que ya se ha transmitido como parte de un conjunto de parámetros y el ID de matriz que identifica esta matriz de cuantificación WM de la manera en la que están asociados uno con el otro.
La unidad de codificación de longitud variable 111 obtiene, a partir de la unidad de reserva de matrices de cuantificación 112, el ID de matriz correspondiente a la matriz de cuantificación WM utilizada para la cuantificación. La unidad de codificación de longitud variable 111 también realiza la codificación de longitud variable de los valores de cuantificación Qcoef, los ID de matriz, los índices de referencia Index, los tipos de imagen Ptype y los vectores de movimiento MV, a fin de obtener un flujo continuo codificado Str.
La figura 4 es un diagrama que representa la correspondencia entre los conjuntos de parámetros de secuencia y los conjuntos de parámetros de imagen y las imágenes. La figura 5 es un diagrama que representa una parte de una
estructura de un conjunto de parámetros de secuencia, y la figura 6 es un diagrama que representa una parte de la estructura de un conjunto de parámetros de imagen. Si bien una imagen se compone de segmentos, todos los segmentos comprendidos en la misma imagen presentan identificadores que indican el mismo conjunto de parámetros de imagen.
En la norma MPEG-4 AVC, no existe el concepto de encabezamiento, y los datos comunes se sitúan en la parte superior de una secuencia debajo de la designación del conjunto de parámetros. Hay dos tipos de conjuntos de parámetros, los conjuntos de parámetros de imagen PPS que están constituidos por los datos correspondientes al encabezamiento de cada imagen, y los conjuntos de parámetros de secuencia SPS correspondientes al encabezamiento de un GOP o una secuencia en MPEG-2. Un conjunto de parámetros de secuencia SPS comprende el número de imágenes que están disponibles como imágenes de referencia, el tamaño de las imágenes, etc., mientras que un conjunto de parámetros de imagen PPS comprende un tipo de codificación de longitud variable (que cambia entre codificación Huffman y codificación aritmética), los valores predefinidos de las matrices de cuantificación, el número de imágenes de referencia, etc.
Se asigna un identificador a un conjunto de parámetros de secuencia SPS y, para permitir la identificación de la secuencia a la cual pertenece una imagen, se indica este identificador en un conjunto de parámetros de imagen PPS. También se asigna un identificador a un conjunto de parámetros de imagen PPS y, para permitir la identificación del conjunto de parámetros de imagen PPS que debe utilizarse, se indica este identificador en un segmento.
Por ejemplo, en el ejemplo representado en la figura 4, la imagen n.º 1 comprende el identificador (PPS=1) de un conjunto de parámetros de imagen PPS que va a indicarse en un segmento comprendido en la imagen n.º 1. El conjunto de parámetros de imagen PPS n.º 1 comprende el identificador (SPS=1) de un conjunto de parámetros de secuencia al cual se va a hacer referencia.
Además, el conjunto de parámetros de secuencia SPS y el conjunto de parámetros de imagen PPS, respectivamente, comprenden los señalizadores 501 y 601 que indican si se transmiten o no matrices de cuantificación, tal como se representa en las figuras 5 y 6 y, en caso de que se vayan a transmitir matrices de cuantificación, se añade una respectiva descripción de las matrices de cuantificación 502 y 602.
La matriz de cuantificación puede cambiarse adaptativamente con respecto a la unidad de cuantificación (por ejemplo, 4 píxeles horizontales x 4 píxeles verticales y 8 píxeles horizontales x 8 píxeles verticales).
La figura 7 es un diagrama que representa un ejemplo de descripción de las matrices de cuantificación de un conjunto de parámetros.
Puesto que una señal de imagen Vin consiste en componentes luma y dos tipos de componentes croma, es posible utilizar matrices de cuantificación diferentes para los componentes luma y los dos tipos de componentes croma por separado al realizar la cuantificación. También es posible utilizar matrices de cuantificación diferentes para la codificación intraimagen y la codificación interimagen por separado.
En consecuencia, por ejemplo, como se representa en la figura 7, es posible describir las matrices de cuantificación para una unidad de cuantificación, los componentes luma y dos tipos de componentes croma y la codificación intraimagen y la codificación interimagen, respectivamente.
A continuación, se describen las operaciones para asignar los ID de matriz en el aparato de codificación de imágenes en movimiento estructurado de la manera descrita. La figura 8 es un diagrama de flujo que representa las operaciones para asignar un ID de matriz.
La unidad de codificación de longitud variable 111 obtiene una matriz de cuantificación WM utilizada para la cuantificación (etapa S101). A continuación, la unidad de codificación de longitud variable 111 determina si la matriz de cuantificación WM obtenida se halla o no en la unidad de reserva de matrices de cuantificación 112 (etapa S102). Entonces, en caso de que la matriz de cuantificación obtenida WM se halle en la unidad de reserva de matrices de cuantificación 112 ("Sí" en la etapa S102), la unidad de codificación de longitud variable 111 obtiene el ID de matriz correspondiente a la matriz de cuantificación obtenida WM en la unidad de reserva de matrices de cuantificación 112 (etapa S103). Entonces, la unidad de codificación de longitud variable 111 asigna el ID de matriz obtenido a unidades predeterminadas (por ejemplo, a cada imagen, segmento o macrobloque) (etapa S104).
Por otro lado, en caso de que la matriz de cuantificación WM obtenida no se halle en la unidad de reserva de matrices de cuantificación 112 ("No" en la etapa S102), la unidad de reserva de matrices de cuantificación 112 genera el ID de matriz para esta matriz de cuantificación WM (etapa S105). A continuación, la unidad de reserva de matrices de cuantificación 112 reserva esta matriz de cuantificación WM y el ID de la matriz de la manera en que están asociados uno con el otro (etapa S106). La unidad de codificación de longitud variable 111 asigna el ID de matriz obtenido a unidades predeterminadas (por ejemplo, a cada imagen, segmento o macrobloque) (etapa S107). La unidad de codificación de longitud variable 111 describe el ID de matriz generado y la matriz de cuantificación
WM en el conjunto de parámetros (etapa S108). Debe observarse que el conjunto de parámetros en el que se describen el ID de matriz y la matriz de cuantificación WM se transmite, en un flujo continuo codificado Str, antes que las unidades predeterminadas (es decir, los datos codificados cuantificados mediante la matriz de cuantificación WM) a las que se asigna dicho ID de matriz.
Como se ha descrito anteriormente, puesto que las matrices de cuantificación WM se describen en un conjunto de parámetros y se transmiten, mientras que solo se asigna el ID de matriz que identifica la matriz de cuantificación WM utilizada a las unidades predeterminadas (por ejemplo, a cada imagen, segmento o macrobloque), no es necesario describir la matriz de cuantificación WM utilizada en cada unidad predeterminada. Por consiguiente, es posible reducir la cantidad de datos que se va a codificar y ofrecer una codificación eficaz.
Debe observarse que es posible actualizar una matriz de cuantificación WM transmitida en un conjunto de parámetros de secuencia SPS y transmitir la matriz actualizada (con el mismo ID de matriz) en un conjunto de parámetros de imagen PPS. En este caso, la matriz de cuantificación actualizada WM se utiliza solo cuando el conjunto de parámetros de imagen PPS está indicado.
También es posible integrar en un flujo continuo codificado un señalizador que indica el cambio entre la matriz de cuantificación predefinida WM y la matriz de cuantificación WM identificada por un ID de matriz. En este caso, la matriz de cuantificación predefinida WM se reemplaza por la matriz de cuantificación WM identificada por el ID de matriz conforme al señalizador.
La figura 9 es un diagrama de bloques que representa la estructura de un aparato de decodificación de imágenes en movimiento que constituye una forma de realización del procedimiento de decodificación de imágenes en movimiento según la presente invención.
El aparato de decodificación de imágenes en movimiento 2 es un aparato que decodifica un flujo continuo codificado obtenido mediante la codificación por el aparato de la codificación de imágenes en movimiento 1 descrito anteriormente, y comprende una unidad de decodificación de longitud variable 201, una unidad de reserva de matrices de cuantificación 202, una memoria de imágenes 203, una unidad de compensación de movimiento 204, una unidad de cuantificación inversa 205, una unidad de transformación ortogonal inversa 206 y una unidad de adición 207.
La unidad de decodificación de longitud variable 201 decodifica el flujo continuo codificado Str y genera unos valores cuantificados Qcoef, unos índices de referencia Index, unos tipos de imágenes Ptype y unos vectores de movimiento MV. La unidad de decodificación de longitud variable 201 también decodifica el flujo continuo codificado, identifica una matriz de cuantificación WM basándose en el ID de matriz extraído y facilita la matriz de cuantificación identificada WM.
La unidad de reserva de matrices de cuantificación 202 asocia la matriz de cuantificación WM que ya se ha transmitido en un conjunto de parámetros con el ID de matriz que identifica esta matriz de cuantificación WM y los reserva.
Los valores cuantificados Qcoef, los índices de referencia Index y los vectores de movimiento MV se introducen en la memoria de imágenes 203, la unidad de compensación de movimiento 204 y la unidad de cuantificación inversa 205, y entonces se aplica a estos el procesamiento de decodificación. Las operaciones de decodificación son iguales a las del aparato de codificación de imágenes en movimiento 1 representado en la figura 3.
A continuación, se describen las operaciones para identificar una matriz de cuantificación en el aparato de decodificación de imágenes en movimiento estructurado tal como se ha indicado anteriormente. La figura 10 es un diagrama de flujo que representa las operaciones para identificar una matriz de cuantificación.
La unidad de decodificación de longitud variable 201 decodifica un flujo continuo codificado Str y extrae un ID de matriz asignado a unidades predeterminadas (etapa S201). A continuación, la unidad de decodificación de longitud variable 201 identifica una matriz de cuantificación WM de las matrices de cuantificación reservadas en la unidad de reserva de matrices de cuantificación 202, basándose en el ID de matriz extraído (etapa S202). A continuación, la unidad de decodificación de longitud variable 201 transmite la matriz de cuantificación identificada WM a la unidad de cuantificación inversa 205 (etapa S203).
Como se ha descrito anteriormente, aunque las matrices de cuantificación WM se describen en un conjunto de parámetros y se transmiten, en unidades predeterminadas (por ejemplo, en cada imagen, segmento o macrobloque), es posible decodificar un flujo continuo codificado al que solo se ha asignado el ID de matriz que identifica la matriz de cuantificación WM utilizada.
Debe observarse que, aunque en la presente forma de realización las matrices de cuantificación WM se describen en un conjunto de parámetros y se transmiten, la presente invención no está limitada a este caso. Por ejemplo, las matrices de cuantificación pueden transmitirse previamente por separado de un flujo continuo codificado.
Puesto que una señal de imagen Vin consiste en componentes luma y dos tipos de componentes croma como los descritos anteriormente, es posible utilizar matrices de cuantificación diferentes por separado para los componentes luma y los dos tipos de componentes croma al realizar la cuantificación. También es posible utilizar una matriz de cuantificación uniforme para todos los componentes.
A continuación, se describen las operaciones para identificar las matrices de cuantificación que se van a utilizar para los componentes croma. La figura 11 es un diagrama de flujo que representa las operaciones para identificar las matrices de cuantificación que se van a utilizar para los componentes croma.
La unidad de decodificación de longitud variable 201 averigua si hay o no una matriz de cuantificación para el tipo de componentes croma correspondiente a la decodificación actual entre las matrices de cuantificación WM identificadas tal como se ha mencionado anteriormente (etapa S301). Por ejemplo, en caso de que el valor cuantificado Qcoef que se va a decodificar sea un primer componente croma, se determina si hay o no una matriz de cuantificación para los primeros componentes croma. En caso de que el valor cuantificado Qcoef que se va a decodificar sea un segundo componente croma, se determina si hay o no una matriz de cuantificación para los segundos componentes croma. Entonces, si existe una matriz de cuantificación para el correspondiente tipo de componentes croma ("Sí" en la etapa S301), se transmite la correspondiente matriz de cuantificación croma a la unidad de cuantificación inversa 205 para que esta la utilice (etapa S302).
Por otro lado, si no existe dicha correspondiente matriz de cuantificación croma ("No", en la etapa S301), la unidad de decodificación de longitud variable 201 determina si hay o no una matriz de cuantificación para otro tipo de componentes croma (etapa S303). Por ejemplo, en caso de que el valor cuantificado Qcoef que se va a decodificar sea un primer componente croma, se determina si hay o no una matriz de cuantificación para los segundos componentes croma. En caso de que el valor cuantificado Qcoef que se va a decodificar sea un segundo componente croma, se determina si hay o no una matriz de cuantificación para los primeros componentes croma. Entonces, si existe una correspondiente matriz de cuantificación para otro tipo de componentes croma ("Sí" en la etapa S303), se transmite la matriz de cuantificación para otro tipo de componentes croma a la unidad de cuantificación inversa 205 para que esta la utilice (etapa S304). Por otro lado, si no existe ninguna matriz de cuantificación para otro tipo de componentes croma ("No" en la etapa S303), se transmite la matriz de cuantificación para los componentes luma a la unidad de cuantificación inversa 205 para que esta la utilice (etapa S305).
De lo anterior se deduce que es posible decodificar un flujo continuo codificado aunque no haya ninguna matriz de cuantificación para componentes croma.
Aplicabilidad industrial
Tal como se ha descrito anteriormente, el procedimiento de codificación de imágenes en movimiento y el procedimiento de decodificación de imágenes en movimiento según la presente invención son útiles como procedimientos para codificar las imágenes que componen una imagen en movimiento a fin de generar un flujo continuo codificado y para decodificar el flujo continuo codificado generado, en dispositivos tales como un teléfono celular, un dispositivo de DVD y un ordenador personal.
Claims (2)
- REIVINDICACIONES1. Procedimiento de decodificación de imágenes para decodificar cada una de una pluralidad de imágenescodificadas por bloque utilizando una matriz de cuantificación, comprendiendo dicho procedimiento las etapas 5 siguientes:obtener, a partir de un flujo codificado, una matriz de cuantificación distinta de una matriz de cuantificación predefinida y un ID de matriz para identificar la matriz de cuantificación, y reservar la matriz de cuantificación y el ID de matriz;10 extraer, a partir del flujo continuo codificado, un ID de matriz que se añade a los datos generados codificando una imagen actual y que se utiliza para identificar una matriz de cuantificación que se ha utilizado para codificar la imagen actual;15 identificar, a partir de las matrices de cuantificación reservadas en dicha etapa de reserva, una matriz de cuantificación correspondiente al ID de matriz ydecodificar los datos de la imagen codificada actual utilizando la matriz de cuantificación identificada,20 componiéndose cada imagen de un componente luma, un primer componente croma y un segundo componente croma, y estando el procedimiento de decodificación de imágenes caracterizado porque comprende las etapas siguientes:una primera etapa, en la que en caso de que exista una matriz de cuantificación para el componente luma,25 una matriz de cuantificación para el primer componente croma y una matriz de cuantificación para el segundo componente croma, por separado, en la matriz de cuantificación identificada por el ID de matriz extraído, la matriz de cuantificación para el componente luma se identifica como matriz de cuantificación para un componente luma de la imagen actual, la matriz de cuantificación para el primer componente croma se identifica como matriz de cuantificación para un primer componente croma de la imagen actual, y la matriz de30 cuantificación para el segundo componente croma se identifica como matriz de cuantificación para un segundo componente croma de la imagen actual,una segunda etapa, en la que, en caso de que la matriz de cuantificación para el primer componente croma no esté presente y la matriz de cuantificación para el segundo componente croma esté presente en la matriz35 de cuantificación identificada por el ID de matriz extraído, se identifica la matriz de cuantificación para el segundo componente croma, en lugar de la matriz de cuantificación predefinida, como matriz de cuantificación para el primer componente croma de la imagen actual, yuna tercera etapa, en la que en caso de que tanto la matriz de cuantificación para el primer componente40 croma y la matriz de cuantificación para el segundo componente croma no estén presentes en la matriz de cuantificación identificada por el ID de matriz extraído, se identifica la matriz de cuantificación para el componente luma, en lugar de la matriz de cuantificación predefinida, como la matriz de cuantificación para el primer componente croma de la imagen actual y el segundo componente croma de la imagen actual.45 2. Procedimiento de decodificación de imágenes según la reivindicación 1, en el que el ID de matriz se añade a los datos de la imagen codificada actual, por cada imagen, segmento o macrobloque.
- 3. Procedimiento de decodificación según la reivindicación 1, en el que la matriz de cuantificación y la informaciónde identificación para identificar la matriz de cuantificación están dispuestas en el flujo continuo codificado, por una 50 pluralidad de imágenes, o por una imagen individual.
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US54049904P | 2004-01-30 | 2004-01-30 | |
US540499P | 2004-01-30 | ||
US55290704P | 2004-03-12 | 2004-03-12 | |
US552907P | 2004-03-12 | ||
US56135104P | 2004-04-12 | 2004-04-12 | |
US561351P | 2004-04-12 | ||
PCT/US2005/002458 WO2005076614A1 (en) | 2004-01-30 | 2005-01-26 | Moving picture coding method and moving picture decoding method |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2392437T3 true ES2392437T3 (es) | 2012-12-10 |
Family
ID=34841730
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES05712072T Active ES2392437T3 (es) | 2004-01-30 | 2005-01-26 | Procedimiento de decodificación de vídeos que utiliza matrices de cuantificación adaptativas |
ES11175220.0T Active ES2563295T3 (es) | 2004-01-30 | 2005-01-26 | Procedimiento de decodificación de imágenes en movimiento que utiliza matrices de cuantificación adicionales |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES11175220.0T Active ES2563295T3 (es) | 2004-01-30 | 2005-01-26 | Procedimiento de decodificación de imágenes en movimiento que utiliza matrices de cuantificación adicionales |
Country Status (8)
Country | Link |
---|---|
US (8) | US7933327B2 (es) |
EP (2) | EP1709801B1 (es) |
JP (3) | JP4679524B2 (es) |
KR (1) | KR101065998B1 (es) |
CN (2) | CN1910922B (es) |
ES (2) | ES2392437T3 (es) |
PL (2) | PL1709801T3 (es) |
WO (1) | WO2005076614A1 (es) |
Families Citing this family (69)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6882685B2 (en) | 2001-09-18 | 2005-04-19 | Microsoft Corporation | Block transform and quantization for image and video coding |
PL1709801T3 (pl) * | 2004-01-30 | 2013-02-28 | Panasonic Ip Corp America | Sposób dekodowania video z wykorzystaniem adaptacyjnych macierzy kwantyzacji |
EP1610560A1 (en) * | 2004-06-24 | 2005-12-28 | Deutsche Thomson-Brandt Gmbh | Method and apparatus for generating and for decoding coded picture data |
US8422546B2 (en) | 2005-05-25 | 2013-04-16 | Microsoft Corporation | Adaptive video encoding using a perceptual model |
US20060291565A1 (en) * | 2005-06-22 | 2006-12-28 | Chen Eddie Y | System and method for performing video block prediction |
WO2007094792A1 (en) * | 2006-02-17 | 2007-08-23 | Thomson Licensing | Localized weighted prediction handling video data brightness variations |
ES2612950T3 (es) | 2006-03-16 | 2017-05-19 | Huawei Technologies Co., Ltd. | Un método y un dispositivo para realizar una cuantificación en codificación-descodificación |
US8503536B2 (en) * | 2006-04-07 | 2013-08-06 | Microsoft Corporation | Quantization adjustments for DC shift artifacts |
US8130828B2 (en) | 2006-04-07 | 2012-03-06 | Microsoft Corporation | Adjusting quantization to preserve non-zero AC coefficients |
US7974340B2 (en) * | 2006-04-07 | 2011-07-05 | Microsoft Corporation | Adaptive B-picture quantization control |
US7995649B2 (en) | 2006-04-07 | 2011-08-09 | Microsoft Corporation | Quantization adjustment based on texture level |
US8059721B2 (en) | 2006-04-07 | 2011-11-15 | Microsoft Corporation | Estimating sample-domain distortion in the transform domain with rounding compensation |
US20070237237A1 (en) * | 2006-04-07 | 2007-10-11 | Microsoft Corporation | Gradient slope detection for video compression |
US8711925B2 (en) * | 2006-05-05 | 2014-04-29 | Microsoft Corporation | Flexible quantization |
JP2008193627A (ja) * | 2007-01-12 | 2008-08-21 | Mitsubishi Electric Corp | 画像符号化装置、画像復号装置、および画像符号化方法、画像復号方法 |
US20080170793A1 (en) * | 2007-01-12 | 2008-07-17 | Mitsubishi Electric Corporation | Image encoding device and image encoding method |
US8238424B2 (en) | 2007-02-09 | 2012-08-07 | Microsoft Corporation | Complexity-based adaptive preprocessing for multiple-pass video compression |
US8942289B2 (en) | 2007-02-21 | 2015-01-27 | Microsoft Corporation | Computational complexity and precision control in transform-based digital media codec |
US8498335B2 (en) | 2007-03-26 | 2013-07-30 | Microsoft Corporation | Adaptive deadzone size adjustment in quantization |
US20080240257A1 (en) * | 2007-03-26 | 2008-10-02 | Microsoft Corporation | Using quantization bias that accounts for relations between transform bins and quantization bins |
US8243797B2 (en) | 2007-03-30 | 2012-08-14 | Microsoft Corporation | Regions of interest for quality adjustments |
US20080253449A1 (en) * | 2007-04-13 | 2008-10-16 | Yoji Shimizu | Information apparatus and method |
US8442337B2 (en) * | 2007-04-18 | 2013-05-14 | Microsoft Corporation | Encoding adjustments for animation content |
US8331438B2 (en) | 2007-06-05 | 2012-12-11 | Microsoft Corporation | Adaptive selection of picture-level quantization parameters for predicted video pictures |
KR101228020B1 (ko) * | 2007-12-05 | 2013-01-30 | 삼성전자주식회사 | 사이드 매칭을 이용한 영상의 부호화 방법 및 장치, 그복호화 방법 및 장치 |
US8189933B2 (en) * | 2008-03-31 | 2012-05-29 | Microsoft Corporation | Classifying and controlling encoding quality for textured, dark smooth and smooth video content |
US8897359B2 (en) | 2008-06-03 | 2014-11-25 | Microsoft Corporation | Adaptive quantization for enhancement layer video coding |
JP2010288166A (ja) * | 2009-06-15 | 2010-12-24 | Panasonic Corp | 動画像符号化装置、放送波記録装置及び、プログラム |
JP2011029956A (ja) * | 2009-07-27 | 2011-02-10 | Sony Corp | 画像符号化装置および画像符号化方法 |
JP5282692B2 (ja) * | 2009-07-27 | 2013-09-04 | ソニー株式会社 | 画像符号化装置と画像符号化方法 |
KR20110017303A (ko) * | 2009-08-13 | 2011-02-21 | 삼성전자주식회사 | 회전변환을 이용한 영상 부호화, 복호화 방법 및 장치 |
KR101504887B1 (ko) | 2009-10-23 | 2015-03-24 | 삼성전자 주식회사 | 데이터 단위 레벨의 독립적 파싱 또는 복호화에 따른 비디오 복호화 방법 및 그 장치, 그리고 데이터 단위 레벨의 독립적 파싱 또는 복호화를 위한 비디오 부호화 방법 및 그 장치 |
EP2495973B1 (en) * | 2009-10-30 | 2019-02-27 | Sun Patent Trust | Decoding method, decoder apparatus, encoding method, and encoder apparatus |
WO2011052217A1 (ja) * | 2009-10-30 | 2011-05-05 | パナソニック株式会社 | 画像復号方法、画像符号化方法、画像復号装置、画像符号化装置、プログラム、及び集積回路 |
KR101457396B1 (ko) | 2010-01-14 | 2014-11-03 | 삼성전자주식회사 | 디블로킹 필터링을 이용한 비디오 부호화 방법과 그 장치, 및 디블로킹 필터링을 이용한 비디오 복호화 방법 및 그 장치 |
KR101494066B1 (ko) | 2010-10-05 | 2015-02-16 | 엠파이어 테크놀로지 디벨롭먼트 엘엘씨 | 공간 광 패턴에 기초한 깊이 데이터의 생성 |
US9167252B2 (en) * | 2010-12-01 | 2015-10-20 | Texas Instruments Incorporated | Quantization matrix compression in video coding |
KR20190069613A (ko) | 2011-02-10 | 2019-06-19 | 벨로스 미디어 인터내셔널 리미티드 | 화상 처리 장치 및 화상 처리 방법 |
US9363509B2 (en) | 2011-03-03 | 2016-06-07 | Electronics And Telecommunications Research Institute | Method for determining color difference component quantization parameter and device using the method |
WO2012118359A2 (ko) | 2011-03-03 | 2012-09-07 | 한국전자통신연구원 | 색차 성분 양자화 매개 변수 결정 방법 및 이러한 방법을 사용하는 장치 |
KR102008030B1 (ko) | 2011-06-23 | 2019-08-06 | 선 페이턴트 트러스트 | 화상 복호 방법, 화상 부호화 방법, 화상 복호 장치, 화상 부호화 장치 및 화상 부호화 복호 장치 |
RU2603552C2 (ru) | 2011-06-24 | 2016-11-27 | Сан Пэтент Траст | Способ декодирования изображения, способ кодирования изображения, устройство декодирования изображения, устройство кодирования изображения и устройство кодирования и декодирования изображения |
WO2012176464A1 (ja) | 2011-06-24 | 2012-12-27 | パナソニック株式会社 | 画像復号方法、画像符号化方法、画像復号装置、画像符号化装置及び画像符号化復号装置 |
BR112013030347B1 (pt) | 2011-06-27 | 2022-06-28 | Sun Patent Trust | Método de decodificação de imagem, método de codificação de imagem, aparelho de decodificação de imagem, aparelho de codificação de imagem e aparelho de codificação e de decodificação de imagem |
MY165469A (en) | 2011-06-28 | 2018-03-23 | Sun Patent Trust | Image decoding method, image coding method, image decoding apparatus, image coding apparatus, and image coding and decoding apparatus |
MX2013010892A (es) | 2011-06-29 | 2013-12-06 | Panasonic Corp | Metodo de decodificacion de imagenes, metodo de codificacion de imagenes, aparato de decodificacion de imagenes, aparato de codificacion de imagenes y aparato de codificacion y decodificacion de imagenes. |
KR102060619B1 (ko) | 2011-06-30 | 2019-12-30 | 선 페이턴트 트러스트 | 화상 복호 방법, 화상 부호화 방법, 화상 복호 장치, 화상 부호화 장치 및 화상 부호화 복호 장치 |
CN103583048B (zh) | 2011-06-30 | 2017-05-17 | 太阳专利托管公司 | 图像解码方法、图像编码方法、图像解码装置、图像编码装置及图像编码解码装置 |
CN103765885B (zh) | 2011-07-11 | 2017-04-12 | 太阳专利托管公司 | 图像解码方法、图像编码方法、图像解码装置、图像编码装置及图像编解码装置 |
US9143802B2 (en) * | 2011-10-31 | 2015-09-22 | Qualcomm Incorporated | Fragmented parameter set for video coding |
JP6120490B2 (ja) * | 2011-11-07 | 2017-04-26 | キヤノン株式会社 | 画像符号化装置、画像符号化方法及びプログラム、画像復号装置、画像復号方法及びプログラム |
CN108924571B (zh) * | 2012-01-20 | 2021-09-07 | 韩国电子通信研究院 | 使用量化矩阵的视频编解码方法 |
EP3432583B1 (en) * | 2012-02-29 | 2020-04-01 | Sony Corporation | Image processing device and method |
JP2013217631A (ja) | 2012-03-14 | 2013-10-24 | Denso Corp | 冷凍サイクル装置 |
WO2013154028A1 (ja) * | 2012-04-13 | 2013-10-17 | ソニー株式会社 | 画像処理装置および方法 |
PL3346708T3 (pl) | 2012-04-16 | 2021-03-08 | Electronics And Telecommunications Research Institute | Sposób kodowania obrazu |
US9736476B2 (en) | 2012-04-27 | 2017-08-15 | Qualcomm Incorporated | Full random access from clean random access pictures in video coding |
US9516308B2 (en) * | 2012-04-27 | 2016-12-06 | Qualcomm Incorporated | Parameter set updates in video coding |
CA2985277C (en) | 2012-06-11 | 2019-06-04 | Samsung Electronics Co., Ltd. | Video encoding method and apparatus, and video decoding method and apparatus sharing sao parameters between color components |
JP6041554B2 (ja) * | 2012-06-27 | 2016-12-07 | キヤノン株式会社 | 画像符号化装置、画像符号化方法及びプログラム、画像復号装置、画像復号方法及びプログラム |
RU2624103C2 (ru) * | 2012-09-06 | 2017-06-30 | Сан Пэтент Траст | Способ кодирования изображений, способ декодирования изображений, устройство кодирования изображений, устройство декодирования изображений и устройство кодирования и декодирования изображений |
JP6210368B2 (ja) * | 2012-09-18 | 2017-10-11 | サン パテント トラスト | 画像復号方法および画像復号装置 |
CN105103563B (zh) * | 2013-04-08 | 2019-05-21 | 寰发股份有限公司 | 关于缩放列表数据信令的方法和装置 |
JP2015076861A (ja) * | 2013-10-11 | 2015-04-20 | ソニー株式会社 | 復号装置および復号方法、並びに、符号化装置および符号化方法 |
US11012693B2 (en) | 2014-12-26 | 2021-05-18 | Panasonic Intellectual Property Management Co., Ltd. | Encoding method, decoding method, encoding apparatus, and decoding apparatus |
JP6272441B2 (ja) * | 2016-11-08 | 2018-01-31 | キヤノン株式会社 | 画像復号装置、画像復号方法及びプログラム |
CN109918605B (zh) * | 2019-03-07 | 2021-09-24 | 杭州又拍云科技有限公司 | 一种基于内容分发网络的生成动态图片的方法 |
US20220224902A1 (en) * | 2019-06-25 | 2022-07-14 | Interdigital Vc Holdings France, Sas | Quantization matrices selection for separate color plane mode |
US20220109840A1 (en) * | 2021-12-17 | 2022-04-07 | Intel Corporation | Methods and apparatus to encode and decode video using quantization matrices |
Family Cites Families (37)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5034965A (en) | 1988-11-11 | 1991-07-23 | Matsushita Electric Industrial Co., Ltd. | Efficient coding method and its decoding method |
JP2794842B2 (ja) | 1988-11-11 | 1998-09-10 | 松下電器産業株式会社 | 符号化方法とその復号化方法 |
JP2924416B2 (ja) | 1992-02-21 | 1999-07-26 | 松下電器産業株式会社 | 高能率符号化方法 |
JP2765268B2 (ja) | 1991-05-21 | 1998-06-11 | 松下電器産業株式会社 | 高能率符号化方法と高能率符号の復号方法 |
US5392037A (en) | 1991-05-21 | 1995-02-21 | Matsushita Electric Industrial Co., Ltd. | Method and apparatus for encoding and decoding |
US5842033A (en) * | 1992-06-30 | 1998-11-24 | Discovision Associates | Padding apparatus for passing an arbitrary number of bits through a buffer in a pipeline system |
EP0593159A3 (en) | 1992-10-09 | 1994-11-09 | Hudson Soft Co Ltd | Image processing apparatus. |
US5613015A (en) * | 1992-11-12 | 1997-03-18 | Fuji Xerox Co., Ltd. | Image signal analyzing system and coding system |
JPH06284412A (ja) | 1993-03-26 | 1994-10-07 | Sony Corp | 画像信号符号化方法および画像信号符号化装置、画像信号復号化方法および画像信号復号化装置、ならびに画像信号記録媒体 |
JPH0775102A (ja) * | 1993-07-19 | 1995-03-17 | Sharp Corp | 画像符号化装置 |
US5937098A (en) * | 1995-02-06 | 1999-08-10 | Asahi Kogaku Kogyo Kabushiki Kaisha | Adaptive quantization of orthogonal transform coefficients for setting a target amount of compression |
US5963673A (en) * | 1995-12-20 | 1999-10-05 | Sanyo Electric Co., Ltd. | Method and apparatus for adaptively selecting a coding mode for video encoding |
DE69721373T2 (de) * | 1996-05-14 | 2004-04-15 | Daewoo Electronics Corp. | Quantisierer für ein Videokodierungssystem |
JP3579544B2 (ja) * | 1996-08-29 | 2004-10-20 | ペンタックス株式会社 | 画像圧縮伸張装置 |
CN1140130C (zh) | 1997-02-08 | 2004-02-25 | 松下电器产业株式会社 | 静画和动画编码的量化矩阵 |
JP3234807B2 (ja) | 1997-02-08 | 2001-12-04 | 松下電器産業株式会社 | デコード方法 |
JP4001969B2 (ja) * | 1997-03-31 | 2007-10-31 | ソニー株式会社 | 符号化装置および方法、並びに復号装置および方法 |
US5879948A (en) * | 1997-05-12 | 1999-03-09 | Tennessee Valley Authority | Determination of total mercury in exhaust gases |
US6126910A (en) * | 1997-10-14 | 2000-10-03 | Wilhelm; James H. | Method for removing acid gases from flue gas |
US6067118A (en) | 1997-12-16 | 2000-05-23 | Philips Electronics North America Corp. | Method of frame-by-frame calculation of quantization matrices |
JP4099682B2 (ja) * | 1998-09-18 | 2008-06-11 | ソニー株式会社 | 画像処理装置および方法、並びに記録媒体 |
JP2000102007A (ja) * | 1998-09-28 | 2000-04-07 | Matsushita Electric Ind Co Ltd | マルチメディア情報合成装置、及び圧縮映像信号生成装置 |
US6259741B1 (en) * | 1999-02-18 | 2001-07-10 | General Instrument Corporation | Method of architecture for converting MPEG-2 4:2:2-profile bitstreams into main-profile bitstreams |
US6999511B1 (en) * | 1999-02-23 | 2006-02-14 | International Business Machines Corporation | Dynamically switching quant matrix tables within an MPEG-2 encoder |
US6658157B1 (en) * | 1999-06-29 | 2003-12-02 | Sony Corporation | Method and apparatus for converting image information |
US6403526B1 (en) * | 1999-12-21 | 2002-06-11 | W. R. Grace & Co.-Conn. | Alumina trihydrate derived high pore volume, high surface area aluminum oxide composites and methods of their preparation and use |
JP4593720B2 (ja) | 2000-03-10 | 2010-12-08 | パナソニック株式会社 | 剰余数係数の動的表示方法および装置 |
KR100796085B1 (ko) | 2000-04-14 | 2008-01-21 | 소니 가부시끼 가이샤 | 복호 장치, 복호 방법, 및 기록 매체 |
JP4348899B2 (ja) | 2001-11-30 | 2009-10-21 | ソニー株式会社 | 画像情報復号方法 |
US7295609B2 (en) | 2001-11-30 | 2007-11-13 | Sony Corporation | Method and apparatus for coding image information, method and apparatus for decoding image information, method and apparatus for coding and decoding image information, and system of coding and transmitting image information |
US6818043B1 (en) * | 2003-01-23 | 2004-11-16 | Electric Power Research Institute, Inc. | Vapor-phase contaminant removal by injection of fine sorbent slurries |
PL1709801T3 (pl) * | 2004-01-30 | 2013-02-28 | Panasonic Ip Corp America | Sposób dekodowania video z wykorzystaniem adaptacyjnych macierzy kwantyzacji |
US7620103B2 (en) * | 2004-12-10 | 2009-11-17 | Lsi Corporation | Programmable quantization dead zone and threshold for standard-based H.264 and/or VC1 video encoding |
US7373009B2 (en) * | 2005-02-09 | 2008-05-13 | Lsi Corporation | Method and apparatus for efficient transmission and decoding of quantization matrices |
US7929624B2 (en) * | 2006-10-26 | 2011-04-19 | Telefonaktiebolaget L M Ericsson (Publ) | Cell ID detection in cellular communication systems |
DE602009001091D1 (de) | 2009-02-05 | 2011-05-26 | Research In Motion Ltd | Tragbares drahtloses Kommunikationsgerät mit Diversity-Antennensystem und entsprechendes Verfahren |
CN108924571B (zh) * | 2012-01-20 | 2021-09-07 | 韩国电子通信研究院 | 使用量化矩阵的视频编解码方法 |
-
2005
- 2005-01-26 PL PL05712072T patent/PL1709801T3/pl unknown
- 2005-01-26 ES ES05712072T patent/ES2392437T3/es active Active
- 2005-01-26 CN CN200580003123XA patent/CN1910922B/zh active Active
- 2005-01-26 CN CN200910262227.2A patent/CN101699866B/zh active Active
- 2005-01-26 EP EP05712072A patent/EP1709801B1/en active Active
- 2005-01-26 KR KR1020067002907A patent/KR101065998B1/ko active IP Right Grant
- 2005-01-26 WO PCT/US2005/002458 patent/WO2005076614A1/en not_active Application Discontinuation
- 2005-01-26 ES ES11175220.0T patent/ES2563295T3/es active Active
- 2005-01-26 EP EP11175220.0A patent/EP2384002B1/en active Active
- 2005-01-26 JP JP2006551435A patent/JP4679524B2/ja active Active
- 2005-01-26 US US10/569,872 patent/US7933327B2/en active Active
- 2005-01-26 PL PL11175220T patent/PL2384002T3/pl unknown
-
2010
- 2010-12-10 JP JP2010276436A patent/JP5048826B2/ja active Active
- 2010-12-10 JP JP2010276437A patent/JP5102344B2/ja active Active
-
2011
- 2011-03-02 US US13/039,079 patent/US8218623B2/en active Active
- 2011-03-02 US US13/039,104 patent/US8194734B2/en active Active
-
2012
- 2012-06-04 US US13/488,169 patent/US8477838B2/en active Active
- 2012-06-04 US US13/488,242 patent/US8396116B2/en not_active Ceased
-
2016
- 2016-02-19 US US15/048,567 patent/USRE46500E1/en active Active
-
2017
- 2017-06-30 US US15/638,872 patent/USRE48401E1/en active Active
-
2021
- 2021-01-15 US US17/150,967 patent/USRE49787E1/en active Active
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2392437T3 (es) | Procedimiento de decodificación de vídeos que utiliza matrices de cuantificación adaptativas | |
EP1528813B1 (en) | Improved video coding using adaptive coding of block parameters for coded/uncoded blocks | |
TWI558178B (zh) | 用於寫碼視訊資料之方法及器件及電腦可讀儲存媒體 | |
JP4348209B2 (ja) | 画像符号化方法および画像復号化方法 | |
JP4755093B2 (ja) | 画像符号化方法および画像符号化装置 | |
KR19980080014A (ko) | 양방향으로 예측된 비디오 객체면과 같은 디지털비디오 화상의 코딩을 위한 방법 및 장치 | |
JP4585047B1 (ja) | 動きベクトル復号化方法 | |
JP2001197501A (ja) | 動きベクトル探索器及び動きベクトル探索方法並びに動画像符号化装置 | |
JP2002165219A (ja) | 画像信号復号装置及び画像信号復号・符号化装置 | |
JP2002165223A (ja) | 画像信号符号化装置 |