ES2347912T3

ES2347912T3 - Codificación adaptativa de un error de predicción en la codificación de video híbrida.

Info

Publication number: ES2347912T3
Application number: ES06841140T
Authority: ES
Inventors: Hans-Georg Musmann; Matthias Narroschke
Original assignee: Individual
Current assignee: Individual
Priority date: 2006-01-09
Filing date: 2006-12-22
Publication date: 2010-11-25
Anticipated expiration: 2026-12-22
Also published as: PL1982524T3; TR201904706T4; JP2013236405A; JP2012124965A; EP3537719A1; PL2950543T3; CN101356823A; EP1982524B1; JP2013236406A; KR100964641B1; JP6199462B2; PL2950544T3; HK1143480A1; HK1199785A1; HUE025501T2; EP2192783A1; HUE044060T2; US20140233631A1; US10021425B2; ES2544978T3

Abstract

Procedimiento para codificar una señal de vídeo usando una codificación híbrida, que comprende: reducción de la redundancia temporal mediante una predicción con compensación de movimiento basada en bloques, para establecer una señal de error de predicción, decisión entre transformar la señal de error de predicción en el dominio de frecuencias o mantener la señal de error de predicción en el dominio espacial para la codificación proporcionando las muestras de la señal de error de predicción en un bloque de error de predicción en el dominio espacial, y proporcionando las muestras exploradas para la posterior codificación.

Description

Codificación adaptativa de un error de predicción en la codificación de vídeo híbrida.

La invención se refiere a un procedimiento de codificación y descodificación, un codificador y un descodificador, y señales de datos que usan la codificación adaptativa del error de predicción.

Los actuales procedimientos de codificación de vídeo se basan en una codificación híbrida. La codificación híbrida proporciona una etapa de codificación en el dominio temporal y una etapa de codificación en el dominio espacial. En primer lugar, la redundancia temporal de las señales de vídeo se reduce mediante el uso de una predicción con compensación de movimiento basada en bloques entre el bloque de imágenes que se va a codificar y un bloque de referencia de una imagen que ya ha sido transmitida determinada por un vector de movimiento. Las muestras de error de predicción restantes se disponen en bloques y se transforman en el dominio de frecuencias, dando lugar a un bloque de coeficientes. Estos coeficientes se cuantifican y exploran de acuerdo con un patrón de exploración en zigzag bastante conocido, que comienza con el coeficiente que representa el valor de la CC. De acuerdo con una representación típica, este coeficiente se encuentra entre los coeficientes de baja frecuencia en la esquina superior izquierda de un bloque. La exploración en zigzag produce un conjunto unidimensional de coeficientes, que se someten a una codificación de entropía posteriormente por un codificador. El codificador está optimizado para un conjunto de coeficientes con una energía decreciente. Debido a que el orden de los coeficientes dentro de un bloque está predeterminado y fijado, la exploración en zigzag produce un conjunto de coeficientes de energía decreciente, si las muestras de predicción de error están correlacionadas. La siguiente etapa de codificación se puede optimizar entonces para dicha situación. Con este fin, el estándar más reciente H.264/AVC propone una codificación aritmética binaria adaptativa basada en el contexto (CABAC) o una codificación de longitud variable adaptable al contexto (CAVLC). Sin embargo, la eficiencia de la transformación solo es alta si las muestras de error de predicción están correlacionadas. Para las muestras que estén correlacionadas solo ligeramente en el dominio espacial, la transformación resulta menos eficiente.

La memoria de la conferencia de NARROSCHKE: "Extending the prediction error coder of H.246/AVC by a vector quantizer" PROCEEDINGS OF SPIE VISUAL COMMUNICATIONS AND IMAGE PROCESSING, [Online] vol. 5969, 12 de julio de 2005 (12-07-2005), páginas M1 a M12, XP002431468 tiene por objeto un codificador de predicción de error de H.24 6/AVC mediante un cuantificador vectorial.

A partir de "Adaptive coding of the prediction error for H. 24 6/AVC", presentado el 2 de diciembre de 2005 y publicado en Internet en la siguiente dirección URL:http//itg32.hhi.de/docs/ITG312 UH 05 2 151.pdf, se conoce un codificador híbrido que comprende unos medios para decidir si se transforma una señal de error de predicción en el dominio de frecuencias o se mantiene la señal de error de predicción en el dominio espacial.

La presente invención tiene por objeto proporcionar un procedimiento de codificación y descodificación, los respectivos codificadores y descodificadores, señales de datos así como los correspondientes sistemas y semántica para codificar y descodificar señales de vídeo que sean más eficientes que en la técnica anterior. La invención se expresa en las reivindicaciones adjuntas.

De acuerdo con un aspecto de la presente invención, se proporciona un procedimiento para codificar una señal de vídeo basado en una codificación híbrida El procedimiento comprende las etapas de reducción de la redundancia temporal mediante la predicción con compensación de movimiento basada en bloques, para establecer una señal de error de predicción, y la etapa de decisión entre transformar la señal de error de predicción en el dominio de frecuencias o mantener la señal de error de predicción en el dominio espacial.

De acuerdo con un aspecto correspondiente de la presente invención, se proporciona un codificador que está adaptado para aplicar la codificación híbrida de una señal de vídeo. El codificador incluye unos medios para reducir la redundancia temporal mediante una predicción con compensación de movimiento basada en bloques, para establecer una señal de error de predicción, y unos medios para decidir entre transformar la señal de error de predicción en el dominio de frecuencia o mantener la señal de error de predicción en el dominio espacial. De acuerdo con este aspecto de la invención, se proporciona un concepto y los correspondientes aparatos, señales y semántica para decidir de forma adaptativa entre procesar la señal de error de predicción en el dominio de frecuencias o en el espacial. Si las muestras de error de predicción solo tienen una pequeña correlación, las siguientes etapas de codificación de las muestras pueden ser más eficientes y provocarían una reducción en la tasa de datos, comparada con la codificación de los coeficientes en el dominio de frecuencia. De este modo, por la presente invención se aplica una etapa de decisión adaptativa y unos medios de control adaptativos para tomar la decisión. Por consiguiente, en función de la señal de error de predicción, se decide si se usa una transformación en el dominio de frecuencias o se mantiene la señal de error de predicción en el dominio espacial. Los siguientes mecanismos de codificación pueden ser los mismos que para el dominio de frecuencias, o se pueden adaptar especialmente a las necesidades de las muestras en el dominio espacial.

De acuerdo con otro aspecto de la invención, el procedimiento para codificar una señal de vídeo, y en particular la etapa de decisión, está basado en una función de costes. Generalmente, la decisión de usar los coeficientes en el dominio de frecuencias o las muestras en el dominio espacial puede basarse en diversos tipos de mecanismos de decisión. La decisión se puede tomar para todas las muestras contenidas en una parte especifica de una señal de vídeo de una sola vez o, por ejemplo, incluso para un número específico de bloques, macrobloques, o rebanadas (slices). La decisión puede basarse en una función de costes, como por ejemplo una función de Lagrange. Los costes se calculan para ambas codificaciones: en el dominio de frecuencias y en el dominio espacial. En la decisión, se opta por la codificación con los costes más bajos.

De acuerdo con otro aspecto de la presente invención, la función de costes incluye los costes de tasa-distorsión para la codificación en el dominio espacial y en el de frecuencias. De acuerdo con otro aspecto más de la invención, los costes de tasa-distorsión se pueden calcular mediante la tasa requerida y la distorsión resultante ponderada por un parámetro de Lagrange. Además, la medida de la distorsión puede ser el error cuadrático medio de la cuantificación o el error absoluto medio de la cuantificación.

De acuerdo con un aspecto de la presente invención, las muestras en el dominio espacial se pueden codificar básicamente por los mismos procedimientos que se usan para los coeficientes en el dominio de frecuencias. Estos procedimientos pueden incluir los procedimientos de codificación CABAC o CAVLC. Por lo tanto, solo sería necesaria, si acaso, una pequeña adaptación de los mecanismos de codificación si los medios de control adaptivos decidieran cambiar entre el dominio de frecuencias y el espacial. No obstante, también se podría proporcionar para usar diferentes sistemas de codificación para los coeficientes en los dos dominios.

De acuerdo con otro aspecto de la invención, se proporciona un procedimiento para codificar una señal de vídeo, basado en la codificación híbrida De acuerdo con este aspecto de la invención, la redundancia temporal se reduce mediante una predicción con compensación de movimiento basada en bloques, y las muestras de la señal del error de predicción se proporcionan en el bloque del error de predicción en el dominio espacial. Las muestras se exploran a partir del bloque de error de predicción para proporcionar un conjunto de muestras en un orden especifico. De acuerdo con este aspecto de la invención, se proporciona un sistema de exploración obtenido a partir de una imagen de error de predicción o una imagen de predicción. El sistema de exploración de acuerdo con este aspecto de la invención tiene en cuenta el hecho de que la exploración en zigzag de acuerdo con la técnica anterior para el dominio de frecuencias puede no ser el orden de exploración más eficiente para el dominio espacial. Por lo tanto, se proporciona un sistema de exploración adaptativa, que tiene en cuenta la distribución de las muestras y la magnitud de las muestras en el dominio espacial. El sistema de exploración puede estar basado preferentemente en una imagen de error de predicción o una imagen de predicción. Este aspecto de la invención tiene en cuenta las posiciones más probables de las muestras con la magnitud más alta y las muestras con mayor probabilidad de ser cero. Debido a que la ganancia de codificación para el dominio de frecuencias está basada principalmente en el fenómeno consistente en que los componentes de baja frecuencia poseen magnitudes más grandes, y la mayor parte de los coeficientes de alta frecuencia son cero, se puede aplicar un sistema de codificación de longitud de código variable muy eficaz como CABAC o CAVLC. Sin embargo, en el dominio espacial, las muestras que poseen las magnitudes más altas pueden estar situadas en cualquier posición dentro de un bloque. Sin embargo, como el error de predicción alcanza normalmente sus valores máximos en los bordes de un objeto en movimiento, se puede usar la imagen de predicción o la imagen de error de predicción para establecer el orden de exploración más eficiente.

De acuerdo con un aspecto de la presente invención, se pueden usar los gradientes de la imagen de predicción para identificar las muestras con magnitudes grandes. El orden de exploración sigue los gradientes contenidos en la imagen de predicción en su orden de magnitud. Después se aplica el mismo orden de exploración a la imagen de error de predicción, es decir, las muestras en la imagen de error de predicción en el dominio espacial.

Además, de acuerdo con otro aspecto más de la presente invención, el sistema de exploración puede estar basado en un vector de movimiento combinado con la imagen de error de predicción del bloque de referencia. La exploración sigue las magnitudes del error de predicción en orden decreciente.

De acuerdo con un aspecto de la invención, el sistema de exploración se obtiene a partir de una combinación lineal del gradiente de la imagen de predicción y la imagen de error de predicción del bloque de referencia junto con un vector de movimiento.

De acuerdo con otro aspecto de la invención, se usa un código específico para los mecanismos de codificación, como por ejemplo CABAC o similares, basado en probabilidades determinadas por separado para los coeficientes en el dominio de frecuencias o las muestras en el dominio espacial. Por lo tanto, los mecanismos de codificación de la técnica anterior ya conocidos se pueden adaptar al menos ligeramente para proporcionar el mecanismo de codificación más eficiente para el dominio espacial. Por lo tanto, el mecanismo de conmutación que está controlado de forma adaptativa para codificar en el dominio espacial o en el de frecuencias se puede adaptar aún más para cambiar las siguientes etapas de la codificación para las muestras o coeficientes en los dominios respectivos.

De acuerdo con un aspecto de la presente invención, se proporciona un procedimiento para codificar una señal de vídeo que incluye una etapa de cuantificación de las muestras de error de predicción en el dominio espacial mediante un cuantificador, que incluye una optimización del error de cuantificación ponderado subjetivamente o bien una optimización del error cuadrático medio de cuantificación. De acuerdo con este aspecto de la invención, el cuantificador usado para cuantificar las muestras en el dominio espacial se puede adaptar para que tenga en cuenta la impresión visual subjetivamente óptima de una imagen. Los niveles y umbrales de decisión representativos de un cuantificador se pueden adaptar entonces basándose en las propiedades subjetivas o estadísticas correspondientes de la señal de error de predicción.

\newpage

Además, la presente invención también se refiere a un procedimiento de descodificación y un aparato descodificador de acuerdo con los aspectos expuestos anteriormente. De acuerdo con un aspecto de la presente invención, se proporciona un descodificador que incluye unos medios de control adaptativos para decidir de forma adaptativa si un flujo de entrada de una señal de vídeo codificada representa la señal de error de predicción de la señal de vídeo codificada en el dominio espacial o en el dominio de frecuencias. Por consiguiente, el descodificador de acuerdo con este aspecto de la presente invención está adaptado para tomar una decisión para un flujo de datos entrante, es decir, si la señal de error de predicción está codificada en el dominio de frecuencias o en el espacial. Además, el descodificador proporciona unos medios de descodificación respectivos para cada uno de los dos dominios, el dominio espacial o el de frecuencias.

Además, de acuerdo con otro aspecto más de la presente invención, el descodificador comprende una unidad de control de exploración para proporcionar un orden de exploración basado en una señal de predicción o una señal de error de predicción. La unidad de control de exploración de acuerdo con este aspecto de la invención está adaptada para recuperar la información necesaria acerca del orden de exploración, en el que se han explorado las muestras de un bloque durante la codificación de las señales de vídeo Además, el descodificador puede comprender todos los medios con el fin de aplicar una cuantificación inversa y una transformación inversa en los coeficientes en el dominio de frecuencias o una cuantificación inversa en las muestras en el dominio espacial. El descodificador también puede incluir un mecanismo para proporcionar la compensación de movimiento y la descodificación. El descodificador puede estar configurado, fundamentalmente, para proporcionar todos los medios para aplicar las etapas del procedimiento correspondientes a las etapas de codificación explicadas anteriormente.

De acuerdo con otro aspecto más de la presente invención, se proporciona una señal de datos que representa una señal de vídeo codificada, en la que la información codificada de la señal de error de predicción en la señal de datos está codificada, en parte, en el dominio espacial y, en parte,, en el dominio de frecuencias. Este aspecto de la invención se refiere a la señal de vídeo codificada, que se obtiene mediante los mecanismos de codificación expuestos anteriormente.

Además, de acuerdo con otro aspecto más de la invención, la señal de datos puede incluir información adicional que indique el dominio en el que una rebanada, macrobloque o bloque está codificado; en particular, información acerca de si una rebanada, macrobloque o bloque está codificado en el dominio espacial o en el de frecuencias. Debido a que el control adaptativo de acuerdo con la presente invención supone que la señal de error de predicción esté codificada en el dominio espacial o bien en el dominio de frecuencias, es necesario incluir la información correspondiente en la señal de vídeo codificada. Por lo tanto, la presente invención también proporciona una información especifica, que indica el dominio en el que se ha codificado la parte especifica, por ejemplo una rebanada, macrobloque o bloque.

Además, este aspecto de la invención también tiene en cuenta la posibilidad de que un macrobloque completo o rebanada completa pueda estar codificado solo en uno de los dos dominios. De forma que, por ejemplo, si un macrobloque completo está codificado en el dominio espacial, esto se pueda indicar mediante un único indicador o similar. Además, incluso una rebanada completa puede estar codificada solo en el dominio de frecuencias o en el espacial, y en el flujo de datos se podría incluir un indicador correspondiente para la rebanada completa. Esto da lugar a una reducción en la tasa de datos y un mecanismo de codificación más eficiente para la información adicional.

Los aspectos de la presente invención se explican con respecto a las formas de realización preferidas que se aclaran haciendo referencia a los dibujos adjuntos.

La fig. 1 muestra un diagrama de bloques simplificado de un codificador que incorpora aspectos de la presente invención;

la fig. 2 muestra un diagrama de bloques simplificado de un descodificador que incorpora aspectos de la presente invención;

la fig. 3 muestra un sistema de exploración de acuerdo con la técnica anterior;

la fig. 4 muestra sistemas de exploración de acuerdo con la presente invención; y

la fig. 5 ilustra los parámetros usados para un cuantificador optimizado de acuerdo con la presente invención.

La fig. 1 muestra un diagrama de bloques simplificado de un codificador de acuerdo con la presente invención. Según esto, la señal de entrada 101 se somete a una estimación del movimiento, en la que se basa una predicción con compensación de movimiento que se lleva a cabo para proporcionar una señal de predicción 104, que se resta de la señal de entrada 101. La señal de error de predicción 105 resultante se transforma en el dominio de frecuencias 106 y se cuantifica mediante un cuantificador optimizado 107 para los coeficientes relativos a la frecuencia. La señal de salida 120 del cuantificador 107 se lleva a un codificador de entropía 113 que proporciona la señal de salida 116 que se va a transmitir, almacenar, etc. Por medio de un bloque de cuantificación inversa 110 y un bloque de transformación inversa 111, la señal de error de predicción 105 cuantificada 120 se usa también para la siguiente etapa de predicción en el bloque de predicción con compensación de movimiento 103. La señal de error de predicción a la que se le ha aplicado la cuantificación inversa y la transformación DCT inversa se añade a la señal de predicción y se lleva a la memoria de tramas 122, en la que se almacenan las imágenes precedentes para el bloque de predicción con compensación de movimiento 103 y el bloque de estimación de movimiento 102. Por lo general, la presente invención sugiere usar, además de la técnica anterior, un mecanismo con control adaptativo 115 para cambiar entre el dominio de frecuencias y el dominio espacial para transformar la señal de error de predicción 105. Los medios de control adaptativos 115 producen señales y parámetros para controlar el cambio adaptativo entre el dominio de frecuencias y el espacial. Por consiguiente, se proporciona una señal de información con control adaptativo 121 a los dos conmutadores que cambian entre las posiciones A y B. Si la transformación se lleva a cabo en el dominio de frecuencias, los dos conmutadores se encuentran en la posición A. Si se usa el dominio espacial, los conmutadores se cambian a la posición B. Además, la señal de información adicional 121, es decir, cuál de los dos dominios se ha usado para el procedimiento de codificación de una imagen también se lleva al codificador de entropía 113. Por consiguiente, en el flujo de datos se incluye una información apropiada para el dispositivo. En paralelo a la transformación de frecuencias, a través de una ruta alternativa, la señal de error de predicción 105 se lleva al cuantificador 109. Este bloque de cuantificación 109 proporciona una cuantificación optimizada para la señal de error de predicción 105 en el dominio espacial. La señal de error de predicción cuantificada 124 en el dominio espacial se puede hacer pasar por un segundo bloque de cuantificación inversa 112 y, después, a la conexión posterior hacia el bloque de predicción con compensación de movimiento 103. Además, existe un bloque de control de la exploración 114 que recibe el vector de movimiento 123 y la señal de error de predicción sometida a la cuantificación inversa 118, o bien la señal de predicción 104 a través de la conexión 119. El bloque 117 sirve para codificar la información de movimiento.

El bloque de control de adaptación 115 decide si un bloque se debe codificar en el dominio de frecuencias o en el espacial, y genera una información adicional correspondiente para indicar el dominio. La decisión tomada por los medios de control de adaptación se basa en los costes de tasa-distorsión para la codificación en el dominio espacial y de frecuencias. Para la codificación, se selecciona el dominio que tenga los costes de tasa-distorsión más bajos. Por ejemplo, los costes de tasa- distorsión C se calculan mediante la tasa requerida R y la distorsión resultante D ponderadas por un parámetro de Lagrange L: C=L*R+D. Como medida de la distorsión, se puede usar el error cuadrático medio de cuantificación, pero también se pueden aplicar otras medidas como, por ejemplo, el error absoluto medio de cuantificación. Como parámetro de Lagrange L, se puede usar el parámetro de Lagrange usado normalmente para el control del codificador de H.246/AVC, L = 0,85*2^{((QO-12>/3)}. También hay otros posibles procedimientos para determinar los costes de tasa-distorsión.

Como otra posibilidad, el control de adaptación 115 puede controlar el procedimiento de codificación. Esto se puede realizar, por ejemplo, basándose en la señal de predicción o basándose en la correlación en el error de predicción, o basándose en el dominio, el error de predicción se codifica en una posición con compensación de movimiento de tramas ya transmitidas.

La fig. 2 muestra un diagrama de bloques simplificado de una arquitectura de un descodificador de acuerdo con unos aspectos de la presente invención. Según esto, los datos de vídeo codificados se llevan a dos bloques de descodificación de entropía 201 y 202, El bloque de descodificación de entropía 202 descodifica información de compensación de movimiento como, por ejemplo, vectores de movimiento, etc. El bloque de descodificación de entropía 201 aplica el mecanismo de codificación inversa usado en el codificador, como, por ejemplo, una descodificación según CABAC o CAVLC. Si el descodificador usa un mecanismo de codificación diferente para los coeficientes o las muestras en el dominio espacial, se debe usar el correspondiente mecanismo de descodificación en los bloques de descodificación de entropía correspondientes. Por consiguiente, el bloque de descodificación de entropía 201 produce las señales apropiadas para cambiar entre las posiciones A y B con el fin de usar la ruta de cuantificación inversa apropiada para el dominio espacial, es decir, el bloque operativo de cuantificación inversa 206, o los bloques apropiados según la posición A de cambio, es decir el bloque de cuantificación inversa 203 y el bloque de transformación inversa 204. Si el error de predicción se representa en el dominio de frecuencias, el bloque de cuantificación inversa 203 y el bloque de transformación inversa 204 aplican las correspondientes operaciones inversas. Debido a que las muestras en el dominio espacial se han dispuesto en un orden especifico de acuerdo con un mecanismo de exploración según unos aspectos de la presente invención, una unidad de control de exploración 205 proporciona el orden correcto de las muestras para el bloque de descodificación de entropía 201. Si la codificación se ha llevado a cabo en el dominio espacial, el bloque de transformación inversa 204 y el bloque de cuantificación inversa 203 se evitan a favor de una operación de cuantificación inversa en el bloque 206. El mecanismo de conmutación, para cambiar entre el dominio de frecuencias y el espacial (es decir, la posición A y B de los conmutadores) , se controla mediante la información adicional enviada en el flujo de bits y descodificada por el bloque de descodificación de entropía 201. Además, la señal sometida a la cuantificación inversa en el dominio espacial, o la señal sometida a cuantificación inversa y transformación inversa en el dominio de frecuencias se suman a la imagen de predicción con compensación de movimiento con el fin de proporcionar las señales de vídeo descodificadas 210. La compensación de movimiento se lleva cabo en el bloque 209, basándose en datos de señal de vídeo descodificada previamente (imágenes previas) y vectores de movimiento. La unidad de control de exploración 205 usa la imagen de predicción 208, o bien la señal de error de predicción 207 combinada con el vector de movimiento 212 para determinar la secuencia de exploración correcta de los coeficientes. El mecanismo de exploración también puede estar basado en ambas imágenes, es decir, la imagen de error de predicción y la imagen de predicción. Tal como se explicó para el mecanismo de codificación con respecto a la fig. 1, la secuencia de exploración durante la codificación puede basarse en una combinación de la información del error de predicción 207 y los vectores de compensación de movimiento. Por consiguiente, los vectores de compensación de movimiento se pueden llevar a través de una ruta 212 hacia la unidad de control de exploración 205. Además, en correspondencia con la fig. 1, existe una memoria de tramas 211, en la que se almacenan las imágenes necesarias y descodificadas previamente.

La fig. 3 muestra un diagrama simplificado para ilustrar el orden de exploración en zigzag de acuerdo con la técnica anterior. Según esto, los coeficientes, que se obtienen a partir de la transformación en el dominio de frecuencias (por ejemplo, DCT) se disponen en un orden predeterminado, tal como se muestra en la fig. 3 para un bloque de cuatro por cuatro. Estos coeficientes se leen en un orden específico, de manera que los coeficientes que representan las partes de baja frecuencia se sitúan en las primeras posiciones de la izquierda de un conjunto unidimensional. Cuantos más hacia la parte inferior derecha del conjunto, mayores serán las frecuencias correspondientes de los coeficientes. Debido a que los bloques que se codifican contienen a menudo una cantidad sustancial de coeficientes de baja frecuencia, los coeficientes de alta frecuencia, o al menos una mayoría de los coeficientes de alta frecuencia, son cero. Esta situación se puede usar eficazmente para reducir los datos para su transmisión, por ejemplo, sustituyendo una secuencia larga de ceros por una información única acerca del número de ceros.

La fig. 4 muestra un ejemplo ilustrativo simplificado de un mecanismo de exploración de acuerdo con un aspecto de la presente invención. La fig. 4(a) muestra la magnitud de los gradientes en la imagen de predicción para un bloque. Los valores en cada posición del bloque representan el gradiente de la imagen de predicción del bloque actual. El propio gradiente es un vector formado por dos componentes que representan el gradiente en dirección horizontal y vertical. Cada componente se puede determinar mediante la diferencia entre las dos muestras adyacentes o se puede determinar mediante el conocido operador de Sobel, teniendo en cuenta seis muestras adyacentes. La magnitud del gradiente es la magnitud del vector. Si dos valores tienen la misma magnitud, se puede aplicar un orden de exploración fijo o predeterminado. El orden de exploración sigue la magnitud de los valores de gradiente en el bloque que se indican mediante la línea de puntos. Una vez que se establece el orden de exploración dentro de la imagen de predicción del gradiente, se aplica el mismo orden de exploración a las muestras de error de predicción cuantificadas, que se ilustran en la fig. 4 (b). Si las muestras cuantificadas en el dominio espacial del bloque que se ilustran en la fig. 4(b) están dispuestas en un conjunto unidimensional, tal como se indica en el lado izquierdo de la fig. 4 (b) de acuerdo con el orden de exploración establecido basado en la magnitud de los gradientes en la imagen de predicción, las muestras que poseen un valor alto se disponen típicamente en primer lugar en el conjunto, es decir, en las posiciones de la izquierda. Las posiciones de la derecha se llenan con ceros, tal como se indica en la fig. 4(b).

En lugar de una exploración controlada por el gradiente, también se pueden aplicar otras exploraciones como, por ejemplo, una exploración predefinida o una exploración controlada por el error de predicción cuantificado de las tramas ya transmitidas en combinación con un vector de movimiento, o combinaciones de los mismos (el control de exploración se refiere a los bloques 114 ó 205, como se explicó con respecto a la fig. 1 y la fig. 2). En el caso de una exploración controlada por la señal de error de predicción en combinación con un vector de movimiento, la exploración sigue las magnitudes de las muestras de error de predicción cuantificadas del bloque, a las que se refiere el vector de movimiento del bloque actual, en orden decreciente.

Si el vector de movimiento apunta a posiciones de muestras fraccionales, las muestras de error de predicción cuantificadas requeridas se pueden determinar usando una técnica de interpolación. Esta puede ser la misma técnica de interpolación que la usada para la interpolación de la imagen de referencia con el fin de generar las muestras de predicción.

En el caso de que la exploración esté controlada por la combinación de la imagen de predicción y la imagen de error de predicción junto con un vector de movimiento, se calculan combinaciones lineales de las magnitudes de los gradientes y de las muestras de error de predicción cuantificadas del bloque, a las que se refiere el vector de movimiento del bloque actual. La exploración sigue los valores de estas combinaciones lineales. Además, el procedimiento para la determinación de la exploración se puede señalar para segmentos de la secuencia, por ejemplo, para cada trama o para cada rebanada o para un grupo de bloques. De acuerdo con el procesamiento estándar típico, los vectores de compensación de movimiento ya se tienen en consideración, mientras que la imagen de predicción se determina.

De acuerdo con otro aspecto de la presente invención, el orden de exploración también puede basarse en la imagen de error de predicción en combinación con un vector de movimiento. Además, se pueden concebir combinaciones del principio del gradiente como las explicadas anteriormente y la imagen de error de predicción.

La fig. 5 muestra una ilustración simplificada que resulta útil para ilustrar la definición de un cuantificador optimizado de acuerdo con unos aspectos de la presente invención. Según esto, los tres parámetros a, b y c son los parámetros usados para adaptar el cuantificador. De acuerdo con el estándar H.246/AVC, se aplican cuantificadores optimizados de tasa-distorsión para los coeficientes con dos medidas de distorsión diferentes. La primera medida es el error cuadrático medio de cuantificación; la segunda es el error de cuantificación ponderado subjetivamente. De acuerdo con el estándar H.246/AVC, se desarrollan dos cuantificadores para las muestras de error de predicción. Debido a que la distribución del error de predicción se aproxima a una distribución laplaciana, se usa un cuantificador de escalar con zona muerta más umbral uniforme en el caso de una optimización de error cuadrático medio de cuantificación. La fig. 5 ilustra los parámetros a, b y c de la cuantificación y la cuantificación inversa.

En la tabla 1, se muestran los parámetros a, b y c, que se pueden usar ventajosamente para los QP (parámetros de cuantificación) usados normalmente en el sistema de codificación H.246/AVC. Los parámetros a, b y c son los respectivos parámetros optimizados para la optimización del error cuadrático medio de cuantificación. No obstante, esto es solo un ejemplo, y puede haber parámetros diferentes o adicionales que resulten útiles para diferentes aplicaciones.

TABLA 1

1

\vskip1.000000\baselineskip

Para la optimización del error de cuantificación ponderado subjetivamente, se propone un cuantificador no uniforme con unos niveles representativos r_{i}, -r_{i} y unos umbrales de decisión en el centro del r_{i} adyacente que también se muestran en la tabla 1. Si se producen grandes errores de predicción en los bordes, se debe sacar provecho del enmascaramiento visual. Por consiguiente, se pueden permitir grandes errores de cuantificación en los bordes y pequeños si la señal de imagen es plana. H. 24 6/AVC puede usar más de 4 QP, tal como se muestra en la tabla 1. En este caso, la tabla 1 se debe ampliar. H.246/AVC puede usar 52 QP diferentes. La idea básica para determinar los valores representativos apropiados r_{i}, -r_{i} se explica a continuación con respecto a la fig. 6.

La fig. 6 muestra una representación simplificada del error de reconstrucción absoluto medio medido de un elemento de una imagen en el caso de la cuantificación ponderada subjetivamente en el dominio de frecuencias en la fig. 6(a) y en el dominio espacial en la fig. 6(b). El error de reconstrucción absoluto medio medido de la cuantificación ponderada subjetivamente en el dominio de frecuencias se muestra como una función del valor absoluto del error de predicción. Para el error de reconstrucción absoluto de la cuantificación ponderada subjetivamente en el dominio espacial, los niveles de representación n se ajustan de manera que el error de reconstrucción absoluto medio sea igual para la cuantificación en el dominio de frecuencias y el espacial con respecto a los intervalos de cuantificación en el dominio espacial. Únicamente a modo de ejemplo, los valores r_{1}, r_{2}, r_{3} y r_{4} para QP = 26 que se indican en la tabla 1 también están presentes en la fig. 6(b). Como regla, un nivel representativo r_{i} se dobla aproximadamente si el valor de QP aumenta en 6. El diseño del cuantificador también puede sacar provecho de otras características del sistema visual. Además, se pueden usar cuantificadores para crear un error de cuantificación con propiedades diferentes a las de los cuantificadores H.246/AVC.

\vskip1.000000\baselineskip

Codificación de entropía de las muestras cuantificadas en el dominio espacial

De acuerdo con un aspecto de la presente invención, la codificación de entropía en el dominio espacial puede basarse en algunos procedimientos en lo que respecta a los coeficientes cuantificados en el dominio de frecuencias. Para el estándar H.246/AVC, dos de los procedimientos de codificación de entropía preferidos son CABAC y CAVLC. No obstante, de acuerdo con este aspecto de la presente invención, en lugar de codificar los coeficientes cuantificados en el dominio de frecuencias, se codifican las muestras cuantificadas en el dominio espacial mediante los procedimientos mencionados anteriormente. Como se explicó antes, el orden de exploración se puede cambiar para proporcionar la misma reducción en los datos que para el dominio de frecuencias. Según se expone anteriormente, la exploración en el dominio espacial se puede controlar por la magnitud del gradiente de la señal de imagen de predicción en la misma posición espacial. De acuerdo con este principio, las muestras que se van a codificar se disponen en un orden decreciente de gradientes, como ya se explicó con respecto a la fig. 4 (a) y (b). También se pueden aplicar otros mecanismos de exploración, tal como se explica anteriormente. Además, se pueden usar códigos separados, lo que supone modelos de probabilidad separados en el caso de CABAC, para el dominio espacial, de acuerdo con unos aspectos de la presente invención. El código, y en el caso de CABAC la inicialización de los modelos de probabilidad, se pueden obtener a partir de las estadísticas de las muestras cuantificadas. La modelización contextual en el dominio espacial se puede realizar del mismo modo que en el dominio de frecuencias.

\vskip1.000000\baselineskip

Codificación de la información adicional

Los medios de control adaptativos explicados con respecto a la fig. 1 generan la información relativa al dominio en el que se va a codificar un bloque. El tamaño del bloque puede ser de cuatro por cuatro u ocho por ocho elementos de imagen, según el tamaño de la transformación. No obstante, de acuerdo con diferentes aspectos de la presente invención, se pueden aplicar otros tamaños de bloque independientes del tamaño de la transformación. De acuerdo con un aspecto de la presente invención, la información adicional incluye unos indicadores específicos, que indican si el mecanismo de codificación se ha cambiado de forma adaptativa durante la codificación. Si, por ejemplo, se codifican todos los bloques de una rebanada en el dominio de frecuencias, esto se puede indicar mediante un bit específico en la señal de datos de vídeo codificadas. Este aspecto de la invención también se puede relacionar con los bloques de un macrobloque, que se pueden codificar todos ellos en cada uno de los dos dominios, o sólo en un dominio. Además, el concepto de acuerdo con el presente aspecto de la invención se puede aplicar a macrobloques y se puede incluir información en el flujo de datos que indique si al menos un bloque o un macrobloque está codificado en el dominio espacial. Por consiguiente, se puede usar el indicador: Indicador_codificación_DF_DE_rebanada para indicar si todos los bloques de la rebanada actual están codificados en el dominio de frecuencias, o si al menos hay un bloque codificado en el dominio de frecuencias. Este indicador puede estar codificado por un único bit. Si hay al menos un bloque de la rebanada que esté codificado en el dominio espacial, esto se puede indicar mediante el indicador: Indicador_codificación_DF_DE_MB para cada macrobloque de la rebanada actual, si todos los bloques del macrobloque actual se codifican en el dominio de frecuencias, o si al menos hay un bloque codificado en el dominio espacial. Este indicador puede codificarse condicionado por los indicadores de los bloques adyacentes ya codificados situados hacia arriba y hacia la izquierda. Si el último de un macrobloque está codificado en el dominio espacial, esto se puede indicar mediante el indicador Indicador_DF_o_DE para cada bloque del macrobloque que se va a codificar, si el bloque actual está codificado en el dominio de frecuencias o en el espacial. Este indicador puede codificarse condicionado por los indicadores de los bloques adyacentes ya codificados situados hacia arriba y hacia la izquierda. Otra posibilidad consiste en que la información adicional se codifique también condicionada por la señal de predicción o la señal de error de predicción, junto con un vector de movimiento.

\vskip1.000000\baselineskip

Sintaxis y semántica

De acuerdo con este aspecto de la presente invención, se presenta una sintaxis y una semántica ejemplares que permiten incorporar aspectos de la presente invención en el sistema de codificación H.246/AVC. Según esto, se puede introducir el indicador Indicador_codificación_DF_DE_rebanada en la cabecera_ rebanada, tal como se muestra en la tabla 2. El indicador Indicador codificación_DF_DE_MB se puede enviar en cada capa_macrobloque, tal como se muestra en la tabla 3. En cabac_bloque_residual, se puede señalar mediante el indicador Indicador_DF_o_DE si se suministra la codificación en el dominio de frecuencias o la codificación en el dominio espacial para el bloque actual; esto se muestra en la tabla 4 que se presenta a continuación. Se puede aplicar un sistema similar en otros algoritmos de codificación de vídeo para la codificación del error de predicción.

\vskip1.000000\baselineskip

\vskip1.000000\baselineskip

TABLA 2

2

TABLA 3

3

\vskip1.000000\baselineskip

TABLA 4

4

Claims

```
\global\parskip0.950000\baselineskip
```
1. Procedimiento para codificar una señal de vídeo usando una codificación híbrida, que comprende:

reducción de la redundancia temporal mediante una predicción con compensación de movimiento basada en bloques, para establecer una señal de error de predicción,

decisión entre transformar la señal de error de predicción en el dominio de frecuencias o mantener la señal de error de predicción en el dominio espacial para la codificación proporcionando las muestras de la señal de error de predicción en un bloque de error de predicción en el dominio espacial, y proporcionando las muestras exploradas para la posterior codificación.
```
\vskip1.000000\baselineskip
```
2. El procedimiento según la reivindicación 1, en el que la etapa de decisión está basada en una función de costes.
3. El procedimiento según la reivindicación 1 ó 2, en el que la función de costes incluye los costes de tasa-distorsión para la codificación en el dominio espacial y la codificación en el dominio de frecuencias.
4. El procedimiento según la reivindicación 3, en el que los costes de tasa-distorsión se calculan mediante la tasa requerida (R) y la distorsión resultante (D) ponderadas por un parámetro de Lagrange.
5. El procedimiento según la reivindicación 4, en el que la medida de la distorsión es el error cuadrático medio de cuantificación o el error absoluto medio de la cuantificación.
6. El procedimiento según una de las reivindicaciones anteriores, en el que las muestras en el dominio espacial se codifican mediante el mismo procedimiento que los coeficientes en el dominio de frecuencias.
7. El procedimiento según la reivindicación 6, en el que la codificación de los coeficientes se lleva a cabo según CABAC o CAVLC.
8. El procedimiento según la reivindicación 7, en el que el sistema de exploración se obtiene a partir del gradiente de la imagen de predicción.
9. El procedimiento según la reivindicación 7, en el que el sistema de exploración está basado en un vector de movimiento junto con la imagen del error de predicción del bloque de referencia.
10. El procedimiento según la reivindicación 7, en el que el sistema de exploración se obtiene a partir de una combinación lineal del gradiente de la imagen de predicción y la imagen del error de predicción del bloque de referencia en combinación con un vector de movimiento.
11. El procedimiento según una de las reivindicaciones anteriores, en el que se usa un código específico para CABAC que posee probabilidades separadas para el dominio espacial.
12. El procedimiento según una de las reivindicaciones anteriores, en el que se usa un código específico para CAVLC para el dominio espacial.
13. El procedimiento según una de las reivindicaciones anteriores, que comprende otra cuantificación de las muestras de error de predicción mediante un cuantificador que posee una optimización del error de cuantificación ponderado subjetivamente u optimización del error cuadrático medio de cuantificación en el dominio espacial.
14. Procedimiento para descodificar una señal de vídeo usando una codificación híbrida, que comprende:

descodificación eficaz de datos de vídeo codificados en el dominio de frecuencias o el espacial, de acuerdo con el mecanismo de codificación usado para codificar los datos de la señal de vídeo, según las reivindicaciones 1 a 13.
```
\vskip1.000000\baselineskip
```
15. El procedimiento de descodificación según la reivindicación 14, en el que las posiciones de las muestras de la señal de error de predicción recibidas en un conjunto unidimensional se asignan a ubicaciones en una disposición bidimensional y se determinan basándose en una señal de error de predicción o imagen de predicción recibida.
16. Codificador para codificar una señal de vídeo usando una codificación híbrida según cualquiera de las reivindicaciones 1 a 13, que comprende:

unos medios para reducir la redundancia temporal mediante una predicción con compensación de movimiento basada en bloques, para establecer una señal de error de predicción, y

unos medios de control adaptativos para decidir entre transformar la señal de error de predicción en el dominio de frecuencias o mantener la señal de error de predicción en el dominio espacial.
```
\global\parskip1.000000\baselineskip
```
17. Descodificador para descodificar una señal de vídeo que se ha codifica usando una codificación híbrida según cualquiera de las reivindicaciones 1 a 13, que comprende unos medios de control adaptativo (201) para decidir de forma adaptativa si un flujo de entrada de una señal de vídeo codificada representa la señal de error de predicción de la señal de vídeo codificada en el dominio espacial o en el dominio de frecuencias.
18. El descodificador según la reivindicación 17, que comprende además unos medios de control de exploración para proporcionar un orden de exploración basado en una señal de predicción o una señal de error de predicción o una combinación lineal de ambos.