ES2348123T3 - Compensación de movimiento global para imágenes de video. - Google Patents

Compensación de movimiento global para imágenes de video. Download PDF

Info

Publication number
ES2348123T3
ES2348123T3 ES02789126T ES02789126T ES2348123T3 ES 2348123 T3 ES2348123 T3 ES 2348123T3 ES 02789126 T ES02789126 T ES 02789126T ES 02789126 T ES02789126 T ES 02789126T ES 2348123 T3 ES2348123 T3 ES 2348123T3
Authority
ES
Spain
Prior art keywords
block
frame
image
mode
motion vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
ES02789126T
Other languages
English (en)
Inventor
Per Frojdh
Rickard Sjoberg
Torbjorn Einarsson
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Telefonaktiebolaget LM Ericsson AB
Original Assignee
Telefonaktiebolaget LM Ericsson AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Telefonaktiebolaget LM Ericsson AB filed Critical Telefonaktiebolaget LM Ericsson AB
Application granted granted Critical
Publication of ES2348123T3 publication Critical patent/ES2348123T3/es
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

Un método para la descompresión de datos de video para cuadros de video que comprenden una pluralidad de bloques de imagen, en el que cada bloque de imagen será descodificado de acuerdo con uno de una pluralidad de modos de codificación, en el que uno de dicha pluralidad de modos es un modo COPY que implica que un bloque adjunto a partir de un cuadro anterior es señalizado para ser copiado a un cuadro actual con un vector de movimiento de cero; caracterizado porque el método comprende las operacio- nes de: descodificar una corriente de bits de datos que representa un bloque de imagen codificado de un cuadro actual en el que la corriente de bits de datos es descodificada de acuerdo a un modo IGMC o de acuerdo al modo copy, en el que dicho modo IGMC com- prende: predecir un vector de movimiento a partir de bloques de imagen contiguos de dicho cuadro actual; y descodificar el bloque de imagen codificado copiando desde un cuadro anterior un bloque adjunto dislocado por el vector de movimiento predicho.

Description

ANTECEDENTES DEL INVENTO
El invento descrito y reivindicado aquí pertenece generalmente a un método para la compresión de datos de señal de vídeo. Más particularmente, el invento pertenece a un método del tipo anterior que emplea la compensación de movimiento global. Incluso más particularmente, algunas realizaciones del invento pertenecen a un método del tipo anterior en el que macrobloques son agrupados en rebanadas y la información de la compensación de movimiento global es transmitida con rebanadas codificadas.
Se ha anticipado que podrían usarse realizaciones del invento en conexión con descodificadores de televisión de señales de TV digital de definición estándar (SDTV) y de alta definición (HDTV), como una parte de sistemas de videoconferencias, y en ordenadores, incluyendo ordenadores personales (PC), ordenadores portátiles y similares para descodificar video. Las realizaciones podrían ser también usadas en dispositivos móviles tales como teléfonos móviles y agendas electrónicas (PDA), como una parte de un descodificador en un proyector de cine digital, y en grabadores, reproductores de video y sistemas de entretenimiento domésticos. Sin embargo, no se ha pretendido limitar el invento a tales realizaciones.
Las señales de video digital, en forma no comprimida, contienen típicamente grandes cantidades de datos. Sin embargo, el contenido de información necesaria real es considerablemente menor debido a correlaciones temporales y espaciales elevadas. Por consiguiente, la compresión de video, o codificación, es usada para reducir la cantidad de datos que es realmente requerida para ciertas tareas, tales como almacenamiento de las señales de video o para transmitirlas desde un lugar a otro. En el proceso de codificación puede usarse la redundancia temporal haciendo predicciones denominadas de movimiento compensado, dónde regiones de un cuadro de video son predichas a partir de regiones similares de un cuadro previo. Es decir, pueden ser partes de un cuadro que contiene pequeños cambios o que no contiene ningún cambio de las partes correspondientes del cuadro previo. Tales regiones pueden ser así omitidas o no codificadas, con el fin de maximizar la eficiencia de compresión. Por otro lado, si no puede encontrarse una buena coincidencia con un cuadro previo, pueden usarse predicciones dentro de un cuadro para reducir la redundancia espacial. Con un esquema de predicción satisfactorio, el error de predicción será pequeño y la cantidad de información que ha de ser codificada será reducida ampliamente. Además, transformando los píxel (elementos de imagen) a un dominio de frecuencia, por ejemplo, usando la transformación de coseno discreta, las correlaciones espaciales proporcionan ganancias de eficiencia adicionales.
Aquí, los términos “imagen” y “cuadro” son usados de forma intercambiable para referirse a un cuadro de datos de imagen en una secuencia de video.
Las correlaciones temporales elevadas son características del video. De ahí, mucho esfuerzo en la optimización de la compresión de video está focalizado en hacer predicciones temporales exactas de regiones de un cuadro. Cuanto mejor es la predicción menos bits son necesarios para codificar la discrepancia. La propia predicción es codificada como instrucciones de cómo traducir, o incluso escalar o rotar, una región codificada previamente. Si muchas regiones de un cuadro tienen un movimiento similar, tal como en una panorámica o zum, otras mejoras en la eficiencia de compresión pueden resultar de codificar un movimiento global por separado, que a continuación se aplica a todas o a algunas regiones del cuadro. Esta técnica es a menudo denominada como una compensación de movimiento global (GMC).
Hay varias razones, sin embargo, por las que no se debería acceder al cuadro entero cuando se ha usado la compensación de movimiento global. La primera razón es la resistencia al error. Con el fin de impedir la propagación de errores desde la partes corrompidas de una imagen, la predicción es a menudo restringida dentro de segmentos limitados denominados rebanadas. Cada rebanada de un cuadro debería por ello estar autocontenida con respecto a la información de movimiento global. Otra razón es que la compensación de movimiento global puede no ser relevante para un cuadro entero, incluso aunque partes menores del cuadro puedan beneficiarse de la compensación de movimiento global aplicada a cada parte de forma separada.
Codificación de imagen fija frente a compensación de movimiento
Un códec de video típico, tal como Recomendaciones de ITU-T, H.261 y H.263, parte 2 de MPEG-1, parte 2 de MPEG-2 (H.262), o parte 2 de MPEG-4, funciona codificando secuencialmente una secuencia de video cuadro a cuadro. Un cuadro está además dividido en bloques que son codificados secuencialmente fila por fila, empezando en la esquina superior izquierda y terminando en la esquina inferior derecha. Un tamaño de bloque típico es el de un macrobloque (MB) que cubre 16x16 píxel de luminancia.
El primer cuadro en la secuencia es codificado como una imagen fija, denominada intra-cuadros. Tal cuadro es autocontenido y no depende de cuadros previamente codificados. Sin embargo, no son usados solamente al inicio de la secuencia, sino que también pueden ser usados ventajosamente en casos en los que el video cambia bruscamente, tales como cortes de escena, o en los que es deseable tener un punto de acceso aleatorio, desde el que un descodificador puede iniciar la descodificación sin tener que descodificar la parte previa de la corriente de bits. Los valores de píxel de macrobloques intracodificados son usualmente transformados a un dominio de frecuencia, por ejemplo usando la transformación de coseno discreta y la transformación de coeficientes cuantificados con el fin de reducir el tamaño de la corriente de bits resultante.
Por el contrario, un inter-cuadros es codificado como una imagen de diferencia de movimiento compensado en relación con un cuadro anterior. Usando como referencia un cuadro ya descodificado (cuadro reconstruido), el codificador de video puede señalar para cada macrobloque un conjunto de vectores de movimiento (MV) y coeficientes. Los vectores de movimiento (uno o varios dependiendo de cómo esté divido el macrobloque) informan al descodificador de cómo traducir espacialmente las regiones correspondientes del cuadro de referencia con el fin de hacer una predicción para el macrobloque en consideración. Esto es denominado como una compensación de movimiento. La diferencia entre la predicción y el original es codificada en términos de coeficientes de transformación. Sin embargo, no todos los macrobloques de un inter-cuadro necesitan ser de movimiento compensado. Si el cambio del macrobloque de referencia al macrobloque en curso es pequeño, el macrobloque puede ser codificado en modo COPY, es decir, no codificado per se sino señalado como para ser copiado. Véase la sección 5.3.1 de la Recomendación H.263 de ITU-T “Indicación de macrobloque codificado (COD) (1 bit)” para un ejemplo de una puesta en práctica de modo COPY. Por otro lado, si los macrobloques difieren sustancialmente, puede ser mejor codificarlos como un intra-macrobloques.
Compensación de movimiento global en H.263
En vez de acceder a la compensación de movimiento solamente sobre una base de bloques, podría ser ventajoso extraer el movimiento global de un cuadro de forma separada y codificar las desviaciones a partir del movimiento global para cada bloque. En una secuencia de toma panorámica o de zum, o cuando un objeto grande se mueve sobre el cuadro, la información de movimiento total es probablemente mantenida al mínimo por tal esquema. Una técnica bien conocida es añadir una operación adicional en el proceso de codificación antes de que un inter-cuadros sea codificado. El anexo P de H.263 “Nuevo Muestreo de Imagen de Referencia” proporciona un método para “alabear” la
H00VHV
imagen de referencia dados cuatro vectores de desplazamiento v00, v, v, y vque especifican los desplazamientos de los píxel de esquina de un cuadro. La fig. 1 muestra un cuadro de referencia, con estos vectores extendiéndose respectivamente desde los píxel de esquina 8. Los desplazamientos de todos los demás píxel son dados por una interpolación bilineal de estos vectores, es decir:
≈Δ «
≈Δ «
≈Δ «
≈Δ «
x
y
x
y
V
� (,) 0
r
x
+
r
y
+
r
xy
Ecuación(1)
+
=
÷◊
÷◊
÷◊
÷◊
x
y
r
H
V
H
5
donde (x,y) es la posición inicial de un píxel, H y V representan posiciones de los píxel de esquina en el cuadro de referencia, y
0 00
r= �
x H0 00
10 r= � – �
y 0V 00
r= � – �
xy 00 H0 0V HV
r= � – � – � + �
Para una descripción detallada de puesta en práctica de esta fórmula, puede
15 hacerse referencia a la Recomendación H.263. Cuando esta compensación de movimiento global es usada para un cuadro subsiguiente o inter, el cuadro de referencia es muestreado de nuevo, píxel por píxel, usando la interpolación anterior. Después de que se haya realizado el nuevo muestreo, el codificador puede continuar codificando el cuadro inter, basado en el cuadro de referencia muestreado de nuevo.
20
Compensación de Movimiento Global en parte 2 de MPEG-4
La compensación de movimiento global está especificada también en la norma visual MPEG-4 usando los denominados S(GMC)-VOP. Aquí la compensación de movimiento global es aplicada píxel por píxel como para el Anexo P de H.263. Sin embargo, se
25 puede aún escoger sobre un nivel de macrobloque si el cuadro de referencia de movimiento compensado global (interpolado) debería ser usado o no.
Compensación de Movimiento Global propuesta para H.26L
El ITU-I está desarrollando actualmente una nueva norma de codificación de vi
30 deo, Recomendación H.26L, que es también probable que sea publicada de forma conjunta como una Norma Internacional por ISO/IEC denominada MPEG-4 AVC (ISO/IEC 14496-10). La norma H.26L actual sigue el diseño de codificación de video antes mencionado con cuadros y macrobloques, en los que cada imagen es codificada por un encabezamiento de imagen seguido de macrobloques. Esta norma es descrita aquí después, en conexión con las figs. 8 a 9.
Una desventaja significativa en la utilización de compensación de movimiento global para un cuadro de video es la pérdida de elasticidad y flexibilidad al error accediendo a cuadros enteros. Así, si los vectores de movimiento global son codificados sólo una vez para una imagen, por ejemplo, al comienzo de la imagen, y esta parte de la corriente de bits se pierde durante la transmisión, probablemente la imagen entera resulte corrompida. Por consiguiente, los vectores de movimiento para bloques a lo largo de toda la imagen no pueden ser descodificados y deben ser ocultados. Tales errores pueden también propagarse en el tiempo, ya que la siguiente imagen puede ser una inter-imagen también, usando así una imagen corrompida como referencia. Otro problema, específicamente relativo al diseño de codificación de video de movimiento global propuesto (GMVC) para la norma H.26L, es que no pueden especificarse movimientos globales diferentes para partes de un cuadro.
El documento WO 00/70879 describe un método para codificar video digital de acuerdo con normas MPEG que usan un estimador de movimiento adaptable.
COMPENDIO DEL INVENTO
Como otro beneficio, el invento introduce un nuevo modo para compensación de movimiento global, denominado como Compensación de Movimiento Global Implícita (IGMC). Este modo puede ser usado como una herramienta en muchos escenarios de codificación que requieren un modo MB más útil que el modo COPY, con el fin de minimizar el número total de bits necesario para vectores de movimiento. En el modo COPY el vector de movimiento es siempre cero. Por el contrario, la IGMC usa vectores de movimiento implícito que son predichos.
El invento puede estar dirigido a un método de compresión de datos de video para usar con bloques de imagen derivados dividiendo un cuadro de video en una secuencia de bloques. En una realización preferida, los bloques son macrobloques que comprenden 16x16 píxel (luminancia) y en los que uno de los distintos modos de codificación de macrobloques posible es un modo de compensación de movimiento global implícita (IGMC). Este modo es usado para copiar los píxel desde un cuadro previo de un bloque adjunto, dislocado por un vector de movimiento que es predicho a partir de bloques de imagen contiguos del cuadro actual.
BREVE DESCRIPCIÓN DE LOS DIBUJOS
La fig. 1 es un diagrama esquemático que ilustra la compensación de movimiento global de un cuadro de acuerdo con la norma de compresión de video H.263. La fig. 2 es un diagrama esquemático que muestra un sistema simplificado para comprimir, transmitir y descodificar información de video de acuerdo con realizaciones del invento. La fig. 3 es un diagrama de bloques que muestra algunos componentes para el compresor del sistema mostrado en la fig. 2. La fig. 4 es un diagrama esquemático que ilustra la división de un cuadro a partir de una secuencia de video en rebanadas que comprenden respectivamente macrobloques. La fig. 5 es un diagrama esquemático que ilustra vectores de movimiento asociados con bloques de píxel respectivos de un macrobloque. Las figs. 6 y 7 son diagramas esquemáticos, mostrando cada uno una rebanada que comprende una secuencia de macrobloques para ilustrar realizaciones del invento. La fig. 8 es un diagrama esquemático que representa la sintaxis de corriente de bits del diseño H.26L sobre niveles de imagen y macrobloque. La fig. 9 es un diagrama esquemático que representa la compensación de movimiento global propuesta en H.26L sobre niveles de imagen y macrobloque. La fig. 10 es un diagrama esquemático que muestra una rebanada que comprende 4x4 macrobloques para ilustrar realizaciones del invento que pertenecen a la norma de compresión de video H.26L.
DESCRIPCIÓN DETALLADA DE LAS REALIZACIONES PREFERIDAS
Con referencia a la fig. 2, se ha mostrado una fuente 10 de información de video tal como una cámara de video. La información, que comprende una sucesión de cuadros de video, es acoplada a un codificador o compresor de video 12, que comprime cuadros sucesivos de datos de acuerdo con una realización del invento, como se ha descrito aquí. Una corriente de bits que representa los datos comprimidos es transmitida a través de un canal de comunicación 22, que puede ser un canal de comunicación inalámbrica, desde un transmisor 14 hasta un receptor 16. Los datos recibidos son aplicados a un descodificador 18 para recuperar la información de video.
Con referencia a la fig. 3, se han mostrado algunos componentes tradicionales de un compresor 12 para tratar un macrobloque 20 de 16x16 píxel, derivado dividiendo un cuadro en una secuencia de cuadros de video tal como se ha mostrado en la fig. 4. Los componentes mostrados en la fig. 3 incluyen un módulo de transformación, tal como un módulo de Transformación de Fourier Discreto 24, un cuantificador 26 y un codificador binario 28.
Como es conocido en la técnica, un módulo de transformación 24 recibe una matriz de enteros, que comprende niveles de la escala de gris respectivos (luminancia) y niveles de color (crominancia) de los píxel de macrobloque 20. El módulo 24 aplica la transformación a los niveles de píxel para generar una matriz de salida de coeficientes de transformación. Como es probablemente bien conocido, el cuantificador 26 divide cada coeficiente de transformación por un tamaño de escalón o nivel de cuantificación correspondiente. La salida del cuantificador 26 es dirigida al codificador binario 28, que genera una corriente correspondiente de bits digitales 30 para transmisión a través del canal 22.
Con referencia ahora a la fig. 4, se ha mostrado un cuadro 32 que comprende uno de los cuadros en una secuencia de vídeo 34. La fig. 4 muestra además el cuadro 32 segmentado en varias rebanadas 36a-d en las que cada rebanada 36a-d comprende una secuencia de macrobloques 38. Cada macrobloque comprende una matriz de píxel del cuadro 32. Como se ha descrito a continuación con más detalle, una rebanada 36 puede contener información de GMC perteneciente a los macrobloques 38 y/o al cuadro 3, de acuerdo con realizaciones del invento.
La fig. 4 también muestra la rebanada 36a con más detalle, para resaltar que un límite de rebanada puede aparecer después de cualquier macrobloque de un cuadro. La rebanada 36b se ha mostrado que incluye macrobloques situados en varias filas 37 del cuadro. Además, la rebanada 36b comienza unos pocos macrobloques desde el límite de cuadro izquierdo de la rebanada y termina unos pocos macrobloques antes del límite del cuadro derecho, en la última fila de la rebanada. Así, algunas rebanadas se distribuyen sobre más de una fila 37, y una fila 37 puede contener más de una rebanada, tal como la fila inferior que contiene las rebanadas 36c y 36d.
Con referencia a la fig. 5, los bloques de píxel 40a’-40d’ de un cuadro previo son usados para predecir los bloques 40a-40d del cuadro actual. Los vectores de movimiento 42a-42d están describiendo la situación desde la que los píxel procedentes del primer cuadro serán copiados a bloques 40a-40d del cuadro actual. Esto ilustra que los bloques de píxel 40a-40d pueden ser fácilmente determinados o reconstruidos usando un cuadro descodificado previamente junto con los vectores de movimiento 42a-42d.
Con referencia a la fig. 6, se ha mostrado una rebanada codificada 40 generada codificando una rebanada tal como la rebanada 36b mostrada en la fig. 4. La rebanada 40 codificada comprende macrobloques o bloques de imagen 4 y está provista de un encabezamiento 44. En una realización del invento, una señal es aplicada a la rebanada codificada 40, por ejemplo incluyendo la señal en el encabezamiento 44, para indicar si ha de usarse o no la compensación de movimiento global (GMC) en la reconstrucción de la rebanada original correspondiente 36. Si ha de usarse la GMC en la construcción de la rebanada, el encabezamiento 44 también incluye información de GMC. Tal información de GMC comprende o representa de manera útil la información del vector de movimiento desde la que los vectores de movimiento para cada uno de los bloques 42 de la rebanada 40 puede ser reconstruida en el descodificador. Así, todos los vectores de movimiento en la rebanada 40 pueden ser derivados exclusivamente a partir de la información contenida en la rebanada 40.
En otra realización útil, todas las rebanadas 40 codificadas a partir de las rebanadas respectivas 36 del cuadro de video 32, a las que se ha hecho referencia antes, contienen la misma información de GMC. Por ejemplo, la información de GMC podría com
xy
prender un conjunto codificado de los vectores de GM r0, r, r, y rxy descritos antes en conexión con la fig. 1. Estos vectores están referenciados al cuadro de video alabeado completo, como se ha mostrado en la fig. 1, y son derivados de los vectores de desplazamiento de píxel de esquina mostrado en él de acuerdo con las relaciones descritas con anterioridad. La resistencia es mejorada de manera significativa repitiendo esta información en cada rebanada codificada, ya que la información alcanzaría el descodificador incluso si alguna de las rebanadas se perdiera en el canal de transmisión. Los vectores de GM codificados podrían ser usados con interpolación bilineal, de acuerdo con la Ecuación
(1) descrita antes, para calcular la compensación de movimiento global para cada píxel
contenido en la rebanada 40. En otra realización, cada rebanada codificada 40 tendría información de GMC que
xy
comprende los vectores de movimiento global r0, r, r, y rxy, donde los vectores están referenciados a la caja limitadora de la rebanada en vez de al cuadro entero. Con referencia adicional a la fig. 6, se ha mostrado la caja limitadora 46 de la rebanada 40 que comprende el menor rectángulo que puede contener la rebanada. La fig. 6 muestra píxel de esqui
00 H0 0VHV
na 46a-d en esquinas respectivas de la caja limitadora 46, con vectores � , � , � ,y � en este caso especificando el desplazamiento de los píxel de esquina respectivos de la
xy
caja limitadora, en vez del cuadro entero. Los cuatro vectores r0, r, r, y rxy pueden ser determinados a partir de los vectores de píxel de esquina por medio de las mismas relaciones descritas antes en conexión con H.263 para el desplazamiento de píxel de esquina de un cuadro entero. A partir de los cuatro vectores codificados para el limitador 46, la compensación de movimiento global para cada píxel contenido en la rebanada 40 puede ser calculado fácilmente usando interpolación bilineal, de acuerdo con la Ecuación (1). Resultará fácilmente evidente que en esta realización, diferentes rebanadas codificadas 40 contendrán información de GMC diferente.
Con referencia a la fig. 7, se ha mostrado de nuevo una rebanada codificada 40 con la caja limitadora 46. Sin embargo, sólo se han mostrado dos vectores de movimiento global 48a y 48b, que son codificados como la información de GMC para la rebanada 40. Estos vectores se refieren a los píxel más a la izquierda y más a la derecha, respectivamente, de la caja limitadora 46. La compensación de movimiento global para píxel respectivos de rebanada 40 puede ser determinada a partir de ellos. Para píxel a lo largo de un eje vertical, los vectores de movimiento global son los mismos, mientras que a lo largo de un eje horizontal son interpolados linealmente a partir de los dos vectores de movimiento global codificados 48a y 48b.
En otra realización, toda la información de GMC en una rebanada puede ser repetida sobre el nivel imagen o de cuadro, tal como en el encabezamiento del cuadro 32.
Con referencia a la fig. 8, se ha mostrado la sintaxis de la corriente de bits de la norma H.26L sobre niveles de imagen y de macrobloque. En H.26L los macrobloques de un inter-cuadros tienen uno de varios modos, que actualmente incluye 7 modos inter (16x16, 16x8, 8x16, 8x8, 8x4, 4x8 y 4x4), 1 modo intra para 4x4 y 23 modos intra para 16x16. Aquí NxM se refiere al tamaño de los bloques en los que es dividido el macrobloque. Para inter-MB, cada bloque tiene un MV y para intra-MB, cada bloque es predicho como una unidad. Además, hay un modo COPY, que no usa MV ni coeficientes. Este es el modo más barato para señalar. De hecho, la codificación de longitud de recorrido es usada para señalizar un número de macrobloques copiados (ocultos) con una contraseña.
Se ha propuesto una compensación de movimiento global para la norma H.26L. Se parece a la GMC usada en el Anexo P de H.263 en el modo en el que se han definido los vectores de movimiento global. Una diferencia principal, sin embargo, es que la imagen de referencia no es muestreada de nuevo y que los vectores de movimiento interpolado no se aplican a píxel sino a bloques de píxel. El vector de movimiento de un bloque de imagen con su píxel superior izquierdo como (x,y) puede ser derivado como
≈Δ «
≈Δ «
≈Δ «
y
x
y
r
x
+
r
y
+
r
xy
Ecuación (2)
÷◊
÷◊
4
4
4
4
H
V
H
V
xyH00V
donde r0, r, r, y rxy están referidos a v00, v, v, y vHV como para el Anexo P de H.263. Sin embargo, estos vectores de movimiento se aplican a bloques de imagen que consis
00 H0 0V
ten de 4x4 píxel. En particular, los vectores � , � , � ,y � HV se aplican a los bloques de esquina del cuadro con sus píxel superiores izquierdos en (0,0), (H-4,0), (0,V-4) y (H-4,V4) respectivamente.
La Codificación de Vector de Movimiento Global (GMVC) para H.26L se ha propuesto para aplicarse sólo para ciertos modos de macrobloques de la imagen. Si se ha usado o no, es señalizado para cada inter-cuadros en el encabezamiento de imagen por un indicador o banderola (indicador de GMVC). Si GMVC es conectado sobre los cuatro
xy
GMV r0, r, r, y rxy siguen al indicador. Estos son usados para la imagen actual siempre que un modo que usa GMVC es señalizado en un macrobloque. La sintaxis propuesta se ha mostrado en la fig. 9.
Los modos de macrobloque para macrobloques en un cuadro con GMVC habilitado tienen dos nuevos modos. El modo COPY es sustituido por GMVC_COPY y hay un modo adicional llamado GMVC_16. Ambos modos son modos 4x4 inter, es decir, el macrobloque es dividido en bloques de imagen de 4x4 píxel. Los vectores de movimiento para cada bloque están dados por los GMV interpolados como viene dado por la fórmula anterior. Para GMVC-COPY no hay coeficientes codificados, es decir, la imagen de referencia de movimiento compensado es copiada, mientras que para GMVC_16, se han añadido coeficientes también.
Con referencia a la fig. 10, se ha mostrado una rebanada codificada 50 que comprende macrobloques 52, en que cada macrobloque 52 está dividido en bloques 54 de imagen de 4x4 de acuerdo con la norma H.26L. En la fig. 10, los vectores de GM interpolados se aplican a bloques 54 de 4x4 en vez de a píxel. Con referencia adicional a la fig. 10, se han mostrado bloques de esquina 54a-d que tienen vectores de movimiento global asociados 56a-d, que especifican sus desplazamientos. Los bloques de esquina 54a-d definen las esquinas de una caja limitadora rectangular 58 que contiene la rebanada 50. Los vectores de movimiento 56a-d están representados por información de GMC contenida en el encabezamiento 60 de la rebanada 50. A partir de la información perteneciente a los vectores de GM 56a-d, la compensación de movimiento global puede ser calculada para cada uno de los bloques 54 de 4x4 de la rebanada 50, por medio de interpolación lineal de acuerdo con la Ecuación (2) anterior.
En otra realización, la compensación de movimiento global para cada uno de los bloques de imagen 54 puede ser calculada a partir de dos vectores de GM codificados (no mostrados) que especifican el desplazamiento de los bloques de 4x4 más a la izquierda y más a la derecha contenidos dentro de la caja limitadora 58. Aun en otra realización, la compensación de movimiento global para cada bloque 54 puede derivarse a partir de un único vector de GM codificado que comprende la información de GMC contenida en el encabezamiento 60.
En otra realización en la que una rebanada de GMC es habilitada, es decir, contiene una señal que indica información de GMC, la información comprende una señal de modo COPY. En respuesta a esta señal con respecto a un macrobloque particular de la rebanada, el codificador copiará el macrobloque correspondiente a partir de la imagen de referencia de movimiento compensado global, es decir, a partir del cuadro alabeado mostrado en la fig. 1. En esta realización los coeficientes que pertenecen al macrobloque pueden o no ser codificados también.
En una realización de acuerdo con el presente invento denominada como compensación de movimiento global Implícito (IGMC) el vector de movimiento no explícito es enviado con la rebanada codificada 40. En cambio, el modo COPY de macrobloque (aka SKIP) es reinterpretado como un modo de inter-macrobloque sin coeficientes o vectores de movimiento codificados explícitamente. El vector de movimiento usado para compensar el movimiento del macrobloque es predicho a partir de los bloques contiguos. Más específicamente, aplicando esta realización a un bloque de imagen particular en el cuadro actual, un bloque adjunto en un cuadro previo, dislocado por un vector de movimiento es copiado a partir del cuadro previo. El vector de movimiento es predicho a partir de bloques contiguos en el cuadro actual, es decir, a partir de bloques que son adyacentes o están próximos al bloque de imagen particular. El modo IGMC puede ser usado para sustituir el modo COPY codificando un bloque de imagen.
Como otro característica de la realización IGMC, una corriente de bits que representa un bloque de imagen codificada puede incluir un elemento sintáctico que puede ser interpretado para indicar el modo IGMC o el modo COPY. Una conmutación entre los modos IGMC y COPY puede ser señalizada implícitamente, por medio de otros elementos de código. Alternativamente, esta conmutación puede ser señalizada implícitamente por una palabra de código.
En una modificación de esta realización, un vector de movimiento adicional es
enviado para cada rebanada, para ser usado en la predicción del primer inter-bloque de la
rebanada.
Obviamente, muchas otras modificaciones y variaciones del presente invento son posibles a la luz de las enseñanzas anteriores. Debe comprenderse por ello que dentro del marco del concepto descrito, el invento puede ser puesto en práctica de otra manera que la que se ha descrito específicamente.

Claims (6)

  1. REIVINDICACIONES
    1.
    Un método para la descompresión de datos de video para cuadros de video que comprenden una pluralidad de bloques de imagen, en el que cada bloque de imagen será descodificado de acuerdo con uno de una pluralidad de modos de codificación, en el que uno de dicha pluralidad de modos es un modo COPY que implica que un bloque adjunto a partir de un cuadro anterior es señalizado para ser copiado a un cuadro actual con un vector de movimiento de cero; caracterizado porque el método comprende las operaciones de: descodificar una corriente de bits de datos que representa un bloque de imagen codificado de un cuadro actual en el que la corriente de bits de datos es descodificada de acuerdo a un modo IGMC o de acuerdo al modo copy, en el que dicho modo IGMC comprende: predecir un vector de movimiento a partir de bloques de imagen contiguos de dicho cuadro actual; y descodificar el bloque de imagen codificado copiando desde un cuadro anterior un bloque adjunto dislocado por el vector de movimiento predicho.
  2. 2.
    El método según la reivindicación 1, en el que: una conmutación entre dichos modos IGMC y COPY es señalizada explícitamente por una palabra de código.
  3. 3.
    El método según la reivindicación 1, en el que: una conmutación entre dichos modos IGMC y COPY es señalizada implícitamente por elementos de código descodificados previamente.
  4. 4.
    El método según la reivindicación 1, en el que: dicha predicción de vector de movimiento es calculada, para cada componente de vector individualmente, como la media de tres vectores de movimiento cercanos.
  5. 5.
    Un descodificador de video para descodificar cuadros de video que comprende una pluralidad de bloques de imagen, en el que cada bloque de imagen será descodificado de acuerdo con uno de una pluralidad de modos de codificación, en el que uno de dicha pluralidad de modos es un modo COPY que implica que un bloque adjuntado desde un cuadro anterior es señalizado para ser copiado a un cuadro actual con un vector de movimiento de cero; caracterizado porque el descodificador de video comprende medios para descodificar una corriente de bits de datos que representa un bloque de imagen codificado de un cuadro actual, en el que la corriente de bits de datos es descodificada de
    acuerdo con un modo IGMC o de acuerdo con el modo copy, en el que el descodificador de video comprende medios para descodificar el bloque de imagen codificado de acuerdo al modo IGMC calculando un vector de movimiento predicho prediciendo vectores de movimiento a partir de bloques de imagen contiguos de dicho cuadro actual; y descodificar el
    5 bloque de imagen codificado copiando desde un cuadro previo un bloque adjunto dislocado por el vector de movimiento predicho.
  6. 6. El descodificador de video según la reivindicación previa, en el que el descodificador comprende medios para calcular dicho vector de movimiento predicho, para cada
    10 componente de vector individualmente, como la media de tres vectores de movimiento contiguos.
ES02789126T 2001-11-30 2002-11-29 Compensación de movimiento global para imágenes de video. Expired - Lifetime ES2348123T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US33497901P 2001-11-30 2001-11-30
US334979P 2001-11-30
US306349 2002-11-27

Publications (1)

Publication Number Publication Date
ES2348123T3 true ES2348123T3 (es) 2010-11-30

Family

ID=34825775

Family Applications (1)

Application Number Title Priority Date Filing Date
ES02789126T Expired - Lifetime ES2348123T3 (es) 2001-11-30 2002-11-29 Compensación de movimiento global para imágenes de video.

Country Status (1)

Country Link
ES (1) ES2348123T3 (es)

Similar Documents

Publication Publication Date Title
AU2002353749B2 (en) Global motion compensation for video pictures
ES2750176T3 (es) Método y aparato para el tratamiento eficaz de cabeceras de fragmentos
ES2969907T3 (es) Método y aparato para codificación de video
ES2767933T3 (es) Capa de sectores en códec de vídeo
US7899115B2 (en) Method for scalably encoding and decoding video signal
ES2963368T3 (es) Obtención de valores de modo de referencia y codificación y descodificación de información que representa modos de predicción
ES2899780T3 (es) Dispositivo y procedimiento de codificación de imagen en movimiento, dispositivo y procedimiento de decodificación de imagen en movimiento, flujo de bits
KR100886191B1 (ko) 영상 블록을 디코딩 하는 방법
KR20110006696A (ko) 깊이 정보에 기초한 디스패리티 예측을 구비한 다중 시점 비디오 코딩
BR112014011334B1 (pt) Método para decodificar um quadro de vídeo
KR20120082994A (ko) 움직임 벡터 부호화/복호화 방법 및 장치
CN114827598A (zh) 视频编码的方法及装置
CN115550644A (zh) 视频编码的方法和装置、计算机设备和存储介质
US10171807B2 (en) Picture-level QP rate control for HEVC encoding
CN110636302A (zh) 视频解码、编码方法和装置、存储介质及解码器、编码器
CN112073720A (zh) 视频解码的方法和装置、计算机设备和存储介质
CN110636288A (zh) 视频解码、编码方法和装置及电子设备
ES2348123T3 (es) Compensación de movimiento global para imágenes de video.
CN112399180A (zh) 视频解码方法、装置及存储介质
AU2007219272B2 (en) Global motion compensation for video pictures
JP2013098735A (ja) 画像符号化装置、画像符号化方法及びプログラム、画像復号装置、画像復号方法及びプログラム
US20220279170A1 (en) Intra prediction device, image encoding device, image decoding device and program
KR20080097914A (ko) 다시점 동영상의 부호화 및 복호화 방법과 그 장치
JP4676474B2 (ja) 画像符号化方法
JP5061355B2 (ja) 画像符号化方法、装置およびプログラムならびに画像処理機器