ES2954981T3

ES2954981T3 - Aparato para codificar un fotograma en movimiento

Info

Publication number: ES2954981T3
Application number: ES21202139T
Authority: ES
Inventors: Soo Mi Oh; Moonock Yang
Original assignee: M&K Holdings Inc
Current assignee: M&K Holdings Inc
Priority date: 2010-08-17
Filing date: 2011-08-12
Publication date: 2023-11-27
Anticipated expiration: 2031-08-12
Also published as: KR20140057396A; PT3958559T; CN107087197B; EP3145188A3; FI3145188T3; CN107087198B; US10979731B2; US20170085902A1; US10602181B2; HRP20230005T1; US9807414B2; US10015516B2; KR20180015686A; PL3958560T3; HRP20230575T1; EP3958562A1; JP2017034706A; CN106878747A; PL3958559T3; US20170085899A1

Abstract

Se proporciona un aparato para codificar una imagen que determina un tamaño de paso de cuantificación de un bloque de codificación anterior según el orden de exploración como predictor del tamaño de paso de cuantificación del bloque de codificación actual cuando un tamaño de paso de cuantificación de un bloque de codificación izquierdo de un bloque de codificación actual y un tamaño de paso de cuantificación de un bloque de codificación anterior del bloque de codificación actual no está disponible, divide los coeficientes de transformación cuantificados de un bloque de transformación cuantificado en una pluralidad de subbloques cuando un tamaño del bloque de transformación es mayor que 4x4, y escanea la pluralidad de subbloques según un patrón de exploración determinado por un modo de intra predicción de un bloque actual. Por lo tanto, es posible reducir la cantidad de bits de codificación necesarios para codificar información de movimiento y el tamaño del paso de cuantificación del bloque de predicción actual. (Traducción automática con Google Translate, sin valor legal)

Description

DESCRIPCIÓN

Aparato para codificar un fotograma en movimiento

[Campo técnico]

La presente invención se refiere a un método de codificación de inter predicción, y más particularmente, a un método de codificación de inter predicción para codificar un vector de movimiento de una unidad de predicción actual usando uno de los vectores de movimiento de una unidad de predicción adyacente a la unidad de predicción actual y un vector de movimiento ubicado en una posición predeterminada de un fotograma de referencia (reference picture) codificado previamente.

[Técnica anterior]

La presente invención se refiere a un aparato y un método para codificar y decodificar prediciendo un vector de movimiento de una unidad de predicción actual.

En los métodos de compresión de imágenes tal como el grupo de expertos de imágenes en movimiento (MPEG)-1, MPEG-2, MPEG-4 y la codificación de video avanzada (AVC)H.264/MPEG-4, un fotograma (picture) se divide en macrobloques para codificar una imagen. Y, los respectivos macrobloques se codifican usando la inter predicción o la intra predicción. Entonces, se selecciona un modo de codificación óptimo en función del tamaño de los datos de un macrobloque a codificar y de la distorsión de un macrobloque original, y se codifica el macrobloque.

En la inter predicción, se usa una estimación de movimiento para eliminar la redundancia temporal entre fotogramas consecutivos. La codificación de estimación de movimiento es un método que codifica una imagen estimando y compensando un movimiento del fotograma actual en la unidad de bloque usando uno o más fotogramas de referencia. En la codificación de estimación de movimiento, se busca el bloque más similar al bloque actual dentro de un intervalo de búsqueda predeterminado para un fotograma de referencia usando una función de estimación predeterminada. Si se busca el bloque más similar, solo se transmite el residuo entre el bloque actual y el bloque más similar del fotograma de referencia para aumentar la relación de compresión de datos.

En este momento, para decodificar el bloque actual codificado con estimación de movimiento, la información para el vector de movimiento indica una diferencia de posición entre el bloque actual y el bloque más similar del fotograma de referencia. Por lo tanto, es necesario insertar información codificada para el vector de movimiento en un flujo de bits cuando se codifica el bloque actual. En este proceso, si la información del vector de movimiento se codifica y se inserta tal cual, la relación de compresión de los datos de una imagen disminuye debido a que se aumenta la sobrecarga. Por lo tanto, en la codificación de inter predicción, un vector de movimiento del bloque actual se predice usando bloques adyacentes al bloque actual, solo se codifica y transmite un valor de diferencia entre el predictor de vector de movimiento generado y el vector de movimiento original, y se comprime la información del vector de movimiento también.

En H.264, el predictor de vector de movimiento, que es un predictor de un vector de movimiento del bloque actual, se determina como una mediana de mvA, mvB y mvC. Como los bloques vecinos tienden a ser similares entre sí, el vector de movimiento del bloque actual se determina como una mediana de los vectores de movimiento de los bloques vecinos.

Pero, si uno o más vectores de movimiento de los bloques vecinos son diferentes del movimiento del bloque actual, la mediana de los vectores de movimiento de los bloques vecinos puede no ser un predictor eficiente del vector de movimiento para el bloque actual. También, se requiere un método para seleccionar un candidato para predecir un vector de movimiento y para codificar o decodificar el vector de movimiento más eficazmente en comparación con el método de predicción de movimiento conocido cuando el movimiento de la imagen es escaso o constante.

Muhammed Cohan et al, "CU-level OP prediction", reunión 5.JCT-VC, JVTVC-E391, 11-03-2011 se refiere al uso del QP de la CU vecinas superiores izquierdas como el predictor para la codificación del QP de la CU actual. Si la vecina de la izquierda no está disponible entonces se usa la QP de la CU más cercana a la izquierda como el predictor.

[Divulgación]

[Problema técnico]

El objeto de la presente invención es mejorar la eficiencia de codificación para la codificación de predicción.

[Solución técnica]

Este objeto se consigue por la materia de la reivindicación independiente. Una realización preferida se define por la reivindicación dependiente.

[Descripción de los dibujos]

La figura 1 es un diagrama de bloques de un aparato para codificar un fotograma en movimiento de acuerdo con la presente invención.

La figura 2 es un diagrama de bloques de un aparato para decodificar un fotograma en movimiento de acuerdo con la presente divulgación.

La figura 3 es un diagrama de flujo que ilustra un procedimiento para generar un bloque reconstruido de una codificación de unidad de predicción en modo de salto de acuerdo con la presente divulgación.

La figura 4 es un diagrama conceptual que muestra las posiciones de los candidatos a salto espacial de acuerdo con la presente divulgación.

La figura 5 es un diagrama conceptual que muestra las posiciones de las unidades de predicción usadas para obtener un candidato a salto temporal de acuerdo con la presente divulgación.

La figura 6 es un diagrama conceptual que ilustra las posiciones de los bloques en un fotograma candidato a salto temporal correspondiente a una unidad de predicción actual de acuerdo con la presente divulgación.

La figura 7 es un diagrama de flujo que ilustra un procedimiento para generar un bloque reconstruido para la predicción de vector de movimiento de la unidad de predicción codificado de acuerdo con la presente divulgación.

La figura 8 es un diagrama conceptual que muestra las posiciones de las unidades de predicción adyacentes a la unidad de predicción actual usadas para generar candidatos de vectores de movimiento espacial de acuerdo con la presente divulgación.

Modo para la invención

En lo sucesivo en el presente documento, se describirán en detalle diversas realizaciones de la presente invención haciendo referencia a los dibujos adjuntos. No obstante, la presente invención no se limita a las realizaciones a modo de ejemplo que se divulgan a continuación, pero puede implementarse en diversos tipos. Por lo tanto, son posibles muchas otras modificaciones y variaciones de la presente invención, y debe entenderse que dentro del alcance del concepto divulgado, la presente invención puede practicarse de manera distinta a como se ha descrito específicamente.

Para codificar una imagen, se divide un fotograma en una pluralidad de fracciones, y cada fracción (slice) se divide en una pluralidad de unidades de codificación más grandes (Largest Coding Units, LCU). La posición de cada LCU se designa mediante un indicador de dirección. La LCU puede ser una unidad de codificación en sí misma o puede estar dividida en una pluralidad de unidades de codificación más pequeñas. La LCU contiene información que indica la estructura de las unidades de codificación en la LCU. Para indicar la estructura de las unidades de codificación en la LCU se usan una o más banderas de división.

Cada unidad de codificación consiste en una o más unidades de predicción (Prediction Units, PU). La unidad de predicción es una unidad básica para la intra predicción o la inter predicción.

Una unidad de transformación (Transform Units, TU) es un bloque básico para la codificación por transformación. En intra predicción, la unidad de predicción puede contener una o más unidades de transformación. En inter predicción, una unidad de transformación puede comprender una o más unidades de predicción. El tamaño máximo de la unidad de predicción se define en un conjunto de parámetros de secuencia (Sequence Parameter Set, SPS), y la unidad de transformación puede dividirse en una forma de árbol cuádruple. El tamaño máximo de la unidad de predicción en la intra predicción puede ser diferente al de la unidad de predicción en la inter predicción. Los tamaños máximos de la unidad de predicción en la intra predicción y la inter predicción se transmiten a un aparato de decodificación a través del SPS.

Haciendo referencia a la figura 1, un aparato para codificar un fotograma en movimiento 100 de acuerdo con la presente invención incluye una unidad de división de fotogramas 110, una unidad de transformación 120, una unidad de cuantificación 130, una unidad de escaneo 131, una unidad de codificación de entropía 140, una unidad de intra predicción 150, una unidad de inter predicción 160, una unidad de cuantificación inversa 135, una unidad de transformación inversa 125, una unidad de posprocesamiento 170, una unidad de almacenamiento de fotogramas 180, un restador 190 y un sumador 195.

La unidad de división de fotogramas 110 analiza una señal de vídeo de entrada para dividir cada LCU de un fotograma en una o más unidades de codificación, cada una de las cuales tiene un tamaño predeterminado, determina el modo de predicción de cada unidad de codificación y determina el tamaño de la unidad de predicción por cada unidad de codificación. La unidad de división de fotogramas 110 envía la unidad de predicción a codificar a la unidad de intra predicción 150 o a la unidad de inter predicción 160 de acuerdo con el modo de predicción. También, la unidad de división de fotogramas 110 envía la unidad de predicción a codificar al restador 190.

La unidad de transformación 120 transforma un bloque residual que es una señal residual entre un bloque original de una unidad de predicción de entrada y un bloque de predicción generado por la unidad de intra predicción 150 o la unidad de inter predicción 160. El bloque residual puede estar compuesto por una unidad de codificación. El bloque residual compuesto por una unidad de codificación puede dividirse en unidades de transformación óptimas y transformarse. Una matriz de transformación puede determinarse de manera adaptativa de acuerdo con un modo de predicción (intra o inter) y un modo de intra predicción. La unidad de transformación puede transformarse por matrices de transformación unidimensionales (1D) horizontales y verticales. En inter predicción, se aplica una matriz de transformación predeterminada.

En intra predicción, existe una gran posibilidad de que el bloque residual tenga una directividad vertical cuando el modo de intra predicción es horizontal. De este modo, se aplica una matriz entera basada en la transformada discreta del coseno (Discrete Cosine Transform, DCT) a la dirección vertical, y una matriz entera basada en la transformada discreta del seno (Discrete Sine Transform, DST) o en la transformada de Karhunen Loeve (Karhunen Loeve Transform, KLT) a la dirección horizontal. Cuando el modo de intra predicción es vertical, se aplica una matriz entera basada en DST o KLT a la dirección vertical, y se aplica una matriz entera basada en DCT a la dirección horizontal. Cuando el modo de intra predicción es DC, la matriz entera basada en DCT puede aplicarse a ambas direcciones. El método mencionado anteriormente puede aplicarse cuando un tamaño de la unidad de transformación es igual o menor que un tamaño predeterminado. El tamaño predeterminado puede ser 4x4 u 8x8. Por lo tanto, cuando el tamaño de la unidad de transformación es mayor que el tamaño predeterminado, la matriz entera basada en DCT o una matriz entera basada en DCT bidimensional se aplica a ambas direcciones. Es decir, en intra predicción, la matriz de transformación puede determinarse de manera adaptativa de acuerdo con el tamaño de la unidad de transformación y el modo de intra predicción.

La unidad de cuantificación 130 determina un tamaño de paso de cuantificación para cuantificar los coeficientes de transformación del bloque residual transformado por la matriz de transformación. El tamaño de paso de cuantificación se determina en una unidad de codificación que tiene un tamaño igual o mayor que un tamaño predeterminado. Para la unidad de codificación que tiene un tamaño menor que el tamaño predeterminado, el tamaño de paso de cuantificación se determina en el tamaño predeterminado. Usando el tamaño de paso de cuantificación determinado y una matriz de cuantificación determinada de acuerdo con un modo de predicción, se cuantifican los coeficientes de transformación del bloque de transformación. La unidad de cuantificación 130 puede determinar un tamaño de paso de cuantificación de la unidad de codificación vecina como un predictor de tamaño de paso de cuantificación de la unidad de codificación actual. Por ejemplo, la unidad de cuantificación 130 puede determinar un tamaño de paso de cuantificación de una unidad de codificación izquierda de la unidad de codificación actual como un predictor de tamaño de paso de cuantificación. Si la unidad de codificación izquierda no está disponible, se determina el tamaño de paso de cuantificación de la unidad de codificación previa en el orden de escaneo como el predictor de tamaño de paso de cuantificación de la unidad de codificación actual. Como alternativa, un primer tamaño de paso de cuantificación disponible se determina como el predictor de tamaño de paso de cuantificación escaneando en el orden de una unidad de codificación izquierda, unidad de codificación superior y una unidad de codificación previa.

El bloque de transformación cuantificado se proporciona a la unidad de cuantificación inversa 135 y a la unidad de escaneo 131.

La unidad de escaneo 131 escanea los coeficientes de transformación cuantificados del bloque de transformación cuantificado, convierte de este modo los coeficientes de transformación cuantificados en coeficientes de transformación cuantificados 1D. Se determina un esquema de escaneo para los coeficientes de acuerdo con el modo de predicción y el modo de intra predicción. El esquema de escaneo de los coeficientes también puede determinarse de acuerdo con el tamaño de la unidad de transformación.

La unidad de escaneo 131 determina si debe o no dividir el bloque de transformación cuantificado en una pluralidad de subconjuntos de acuerdo con el tamaño de la unidad de transformación actual. Si el tamaño de la unidad de transformación es mayor que un primer tamaño de referencia, el bloque de transformación cuantificado se divide en la pluralidad de subconjuntos. El primer tamaño de referencia es preferentemente 4x4 u 8x8.

La unidad de escaneo 131 determina un patrón de escaneo a aplicar al bloque de coeficientes cuantificados. En inter predicción, puede usarse un patrón de escaneo predeterminado (por ejemplo, escaneo en zigzag). En intra predicción, el patrón de escaneo puede seleccionarse basándose en el modo de intra predicción y el tamaño de la unidad de transformación. En el modo de intra predicción no direccional, se usa el patrón de escaneo predeterminado. El modo de intra predicción no direccional puede ser un modo DC o un modo plano.

En el modo de intra predicción direccional, el patrón de escaneo puede variar de acuerdo con el modo de intra predicción y el tamaño de la unidad de transformación. En el modo de intra predicción direccional, el patrón de escaneo predeterminado puede usarse si el tamaño de la unidad de transformación es igual o mayor que un tamaño predeterminado, y un patrón de escaneo puede seleccionarse de manera adaptable basándose en el modo de intra predicción direccional si el tamaño de la unidad de transformación es menor que el tamaño predeterminado. El tamaño predeterminado puede ser 16x16.

Si el tamaño de la unidad de transformación es menor que el tamaño predeterminado, puede usarse uno de los tres patrones de escaneo. Los tres patrones de escaneo son un primer patrón de escaneo (igual que el escaneo predeterminado), un segundo patrón de escaneo (un patrón de escaneo horizontal) y un tercer patrón de escaneo (un patrón de escaneo vertical). Para el modo de intra predicción vertical, se aplica el segundo patrón de escaneo debido a que es muy probable que los coeficientes existan en la dirección horizontal. Para un número predeterminado de modos de intra predicción direccional adyacentes al modo de intra predicción vertical en los lados izquierdo y derecho, se aplica el segundo patrón de escaneo. Para el modo de intra predicción horizontal, se aplica el tercer patrón de escaneo. Para el número predeterminado de modos de intra predicción direccional adyacentes al modo de intra predicción horizontal en los lados superior e inferior, se aplica el tercer patrón de escaneo. El número predeterminado es preferentemente 3 o 4 para cada dirección.

Los coeficientes cuantificados se escanean en sentido inverso. Cuando los coeficientes cuantificados se dividen en una pluralidad de subconjuntos, se aplica el mismo patrón de escaneo a los coeficientes cuantificados de cada subconjunto. La pluralidad de subconjuntos consiste en un subconjunto principal y uno o más subconjuntos restantes. El subconjunto principal está ubicado en el lado superior izquierdo e incluye los coeficientes de c C. El uno o más subconjuntos restantes cubren una región distinta del subconjunto principal.

Se aplica el escaneo en zigzag para escanear la pluralidad de subconjuntos. La pluralidad de subconjuntos se escanea preferentemente comenzando por el subconjunto principal hacia los subconjuntos restantes en una dirección hacia delante o puede escanearse en un sentido inverso. Un patrón de escaneo para escanear la pluralidad de subconjuntos se establece igual que el patrón de escaneo para escanear los coeficientes cuantificados de cada subconjunto. En este caso, el patrón de escaneo para escanear la pluralidad de subconjuntos se determina de acuerdo con el modo de intra predicción. Mientras tanto, un codificador transmite información capaz de indicar una posición del último coeficiente cuantificado distinto de cero de la unidad de transformación a un decodificador. El codificador también transmite información capaz de indicar una posición del último coeficiente cuantificado distinto de cero de cada subconjunto al decodificador.

La unidad de cuantificación inversa 135 cuantifica inversamente los coeficientes cuantificados. La unidad de transformación inversa 125 restaura el bloque residual del dominio espacial a partir de los coeficientes de transformación cuantificados inversamente. El sumador genera un bloque reconstruido sumando el bloque residual reconstruido por la unidad de transformación inversa 125 y el bloque de predicción de la unidad de intra predicción 150 o la unidad de inter predicción 160.

La unidad de posprocesamiento 170 realiza un proceso de filtrado de desbloqueo para eliminar el artefacto de bloqueo generado en un fotograma reconstruido, un proceso de aplicación de desplazamiento adaptativo para complementar una diferencia entre el fotograma reconstruido y la imagen original por píxel, y un proceso de filtrado en bucle adaptativo para complementar una diferencia entre el fotograma reconstruido y la imagen original en una unidad de codificación.

El proceso de filtrado de desbloqueo puede aplicarse a un límite entre unidades de predicción y a un límite entre unidades de transformación que tengan un tamaño predeterminado o más. El tamaño predeterminado puede ser 8x8. El proceso de filtrado de desbloqueo incluye una etapa para determinar un límite a filtrar, una etapa para determinar la intensidad de filtrado de límites a aplicar a los mismos, una etapa para determinar si se aplica o no un filtro de desbloqueo, y una etapa para seleccionar un filtro a aplicar al límite cuando se determine aplicar el filtro de desbloqueo.

Si se aplica o no el filtro de desbloqueo se determina de acuerdo con i) si la intensidad de filtrado de límites es o no mayor que 0 y ii) si un valor que indica la diferencia entre los píxeles de los límites del bloque P y del bloque Q que se localizan en un límite a filtrar es o no menor que un primer valor de referencia determinado de acuerdo con un parámetro de cuantificación.

Pueden existir dos o más filtros. Cuando un valor absoluto de una diferencia entre dos píxeles adyacentes al límite de bloque es igual o mayor que un segundo valor de referencia, se selecciona un filtro débil. El segundo valor de referencia viene determinado por el parámetro de cuantificación y la intensidad de filtrado de límites.

El proceso de filtrado en bucle adaptativo puede realizarse sobre la base de un valor obtenido comparando una imagen original y una imagen reconstruida a la que se aplica el proceso de filtrado de desbloqueo o el proceso de aplicación de desplazamiento adaptativo. Un filtro en bucle adaptativo (Adaptive Loop Filter, ALF) se detecta a través de un valor de actividad laplaciano sobre la base de un bloque 4x4. El ALF determinado puede aplicarse a todos los píxeles incluidos en un bloque de 4x4 o en un bloque de 8x8. La aplicación o no de un ALF puede determinarse antes de la unidad de codificación. El tamaño y los coeficientes de un filtro en bucle pueden variar de acuerdo con cada unidad de codificación. Una cabecera de fracción puede incluir información que indique si se aplica o no el ALF a cada unidad de codificación, información de coeficiente de filtro e información de forma de filtro, etc. En el caso de los componentes de crominancia, la aplicación o no del ALF puede determinarse en la unidad de fotogramas. A diferencia de la luminancia, el filtro en bucle puede tener una forma rectangular.

El proceso de filtrado en bucle adaptativo se realiza sobre la base de la secuencia o fotograma. La información de parámetro de filtro de ALF se incluye en una cabecera de fotograma o en una cabecera de fracción. Si la información de parámetro de filtro de ALF se incluye en la cabecera de fotograma, la cabecera de fracción no contiene la información de parámetro de filtro de ALF. Pero, si la información de parámetro de filtro de ALF no está incluida en la cabecera de fotograma, la cabecera de fracción contiene la información de parámetro de filtro de ALF. La información de parámetro de filtro de ALF incluye información que indica una longitud horizontal y/o una longitud vertical del filtro para los componentes de luminancia y un número de filtros. Si el número de filtro es 2 o más, la información de parámetro de filtro de ALF puede contener información que indique si los filtros se codifican usando o no la predicción. La información de parámetro de filtro de ALF incluye los coeficientes de filtro predichos cuando los filtros se codifican usando la predicción. Al contrario, la información de parámetro de filtro de ALF incluye los coeficientes de filtro no predichos cuando los filtros se codifican sin usar la predicción.

Los componentes de crominancia también pueden filtrarse de manera adaptativa. La información de parámetro de filtro de ALF puede incluir información sobre si se filtra o no cada componente de crominancia. Para reducir la cantidad de bits, puede codificarse conjuntamente la información que indica si el componente Cr está filtrado y la información que indica si el componente Cb está filtrado. Es preferible una codificación de entropía que asigne la menor información para el caso de que no se filtre ninguno de los componentes Cr y Cb debido a que la probabilidad de que no se filtre ninguno de los componentes Cr y Cb es alta. Para el caso de que se filtre al menos uno de los componentes Cr y Cb, la información de parámetro de filtro de ALF incluye información que indica una longitud horizontal y/o una longitud vertical de los coeficientes de filtro para los componentes de crominancia e información del filtro.

También, el proceso de ALF puede estar activado o desactivado por unidad de codificación igual o mayor que un tamaño predeterminado. De este modo, cada cabecera de fracción contiene información que indica si el proceso de ALF se aplica o no por unidad de codificación en la fracción.

La unidad de almacenamiento de fotogramas 180 recibe los datos de imagen posprocesada de la unidad de posprocesamiento 170, y almacena la imagen restaurada en la unidad de fotogramas. Un fotograma puede ser una imagen en una trama o en un campo. La unidad de almacenamiento de fotogramas 180 tiene una memoria intermedia (no mostrada) capaz de almacenar una pluralidad de fotogramas.

La unidad de inter predicción 160 realiza una estimación de movimiento usando uno o más fotogramas de referencia almacenados en la unidad de almacenamiento de fotogramas 180, y determina un índice de fotograma de referencia que indica el fotograma de referencia y un vector de movimiento. De acuerdo con el índice de fotograma de referencia y el vector de movimiento, la unidad de inter predicción 160 extrae un bloque de predicción que corresponde a una unidad de predicción a codificar de un fotograma de referencia seleccionado entre una pluralidad de fotogramas de referencia almacenados en la unidad de almacenamiento de fotogramas 150 y emite el bloque de predicción extraído.

La unidad de intra predicción 150 realiza una intra predicción usando valores de píxeles reconstruidos dentro de un fotograma que contiene la unidad de predicción actual. La unidad de intra predicción 150 recibe la unidad de predicción actual para codificarse predictivamente, selecciona uno de un número predeterminado de modos de intra predicción, y realiza la intra predicción. El número predeterminado de modos de intra predicción puede depender del tamaño de la unidad de predicción actual. La unidad de intra predicción filtra de manera adaptativa los píxeles de referencia para generar el bloque de intra predicción. Cuando algunos de los píxeles de referencia no están disponibles, es posible generar los píxeles de referencia en las posiciones no disponibles usando uno o más píxeles de referencia disponibles.

La unidad de codificación de entropía 140 codifica con entropía los coeficientes cuantificados que se han cuantificado por la unidad de cuantificación 130, la información de intra predicción recibida de la unidad de intra predicción 150, la información de movimiento recibida de la unidad de inter predicción 160, y así sucesivamente.

Mientras tanto, el aparato para codificar un fotograma en movimiento 100 de acuerdo con la presente invención codifica predictivamente el vector de movimiento. El procedimiento de codificación del vector de movimiento se realiza por la unidad de inter predicción 160 y la unidad de codificación de entropía 140. El procedimiento de codificación del vector de movimiento en el aparato para codificar un fotograma en movimiento 100 es el siguiente.

Se obtiene un vector de movimiento de la unidad de predicción actual.

Los vectores de movimiento disponibles de las unidades de predicción vecinas existentes en posiciones predeterminadas se determinan como candidatos a vectores de movimiento espacial. Si el vector de movimiento de la unidad de predicción vecina no existe o la unidad de predicción vecina no está incluida en una fracción diferente, el vector de movimiento se determina como no disponible.

A continuación, el vector de movimiento espacial puede escalarse de manera adaptativa. Si la unidad de predicción actual y la unidad de predicción vecina tienen el mismo fotograma de referencia, el candidato a vector de movimiento no se escala. Pero, si la unidad de predicción actual y la unidad de predicción vecina tienen diferentes fotogramas de referencia o las distancias temporales del fotograma de referencia no son las mismas, el candidato a vector de movimiento puede escalarse usando las distancias temporales. El vector de movimiento puede no escalarse para una imagen fija (por ejemplo, imagen de fondo). En este caso, puede transmitirse una indicación de bandera si el vector de movimiento está escalado o no a un decodificador. El número de escalas del candidato a vector de movimiento espacial puede limitarse a un número predeterminado.

Se selecciona un predictor de vector de movimiento de la unidad de predicción actual entre los candidatos a vector de movimiento espacial y el candidato a vector de movimiento temporal.

Se obtiene y codifica la diferencia de vector de movimiento (Motion Vector Difference, MVD) entre el vector de movimiento de la unidad de predicción actual y el predictor de vector de movimiento de la unidad de predicción actual. Y se codifica la información que indica el predictor de vector de movimiento.

El candidato a vector de movimiento temporal es un vector de movimiento de una unidad de predicción que se ubica en o cerca de una posición en un fotograma de referencia, que está previamente codificado, correspondiente a la posición de la unidad de predicción actual. Cuando existe una pluralidad de vectores de movimiento de la unidad de predicción que se ubica en o cerca de la posición en el fotograma de referencia correspondiente a la posición de la unidad de predicción actual, se selecciona un vector de movimiento como vector de movimiento temporal de acuerdo con un método predeterminado. Por ejemplo, si está disponible el vector de movimiento del bloque ubicado en una primera posición correspondiente a la unidad de predicción actual en el fotograma, el vector de movimiento se determina como el candidato a vector de movimiento temporal. Pero, si el vector de movimiento del bloque ubicado en la primera posición no está disponible, el vector de movimiento de un bloque ubicado en una segunda posición se determina como el candidato a vector de movimiento temporal.

En la fracción (slice) B (predicción bidireccional), el único fotograma de referencia que contiene el candidato a vector de movimiento temporal procede de la lista de fotogramas de referencia 0 o 1. Por lo tanto, la información de la lista que indica la lista de fotogramas de referencia se transmite a un decodificador, y el decodificador determina el fotograma de referencia usando la información de la lista.

La información que indica si se usa o no el candidato a vector de movimiento temporal puede incluirse en el flujo de bits (bit stream). Por lo tanto, el procedimiento de decodificación del vector de movimiento puede variar de acuerdo con la información.

Los candidatos a vector de movimiento espacial incluyen un candidato a vector de movimiento izquierdo y un candidato a vector de movimiento superior. El candidato a vector de movimiento izquierdo de la unidad de predicción actual es un vector de movimiento de una unidad de predicción vecina a la izquierda de la unidad de predicción actual o un vector de movimiento de una unidad de predicción vecina inferior-izquierda de la unidad de predicción actual. El candidato a vector de movimiento izquierdo es el primer vector de movimiento disponible encontrado al recuperar los vectores de movimiento de la unidad de predicción izquierda y de la unidad de predicción inferior-izquierda en un orden predeterminado. El candidato a vector de movimiento superior de la unidad de predicción actual es un primer vector de movimiento disponible encontrado al recuperar los vectores de movimiento de una unidad de predicción vecina a la superior de la unidad de predicción actual, una unidad de predicción vecina a la superior-derecha de la unidad de predicción actual y una unidad de predicción vecina a la superior-izquierda de la unidad de predicción actual en un orden predeterminado.

Si los candidatos a vector de movimiento tienen los mismos valores, se elimina el candidato a vector de movimiento que tiene un orden grande.

Si el candidato a vector de movimiento es uno, el candidato a vector de movimiento se determina como predictor de vector de movimiento y el indicador de predictor que indica el predictor de vector de movimiento no se codifica.

Haciendo referencia a la figura 2, el aparato para decodificar un fotograma en movimiento 200 de acuerdo con la presente invención incluye una unidad de decodificación de entropía 210, una unidad de escaneo inverso 215, una unidad de cuantificación inversa 220, una unidad de transformación inversa 225, un sumador 270, una unidad de posprocesamiento 250, una unidad de almacenamiento de fotogramas 260, una unidad de intra predicción 230, una unidad de inter predicción 240 y un conmutador de intra/inter conversión 280.

La unidad de decodificación de entropía 210 extrae un índice de modo de intra predicción, una información de movimiento, una secuencia de coeficientes cuantificados, etc., a partir de un flujo de bits recibido y transmitido desde un aparato para codificar un fotograma en movimiento. La unidad de decodificación de entropía 210 transmite la información de movimiento a la unidad de inter predicción 240, la información del modo de intra predicción a la unidad de intra predicción 230 y a la unidad de cuantificación inversa 220, y la secuencia de coeficientes cuantificados a la unidad de cuantificación inversa 220 y a la unidad de transformación inversa 225.

La unidad de escaneo inverso 215 convierte la secuencia de coeficientes cuantificados en una unidad de transformación cuantificada bidimensional (2D). Se selecciona uno de una pluralidad de patrones de escaneo inverso para la conversión. El patrón de escaneo inverso para escanear inversamente los coeficientes cuantificados puede seleccionarse basándose en el modo de intra predicción. Si el tamaño de una unidad de transformación actual es mayor que un tamaño de referencia predeterminado, la secuencia de coeficientes cuantificados se escanea inversamente en la unidad de subconjunto que tiene el tamaño predeterminado para generar la unidad de transformación cuantificada. Si el tamaño de la unidad de transformación actual es igual al tamaño de referencia predeterminado, la secuencia de coeficientes cuantificados se escanea inversamente en la unidad de la unidad de transformación para generar la unidad de transformación cuantificada. Si los coeficientes cuantificados se escanean inversamente en la unidad de subconjunto, se aplica el mismo patrón de escaneo inverso a los coeficientes cuantificados en cada subconjunto. La pluralidad de subconjuntos consiste en un subconjunto principal y uno o más subconjuntos restantes. El subconjunto principal se coloca en el lado superior izquierdo e incluye los coeficientes de CC, y el o los subconjuntos restantes cubren regiones distintas del subconjunto principal.

Un patrón de escaneo inverso a aplicar a los subconjuntos es un escaneo en zigzag hacia atrás. Los subconjuntos pueden escanearse inversamente comenzando por el subconjunto principal hacia los subconjuntos restantes en un sentido hacia delante o pueden escanearse inversamente en el sentido hacia atrás. Un patrón de escaneo para escanear inversamente los subconjuntos puede establecerse igual que un patrón de escaneo inverso para escanear inversamente los coeficientes cuantificados. La unidad de escaneo inverso 215 realiza el procedimiento de escaneo inverso usando la información que indica una posición del último coeficiente cuantificado distinto de cero de la unidad de transformación actual.

En el modo de intra predicción direccional, el patrón de escaneo inverso para cada subconjunto puede variar de acuerdo con el modo de intra predicción y el tamaño de la unidad de transformación. Es decir, el patrón de escaneo predeterminado puede aplicarse a una unidad de transformación que tenga un tamaño igual o mayor que un tamaño predeterminado, y un patrón de escaneo inverso puede seleccionarse de manera adaptativa basándose en el modo de intra predicción direccional para la unidad de transformación que tenga un tamaño menor que el tamaño predeterminado. El tamaño predeterminado puede ser 16x16. Si el tamaño de la unidad de transformación es menor que el tamaño predeterminado, puede usarse uno de los tres patrones de escaneo. Los tres patrones de escaneo son un primer patrón de escaneo (igual que el escaneo predeterminado), un segundo patrón de escaneo (una escaneo horizontal) y un tercer patrón de escaneo (una escaneo vertical). Para el modo de intra predicción vertical y un número predeterminado de modos de intra predicción direccional adyacentes al modo de intra predicción vertical en ambos lados, se aplica el segundo patrón de escaneo. De manera similar, para el modo de intra predicción horizontal y el número predeterminado de modos de intra predicción direccional adyacentes al modo de intra predicción horizontal en ambos lados, se aplica el tercer patrón de escaneo. El número predeterminado es preferentemente 3 o 4 para cada dirección.

La unidad de cuantificación inversa 220 restaura un tamaño de paso de cuantificación para cuantificar inversamente los coeficientes cuantificados inversamente en 2D (es decir, la unidad de transformación cuantificada 2D). El tamaño de paso de cuantificación se determina en una unidad de codificación que tiene un tamaño igual o mayor que un tamaño predeterminado. Si el tamaño de las unidades de codificación es menor que el tamaño predeterminado, el tamaño de paso de cuantificación se determina para el tamaño predeterminado. La unidad de cuantificación inversa 220 puede usar un tamaño de paso de cuantificación de una unidad de codificación vecina para una unidad de codificación actual como predictor de tamaño de paso de cuantificación de la unidad de codificación actual. Por ejemplo, la unidad de cuantificación inversa 220 puede determinar un tamaño de paso de cuantificación de una unidad de codificación izquierda de la unidad de codificación actual como el predictor de tamaño de paso de cuantificación de la unidad de codificación actual. Si la unidad de codificación izquierda no está disponible, el tamaño de paso de cuantificación de una unidad de codificación previa en el orden de escaneo se determina como el predictor de tamaño de paso de cuantificación de la unidad de codificación actual. Como alternativa, un tamaño de paso de cuantificación disponible se determina como el predictor del tamaño de paso de cuantificación de la unidad de codificación actual cuando se escanea en el orden de la unidad de codificación izquierda, una unidad de codificación superior y la unidad de codificación previa.

Cuando se determina el predictor de tamaño de paso de cuantificación, el tamaño de paso de cuantificación se obtiene sumando el predictor de tamaño de paso de cuantificación y el tamaño de paso de cuantificación residual recibido. Entonces, la unidad de transformación cuantificada se cuantifica inversamente usando una matriz de cuantificación inversa determinada de acuerdo con el tamaño de paso de cuantificación y un modo de predicción.

La unidad de transformación inversa 225 transforma inversamente el bloque cuantificado inverso (es decir, una unidad de transformación) para restaurar un bloque residual. La matriz de transformación inversa a aplicar a la unidad de transformación se determina de manera adaptativa de acuerdo con el modo de predicción (intra o inter) y el modo de intra predicción. Se aplica una matriz de transformación inversa de la matriz de transformación, que se aplica a la unidad de transformación 120 de la figura 1.

El sumador 270 suma el bloque residual restaurado reconstruido por la unidad de transformación inversa 225 y un bloque de predicción generado por la unidad de intra predicción 230 o la unidad de inter predicción 240 para restaurar un bloque de imagen.

La unidad de posprocesamiento 250 realiza un proceso de filtro de desbloqueo al bloque de imagen restaurado generado por el sumador 270. Por esto, pueden disminuirse los artefactos de bloqueo resultantes de la pérdida de imagen de acuerdo con un proceso de cuantificación.

La unidad de almacenamiento de fotogramas 260 es una memoria de tramas que almacena una imagen local reconstruida filtrada desbloqueando mediante la unidad de posprocesamiento 250.

La unidad de intra predicción 230 restaura un modo de intra predicción del bloque actual basándose en el índice de modo de intra predicción recibido, y genera un bloque de predicción de acuerdo con el modo de intra predicción restaurado.

La unidad de inter predicción 240 restaura un vector de movimiento de la unidad de predicción actual basándose en la información de movimiento recibida, y genera un bloque de predicción de la unidad actual basándose en el vector de movimiento de un fotograma almacenado en la unidad de almacenamiento de fotogramas 260. Si se aplica la compensación de movimiento de precisión decimal, se genera el bloque de predicción usando un filtro de interpolación seleccionado.

La unidad de inter predicción 240 decodifica el vector de movimiento de la siguiente manera (proceso de decodificación AMVP).

La diferencia de vector de movimiento (Motion Vector Difference, MVD) se genera restaurando una diferencia entre los vectores de movimiento codificados.

Los vectores de movimiento disponibles de las unidades de predicción vecinas para la unidad de predicción actual y que existen en posiciones predeterminadas se determinan como candidatos a vector de movimiento espacial. Y los candidatos a vector de movimiento espacial se escalan de manera adaptativa. Si la unidad de predicción actual y la unidad de predicción vecina tienen el mismo fotograma de referencia, no se escalan los candidatos a vector de movimiento espacial. Pero, si la unidad de predicción actual y la unidad de predicción vecina tienen fotogramas de referencia diferentes, pueden escalarse los candidatos a vector de movimiento espacial usando las distancias temporales de los fotogramas de referencia.

Un predictor de vector de movimiento de la unidad de predicción actual se selecciona entre los candidatos a vector de movimiento espacial y un candidato a vector de movimiento temporal usando la información de movimiento que indica el predictor de vector de movimiento. Entonces, la diferencia de vector de movimiento y el predictor de vector de movimiento seleccionado se suman para generar un vector de movimiento de la unidad de predicción actual.

El candidato a vector de movimiento temporal es un vector de movimiento de una unidad de predicción que se ubica en o cerca de una posición correspondiente a la unidad de predicción actual en un fotograma de referencia específico codificado previamente. Cuando existe una pluralidad de vectores de movimiento de la unidad de predicción que se ubica en o cerca de la posición correspondiente a la posición de la unidad de predicción actual en el fotograma de referencia específico, se selecciona un vector de movimiento como candidato a vector de movimiento temporal de acuerdo con un método predeterminado. Por ejemplo, si está disponible el vector de movimiento del bloque ubicado en una primera posición correspondiente a la unidad de predicción actual en el fotograma específico, el vector de movimiento se determina como el candidato a vector de movimiento temporal. Pero, si el vector de movimiento del bloque ubicado en la primera posición no está disponible, el vector de movimiento de un bloque ubicado en una segunda posición se determina como el candidato a vector de movimiento temporal.

En la fracción B, el fotograma de referencia específico que contiene el candidato a vector de movimiento temporal se obtiene a partir de la lista de fotogramas de referencia 0 o 1. Por lo tanto, la unidad de descodificación determina el fotograma de referencia específico usando la información de la lista.

La información que indica si se usa o no el vector de movimiento temporal puede incluirse en el flujo de bits. Por lo tanto, el procedimiento de decodificación del vector de movimiento puede variar de acuerdo con la información.

Los candidatos a vector de movimiento espacial incluyen un candidato a vector de movimiento izquierdo y un candidato a vector de movimiento superior. El candidato a vector de movimiento izquierdo de la unidad de predicción actual es un vector de movimiento de una unidad de predicción vecina a la izquierda de la unidad de predicción actual o un vector de movimiento de una unidad de predicción vecina a la parte inferior-izquierda de la unidad de predicción actual. El candidato a vector de movimiento izquierdo es el primer vector de movimiento disponible encontrado al recuperar los vectores de movimiento de la unidad de predicción izquierda y de la unidad de predicción inferior-izquierda en un orden predeterminado. El candidato a vector de movimiento superior de la unidad de predicción actual es un primer vector de movimiento disponible encontrado al recuperar los vectores de movimiento de una unidad de predicción superior, una unidad de predicción superior-derecha y una unidad de predicción superior-izquierda de la unidad de predicción actual en un orden predeterminado.

Si los candidatos a vector de movimiento tienen los mismos vectores de movimiento, se elimina el candidato a vector de movimiento que tiene un orden grande.

Si el candidato a vector de movimiento es uno, el candidato a vector de movimiento se determina como predictor de vector de movimiento, y la información que indica el predictor de vector de movimiento no se codifica.

El conmutador de intra/inter conversión 280 proporciona el bloque de predicción generado por la unidad de intra predicción 230 o la unidad de inter predicción 240 al sumador 270 basándose en el modo de predicción.

Se describe un método de decodificación de inter predicción de acuerdo con la presente divulgación. El método comprende un procedimiento para decodificar la información de movimiento de la unidad de predicción actual, un procedimiento para generar un bloque de predicción de la unidad de predicción actual, un procedimiento para generar un bloque residual y un procedimiento para generar un bloque reconstruido usando el bloque de predicción y el bloque residual. La información de movimiento incluye un vector de movimiento y un índice de fotograma de referencia.

La figura 3 es un diagrama de flujo que ilustra un procedimiento para generar un bloque reconstruido de una unidad de predicción codificada en modo de salto de acuerdo con la presente divulgación.

Cuando la bandera_salto (skip_flag) de la unidad de codificación recibida es 1, se realiza el procedimiento.

En primer lugar, los candidatos a salto espacial se obtienen a partir de las unidades de predicción vecinas en la etapa S210.

Como se muestra en la figura 4, la información de movimiento de una unidad de predicción izquierda de la unidad de predicción actual (bloque A), la información de movimiento de una unidad de predicción superior de la unidad de predicción actual (bloque B), la información de movimiento de una unidad de predicción superior-derecha de la unidad de predicción actual (bloque C) y la información de movimiento de una unidad de predicción inferior-izquierda de la unidad de predicción actual (bloque D) pueden ser los candidatos a salto espacial. La información de movimiento de una unidad de predicción superior-izquierda de la unidad de predicción actual (bloque E) puede ser un candidato a salto espacial en un caso específico. Por ejemplo, si uno o más bloques entre los bloques A, B, C y D no están disponibles, la información del bloque E puede ser el candidato a salto espacial. La información de movimiento incluye el índice de fotograma de referencia y el vector de movimiento.

Como alternativa, la información de movimiento de una unidad de predicción izquierda (bloque A), la información de movimiento de una unidad de predicción superior (bloque B) y la información de movimiento de una unidad de predicción de esquina (C o D o E) pueden ser el candidato a salto espacial. La unidad de predicción de esquina puede ser la primera unidad de predicción disponible encontrada al recuperar los bloques C, D y E en un orden predeterminado (por ejemplo, en el orden del bloque C, bloque D y bloque E, en el orden del bloque E, bloque D y bloque C).

La disponibilidad se comprueba en cada unidad de predicción vecina. Si la unidad de predicción no existe o el modo de predicción de la unidad de predicción es el modo intra, la unidad de predicción se determina como no disponible.

Cuando hay una pluralidad de unidades de predicción vecinas a la izquierda de la unidad de predicción actual, la primera unidad de predicción disponible encontrada al comprobar la disponibilidad de la pluralidad de unidades de predicción izquierdas en un orden predeterminado (por ejemplo, de arriba a abajo o de abajo a arriba) puede determinarse como la unidad de predicción izquierda. Como alternativa, una unidad de predicción ubicada en una posición predeterminada (por ejemplo, la unidad de predicción más superior izquierda o la unidad de predicción más inferior izquierda) puede determinarse como la unidad de predicción izquierda. De manera similar, cuando hay una pluralidad de unidades de predicción vecinas a la superior de la unidad de predicción actual, la primera unidad de predicción disponible encontrada al comprobar la disponibilidad de la pluralidad de unidades de predicción superiores en un orden predeterminado (por ejemplo, de izquierda a derecha o de derecha a izquierda) puede determinarse como la unidad de predicción superior. Como alternativa, una unidad de predicción ubicada en una posición predeterminada (por ejemplo, la unidad de predicción más a la izquierda superior o la unidad de predicción más a la derecha superior) puede determinarse como la unidad de predicción superior.

El candidato a salto temporal se obtiene en la etapa S220. La etapa S220 incluye una etapa para obtener un índice de fotograma de referencia para un candidato a salto temporal y una etapa para obtener un vector de movimiento del candidato a salto temporal.

Se obtiene el índice de fotograma de referencia para el candidato a salto temporal. El índice de fotograma de referencia para el candidato a salto temporal puede fijarse en 0. Como alternativa, el índice de fotograma de referencia para el candidato a salto temporal puede obtenerse usando índices de fotograma de referencia de unidades de predicción espacialmente vecinas a la unidad de predicción actual.

La figura 5 es un diagrama conceptual que muestra las posiciones de las unidades de predicción vecinas a la unidad de predicción actual usadas para obtener un índice de fotograma de referencia para el candidato a salto temporal. El índice de fotograma de referencia para el candidato a salto temporal es uno de los índices de fotograma de referencia de las unidades de predicción vecinas.

Los índices de fotograma de referencia de una unidad de predicción izquierda (bloque A), una unidad de predicción superior (bloque B), una unidad de predicción superior-derecha (bloque C), una unidad de predicción inferior-izquierda (bloque D) y una unidad de predicción superior-izquierda (bloque E) pueden usarse para obtener el índice de fotograma de referencia para el candidato a salto temporal.

Cuando hay una pluralidad de unidades de predicción superiores, puede determinarse un índice de fotograma de referencia de la primera unidad de predicción disponible encontrada al recuperar la pluralidad de unidades de predicción superiores de izquierda a derecha (o de derecha a izquierda) como el índice de fotograma de referencia de la unidad de predicción superior. De manera similar, cuando hay una pluralidad de unidades de predicción izquierdas, puede determinarse un índice de fotograma de referencia de la primera unidad de predicción disponible encontrada al recuperar la pluralidad de unidades de predicción izquierdas de arriba a abajo como el índice de fotograma de referencia de la unidad de predicción izquierda.

Un índice de fotograma de referencia de la primera unidad de predicción disponible encontrada al recuperar los bloques en el orden de la unidad de predicción superior-derecha (bloque C), la unidad de predicción inferior-izquierda (bloque D) y la unidad de predicción superior-izquierda (bloque E) se determina como un índice de fotograma de referencia de una unidad de predicción de esquina.

Cuando se determinan el índice de fotograma de referencia de la unidad de predicción izquierda (índice de fotograma de referencia izquierdo), el índice de fotograma de referencia de la unidad de predicción superior (índice de fotograma de referencia superior) y el índice de fotograma de referencia de la unidad de predicción de esquina (índice de fotograma de referencia de esquina) de la unidad de predicción actual, se obtiene el índice de fotograma de referencia para el candidato a salto temporal a partir de los mismos. Aquí, el único fuera de los bloques C, D y E se usa para obtener el índice de fotograma de referencia para el candidato a salto temporal. Pero, los bloques C y D (4 candidatos) o todos los bloques C, D y E (5 candidatos) pueden usarse para obtener el índice de fotograma de referencia para el candidato a salto temporal. En lo sucesivo en el presente documento, el caso en el que se usan 3 índices de fotograma de referencia, es decir, el índice de fotograma de referencia izquierdo, el índice de fotograma de referencia superior y el índice de fotograma de referencia de esquina, se describirá como una realización a modo de ejemplo.

El índice de fotograma de referencia de mayor frecuencia fuera de los índices de fotograma de referencia disponibles se determina como el índice de fotograma de referencia para el candidato a salto temporal. Cuando hay una pluralidad de índices de fotograma de referencia que tienen la mayor frecuencia, el índice de fotograma de referencia más bajo se determina como índice de fotograma de referencia para el candidato a salto temporal.

A continuación, se describe la etapa para obtener el vector de movimiento para el candidato a salto temporal.

En primer lugar, se determina un fotograma (un fotograma candidato a salto temporal) al que pertenece el bloque de candidato a salto temporal. Puede determinarse un fotograma de referencia de índice 0 como fotograma candidato a salto temporal. El primer fotograma de una lista 0 se determina como el fotograma candidato a salto temporal cuando el tipo de fracción es P. Cuando el tipo de fracción es B, se selecciona una lista de fotogramas de referencia usando una bandera dentro de una cabecera de fracción que indica la lista de fotogramas de referencia a la que pertenece el candidato a salto temporal, y se determina un fotograma cuyo índice de fotograma de referencia es 0 de la lista de fotogramas de referencia seleccionada como el fotograma candidato a salto temporal. Por ejemplo, cuando la bandera es 1, el fotograma candidato a salto temporal se selecciona de la lista 0. Y cuando la bandera es 0, el fotograma candidato a salto temporal se selecciona de la lista 1.

Como alternativa, un fotograma de referencia indicado por un índice de fotograma de referencia para el fotograma candidato a salto temporal se determina como el fotograma candidato a salto temporal a la que pertenece el bloque candidato a salto temporal. Por ejemplo, el fotograma de referencia indicado por el índice de fotograma de referencia para el fotograma candidato a salto temporal de la lista 0 se determina como el fotograma candidato a salto temporal cuando el tipo de fracción es P. Cuando el tipo de fracción es B, el fotograma de candidato a salto temporal se determina usando la bandera de la cabecera de fracción que indica la lista a la que pertenece el candidato a salto temporal.

A continuación, se obtiene un bloque candidato a salto temporal en el fotograma candidato a salto temporal. Uno de una pluralidad de bloques del fotograma candidato a salto temporal correspondiente a la unidad de predicción actual se selecciona como bloque candidato a salto temporal. Se asigna una prioridad a cada uno de la pluralidad de bloques. Un primer bloque disponible determinado basándose en las prioridades se selecciona como el bloque candidato a salto temporal.

La figura 6 es un diagrama conceptual que ilustra los bloques del fotograma candidato a salto temporal correspondiente a una unidad de predicción actual.

Se prefiere que una posición del candidato a salto temporal sea diferente de las posiciones de los candidatos a salto espacial.

De este modo, un bloque de esquina inferior-izquierdo (bloque BR0) o un bloque inferior-izquierdo (bloque BR1) puede ser el primer bloque candidato a salto. El bloque de esquina inferior-izquierdo (bloque BR0) es adyacente a un bloque incluido en el fotograma candidato a salto temporal y corresponde a la unidad de predicción actual. El bloque inferiorizquierdo (bloque BR1) se ubica dentro de un bloque que está incluido en el fotograma candidato a salto temporal y corresponde a la unidad de predicción actual. Un bloque (bloque C) que incluye un píxel superior-izquierdo o un píxel inferior-derecho de una posición central de un bloque que está incluido en el fotograma candidato a salto temporal y que corresponde a la unidad de predicción actual puede ser el segundo bloque candidato a salto.

Si el primer bloque candidato a salto está disponible, el primer bloque candidato a salto se determina como el bloque candidato a salto temporal. Si el primer bloque candidato a salto no está disponible y el segundo bloque candidato a salto está disponible, el segundo bloque candidato a salto se determina como el bloque candidato a salto temporal.

Como alternativa, los bloques pueden escanearse en el orden de BR0, BR1 y C. También, existe una pluralidad de bloques candidatos a salto temporal disponibles, un bloque correspondiente más grande o un valor medio de los bloques candidatos a salto temporal disponibles puede determinarse como el bloque candidato a salto temporal.

Cuando se determina el bloque candidato a salto temporal, un vector de movimiento del bloque candidato a salto temporal se establece como vector de movimiento candidato a salto temporal.

A continuación, en la etapa S230 se construye una lista de candidatos a salto.

La lista de candidatos a salto se construye usando los candidatos a salto espacial disponibles y los candidatos a salto temporal disponibles. La lista de candidatos a salto puede construirse en un orden predeterminado. El orden predeterminado puede ser en el orden de un candidato a salto izquierdo espacial (candidato A), un candidato a salto superior espacial (candidato B), un candidato a salto temporal, un candidato a salto superior espacial-derecho (candidato C) y un candidato a salto espacial inferior-izquierdo (candidato D) o en el orden de un candidato a salto temporal, un candidato a salto izquierdo espacial (candidato A), un candidato a salto superior espacial (candidato B), un candidato a salto superior-derecho espacial (candidato C) y un candidato a salto inferior-izquierdo espacial (candidato D).

Cuando uno o más de los candidatos A, B, C, D no están disponibles, el candidato a salto superior espacial-izquierda (candidato E) se añade a la lista de candidatos a salto. En este caso, el candidato a salto superior-izquierdo espacial (candidato E) se añade a una posición del candidato no disponible. Es decir, la disponibilidad de cada candidato a salto espacial se comprueba en el orden de prioridad de cada candidato a salto espacial, y el candidato a salto superiorizquierdo espacial (candidato E) se añade a la posición del candidato no disponible en la lista de candidatos a salto. La prioridad se asigna en el orden del candidato A, candidato B, el candidato C y el candidato D o el candidato A, candidato D, el candidato B y el candidato C.

Si una pluralidad de candidatos a salto tienen el mismo vector de movimiento y el mismo índice de fotograma de referencia al construir la lista de candidatos a salto, el candidato con menor prioridad se elimina de la lista de candidatos a salto.

A continuación, el vector de movimiento y el índice de fotograma de referencia de la unidad de predicción actual se obtienen en la etapa S240.

Cuando hay un índice de salto en la unidad de predicción recibida, el vector de movimiento y el índice de fotograma de referencia de la unidad de predicción candidata a salto correspondiente al índice de salto se determinan como el vector de movimiento y el índice de fotograma de referencia de la unidad de predicción actual.

Cuando no existe el índice de salto en la unidad de predicción recibida y existe un candidato a salto, el vector de movimiento y el índice de fotograma de referencia del candidato a salto se determinan como el vector de movimiento y el índice de referencia de la unidad de predicción actual.

Cuando no existe el índice de salto en la unidad de predicción recibida y no existe el candidato a salto, el vector de movimiento y el índice de referencia de la unidad de predicción actual se ponen a 0.

Cuando el candidato a salto indica el candidato a salto temporal, el vector de movimiento del candidato a salto se determina como el vector de movimiento de la unidad de predicción actual. Y 0 o el índice de fotograma de referencia para el candidato a salto temporal puede determinarse como el índice de fotograma de referencia de la unidad de predicción actual.

El índice de salto puede haberse codificado usando una tabla de codificación de longitud variable (VLC) determinada por el número de los candidatos a salto disponibles. Si el índice de salto se ha codificado usando una tabla de VLC determinada por el número de los candidatos de salto disponibles, entre la etapa 230 y la etapa 240 puede insertarse una etapa de decodificación del índice de salto mediante una tabla de VLC correspondiente al número de candidatos a salto disponibles. En la etapa S240, la información de movimiento de la unidad de predicción actual se determina usando el índice de salto decodificado. Como alternativa, el número de candidatos a salto puede ser fijo. Si el número de candidatos a salto es fijo, la lista de candidatos a salto puede construirse generando candidatos a salto correspondientes a uno o más candidatos a salto no disponibles usando los candidatos a salto disponibles.

Si se obtienen el vector de movimiento y el índice de fotograma de referencia de la unidad de predicción actual, se genera un bloque de predicción usando el vector de movimiento dentro de un fotograma indicado por el índice de fotograma de referencia en la etapa S250. El bloque de predicción es un bloque reconstruido.

Mientras tanto, cuando el bandera_salto (skip_flag) en la unidad de codificación es 0 y la bandera_fusión (merge_flag) en la unidad de predicción recibida es 1, un procedimiento para generar un bloque reconstruido es casi igual al procedimiento para generar un bloque reconstruido del modo de salto. Específicamente, el procedimiento para generar un bloque de predicción es el mismo que el procedimiento para generar un bloque de predicción del modo de salto. En el modo de salto, el bloque de predicción generado es el bloque de reconstrucción debido a que el bloque residual es 0. No obstante, el bloque residual no es cero en el modo de fusión, se añade una etapa para restaurar un bloque residual y una etapa para generar un bloque reconstruido añadiendo el bloque de predicción y el bloque residual.

Los candidatos a fusión espacial y temporal disponibles se obtienen a partir de las unidades de predicción vecinas. Los procedimientos para obtener los candidatos a fusión espacial y el candidato a fusión temporal son los mismos que los candidatos a salto espacial y el candidato a salto temporal, respectivamente.

A continuación, se construye una lista de candidatos a fusión disponibles. Los candidatos a fusión espacial disponibles y los candidatos a fusión temporal disponibles están dispuestos en un orden predeterminado. El orden predeterminado es el de un candidato a fusión izquierdo espacial (candidato A), un candidato a fusión superior espacial (candidato B), un candidato a fusión temporal, un candidato a fusión superior-derecho espacial (candidato C) y un candidato a fusión inferior-izquierdo espacial (candidato D) o en el orden de un candidato a fusión temporal, un candidato a fusión izquierdo espacial (candidato A), un candidato a fusión superior espacial (candidato B), un candidato a fusión superiorderecho espacial (candidato C) y un candidato a fusión inferior-izquierdo espacial (candidato D).

Cuando uno o más de los candidatos a fusión A, B, C, D no están disponibles, se añade el candidato a fusión superiorizquierdo espacial (candidato E). En este caso, el candidato a fusión superior-izquierdo espacial (candidato E) se añade a la posición del candidato no disponible en la lista de candidatos a fusión. Es decir, la disponibilidad de cada candidato a fusión espacial se comprueba en el orden de prioridad de cada candidato a fusión espacial, y el candidato a fusión superior-izquierdo espacial (candidato E) se añade a la posición del candidato no disponible en la lista de candidatos a fusión. La prioridad se asigna en el orden A, B, C y D o A, D, B y C.

También, el orden predeterminado puede cambiarse o uno o más candidatos a fusión se excluyen de los candidatos a fusión de acuerdo con un modo de predicción de la unidad de predicción. Por ejemplo, si la unidad de predicción es 2NxN, puede excluirse el candidato a fusión inferior-izquierdo espacial (candidato D). Si la unidad de predicción es Nx2N, se cambian los órdenes del candidato a fusión inferior-izquierdo espacial (candidato D) y del candidato a fusión superior-derecho espacial (candidato C) o se excluye el candidato a fusión superior-derecho espacial (candidato C) debido a que la correlación entre el candidato a fusión inferior-izquierdo espacial (candidato D) y la unidad de predicción actual es mayor que la del candidato a fusión superior-derecho espacial (candidato C) y la unidad de predicción actual.

A continuación, se obtienen el vector de movimiento y el índice de fotograma de referencia de la unidad de predicción actual. Cuando hay un índice de fusión en la unidad de predicción recibida, el vector de movimiento y el índice de fotograma de referencia del candidato a fusión indicado por el índice de fusión en la lista de candidatos a fusión se determinan como el vector de movimiento y el índice de referencia de la unidad de predicción actual.

Cuando no existe el índice de fusión en la unidad de predicción recibida y existe un candidato a fusión, el vector de movimiento y el índice de fotograma de referencia del candidato a fusión se determinan como el vector de movimiento y el índice de referencia de la unidad de predicción actual.

Cuando no hay un índice de fusión en la unidad de predicción recibida y no existe al menos un candidato a salto, el vector de movimiento y el índice de referencia de la unidad de predicción actual se ponen a 0.

Cuando el candidato a fusión indica el candidato a fusión temporal, el vector de movimiento del candidato a fusión temporal se determina como el vector de movimiento de la unidad de predicción actual. Y 0 o el índice de fotograma de referencia para el candidato a fusión temporal puede determinarse como el índice de fotograma de referencia de la unidad de predicción actual.

El índice de fusión puede haberse codificado usando una tabla de VLC determinada por el número de los candidatos a fusión disponibles. Si el índice de fusión se ha codificado usando una tabla de VLC determinada por el número de los candidatos a fusión disponibles, puede insertarse una etapa para contar el número de candidatos a salto disponibles y decodificar el índice de salto usando una tabla de v Lc correspondiente al número.

Si se obtienen el vector de movimiento y el índice de fotograma de referencia de la unidad de predicción actual, se genera un bloque de predicción usando un vector de movimiento en un fotograma indicado por el índice de fotograma de referencia.

También, se restaura un bloque residual en la unidad de las unidades de transformación. El bloque residual se restaura a través de decodificación de entropía, escaneo inverso, cuantificación inversa y transformación inversa. El procedimiento se realiza por la unidad de decodificación de entropía 210, la unidad de escaneo inverso 215, la unidad de cuantificación inversa 220 y la unidad de transformación inversa 225 del aparato de decodificación de la figura 2.

Finalmente, se genera un bloque reconstruido usando el bloque de predicción y el bloque residual. El bloque reconstruido puede generarse en la unidad de la unidad de codificación. Por lo tanto, después el bloque de predicción y el bloque residual se generan en las unidades de codificación respectivamente, y el bloque reconstruido puede generarse usando el bloque de predicción en la unidad de codificación y el bloque residual en la unidad de codificación.

La figura 7 es un diagrama de flujo que ilustra un procedimiento para generar un bloque reconstruido de una unidad de predicción codificada de vectores de movimiento de acuerdo con la presente invención. Cuando la bandera_salto (skip_flag) en una unidad de codificación es 0 y el la bandera_fusión (merge_flag) en una unidad de predicción recibida es 0, se aplica el presente procedimiento.

En primer lugar, se obtienen un índice de fotograma de referencia y una diferencia de vector de movimiento de una unidad de predicción actual a partir de una sintaxis de unidad de predicción del flujo de bits recibido en la etapa S310.

Si el tipo de fracción es B, se comprueba la información de inter predicción. Si la información de inter predicción indica una predicción unidireccional usando la lista de fotogramas de referencia combinada (Pred_LC), se selecciona un fotograma de referencia entre los fotogramas de referencia de la lista de fotogramas de referencia combinada (lista_c) usando el índice de fotograma de referencia, y se restaura la diferencia de vector de movimiento. Si la información de inter predicción indica una predicción unidireccional usando una lista de fotogramas de referencia 0, se selecciona un fotograma de referencia usando el índice de fotograma de referencia de la lista de fotogramas de referencia 0, y se restaura la diferencia de vector de movimiento. Si la información de inter predicción indica una predicción bidireccional, cada fotograma de referencia se selecciona usando cada índice de fotograma de referencia de las listas de fotogramas de referencia 0 y 1, y se restaura cada diferencia de vector de movimiento para cada fotograma de referencia.

A continuación, se obtienen los candidatos a vector de movimiento espacial en la etapa S320. La figura 8 es un diagrama conceptual que muestra las posiciones de las unidades de predicción vecinas a una unidad de predicción actual y usadas para generar candidatos a vectores de movimiento de acuerdo con la presente invención.

Un candidato a vector de movimiento izquierdo espacial puede ser una de las unidades de predicción izquierda (bloques A y D) de la unidad de predicción actual. Un candidato a vector de movimiento superior espacial puede ser una de las unidades de predicción superiores (bloques B, C y E) de la unidad de predicción actual.

El procedimiento para obtener un candidato a vector de movimiento izquierdo espacial es el siguiente.

Se comprueba si existe una unidad de predicción que cumpla las primeras condiciones recuperando los bloques izquierdos de la unidad de predicción actual en el orden de los bloques A y D o en el orden de los bloques D y A. Las primeras condiciones son 1) existe una unidad de predicción, 2) la unidad de predicción es una unidad codificada de inter predicción, 3) la unidad de predicción tiene el mismo fotograma de referencia que el de la unidad de predicción actual y 4) la unidad de predicción tiene la misma lista de fotogramas de referencia que la de la unidad de predicción actual. Si hay una unidad de predicción que cumpla las primeras condiciones, el candidato a vector de movimiento izquierdo espacial se determina como el vector de movimiento de la unidad de predicción. Si no hay una unidad de predicción que cumpla las primeras condiciones, se comprueba si existe una unidad de predicción que cumpla las segundas condiciones. Las segundas condiciones son 1) que exista una unidad de predicción, 2) la unidad de predicción es una unidad codificada de inter predicción, 3) la unidad de predicción tiene el mismo fotograma de referencia que el de la unidad de predicción actual y 4) la unidad de predicción tiene una lista de fotogramas de referencia diferente a la de la unidad de predicción actual. Si hay una unidad de predicción que cumpla las segundas condiciones, el candidato a vector de movimiento izquierdo espacial se determina como el vector de movimiento de la unidad de predicción.

Si no hay una unidad de predicción que cumpla las segundas condiciones, se comprueba si existe una unidad de predicción que cumpla las terceras condiciones. Las terceras condiciones son 1) que exista una unidad de predicción, 2) la unidad de predicción es una unidad codificada de inter predicción, 3) la unidad de predicción tiene la misma lista de fotogramas de referencia que la de la unidad de predicción actual y 4) la unidad de predicción tiene un fotograma de referencia diferente al de la unidad de predicción actual. Si hay una unidad de predicción que cumpla las terceras condiciones, el candidato a vector de movimiento izquierdo espacial se determina como el vector de movimiento de la unidad de predicción.

Si no hay una unidad de predicción que cumpla las terceras condiciones, se comprueba si existe una unidad de predicción que cumpla las cuartas condiciones. Las cuarta condiciones son 1) que exista una unidad de predicción, 2) la unidad de predicción es una unidad codificada de inter predicción, 3) la unidad de predicción tiene una lista de fotogramas de referencia diferente a la de la unidad de predicción actual y 4) la unidad de predicción tiene un fotograma de referencia diferente al de la unidad de predicción actual. Si hay una unidad de predicción que cumpla las cuartas condiciones, el candidato a vector de movimiento izquierdo espacial se determina como el vector de movimiento de la unidad de predicción.

El vector de movimiento de la unidad de predicción que cumpla las primeras condiciones o las segundas se usa tal cual. Pero, el vector de movimiento de la unidad de predicción que cumpla las terceras condiciones o las cuartas condiciones se escala y se usa como candidato a vector de movimiento.

Si no hay una unidad de predicción que cumpla alguna de las condiciones presentadas anteriormente, el candidato a vector de movimiento izquierdo espacial se establece como no disponible.

A continuación, el procedimiento para obtener un candidato a vector de movimiento superior espacial es el siguiente.

Se comprueba si existe una unidad de predicción que cumpla las primeras condiciones recuperando los bloques superiores en el orden de los bloques B, C y E o en el orden de los bloques C, B y E. Si hay una unidad de predicción que cumpla las primeras condiciones, el candidato a vector de movimiento superior espacial se determina como el vector de movimiento de la unidad de predicción.

Si no hay una unidad de predicción que cumpla las primeras condiciones, se comprueba si existe una unidad de predicción que cumpla las segundas condiciones. Si hay una unidad de predicción que cumpla las segundas condiciones, el candidato a vector de movimiento superior espacial se determina como el vector de movimiento de la unidad de predicción.

Si no hay una unidad de predicción que cumpla las segundas condiciones, se comprueba si existe una unidad de predicción que cumpla las terceras condiciones. Si hay una unidad de predicción que cumpla las terceras condiciones, el candidato a vector de movimiento superior espacial se determina como el vector de movimiento de la unidad de predicción.

Si no hay una unidad de predicción que cumpla las terceras condiciones, se comprueba si existe una unidad de predicción que cumpla las cuartas condiciones. Si hay una unidad de predicción que cumpla las cuartas condiciones, el candidato a vector de movimiento superior espacial se determina como el vector de movimiento de la unidad de predicción.

El vector de movimiento de la unidad de predicción que cumpla las primeras condiciones o las segundas condiciones se usa como candidato a vector de movimiento en la misma. Pero, el vector de movimiento de la unidad de predicción que cumpla las terceras condiciones o las cuartas condiciones se escala y se usa como candidato a vector de movimiento.

Si no hay una unidad de predicción que cumpla alguna de las condiciones, el candidato a vector de movimiento superior espacial se establece como no disponible.

Las condiciones primera a cuarta para determinar el candidato a vector de movimiento izquierdo espacial son las mismas que para determinar el candidato a vector de movimiento superior espacial.

En la etapa S330 se obtiene un candidato a vector de movimiento temporal. En primer lugar, se obtiene un fotograma (un fotograma candidato a salto temporal) al que pertenece un bloque candidato a vector de movimiento temporal. Puede determinarse un fotograma de referencia de índice 0 como fotograma candidato a vector de movimiento temporal. Por ejemplo, un primer fotograma de la lista de fotogramas de referencia 0 se determina como fotograma candidato a vector de movimiento temporal cuando el tipo de fracción es P. Cuando el tipo de fracción es B, el fotograma candidato a vector de movimiento temporal se determina usando una bandera de una cabecera de fracción que indica una lista a la que pertenece el candidato a vector de movimiento temporal. Por ejemplo, si la bandera es 1, el fotograma candidato a vector de movimiento temporal se determina a partir de la lista 0, y si la bandera es 0, el fotograma candidato a vector de movimiento temporal se determina a partir de la lista 1. Como alternativa, un fotograma correspondiente a un índice de fotograma de referencia de la unidad de predicción actual obtenida a partir de una unidad de predicción recibida se determina como fotograma candidato a vector de movimiento temporal.

A continuación, se obtiene un bloque candidato a vector de movimiento temporal en el fotograma candidato a vector de movimiento temporal. El bloque candidato a vector de movimiento temporal es el mismo que el bloque candidato a salto temporal. Si se obtiene el bloque candidato a vector de movimiento temporal, el vector de movimiento del bloque candidato a vector de movimiento temporal se determina como candidato a vector de movimiento temporal.

A continuación, se construye una lista de candidatos a vectores de movimiento en la etapa S340. La lista de candidatos a vectores de movimiento se construye usando los candidatos a vectores de movimiento espacial y temporal disponibles. La lista de candidatos a vectores de movimiento puede construirse en un orden predeterminado. El orden predeterminado es el orden de un candidato a vector de movimiento izquierdo espacial, un candidato a vector de movimiento superior espacial y un candidato a vector de movimiento temporal o el orden de un candidato a vector de movimiento temporal, un candidato a vector de movimiento izquierdo espacial y un candidato a vector de movimiento superior espacial.

El orden predeterminado puede cambiarse de acuerdo con un modo de predicción de la unidad de predicción o uno o más candidatos a vector de movimiento se excluyen de los candidatos a vector de movimiento. Por ejemplo, si la unidad de predicción actual se divide en dos unidades de predicción 2NxN, el candidato a vector de movimiento superior espacial puede excluirse para una unidad de predicción inferior 2NxN. Si la unidad de predicción actual se divide en dos unidades de predicción Nx2N, los órdenes del candidato a vector de movimiento superior espacial y del candidato a vector de movimiento izquierdo espacial se cambian o el candidato a vector de movimiento izquierdo espacial puede excluirse para una unidad de predicción Nx2N derecha.

Como alternativa, cuando una unidad de codificación se divide en dos unidades de predicción 2NxN, puede fusionarse el bloque de predicción 2NxN superior. Si no puede fusionarse el bloque de predicción 2NxN superior, el bloque D puede eliminarse o los bloques A y D se escanean en este orden al determinar el candidato a vector de movimiento izquierdo espacial. Cuando una unidad de codificación se divide en dos unidades de predicción Nx2N, puede fusionarse la unidad de predicción Nx2N izquierda. Si no puede fusionarse el bloque de predicción Nx2N izquierdo, el bloque C puede eliminarse o los bloques B, C y E se escanean en este orden al determinar el candidato a vector de movimiento superior espacial.

A continuación, cuando se construye la lista de candidatos a vector de movimiento y una pluralidad de candidatos tienen el mismo vector de movimiento, el candidato que tiene menor prioridad se elimina en la lista de candidatos a vector de movimiento.

A continuación, se obtiene un predictor de vector de movimiento de la unidad de predicción actual en la etapa S350.

Cuando hay un índice de vector de movimiento en la unidad de predicción actual, el candidato a vector de movimiento de un índice correspondiente en la lista de candidatos a vector de movimiento se determina como el predictor de vector de movimiento de la unidad de predicción actual. Cuando no hay un índice de vector de movimiento en la unidad de predicción actual y existe un candidato a vector de movimiento, el candidato a vector de movimiento se determina como el predictor de vector de movimiento de la unidad de predicción actual. Cuando no están disponibles todos los candidatos a vector de movimiento, el predictor de vector de movimiento de la unidad de predicción actual se pone a 0.

Mientras tanto, antes de la construcción de la lista de candidatos a vectores de movimiento, puede leerse el índice de vector de movimiento. En este caso, después de recuperar los candidatos a vector de movimiento disponibles mediante el número indicado por el índice de vector de movimiento en un orden predeterminado, el candidato a vector de movimiento correspondiente al índice de vector de movimiento puede determinarse como el vector de movimiento de la unidad de predicción actual. El índice de vector de movimiento puede codificarse en una longitud fija o en una longitud variable.

Si se obtiene el predictor de vector de movimiento de la unidad de predicción actual, un vector de movimiento de la unidad de predicción actual se reconstruye sumando la diferencia de vector de movimiento y el predictor de vector de movimiento en la etapa S360.

A continuación, se genera un bloque de predicción usando el índice de fotograma de referencia recibido de la unidad de predicción actual y el vector de movimiento restaurado de la unidad de predicción actual en la etapa S370.

También, se restaura un bloque residual en la unidad de las unidades de transformación en la etapa S380. El bloque residual se restaura a través de decodificación de entropía, escaneo inverso, cuantificación inversa y transformación inversa. El procedimiento se realiza por la unidad de decodificación de entropía 210, la unidad de escaneo inverso 215, la unidad de cuantificación inversa 220 y la unidad de transformación inversa 225 del aparato de decodificación de la figura 2.

Finalmente, se genera un bloque reconstruido usando el bloque de predicción y el bloque residual en la etapa S390. El bloque reconstruido puede generarse en la unidad de la unidad de codificación. Por lo tanto, después el bloque de predicción y el bloque residual se generan en la unidad de codificación, y el bloque reconstruido se genera usando el bloque de predicción en la unidad de la unidad de codificación y el bloque residual en la unidad de la unidad de codificación.

Aunque la invención se ha mostrado y descrito haciendo referencia a ciertas realizaciones a modo de ejemplo de la misma, se entenderá por los expertos en la materia que diversos cambios en la forma y los detalles pueden realizarse sin alejarse del alcance de la invención, según se define por las reivindicaciones adjuntas.

Claims

REIVINDICACIONES

1. Un aparato para codificar un fotograma en movimiento, que comprende:

una unidad de división de fotogramas (110) configurada para determinar un tamaño y un modo de predicción de cada bloque de codificación;

una unidad de inter predicción (160) configurada para determinar un fotograma de referencia y un vector de movimiento de un bloque actual realizando una estimación de movimiento y extraer un bloque de predicción correspondiente al bloque actual del fotograma de referencia cuando el bloque actual se codifica utilizando inter predicción;

una unidad de intra predicción (150) configurada para determinar un modo de intra predicción de un bloque actual y generar el bloque de predicción correspondiente al bloque actual de acuerdo con el modo de intra predicción cuando el bloque actual se codifica usando intra predicción;

una unidad de transformación (120) configurada para transformar un bloque residual obtenido calculando la diferencia entre el bloque actual y el bloque de predicción para generar un bloque de transformación;

una unidad de cuantificación (130) configurada para determinar un tamaño de paso de cuantificación de un bloque de codificación actual y cuantificar el bloque de transformación usando el tamaño de paso de cuantificación para generar un bloque de transformación cuantificado;

una unidad de escaneo (131) configurada para escanear coeficientes de transformación cuantificados del bloque de transformación cuantificado para generar coeficientes de transformación cuantificados unidimensionales (1D); y

una unidad de codificación de entropía (140) configurada para codificar entropía de los coeficientes de transformación cuantificados 1D,

en donde el tamaño de paso de cuantificación se codifica usando un predictor de tamaño de paso de cuantificación y el predictor de tamaño de paso de cuantificación se genera usando un tamaño de paso de cuantificación de un bloque de codificación izquierdo del bloque de codificación actual y un tamaño de paso de cuantificación de un bloque de codificación anterior del bloque de codificación actual,

en donde, cuando el tamaño de paso de cuantificación del bloque de codificación izquierdo del bloque de codificación actual y el tamaño de paso de cuantificación del bloque de codificación anterior del bloque de codificación actual no están disponibles, se selecciona un tamaño de paso de cuantificación del bloque de codificación previo en orden de escaneo como el predictor de tamaño de paso de cuantificación del bloque de codificación actual,

en donde, cuando un tamaño del bloque de transformación es mayor que 4x4, los coeficientes de transformación cuantificados del bloque de transformación cuantificado se dividen en una pluralidad de subconjuntos,

en donde, cuando el bloque actual se codifica usando intra predicción, la pluralidad de subconjuntos se escanea de acuerdo con un patrón de escaneo determinado por el modo de intra predicción del bloque actual y los coeficientes de transformación cuantificados de cada subconjunto se escanean de acuerdo con un patrón de escaneo determinado por el modo de intra predicción del bloque actual,

en donde, cuando el bloque actual se codifica usando inter predicción, la pluralidad de subconjuntos y los coeficientes de transformación cuantificados de cada subconjunto se escanean de acuerdo con un patrón de escaneo predeterminado,

en donde el patrón de escaneo para escanear la pluralidad de subconjuntos es el mismo que el patrón de escaneo para escanear los coeficientes de transformación cuantificados de cada subconjunto.

2. El aparato de la reivindicación 1, en donde los coeficientes de transformación cuantificados de cada subconjunto y la pluralidad de subconjuntos se escanean en una dirección inversa.