ES2778227T3

ES2778227T3 - Dispositivo, método y programa de decodificación bipredictiva de imágenes

Info

Publication number: ES2778227T3
Application number: ES15191817T
Authority: ES
Inventors: Yoshinori Suzuki; Choong Seng Boon; Thiow Keng Tan
Original assignee: NTT Docomo Inc
Current assignee: NTT Docomo Inc
Priority date: 2010-10-06
Filing date: 2011-09-29
Publication date: 2020-08-10
Anticipated expiration: 2031-09-29
Also published as: MX348155B; JP5982537B2; CN103119942A; TW201909637A; RU2732512C1; RU2621688C1; KR20190122275A; TWI621351B; JP5774753B2; CN106210737A; CA2973344A1; US20190335194A1; CA2813377C; AU2011313407A1; CN107197304A; RU2013120007A; CA3083703A1; KR101927282B1; TWI562608B; US20140369616A1

Abstract

Dispositivo de decodificación predictiva de imágenes para generar una señal predicha de una región objetivo, comprendiendo el dispositivo: medios (202) de análisis de datos adaptados para extraer, a partir de datos comprimidos, datos codificados de información de indicación de la región objetivo y datos codificados de una señal residual de la región objetivo, identificando los datos codificados de información de indicación un conjunto de información de movimiento incluyendo dos fragmentos de información de movimiento asociados con regiones adyacentes, adyacentes a la región objetivo, incluyendo cada uno de los dos fragmentos de información de movimiento un número de trama y un vector de movimiento, identificándose el número de trama por una identificación de lista de imágenes de referencia y un índice de imágenes de referencia; medios (208) de decodificación de información de predicción adaptados para decodificar los datos codificados de información de indicación para restaurar la información de indicación; medios (121) de derivación de información de movimiento adaptados para derivar un conjunto de conjuntos de información de movimiento candidata, comprendiendo cada conjunto de información de movimiento dos fragmentos de información de movimiento para decodificación bipredictiva, en el que el conjunto de conjuntos información de movimiento candidata comprende todas las combinaciones por pares posibles de información de movimiento seleccionada de una pluralidad de regiones adyacentes de la región objetivo, en el que en cada uno de los conjuntos de información de movimiento candidata entre los dos fragmentos de información de movimiento y los números de trama respectivos son diferentes entre sí, o los vectores de movimiento respectivos son diferentes entre sí; medios (209) de determinación de información de movimiento adaptados para seleccionar, de los conjuntos de información de movimiento candidata, un conjunto de información de movimiento que va a usarse en la generación de la señal predicha de la región objetivo basándose en la información de indicación; medios (216) de compensación de movimiento adaptados para generar la señal predicha de la región objetivo combinando dos señales obtenidas a partir de una o más imágenes reconstruidas almacenadas en la memoria basándose en los dos fragmentos de información de movimiento que se identifican mediante el conjunto de información de movimiento seleccionado en los medios (209) de determinación de información de movimiento; medios (104) de grabación de información de movimiento adaptados para almacenar información de movimiento utilizada para la generación de la señal predicha de la región objetivo en la memoria; medios (203, 204, 207) de restauración de señal residual adaptados para restaurar una señal residual de la región objetivo a partir de los datos codificados de la señal residual; medios (205, 104) de grabación de imagen adaptados para reconstruir una señal de píxel de la región objetivo basándose en la señal predicha y la señal residual restaurada, y para almacenar la señal de píxel reconstruida como una parte de una imagen reconstruida.

Description

DESCRIPCIÓN

Dispositivo, método y programa de decodificación bipredictiva de imágenes

Campo técnico

Realizaciones de la presente invención se refieren a un dispositivo de codificación predictiva de imágenes, a un método de codificación predictiva de imágenes, a un programa de codificación predictiva de imágenes, a un dispositivo de decodificación predictiva de imágenes, a un método de decodificación predictiva de imágenes y a un programa de decodificación predictiva de imágenes y, más particularmente, a un dispositivo de codificación predictiva de imágenes, a un método de codificación predictiva de imágenes, a un programa de codificación predictiva de imágenes, a un dispositivo de decodificación predictiva de imágenes, a un método de decodificación predictiva de imágenes y a un programa de decodificación predictiva de imágenes para generar una señal predicha de un bloque objetivo, usando información de movimiento de bloques adyacentes.

Técnica anterior

Las tecnologías de codificación por compresión se usan para una transmisión y un almacenamiento eficientes de datos de vídeo e imágenes fijas. Las técnicas definidas en las normas MPEG-1 a 4 y las normas H.261 a H.264 de la ITU (Unión Internacional de Telecomunicaciones) se usan habitualmente para datos de vídeo.

En estas técnicas de codificación, una imagen como objetivo de codificación se divide para dar una pluralidad de bloques y luego se llevan a cabo un procedimiento de codificación y un procedimiento de decodificación bloque a bloque. En la codificación predictiva intraimagen, se genera una señal predicha usando una señal de imagen reconstruida (o una señal restaurada de datos de imagen comprimidos) de una región adyacente presente en la misma imagen que un bloque objetivo y luego se codifica una señal de diferencia de una diferencia entre la señal predicha y una señal de píxel del bloque objetivo. En la codificación predictiva interimagen, se genera una señal predicha con compensación de movimiento con referencia a una señal de imagen reconstruida de una región adyacente presente en una imagen diferente de un bloque objetivo, y se codifica una señal de diferencia de una diferencia entre la señal predicha y una señal del bloque objetivo.

Por ejemplo, la codificación predictiva intraimagen de la norma H.264 emplea un método de generación de la señal predicha extrapolando valores de píxel anteriormente reproducidos de una región contigua a un bloque que sirve como objetivo de codificación, en direcciones predeterminadas. La figura 17 es un diagrama esquemático para explicar el método de predicción intraimagen usado en la norma H.264 de la ITU. En (A) de la figura 17, un bloque 802 objetivo es un bloque que sirve como objetivo de codificación, y un grupo 801 de píxeles que consiste en píxeles A a M contiguos a un límite del bloque 802 objetivo es una región adyacente, que es una señal de imagen anteriormente reproducida en un procesamiento anterior.

En la predicción mostrada en (A) de la figura 17, la señal predicha se genera extendiendo hacia abajo el grupo 801 de píxeles como píxeles adyacentes ubicados inmediatamente por encima del bloque 802 objetivo. En la predicción mostrada en (B) de la figura 17, la señal predicha se genera extendiendo hacia la derecha píxeles anteriormente reproducidos (I a L) ubicados en el lado izquierdo del bloque 804 objetivo. Para métodos específicos para la generación de la señal predicha, se hace referencia, por ejemplo, al documento de patente 1. Se calcula una diferencia entre cada una de nueve señales predichas generadas mediante los métodos mostrados en (A) a (I) de la figura 17 de la manera descrita anteriormente, y la señal de píxel del bloque objetivo, y estas diferencias obtenidas se comparan para seleccionar un candidato para proporcionar una diferencia mínima, como señal predicha óptima. Tal como se describió anteriormente, la señal predicha puede generarse mediante extrapolación de píxeles. El contenido anterior se describe en el documento de patente 1 a continuación.

En la codificación predictiva interimagen habitual, la señal predicha se genera mediante un método de búsqueda en imágenes reconstruidas de una señal similar a la señal de píxel del bloque objetivo. Luego se realiza la codificación de un vector de movimiento como una cantidad de desplazamiento espacial entre el bloque objetivo y una región compuesta por la señal detectada, y una señal residual de la diferencia entre la señal de píxel del bloque objetivo y la señal predicha. La técnica de búsqueda del vector de movimiento para cada bloque tal como se describió anteriormente se denomina concordancia de bloques.

La figura 16 es un diagrama esquemático para explicar un procedimiento de concordancia de bloques. A continuación se describirá un procedimiento de generación de una señal predicha para un ejemplo de un bloque 702 objetivo en una imagen 701 objetivo de codificación. Una imagen 703 es una imagen reconstruida y una región 704 en la imagen reconstruida es una región ubicada espacialmente en la misma posición que el bloque 702 objetivo. En la concordancia de bloques, se establece un intervalo 705 de búsqueda que incluye la región 704. Una región 706 con una señal para minimizar la suma de diferencias absolutas con respecto a la señal de píxel del bloque 702 objetivo se detecta a partir de este intervalo de búsqueda. Se determina que la señal de esta región 706 es una señal predicha, y se detecta una cantidad de desplazamiento desde la región 704 hasta la región 706 como vector 707 de movimiento. También se emplea a menudo un método de preparar una pluralidad de imágenes de referencia, seleccionar una imagen de referencia que va a aplicarse a la concordancia de bloques para cada bloque objetivo, y detectar información de selección de imagen de referencia. En algunos casos en la norma H.264 se prepara una pluralidad de tipos de predicción de diferentes tamaños de bloque para la codificación de un vector de movimiento, con el fin de adaptarse a cambios de características locales de imágenes. Los tipos de predicción de la norma H.264 se describen, por ejemplo, en el documento de patente 2.

En la codificación por compresión de datos de vídeo, un orden de codificación de imágenes (tramas o campos) puede ser opcional. Por este motivo, hay tres tipos de técnicas en relación con el orden de codificación en la predicción interimagen para generar la señal predicha con referencia a imágenes reconstruidas. La primera técnica es una predicción hacia adelante para generar la señal predicha con referencia a una imagen reconstruida anterior en un orden de visualización, la segunda técnica es una predicción hacia atrás para generar la señal predicha con referencia a una imagen reconstruida futura en el orden de visualización, y la tercera técnica es una predicción bidireccional para realizar tanto una predicción hacia adelante como una predicción hacia atrás y promediar dos señales predichas. Los tipos de predicciones interimagen se describen, por ejemplo, en el documento de patente 3. En la norma H.264, la tercera técnica se realiza usando dos listas de imágenes de referencia que consisten cada una en una pluralidad de imágenes reconstruidas como candidatas para una imagen de referencia. Más específicamente, la concordancia de bloques se lleva a cabo usando la pluralidad de imágenes de referencia registradas en cada lista de imágenes de referencia para detectar dos regiones correspondientes a la región 706, y se promedian dos señales predichas así detectadas.

Se describirá un ejemplo de listas de imágenes de referencia con las figuras 5 y 6. En (A) de la figura 5, una imagen 505 indica una imagen objetivo de codificación y las imágenes 501 a 504 indican imágenes reconstruidas. Cada imagen se identifica mediante un número de trama (frame_num). Las identificaciones de lista de imágenes de referencia List0 y List1 en (A) de la figura 6 indican dos listas de imágenes de referencia y, en este ejemplo, cuatro imágenes de referencia están registradas en cada una de las dos listas de imágenes de referencia. Cada imagen de referencia se identifica mediante un índice de referencia (ref_idx).

Las imágenes reconstruidas que pueden registrarse en las listas de imágenes de referencia son básicamente opcionales. Al igual que en la tabla 521 mostrada en (A) de la figura 6, todas las imágenes de referencia registradas en las dos listas de imágenes de referencia pueden ser imágenes reconstruidas anteriores. Dado que las dos señales predichas son ambas señales predichas hacia adelante en este caso, la técnica de predicción para promediar las dos señales predichas se denomina predicción bipredictiva, en lugar de la predicción bidireccional. En la predicción bipredictiva, es necesario codificar dos combinaciones (información de movimiento) de vectores de movimiento e índices de referencia. Por tanto, con el fin de disminuir el recuento de bits, hay una técnica para realizar la predicción bipredictiva usando la información de movimiento identificada mediante List0 y la información de movimiento identificada mediante List1, a partir de la información de movimiento de bloques adyacentes.

Lista de referencias

Bibliografía de patentes

Documento de patente 1: patente estadounidense n.° 6.765.964

Documento de patente 2: patente estadounidense n.° 7.003.035

Documento de patente 3: patente estadounidense n.° 6.259.739

El documento US 2005/117646 A1 describe un método de predicción de vector de movimiento para su uso en codificación de vector de movimiento diferencial dentro de un codificador de vídeo basado en compensación de movimiento de bloque. El codificador de vídeo emplea una memoria intermedia de múltiples imágenes de referencia generalizadas que puede contener múltiples imágenes de referencia tanto en la dirección temporal hacia adelante como hacia atrás de la imagen actual.

En el documento US 2004/264570 A1 al codificar una imagen que va a usarse como una imagen de referencia por otra imagen, se almacena un vector de movimiento usado en codificación predictiva interimagen bajo control de una unidad de control de codificación de tal manera que se almacenan los vectores de movimiento de imágenes, menores en número que el número de imágenes de referencia.

En el documento “Video coding technology proposal by BBC (and Samsung)” por Davies (BBC) T, n.° JCTVC-A125, 16 de abril de 2010 se divulga la selección del mejor elemento de predicción (movimiento) de un conjunto dado. El índice del mejor elemento de predicción se señala desde el codificador hasta el decodificador.

Sumario de la invención

Problema técnico

La predicción bipredictiva implica promediar dos señales predichas similares, mediante lo cual puede eliminarse ruido en las señales predichas de manera más eficaz mediante un efecto de suavizado. Con este propósito, resulta eficaz adquirir dos señales con vectores de movimiento ligeramente diferentes a partir de una imagen de referencia idéntica. Sin embargo, en los métodos convencionales de predicción bipredictiva que usan la información de movimiento de bloques adyacentes, la selección de la información de movimiento que va a usarse en la generación de dos señales predichas se restringe mediante listas de imágenes de referencia. A causa de esta restricción, aunque un conjunto de dos fragmentos de información de movimiento de bloques adyacentes incluya vectores de movimiento de valores cercanos basados en la misma imagen de referencia, no pueden seleccionarse.

En el presente documento se supone que cuando un bloque 400 en la figura 7 es un bloque objetivo de codificación y los bloques 401 a 403 son bloques adyacentes al bloque objetivo, cada uno de los tres bloques adyacentes tiene dos fragmentos de información de movimiento identificados mediante List0 y List1. Según la técnica de la técnica anterior, las dos señales predichas se generan seleccionando uno de los tres fragmentos de información de movimiento identificados mediante List0 y uno de los tres fragmentos de información de movimiento identificados mediante List1, que son la información de movimiento de los tres bloques adyacentes. En general, el recuento de bits necesario para el índice de referencia ref_idx se vuelve más pequeño cuando el índice de referencia ref_idx es “0”; por tanto, a menudo se da el caso de que todos los índices de referencia ref_idx en la información de movimiento de bloques adyacentes son 0. En el caso en el que el índice de referencia es “0”, el uso de las listas (521) de imágenes de referencia en (A) de la figura 6 da como resultado la adquisición de las dos señales predichas a partir de una imagen de referencia con el número de trama (frame_num) de “3” y a partir de una imagen de referencia con el número de trama de “2”, respectivamente. En este caso, no es factible lograr un efecto de suavizado alto.

Como otro ejemplo, se supone una situación en la que dos listas de imágenes de referencia están compuestas por imágenes de referencia diferentes. En el caso, tal como se muestra en (B) de la figura 5, en el que una imagen 510 identificada mediante el número de trama de “3” es una imagen objetivo de codificación, en el que las imágenes 507, 508, 509 y 511 identificadas mediante los números de trama de “0”, “1”, “2” y “4”, respectivamente, son imágenes reconstruidas, y en el que las listas de imágenes de referencia son las listas 522 mostradas en (B) de la figura 6, las dos señales predichas se generan a partir de imágenes de referencia diferentes. En este caso, tampoco es factible lograr un efecto de suavizado alto.

Por tanto, existe la necesidad de un dispositivo de codificación predictiva de imágenes, un método de codificación predictiva de imágenes, un programa de codificación predictiva de imágenes, un dispositivo de decodificación predictiva de imágenes, un método de decodificación predictiva de imágenes y un programa de decodificación predictiva de imágenes capaces de suprimir el ruido de señales predichas.

Solución al problema

La invención se establece en el juego adjunto de reivindicaciones. Aspectos y realizaciones adicionales en la descripción se presentan sólo como ejemplos ilustrativos.

La codificación predictiva de imágenes según un ejemplo permite que dos fragmentos de información de movimiento entre los cuales cualquier elemento constituyente difiere en cuanto al valor se seleccionen sin estar restringidos por listas de imágenes de referencia. Como resultado, puede lograrse el efecto de suavizado para la generación de la señal predicha.

En una realización, la codificación predictiva de imágenes puede configurarse de la siguiente manera: los medios de grabación de imagen almacenan una pluralidad de imágenes reconstruidas, cada fragmento de la información de movimiento contiene información para identificar la imagen reconstruida, y un vector de movimiento, las imágenes reconstruidas almacenadas en los medios de grabación de imagen se identifican usando números de trama respectivos en la codificación de las imágenes reconstruidas, y un conjunto de información de movimiento derivado es un conjunto de información de movimiento que incluye dos fragmentos de información de movimiento que tienen un número de trama idéntico de la imagen reconstruida y valores diferentes de vectores de movimiento.

En una realización, la codificación predictiva de imágenes puede configurarse de la siguiente manera: los medios de grabación de imagen almacenan una pluralidad de imágenes reconstruidas, la pluralidad de imágenes reconstruidas almacenadas en los medios de grabación de imagen se identifican usando dos listas de imágenes de referencia que consisten cada una en una o más imágenes reconstruidas, cada fragmento de la información de movimiento contiene información para identificar las dos listas de imágenes de referencia, y el vector de movimiento, y un conjunto de información de movimiento derivado es un conjunto de información de movimiento que incluye dos fragmentos de información de movimiento que tienen información idéntica para identificar las listas de imágenes de referencia, y valores diferentes de vectores de movimiento.

En una realización, la codificación predictiva de imágenes puede configurarse de la siguiente manera: el conjunto de información de movimiento que va a usarse en la generación de la señal predicha de la región objetivo se selecciona a partir de una pluralidad de fragmentos de información de movimiento asociados con una región adyacente a la región objetivo.

En una realización, la codificación predictiva de imágenes puede configurarse de la siguiente manera: se codifica información para indicar el conjunto de información de movimiento seleccionado que consiste en los dos fragmentos de información de movimiento.

Un aspecto de la presente invención se refiere a la decodificación predictiva de imágenes.

Un dispositivo de decodificación predictiva de imágenes según un aspecto de la presente invención es un dispositivo de decodificación predictivo de imágenes según la reivindicación 1.

Un dispositivo de decodificación predictiva de imágenes según un aspecto de la presente invención es un método de decodificación predictivo de imágenes según la reivindicación 2.

Un programa de decodificación predictiva de imágenes según un aspecto de la presente invención es un programa de decodificación predictivo de imágenes según la reivindicación 3.

La decodificación predictiva de imágenes según un aspecto de la presente invención permite que una imagen se restaure a partir de datos comprimidos generados por la codificación predictiva de imágenes del aspecto mencionado anteriormente. El ruido puede reducirse en esta imagen restaurada.

En una realización, la decodificación predictiva de imágenes puede configurarse de la siguiente manera: comprende extraer datos codificados de información de indicación, consistiendo los datos codificados extraídos de una pluralidad de fragmentos de información de movimiento almacenados en los medios de grabación de información de movimiento para identificar un conjunto de información de movimiento en dos fragmentos de información de movimiento entre los cuales uno cualquiera de los elementos constituyentes difiere en cuanto al valor, hacer que los medios de decodificación de información de predicción decodifiquen la información de indicación, y extraer un conjunto de información de movimiento que va a usarse en la generación de la señal predicha de la región objetivo a partir del uno o más conjuntos de información de movimiento derivados por los medios de derivación de información de movimiento, basándose en la información de indicación decodificada.

En una realización, la decodificación predictiva de imágenes puede configurarse de la siguiente manera: los medios de grabación de imagen almacenan una pluralidad de imágenes reconstruidas, la información de movimiento contiene información para identificar la pluralidad de imágenes reconstruidas, y vectores de movimiento, la pluralidad de imágenes reconstruidas almacenadas en los medios de grabación de imagen se identifican usando números de trama respectivos al decodificar las imágenes reconstruidas respectivas, y un conjunto de información de movimiento derivado es un conjunto de información de movimiento que incluye dos fragmentos de información de movimiento que tienen un número de trama idéntico de la imagen reconstruida y valores diferentes de vectores de movimiento.

En una realización, la decodificación predictiva de imágenes puede configurarse de la siguiente manera: los medios de grabación de imagen almacenan una pluralidad de imágenes reconstruidas, la pluralidad de imágenes reconstruidas almacenadas en los medios de grabación de imagen se identifican usando dos listas de imágenes de referencia que consisten cada una en una o más imágenes reconstruidas, cada fragmento de la información de movimiento se configura de manera que contiene información para identificar las dos listas de imágenes de referencia, y el vector de movimiento, y un conjunto de información de movimiento derivado es un conjunto de información de movimiento que incluye dos fragmentos de información de movimiento que tienen información idéntica para identificar las listas de imágenes de referencia, y valores diferentes de vectores de movimiento.

En una realización, la decodificación predictiva de imágenes puede configurarse de la siguiente manera: el conjunto de información de movimiento que va a usarse en la generación de la señal predicha de la región objetivo se deriva a partir de una pluralidad de fragmentos de información de movimiento asociados con una región adyacente a la región objetivo.

Efectos ventajosos de la invención

Tal como se describió anteriormente, varios aspectos de la presente invención proporcionan el dispositivo de codificación predictiva de imágenes, el método de codificación predictiva de imágenes, el programa de codificación predictiva de imágenes, el dispositivo de decodificación predictiva de imágenes, el método de decodificación predictiva de imágenes y el programa de decodificación predictiva de imágenes capaces de suprimir el ruido de la señal predicha.

Breve descripción de los dibujos

La figura 1 es un dibujo que muestra una configuración de un dispositivo de codificación predictiva de imágenes según una realización.

La figura 2 es un dibujo que muestra una configuración de una unidad de generación de señal predicha mostrada en la figura 1.

La figura 3 es un diagrama de flujo que muestra un procedimiento de una unidad de derivación de información de movimiento mostrada en la figura 2.

La figura 4 es un diagrama esquemático para explicar un ejemplo de una técnica para seleccionar un fragmento de información de predicción candidata a partir de información de predicción de movimiento candidata (combinación de dos fragmentos de información de movimiento) usando píxeles adyacentes a un bloque objetivo.

La figura 5 es un diagrama esquemático para explicar ejemplos de órdenes de codificación de imágenes.

La figura 6 es un dibujo para explicar ejemplos de listas de imágenes de referencia.

La figura 7 es un dibujo para explicar ejemplos de bloques adyacentes.

La figura 8 es un dibujo para explicar otros ejemplos de bloques adyacentes.

La figura 9 es un diagrama de flujo que muestra un procedimiento de un método de codificación predictiva de imágenes según una realización.

La figura 10 es un dibujo que muestra una configuración de un dispositivo de decodificación predictiva de imágenes según una realización.

La figura 11 es un diagrama de flujo que muestra un procedimiento de un método de decodificación predictiva de imágenes según una realización.

La figura 12 es un dibujo que muestra una configuración de un programa para hacer que un ordenador ejecute el método de codificación predictiva de imágenes según una realización.

La figura 13 es un dibujo que muestra una configuración de un programa para hacer que un ordenador ejecute el método de decodificación predictiva de imágenes según una realización.

La figura 14 es un dibujo que muestra una configuración de hardware de un ordenador para ejecutar un programa grabado en un medio de grabación.

La figura 15 es una vista en perspectiva de un ordenador para ejecutar un programa almacenado en un medio de grabación.

La figura 16 es un dibujo esquemático para explicar un procedimiento de estimación de movimiento en predicción interimagen.

La figura 17 es un diagrama esquemático para explicar el método convencional de predicción intraimagen.

Descripción de realizaciones

A continuación se describirán en detalle algunas realizaciones con referencia a los dibujos. En los dibujos, las partes idénticas o equivalentes se indicarán mediante los mismos signos de referencia, sin una descripción redundante. En la presente memoria descriptiva, “tramas” e “imágenes” (501 a 511 en la figura 5) significan lo mismo.

La figura 1 es un dibujo que muestra una configuración de un dispositivo de codificación predictiva de imágenes según una realización. El dispositivo 100 de codificación predictiva de imágenes mostrado en la figura 1 está dotado de un terminal 101 de entrada, una unidad 102 de división en bloques, una unidad 103 de generación de señal predicha, una memoria 104 de tramas, una unidad 105 de resta, una unidad 106 de transformada, una unidad 107 de cuantificación, una unidad 108 de cuantificación inversa, una unidad 109 de transformada inversa, una unidad 110 de suma, una unidad 111 de codificación de coeficientes de transformada cuantificados, un terminal 112 de salida, una memoria 113 de información de predicción y una unidad 114 de codificación de información de predicción. En una realización, la unidad 106 de transformada y la unidad 107 de cuantificación funcionan como medios de codificación de señal residual, la unidad 108 de cuantificación inversa y la unidad 109 de transformada inversa funcionan como medios de restauración de señal residual, y la memoria de información de predicción funciona como medios de grabación de información de movimiento. Se observa que la memoria 113 de información de predicción puede incorporarse en la unidad 103 de generación de señal predicha. En una realización, la unidad 111 de codificación de coeficientes de transformada cuantificados puede funcionar también como una parte de los medios de codificación de señal residual y, en este caso, un elemento que decodifica datos generados por la unidad 111 de codificación de coeficientes de transformada cuantificados y emite los datos decodificados a la unidad 108 de cuantificación inversa constituye una parte de los medios de restauración de señal residual.

El terminal 101 de entrada es un terminal que implementa la introducción de una señal de una secuencia de vídeo que consiste en una pluralidad de imágenes.

La unidad 102 de división en bloques divide cada imagen de un objetivo de codificación representado por una señal introducida desde el terminal 101 de entrada, para dar una pluralidad de regiones. En una realización, una imagen objetivo de codificación puede dividirse para dar una pluralidad de bloques que consisten cada uno en 8x8 píxeles. Estas regiones o bloques son regiones objetivo o bloques objetivo a los que se aplica el procesamiento descrito a continuación. El tamaño y la forma de los bloques no se limitan a este ejemplo. Pueden mezclarse bloques de diferentes tamaños en cada imagen.

La unidad 103 de generación de señal predicha detecta la información de movimiento necesaria para la generación de una señal predicha de cada bloque de predicción en un bloque objetivo y genera la señal predicha. No hay restricciones particulares con respecto a un método de generación de la señal predicha, pero puede ser la predicción interimagen o la predicción intraimagen tal como se describió en la técnica anterior (aunque la predicción intraimagen no se ilustra). En una realización, la información de movimiento puede detectarse mediante la concordancia de bloques mostrada en la figura 16. En la concordancia de bloques, la señal predicha para minimizar la suma de diferencias absolutas con respecto a la señal original (señal de píxel) del bloque objetivo se detecta a partir de una imagen reconstruida adquirida mediante la línea L104.

En una realización, la información de movimiento puede contener un vector de movimiento, una identificación de una lista de imágenes de referencia (List0 y List1 en la figura 5) y un índice de referencia (ref_idx en la figura 5).

Cuando cada lista de imágenes de referencia está compuesta por una pluralidad de imágenes de referencia tal como se muestra en la figura 6, el índice de referencia se detecta simultáneamente con el vector de movimiento, con el fin de indicar qué imagen de referencia es un objetivo del vector de movimiento en la información de movimiento. Cuando se usa predicción bipredictiva, también se determina al mismo tiempo el tipo de predicción (hacia adelante/hacia atrás/bidireccional). Cuando el tipo de predicción es la predicción hacia adelante, se detecta la información de movimiento con la identificación de lista de imágenes de referencia de List0; cuando el tipo de predicción es la predicción hacia atrás, se detecta la información de movimiento con la identificación de lista de imágenes de referencia de List1. En el caso de la predicción bipredictiva, se detectan dos fragmentos de información de movimiento identificados mediante List0 y List1. Las imágenes reconstruidas registradas en las listas de imágenes de referencia mostradas en la figura 6 pueden determinarse automáticamente según una regla predeterminada, o información para especificar las imágenes reconstruidas registradas en las listas de imágenes de referencia puede codificarse explícitamente en unidades de trama o en unidades de secuencia. En una realización, pueden usarse números de trama como la información, tal como se muestra en las figuras 5 y 6.

Volviendo a hacer referencia a la figura 1, la información de movimiento y el tipo de predicción se emiten mediante la línea L103c y mediante la línea L103b a la memoria 113 de información de predicción y a la unidad 114 de codificación de información de predicción, respectivamente.

La memoria 113 de información de predicción almacena el tipo de predicción y la información de movimiento de entrada.

La unidad 114 de codificación de información de predicción codifica por entropía la información de movimiento del bloque objetivo de codificación y emite datos codificados mediante la línea L114 al terminal 112 de salida. No hay restricciones particulares con respecto a un método de la codificación por entropía, pero puede ser la codificación aritmética, codificación de longitud variable o similares.

La señal predicha generada por la unidad 103 de generación de señal predicha se emite mediante la línea L103a a la unidad 105 de resta ya la unidad 110 de suma.

La unidad 105 de resta resta la señal predicha del bloque objetivo introducida mediante la línea L103a, a partir de la señal de píxel del bloque objetivo para generar una señal residual. La unidad 105 de resta emite la señal residual mediante la línea L105 a la unidad 106 de transformada.

La unidad 106 de transformada realiza una transformada de coseno discreta de la señal residual de entrada para generar coeficientes de transformada. La unidad 107 de cuantificación cuantifica los coeficientes de transformada generados por la unidad 106 de transformada, para generar coeficientes de transformada cuantificados. La unidad 111 de codificación de coeficientes de transformada cuantificados codifica por entropía los coeficientes de transformada cuantificados generados por la unidad 107 de cuantificación. Los datos codificados generados por la unidad 111 de codificación de coeficientes de transformada cuantificados se emiten mediante la línea L111 al terminal 112 de salida. No hay restricciones particulares con respecto a un método de la codificación por entropía en la unidad 111 de codificación de coeficientes de transformada cuantificados, pero puede ser codificación aritmética, codificación de longitud variable o similares.

El terminal 112 de salida emite la información recibida desde la unidad 114 de codificación de información de predicción y la información procedente de la unidad 111 de codificación de coeficientes de transformada cuantificados, de manera conjunta al exterior.

La unidad 108 de cuantificación inversa realiza una cuantificación inversa de los coeficientes de transformada cuantificados generados por la unidad 107 de cuantificación, para generar coeficientes de transformada. La unidad 109 de transformada inversa aplica una transformada de coseno discreta inversa a los coeficientes de transformada generados por la unidad 108 de cuantificación inversa, para restaurar una señal residual. La unidad 110 de suma suma la señal residual restaurada a la entrada de señal predicha proporcionada mediante la línea L103a, para generar una señal de píxel reconstruida del bloque objetivo de codificación y almacena la señal de píxel reconstruida en la memoria 104 de tramas. También es posible adoptar otros procedimientos de transformada que sustituyen a los procedimientos de la unidad 106 de transformada y la unidad 109 de transformada inversa. También se observa que la unidad 106 de transformada y la unidad 109 de transformada inversa no siempre son esenciales. De esta manera, la señal de píxel reconstruida del bloque objetivo de codificación se almacena como parte de una imagen de referencia o imagen reconstruida en la memoria 104 de tramas, con el fin de usarse para la generación de una señal predicha de un bloque objetivo de codificación posterior.

En una realización, la unidad 103 de generación de señal predicha también puede generar la señal predicha del bloque objetivo haciendo uso de la información de movimiento asociada con bloques adyacentes al bloque objetivo (bloques adyacentes). La información de movimiento asociada con un bloque adyacente es información de movimiento usada para la generación de la señal predicha cuando el bloque adyacente era un objetivo de codificación. La información de movimiento asociada con los bloques adyacentes se almacena en la memoria 113 de información de predicción. Para cada bloque, puede incluirse en un estado codificado en datos comprimidos información para indicar que la señal predicha se generó haciendo uso de la información de movimiento asociada con los bloques adyacentes, o información para indicar que la señal predicha se generó haciendo uso del vector de movimiento detectado por la concordancia de bloques.

Ahora, va a considerarse el caso en el que la señal predicha del bloque objetivo se genera mediante la predicción bipredictiva. Se describirá a continuación usando un ejemplo de (A) en la figura 7. Los bloques adyacentes son dos bloques 401 y 402 adyacentes al bloque 400 objetivo, que están ubicados inmediatamente a la izquierda e inmediatamente por encima del bloque 400 objetivo, y la información de movimiento asociada con estos bloques se usa para la predicción. En este caso, si el tipo de predicción asociado con los dos bloques adyacentes es la predicción bipredictiva, pueden usarse hasta cuatro fragmentos de información de movimiento para la generación de la señal predicha del bloque objetivo. La unidad 103 de generación de señal predicha selecciona dos fragmentos de información de movimiento que tienen valores diferentes de vectores de movimiento o valores diferentes de números de trama de imágenes de referencia, a partir de los cuatro fragmentos de información de movimiento como candidatos (cuatro fragmentos de información de movimiento candidata). Un número de trama (frame_num) de una imagen de referencia puede identificarse mediante una combinación de una identificación de lista de imágenes de referencia (List0 o List1) y un índice de referencia (ref_idex). Luego se adquieren dos señales predichas desde la memoria 104 de tramas basándose en los fragmentos respectivos de información de movimiento, y las dos señales predichas se promedian en unidades de píxel para obtener una señal predicha. Si las dos señales predichas se parecen entre sí, el rendimiento de predicción se mejora por el efecto de eliminación de ruido debido al suavizado. La unidad 114 de codificación de información de predicción codifica información (información de indicación) para identificar los dos fragmentos de información de movimiento usados en la generación de la señal predicha del bloque objetivo a partir de los cuatro fragmentos de información de movimiento candidata, en lugar de la información de movimiento. Por tanto, la señal predicha puede generarse en un recuento de bits que es menor que el de los datos codificados obtenidos codificando la información de movimiento. La información de indicación puede ser dos fragmentos de información de indicación para identificar los fragmentos respectivos de información de movimiento candidata, o puede ser un fragmento de información de indicación para identificar la combinación de los dos fragmentos de información de movimiento candidata.

La memoria 113 de información de predicción almacena los dos fragmentos de información de movimiento usados en realidad en la generación de la señal predicha del bloque objetivo, como información de movimiento asociada con el bloque objetivo. Los dos fragmentos de información de movimiento pueden almacenarse tal cual, pero dado que los procedimientos existentes de codificación y decodificación predictiva de imágenes presentan la restricción de hacer referencia a las dos listas de imágenes de referencia de List0 y List1, los dos fragmentos de información de movimiento pueden almacenarse tal como se describe a continuación.

Concretamente, cuando los dos fragmentos de información de movimiento tienen la misma identificación de lista de imágenes de referencia, la identificación de lista de imágenes de referencia en los dos fragmentos de información de movimiento puede modificarse según una regla predeterminada. Por ejemplo, de los dos fragmentos de información de movimiento, la identificación de lista de imágenes de referencia de un fragmento de información de movimiento con un índice de referencia (ref_idx) menor se asigna a Listo, y la identificación de lista de imágenes de referencia del otro fragmento de información de movimiento se asigna a List1.

Cuando los dos fragmentos de información de movimiento también tienen el mismo índice de referencia, la identificación de lista de imágenes de referencia de un fragmento de información de movimiento con el vector de movimiento que tiene la menor suma de valores absolutos de componentes respectivos del mismo se asigna a List0, y la identificación de lista de imágenes de referencia del otro fragmento de información de movimiento se asigna a List1.

Si esta asignación da como resultado que se hace referencia a un número de trama diferente del número de trama antes de la asignación, el índice de referencia (ref_idx) puede modificarse para permitir la referencia al número de trama antes de la asignación.

Si las dos listas de imágenes de referencia no incluyen ningún número de trama idéntico tal como se muestra en (B) de la figura 6, la información de movimiento puede gestionarse usando listas (523) de imágenes de referencia ampliadas para incluir los mismos números de trama tal como se muestra en (C) de la figura 6. Las listas de imágenes de referencia ampliadas pueden usarse directamente en el caso en el que la señal predicha del bloque objetivo se genera usando la información de movimiento asociada con bloques adyacentes. Dado que los números de trama se graban, también pueden aplicarse a casos en los que el vector de movimiento se ajusta a escala según la distancia en la dirección temporal entre imágenes (por ejemplo, cada componente de vector se duplica cuando el vector de movimiento con respecto al objetivo de la imagen 504 en (A) de la figura 5 se convierte en el vector de movimiento con respecto al objetivo de la imagen 503). Dado que los métodos de almacenamiento de vectores de movimiento descritos en el presente documento pueden convertirse de uno a otro, puede aplicarse uno cualquiera de los métodos de almacenamiento sin ninguna influencia sobre el resultado de codificación.

El procesamiento de la unidad 103 de generación de señal predicha se describirá adicionalmente en detalle. La figura 2 es un dibujo que muestra una configuración de la unidad 103 de generación de señal predicha según una realización. Tal como se muestra en la figura 2, la unidad 103 de generación de señal predicha está dotada de una unidad 121 de derivación de información de movimiento, una unidad 122 de selección de información de predicción de movimiento y una unidad 123 de compensación de movimiento. En este dibujo, se omite la parte de detección de movimiento mediante la concordancia de bloques convencional.

Cuando ambos tipos de predicción de los bloques inmediatamente superior e inmediatamente izquierdo usados como bloques adyacentes son una predicción bipredictiva, la unidad 121 de derivación de información de movimiento compara cuatro fragmentos de información de movimiento asociados con estos bloques adyacentes. La unidad 121 de derivación de información de movimiento define información de movimiento que tiene un valor diferente de uno cualquiera de los elementos que constituyen la información de movimiento, que son el vector de movimiento, la identificación de lista de imágenes de referencia y el índice de referencia, con respecto a los de los otros tres fragmentos de información de movimiento, como información de movimiento candidata aplicable a la predicción del bloque objetivo. Si hay dos o más fragmentos de información de movimiento con el mismo valor de vector de movimiento y el mismo valor de número de trama de la imagen de referencia (el número de trama de la imagen de referencia puede identificarse mediante la combinación de la lista de imágenes de referencia y el índice de referencia), uno de ellos se define como información de movimiento candidata. Luego la unidad 121 de derivación de información de movimiento deriva un conjunto de dos fragmentos cualesquiera de información de movimiento candidata, como información de predicción bipredictiva candidata. En este caso, pueden derivarse hasta seis fragmentos de información de predicción bipredictiva candidata. En casos en los que al menos uno de los bloques inmediatamente superior e inmediatamente izquierdo con respecto al bloque objetivo se emplea como bloque adyacente y en los que la predicción es una predicción bipredictiva, a partir de los bloques adyacentes pueden derivarse patrones de combinación de dos fragmentos de información de movimiento en un número igual al de los patrones descritos a continuación. Concretamente, los patrones de combinación son de la siguiente manera.

(1) 2 patrones: en casos en los que se emplean dos fragmentos de información de movimiento del bloque (402) inmediatamente superior o el bloque (401) inmediatamente izquierdo.

(2) 4 patrones: en casos en los que se emplean un fragmento de información de movimiento del bloque (402) inmediatamente superior y un fragmento de información de movimiento del bloque (401) inmediatamente izquierdo y en los que las listas de imágenes de referencia en los dos fragmentos seleccionados de información de movimiento son diferentes.

(3) 2 patrones: en casos en los que se emplean un fragmento de información de movimiento del bloque (402) inmediatamente superior y un fragmento de información de movimiento del bloque (401) inmediatamente izquierdo y en los que las listas de imágenes de referencia en los dos fragmentos seleccionados de información de movimiento son iguales.

La figura 3 muestra un diagrama de flujo del procesamiento llevado a cabo por la unidad 121 de derivación de información de movimiento. En primer lugar, en la etapa S301 se establece el número N de bloques adyacentes que van a usarse en la predicción del bloque objetivo y el número n de bloque adyacente actual se establece a ^“0^{” .} Por ejemplo, se establece n=0 para el bloque 401 y n=1 para el bloque 402. Además, el número L de fragmentos de información de movimiento candidata se inicializa a 0. Luego se adquieren la información de movimiento y el tipo de predicción del n-ésimo bloque desde la memoria 113 de información de predicción (etapa S302). Después de eso, se establece el número M de fragmentos de información de movimiento asociados con el n-ésimo bloque adyacente basándose en el tipo de predicción (etapa S303).

A continuación, la m-ésima información de movimiento del n-ésimo bloque adyacente se compara con los L fragmentos de información de movimiento candidata (etapa S304). Si todos los fragmentos de información de movimiento candidata son diferentes de la información de movimiento del objetivo de comparación, o si L=0, el procesamiento avanza a la etapa S305. En la etapa S305, la m-ésima información de movimiento del n-ésimo bloque adyacente se suma a la información de movimiento candidata y el valor de L recibe un incremento de 1. Después de eso, el procesamiento avanza a la etapa S306.

Si la etapa S304 da como resultado que se encuentra lo mismo que la m-ésima información de movimiento en la información de movimiento candidata, el procesamiento avanza a la etapa S306. En la etapa S304, si los valores de dos vectores de movimiento que se comparan son idénticos y si los números de trama correspondientes a dos conjuntos de índices de referencia e identificaciones de lista de imágenes de referencia que se comparan son idénticos, se determina que la información de movimiento es idéntica incluso con una diferencia de las listas de imágenes de referencia. Un motivo para ello es que cuando los vectores de movimiento de dos fragmentos de información de movimiento y los números de trama de imágenes de referencia de los mismos son idénticos, las señales predichas generadas a partir de estos fragmentos de información de movimiento pasan a ser coincidentes. En la etapa S306, el valor de m recibe un incremento de 1. En la etapa S307 posterior, se determina si los procedimientos de las etapas S304 a S306 se han completado, para todos los fragmentos de información de movimiento asociados con el n-ésimo bloque adyacente; si se han completado, el procesamiento avanza a la etapa S308; si no se han completado, el procesamiento vuelve a la etapa S304.

En la etapa S308, el valor del número n del bloque adyacente recibe un incremento de 1. Luego, en la etapa S309, se determina si el procesamiento se ha completado para todos los bloques adyacentes. Si se ha completado, el procesamiento avanza a la etapa S310; si no se ha completado, el procesamiento vuelve a la etapa S302.

Finalmente, en la etapa S310, cada conjunto de dos fragmentos de información de movimiento que tienen valores diferentes de vectores de movimiento o valores diferentes de números de trama de imágenes de referencia (el número de trama de cada imagen de referencia puede identificarse mediante la combinación de la lista de imágenes de referencia y el índice de referencia) se deriva a partir de los L fragmentos de información de movimiento candidata y se establece como información de predicción bipredictiva candidata.

En lo que respecta a la información de movimiento cuyos bloques adyacentes usa la unidad 121 de derivación de información de movimiento, puede determinarse de manera preliminar tanto para el lado de codificación como para el lado de decodificación. Además, la información para especificar la información de movimiento cuyos bloques adyacentes usó la unidad 121 de derivación de información de movimiento puede transmitirse en un estado codificado al lado de decodificación.

La unidad 122 de selección de información de predicción de movimiento selecciona un fragmento óptimo a partir de la información de predicción bipredictiva candidata introducida mediante la línea L121 desde la unidad 121 de derivación de información de movimiento. Específicamente, selecciona la información de predicción bipredictiva candidata para minimizar la suma de diferencias absolutas entre la “señal obtenida como promedio de dos señales adquiridas mediante la línea L104 desde la memoria 104 de tramas basándose en dos fragmentos de información de movimiento candidata” y la “señal de píxel del bloque objetivo adquirida mediante la línea L102”. Luego se emite información de indicación para identificar la información de predicción bipredictiva candidata seleccionada o para identificar los dos fragmentos de información de movimiento candidata que constituyen la información de predicción bipredictiva candidata seleccionada, mediante la línea L103b, a la unidad de codificación de información de predicción.

Además, la unidad 122 de selección de información de predicción de movimiento emite los dos fragmentos seleccionados de información de movimiento mediante la línea L103c a la memoria 113 de información de predicción para hacer que la información se almacene en la misma, y emite la información mediante la línea L122 a la unidad 123 de compensación de movimiento. La unidad 123 de compensación de movimiento promedia dos señales de píxel reconstruidas extraídas a partir de las imágenes reconstruidas adquiridas mediante la línea L104, basándose en los dos fragmentos de entrada de información de movimiento, para generar una señal predicha, y emite la señal predicha mediante la línea L103a a la unidad 105 de resta ya la unidad 110 de suma.

No hay restricciones particulares con respecto a la técnica de selección de un fragmento óptimo de información de predicción bipredictiva candidata en la unidad 122 de selección de información de predicción de movimiento. Por ejemplo, tal como se muestra en la figura 4, en lugar de una señal de píxel de un bloque 461 objetivo en una imagen 451 objetivo de codificación, puede usarse una región (462) reconstruida que tiene forma de L invertida adyacente al bloque 461. Dado que la región 462 es la región reconstruida, el dispositivo de decodificación también puede usarla. Tal como se muestra en el dibujo, una región (472) predicha correspondiente a la región 462 puede adquirirse a partir de la imagen 452 de referencia basándose en un fragmento de información 473 de movimiento. Para cada fragmento de información de predicción bipredictiva candidata, pueden adquirirse regiones en forma de L invertida a partir de dos fragmentos de información de movimiento candidata y se promedian señales de los mismos para encontrar la información de predicción bipredictiva candidata para minimizar la suma de diferencias absolutas con respecto a la región 462. Esta técnica permite que el dispositivo de decodificación seleccione la misma información de predicción bipredictiva candidata que la seleccionada por el dispositivo de codificación, y por tanto proporciona la ventaja de eliminar la necesidad de la transmisión de la información de indicación.

De esta manera, la señal predicha con una pequeña diferencia con respecto a la señal original se genera a partir de la información de movimiento asociada con los bloques adyacentes al bloque objetivo y se seleccionan dos fragmentos de información de movimiento que tienen valores diferentes de vectores de movimiento o valores diferentes de números de trama de imágenes de referencia (el número de trama de cada imagen de referencia puede identificarse mediante la combinación de la lista de imágenes de referencia y el índice de referencia), mediante lo cual la predicción bipredictiva del bloque objetivo puede implementarse sin la transmisión de la información de movimiento. Dado que la información de movimiento contiene la información para identificar la lista de imágenes de referencia, pasa a ser factible realizar la predicción bipredictiva usando la información de movimiento con la misma lista de imágenes de referencia. Por tanto, aunque las imágenes de referencia en dos listas de imágenes de referencia sean completamente diferentes, la predicción bipredictiva puede llevarse a cabo usando vectores de movimiento de la misma imagen de referencia. Por ejemplo, cuando la predicción bipredictiva con dos señales similares se lleva a cabo usando los vectores de movimiento de la misma imagen de referencia, puede esperarse una mejora del rendimiento de predicción basándose en el efecto de suavizado.

La figura 9 es un diagrama de flujo que muestra un procedimiento de un método de codificación predictiva de imágenes según una realización. En primer lugar, la unidad 102 de división en bloques divide una imagen de entrada para dar bloques de codificación de 8x8 (la imagen de entrada puede dividirse para dar cualquier otro tamaño o forma de bloque o pueden mezclarse bloques de diferentes tamaños en una imagen).

A continuación, la unidad 121 de derivación de información de movimiento adquiere la información de movimiento asociada con bloques adyacentes a un bloque objetivo de un objetivo de codificación, desde la memoria 113 de información de predicción y extrae información de movimiento que tiene un valor diferente de uno cualquiera de los elementos constituyentes de la misma a partir de la otra información de movimiento, como información de movimiento candidata aplicable a la predicción del bloque objetivo. Luego se deriva un conjunto de dos fragmentos cualesquiera de información de movimiento candidata como información de predicción bipredictiva candidata (etapa S300). Los detalles de esta etapa S300 ya se describieron con referencia a la figura 3.

A continuación, la unidad 122 de selección de información de predicción de movimiento selecciona uno que va a usarse en la generación de la señal predicha del bloque objetivo, a partir de una pluralidad de fragmentos de información de predicción bipredictiva candidata. Luego la unidad 122 de selección de información de predicción de movimiento determina la información de indicación para identificar el fragmento seleccionado de información de predicción bipredictiva candidata o para identificar los dos fragmentos de información de movimiento candidata que constituyen el fragmento seleccionado de información de predicción bipredictiva candidata (etapa S320). En la etapa S101 posterior, los dos fragmentos seleccionados de información de movimiento se almacenan en la memoria 113 de información de predicción y la unidad 114 de codificación de información de predicción codifica la información de indicación.

A continuación, en la etapa S102 la unidad 123 de compensación de movimiento adquiere señales de píxel a partir de dos imágenes reconstruidas adquiridas desde la memoria 104 de tramas, basándose en la información de movimiento seleccionada, y promedia estas señales de píxel para generar una señal predicha del bloque objetivo. En la técnica de predicción que no usa la información de movimiento de bloques adyacentes, la información de movimiento se detecta mediante la concordancia de bloques descrita en la figura 16 y la señal predicha del bloque objetivo se genera basándose en la información de movimiento. La unidad 114 de codificación de información de predicción codifica la información de movimiento e información para la conmutación de las dos técnicas de predicción. La información de movimiento se almacena en la memoria 113 de información de predicción.

A continuación, la señal residual indicativa de la diferencia entre la señal de píxel del bloque objetivo de codificación y la señal predicha se transforma y se codifica mediante la unidad 106 de transformada, la unidad 107 de cuantificación y la unidad 111 de codificación de coeficientes de transformada cuantificados (etapa S103). Los datos codificados de la información de indicación y los coeficientes de transformada cuantificados se emiten a través del terminal 112 de salida (etapa S104).

Después de estos procedimientos o en paralelo a estos procedimientos, la señal residual codificada se decodifica mediante la unidad 108 de cuantificación inversa y la unidad 109 de transformada inversa, para la codificación predictiva de un bloque objetivo de codificación posterior. Luego la unidad 110 de suma suma la señal residual decodificada a la señal predicha para reconstruir una señal del bloque objetivo de codificación. La señal reconstruida se almacena como imagen de referencia (señal de imagen reconstruida) en la memoria 104 de tramas (etapa S105). Si el procesamiento no se ha completado para todos los bloques objetivo de codificación, el procesamiento vuelve a la etapa S101 para llevar a cabo el procesamiento para el siguiente bloque objetivo de codificación. Si el procesamiento se ha completado para todos los bloques objetivo de codificación, se termina el procesamiento (etapa S106).

A continuación, se describirá un dispositivo de decodificación predictiva de imágenes según una realización. La figura 10 es un diagrama de bloques que muestra el dispositivo de decodificación predictiva de imágenes según una realización. El dispositivo 200 de decodificación predictiva de imágenes mostrado en la figura 10 está dotado de un terminal 201 de entrada, una unidad 202 de análisis de datos, una unidad 203 de cuantificación inversa, una unidad 204 de transformada inversa, una unidad 205 de suma, un terminal 206 de salida, una unidad 207 de decodificación de coeficientes de transformada cuantificados, una unidad 208 de decodificación de información de predicción, una memoria 104 de tramas, una unidad 209 de determinación de información de movimiento, una unidad 121 de derivación de información de movimiento, una memoria 113 de información de predicción y una unidad 126 de compensación de movimiento. La unidad 203 de cuantificación inversa y la unidad 204 de transformada inversa funcionan como medios de decodificación de señal residual y la memoria 113 de información de predicción funciona como medios de grabación de información de movimiento. Los medios de decodificación mediante la unidad 203 de cuantificación inversa y la unidad 204 de transformada inversa pueden ser cualquier medio distinto de los de otras realizaciones. Además, la unidad 204 de transformada inversa puede excluirse en otras realizaciones.

El terminal 201 de entrada implementa la introducción de datos comprimidos codificados por compresión mediante el método de codificación predictiva de imágenes mencionado anteriormente. Estos datos comprimidos contienen, para cada uno de los bloques, datos codificados obtenidos mediante la codificación por entropía de coeficientes de transformada cuantificados generados mediante la transformada y la cuantificación de la señal residual, datos codificados de la información de predicción, es decir, datos codificados de información de movimiento para la generación de la señal predicha del bloque o información de indicación para identificar la información de movimiento que va a usarse en la generación de la señal predicha del bloque objetivo de decodificación a partir de la información de movimiento asociada con bloques adyacentes, y datos codificados de información para indicar cuál de la información de movimiento y la información de indicación se codifica.

La unidad 202 de análisis de datos analiza los datos comprimidos introducidos en el terminal 201 de entrada, separa los datos comprimidos para dar datos codificados de coeficientes de transformada cuantificados y datos codificados de información de predicción, para un bloque objetivo de decodificación, y emite estos datos codificados mediante la línea L202a y mediante la línea L202b a la unidad 207 de decodificación de coeficientes de transformada cuantificados y a la unidad 208 de decodificación de información de predicción, respectivamente.

La unidad 208 de decodificación de información de predicción decodifica por entropía los datos codificados de información de movimiento o información de indicación. La información de movimiento decodificada se envía mediante la línea L208 a la unidad 209 de determinación de información de movimiento y se emite luego sin cambios mediante la línea L207a y la línea L207b a la unidad 126 de compensación de movimiento y la memoria 113 de información de predicción. La memoria 113 de información de predicción almacena la información de movimiento y la unidad 126 de compensación de movimiento adquiere una señal de píxel a partir de una imagen reconstruida adquirida desde la memoria 104 de tramas, basándose en la información de movimiento, y genera la señal predicha de cada bloque de predicción en el bloque objetivo de decodificación, usando la señal de píxel. La señal predicha generada se emite mediante la línea L126 a la unidad 205 de suma.

Por otra parte, cuando la unidad 208 de decodificación de información de predicción decodifica por entropía los datos codificados de información de indicación, la unidad 121 de derivación de información de movimiento funciona. La unidad 121 de derivación de información de movimiento, tal como se describió en detalle con referencia a la figura 3, adquiere la información de movimiento asociada con bloques adyacentes al bloque objetivo de decodificación, desde la memoria 113 de información de predicción, y extrae información que tiene valores diferentes de uno cualquiera de los elementos constituyentes de la misma, como información de movimiento candidata aplicable a la predicción del bloque objetivo de decodificación. Luego la unidad 121 de derivación de información de movimiento deriva un conjunto de dos fragmentos cualesquiera de información de movimiento candidata como información de predicción bipredictiva candidata y emite la información de predicción bipredictiva candidata mediante la línea L121 a la unidad 209 de determinación de información de movimiento.

La unidad 209 de determinación de información de movimiento selecciona un fragmento de información de predicción bipredictiva candidata identificada mediante la información de indicación introducida mediante la línea L208, a partir de una pluralidad de fragmentos de información de predicción bipredictiva candidata introducida mediante la línea L121. Los dos fragmentos de información de movimiento que constituyen la información de predicción bipredictiva candidata seleccionada se emiten mediante la línea L207a y mediante la línea L207b a la unidad 126 de compensación de movimiento y a la memoria 113 de información de predicción. La memoria 113 de información de predicción almacena la información de movimiento y la unidad 126 de compensación de movimiento adquiere señales de píxel a partir de imágenes reconstruidas adquiridas desde la memoria 104 de tramas, basándose en los dos fragmentos de información de movimiento, y genera una señal predicha de cada bloque de predicción en el bloque objetivo de decodificación, usando las señales de píxel. La señal predicha generada se emite mediante L126 a la unidad 205 de suma.

La unidad 207 de decodificación de coeficientes de transformada cuantificados decodifica por entropía los datos codificados de coeficientes de transformada cuantificados de la señal residual en el bloque objetivo de codificación, y emite los coeficientes de transformada cuantificados restaurados mediante la línea L207 a la unidad 203 de cuantificación inversa.

La unidad 203 de cuantificación inversa realiza una cuantificación inversa de los coeficientes de transformada cuantificados del bloque objetivo de decodificación introducido mediante la línea L207, para generar coeficientes de transformada. La unidad 204 de transformada inversa realiza una transformada de coseno discreta inversa de los coeficientes de transformada para restaurar una señal residual.

La unidad 205 de suma suma la señal predicha generada por la unidad 103 de generación de señal predicha, a la señal residual restaurada por la unidad 203 de cuantificación inversa y la unidad 204 de transformada inversa, para generar una señal de píxel decodificada del bloque objetivo de decodificación. La señal de píxel decodificada se emite mediante la línea L205 al terminal 206 de salida y la memoria 104 de tramas. El terminal 206 de salida emite una imagen reconstruida que incluye la señal de píxel decodificada, al exterior (por ejemplo, un dispositivo de visualización).

La memoria 104 de tramas almacena como imagen de referencia la imagen reconstruida emitida desde la unidad 205 de suma, que se usa como imagen reconstruida para referencia para el siguiente procedimiento de decodificación.

A continuación se describirá un método de decodificación predictiva de imágenes según una realización con referencia a la figura 11. En primer lugar, se introducen datos comprimidos a través del terminal 201 de entrada (etapa S201). Luego la unidad 202 de análisis de datos realiza el análisis de datos de los datos comprimidos y extrae los datos codificados de la información de movimiento para la generación de la señal predicha del bloque o la información de indicación para identificar la información de movimiento usada para la generación de la señal predicha del bloque objetivo de decodificación a partir de la información de movimiento asociada con bloques adyacentes, los datos codificados de la información para indicar cuál de la información de movimiento y la información de indicación se codifica, y los datos codificados de los coeficientes de transformada cuantificados. Los datos codificados de la información de movimiento o los datos codificados de la información de indicación se decodifican mediante la unidad 208 de decodificación de información de predicción.

Cuando se restaura la información de movimiento, la unidad 126 de compensación de movimiento genera la señal predicha del bloque objetivo de decodificación, basándose en la información de movimiento restaurada. La información de movimiento restaurada se almacena en la memoria 113 de información de predicción.

Cuando se restaura la información de indicación, la unidad 121 de derivación de información de movimiento adquiere la información de movimiento de bloques adyacentes desde la memoria 113 de información de predicción. La unidad 121 de derivación de información de movimiento puede adquirir la información de movimiento a partir de bloques adyacentes predeterminados. La información de movimiento puede adquirirse a partir de bloques adyacentes, basándose en la información transmitida desde el lado de codificación.

A continuación, la unidad 121 de derivación de información de movimiento, tal como se muestra en detalle en la figura 3, extrae información de movimiento entre la cual uno cualquiera de los elementos constituyentes de los fragmentos adquiridos de información de movimiento difiere en cuanto al valor, como información de movimiento candidata aplicable a la predicción del bloque objetivo de decodificación. Luego la unidad 121 de derivación de información de movimiento deriva un conjunto de dos fragmentos cualesquiera de información de movimiento candidata como información de predicción bipredictiva candidata (etapa S300).

A continuación, la unidad 209 de determinación de información de movimiento selecciona un fragmento de información de predicción bipredictiva a partir de los fragmentos derivados de información de predicción bipredictiva candidata, usando la información de indicación restaurada, para restaurar dos fragmentos de información de movimiento (etapa S203).

Después de eso, la unidad 126 de compensación de movimiento genera la señal predicha del bloque objetivo de decodificación, basándose en los dos fragmentos restaurados de información de movimiento, y almacena los dos fragmentos de información de movimiento en la memoria de información de predicción (S207).

A continuación, los coeficientes de transformada cuantificados decodificados por la unidad 207 de decodificación de coeficientes de transformada cuantificados se cuantifican de manera inversa mediante la unidad 203 de cuantificación inversa y la unidad 204 de transformada inversa aplica adicionalmente la transformada inversa a la salida procedente de la unidad 203 de cuantificación inversa para generar una señal residual decodificada (S208).

A continuación, la señal predicha generada se suma a la señal residual decodificada para generar una señal decodificada, y esta señal decodificada se almacena en la memoria 104 de tramas, para la decodificación del siguiente bloque objetivo de decodificación (etapa S209). Después de eso, cuando la determinación en la etapa S210 da como resultado que se determina que hay siguientes datos comprimidos, se repiten los procedimientos de S202 a S209 (S210), procesándose así todos los datos hasta el último.

La figura 12 es un dibujo que muestra una configuración de un programa para hacer que un ordenador ejecute el método de codificación predictiva de imágenes según una realización. El programa P100 de codificación predictiva de imágenes está dotado de un módulo P101 de división en bloques, un módulo P103 de generación de señal predicha, un módulo P104 de almacenamiento, un módulo P105 de resta, un módulo P106 de transformada, un módulo P107 de cuantificación, un módulo P108 de cuantificación inversa, un módulo P109 de transformada inversa, un módulo P110 de suma, un módulo P111 de codificación de coeficientes de transformada cuantificados, un módulo P113 de almacenamiento de información de predicción y un módulo P114 de codificación de información de predicción. El módulo P103 de generación de señal predicha incluye un módulo P121 de derivación de información de movimiento, un módulo P122 de selección de información de predicción de movimiento y un módulo P123 de compensación de movimiento.

Las funciones que el módulo P101 de división en bloques, el módulo P103 de generación de señal predicha, el módulo P104 de almacenamiento, el módulo P105 de resta, el módulo P106 de transformada, el módulo P107 de cuantificación, el módulo P108 de cuantificación inversa, el módulo P109 de transformada inversa, el módulo P110 de suma, el módulo P111 de codificación de coeficientes de transformada cuantificados, el módulo P113 de almacenamiento de información de predicción, el módulo P114 de codificación de información de predicción, el módulo P121 de derivación de información de movimiento, el módulo P122 de selección de información de predicción de movimiento y el módulo P123 de compensación de movimiento hacen que ejecute un ordenador son las mismas que las funciones respectivas de la unidad 102 de división en bloques, la unidad 103 de generación de señal predicha, la memoria 104 de tramas, la unidad 105 de resta, la unidad 106 de transformada, la unidad 107 de cuantificación, la unidad 108 de cuantificación inversa, la unidad 109 de transformada inversa, la unidad 110 de suma, la unidad 111 de codificación de coeficientes de transformada cuantificados, la memoria 113 de información de predicción, la unidad 114 de codificación de información de predicción, la unidad 121 de derivación de información de movimiento, la unidad 122 de selección de información de predicción de movimiento y la unidad 123 de compensación de movimiento.

La figura 13 es un dibujo que muestra una configuración de un programa para hacer que un ordenador ejecute el método de decodificación predictiva de imágenes según una realización. El programa P200 de decodificación predictiva de imágenes está dotado de un módulo P201 de análisis de datos, un módulo P202 de decodificación de información de predicción, un módulo P121 de derivación de información de movimiento, un módulo P203 de determinación de información de movimiento, un módulo P205 de almacenamiento de información de predicción, un módulo P126 de compensación de movimiento, un módulo P206 de decodificación de coeficientes de transformada cuantificados, un módulo P207 de cuantificación inversa, un módulo P208 de transformada inversa, un módulo P209 de suma y un módulo P104 de almacenamiento.

Las funciones que el módulo P201 de análisis de datos, el módulo P202 de decodificación de información de predicción, el módulo P121 de derivación de información de movimiento, el módulo P203 de determinación de información de movimiento, el módulo P205 de almacenamiento de información de predicción, el módulo P126 de compensación de movimiento, el módulo P206 de decodificación de coeficientes de transformada cuantificados, el módulo P207 de cuantificación inversa, el módulo P208 de transformada inversa, el módulo P209 de suma y el módulo P104 de almacenamiento hacen que ejecute un ordenador son las mismas que las funciones respectivas de la unidad 202 de análisis de datos, la unidad 208 de decodificación de información de predicción, la unidad 121 de derivación de información de movimiento, la unidad 209 de determinación de información de movimiento, la memoria 113 de información de predicción, la unidad 126 de compensación de movimiento, la unidad 207 de decodificación de coeficientes de transformada cuantificados, la unidad 203 de cuantificación inversa, la unidad 204 de transformada inversa, la unidad 205 de suma y la memoria 104 de tramas.

El programa P100 de codificación predictiva de imágenes o el programa P200 de decodificación predictiva de imágenes configurados tal como se describió anteriormente se almacenan en un medio 10 de grabación y se ejecutan por un ordenador descrito a continuación.

La figura 14 es un dibujo que muestra una configuración de hardware de un ordenador para ejecutar un programa grabado en un medio de grabación y la figura 15 es una vista en perspectiva de un ordenador para ejecutar un programa almacenado en un medio de grabación. El equipo que ejecuta un programa grabado en un medio de grabación no se limita a ordenadores, sino que puede ser un reproductor de DVD, un descodificador, un teléfono celular o similares, dotado de una CPU y configurado para realizar procesamiento y control basándose en software. Tal como se muestra en la figura 14, un ordenador 30 está dotado de un dispositivo 12 de lectura tal como una unidad de disquete, una unidad de CD-ROM o una unidad de DVD, una memoria 14 de trabajo (RAM) en la que reside un sistema operativo, una memoria 16 que almacena un programa almacenado en un medio 10 de grabación, un dispositivo 18 de monitor tal como un dispositivo de visualización, un ratón 20 y un teclado 22 como dispositivos de entrada, un dispositivo 24 de comunicación para la transmisión/recepción de datos y otros, y una CPU 26 para controlar la ejecución del programa. Cuando el medio 10 de grabación se pone en el dispositivo 12 de lectura, el ordenador 30 pasa a ser accesible para el programa P100 de codificación predictiva de imágenes o el programa P200 de decodificación predictiva de imágenes almacenado en el medio 10 de grabación, a través del dispositivo 12 de lectura, y pasa a ser capaz de funcionar como el dispositivo 100 de codificación predictiva de imágenes o el dispositivo 200 de decodificación predictiva de imágenes, basándose en el programa P100 de codificación predictiva de imágenes o el programa P200 de decodificación predictiva de imágenes.

Tal como se muestra en la figura 15, el programa de codificación predictiva de imágenes y el programa de decodificación predictiva de imágenes pueden ser los proporcionados en forma de señal 40 de datos de ordenador superpuesta sobre una onda portadora, a través de una red. En este caso, el ordenador 30 puede guardar el programa de codificación predictiva de imágenes o el programa de decodificación predictiva de imágenes recibido por el dispositivo 24 de comunicación, en la memoria 16 y ejecutar el programa de codificación predictiva de imágenes o el programa de decodificación predictiva de imágenes.

Las diversas realizaciones se describieron anteriormente, pero debe observarse que la presente invención puede incluir además modificaciones tal como se describe a continuación.

(Candidatos a información de movimiento)

En la realización anterior la información de movimiento está compuesta por el vector de movimiento, la identificación de lista de imágenes de referencia (List0 y List1 en la figura 5) y el índice de referencia (ref_idx en la figura 5), pero la información de movimiento puede configurarse sustituyendo la identificación de lista de imágenes de referencia y el índice de referencia con un número de trama. Un motivo para ello es que usando los números de trama puede lograrse el mismo resultado y efecto que en la realización descrita anteriormente que usa la información de movimiento asociada con bloques adyacentes.

(Restricciones con respecto a la información de movimiento bidireccional candidata)

En la realización anterior la unidad de derivación de información de movimiento usó todas las combinaciones de información de movimiento candidata como información de movimiento bidireccional candidata, pero sólo los conjuntos de información de movimiento que satisfagan las siguientes condiciones pueden adoptarse como información de movimiento bidireccional candidata.

1) Sólo los bloques inmediatamente superior e inmediatamente izquierdo con respecto al bloque objetivo.

2) Dos fragmentos de información de movimiento para indicar la misma imagen de referencia.

3) Dos vectores de movimiento que no son idénticos pero tienen valores cercanos (cuya diferencia de valores absolutos es menor que un determinado valor). Concretamente, el vector de movimiento (MVXa, MVYa) del bloque inmediatamente superior y el vector de movimiento (MVXb, MVYb) del bloque inmediatamente izquierdo satisfacen las dos siguientes relaciones:

(|MVXa - MVXb| != 0)||(|MVYa - MVYb| != 0); y

(|MVXa - MVXb| <= N) && (|MVYa - MVYb| <= N) (donde N es un valor pequeño).

Si no hay información de movimiento bidireccional candidata que satisfaga las condiciones, puede usarse el otro procedimiento de predicción sin transmisión de la información de indicación.

El número de la información de movimiento bidireccional candidata puede designarse en unidades de trama o en unidades de bloque y la información para especificar el número designado puede incluirse en datos comprimidos. Además, la información para indicar tal aplicación de las restricciones con respecto a la información de movimiento bidireccional candidata puede codificarse en unidades de trama.

(Identificación de información de indicación)

Al determinar la identificación de la información de indicación, un orden de prioridad del bloque (401) inmediatamente izquierdo y el bloque (402) inmediatamente superior puede determinarse usando la información de movimiento del bloque (404) superior derecho (en la figura 8) con respecto al bloque (400) objetivo (en la figura 8). Si el vector de movimiento del bloque inmediatamente superior (MVXa, MVYa), el vector de movimiento del bloque inmediatamente izquierdo (MVXb, MVYb) y el vector de movimiento del bloque superior izquierdo (MVXc, MVYc) satisfacen la relación de |MVXa - MVXc| |MVYa - MVYc| < |MVXb - MVXc| |MVYb - MVYc|, la información de movimiento del bloque inmediatamente izquierdo recibe una identificación con un recuento de bits menor. Si no se satisface la relación, la información de movimiento del bloque inmediatamente superior recibe una identificación con un recuento de bits menor. Cuando se otorga una prioridad más alta a la información de movimiento del bloque adyacente que se supone que tiene una correlación más alta con el bloque objetivo de esta manera, puede reducirse el recuento de bits de la información de indicación.

(Derivación y selección de vector de movimiento candidato)

En la realización anterior la derivación y la selección de vector de movimiento candidato se llevan a cabo para las componentes horizontal y vertical del vector de movimiento de manera conjunta, pero la derivación y la selección de vector de movimiento candidato pueden realizarse de manera individual para la componente horizontal y la componente vertical del vector de movimiento. En la realización anterior se definió un único vector de movimiento de un bloque adyacente como vector de movimiento candidato, pero también es posible definir como vector de movimiento candidato un promedio de dos vectores de movimiento o un vector de movimiento ajustado a escala según la distancia en la dirección temporal entre imágenes (por ejemplo, cada componente de vector se duplica cuando el vector de movimiento con respecto al objetivo de la imagen 504 en (A) de la figura 5 se convierte en el vector de movimiento con respecto al objetivo de la imagen 503).

(Tipo de predicción)

En la realización anterior el tipo de predicción para ambos de los dos bloques adyacentes es la predicción bipredictiva, pero la presente invención también puede aplicarse a casos en los que uno de ellos es la predicción hacia adelante o hacia atrás. En tales casos, se derivan hasta tres fragmentos de información de predicción bipredictiva candidata. En estos casos, pueden derivarse patrones de combinación de dos fragmentos de información de movimiento en un número igual al de los patrones descritos a continuación, a partir de bloques adyacentes. Concretamente, los patrones de combinación son de la siguiente manera:

(1) 1 patrón: en casos en los que se adoptan dos fragmentos de información de movimiento del bloque (402) inmediatamente superior o el bloque (401) inmediatamente izquierdo;

(2) 1 patrón: en casos en los que se emplean un fragmento de información de movimiento del bloque (402) inmediatamente superior y un fragmento de información de movimiento del bloque (401) inmediatamente izquierdo y en los que las listas de imágenes de referencia acerca de los dos fragmentos de información de movimiento son diferentes;

(3) 1 patrón: en casos en los que se emplean un fragmento de información de movimiento del bloque (402) inmediatamente superior y un fragmento de información de movimiento del bloque (401) inmediatamente izquierdo y en los que las listas de imágenes de referencia acerca de los dos fragmentos de información de movimiento son idénticas.

Además, ambos de los dos bloques adyacentes pueden ser la predicción hacia adelante o hacia atrás, o uno de ellos puede ser la predicción hacia adelante y el otro la predicción hacia atrás.

(Número de bloques adyacentes)

No hay restricciones particulares con respecto al número de bloques adyacentes aplicables a la predicción del bloque objetivo. Tal como en (B) de la figura 7, pueden usarse tres bloques 401 a 403 como bloques adyacentes. También es posible usar información de movimiento asociada con un bloque de una trama anterior. Si los bloques (401-405) adyacentes se dividen adicionalmente tal como se muestra en la figura 8, la información de movimiento asociada con tales bloques más pequeños puede incluirse en la información de movimiento candidata. También es posible usar información de movimiento de un bloque que no es contiguo al bloque objetivo.

(Predicción N-predictiva)

En la realización anterior el método de predicción del bloque objetivo realizado usando la información de movimiento asociada con los bloques adyacentes es la predicción bipredictiva, pero el método de predicción no tiene que limitarse a la misma, y puede ser una predicción unipredictiva o una predicción tripredictiva. En este caso, la etapa S310 en la figura 3 puede configurarse para derivar información de predicción N-predictiva candidata y seleccionar una a partir de la misma. En ese caso pueden almacenarse N fragmentos de información de movimiento, pero en el caso en el que N es tres o más, la información de movimiento que va a almacenarse puede limitarse a dos, por los índices de referencia o los valores de los vectores de movimiento.

(Unidad de transformada y unidad de transformada inversa)

El procedimiento de transformada de la señal residual puede llevarse a cabo en un tamaño de bloque fijo o el procedimiento de transformada puede llevarse a cabo dividiendo adicionalmente la región objetivo según una región parcial.

(Señal de color)

En la descripción de la realización anterior no hay ninguna descripción particular acerca del formato de color, pero el procedimiento de generación de señal predicha puede llevarse a cabo de manera individual a partir de una señal de luminancia, para una señal de color o una señal de diferencia de color. El procesamiento también puede llevarse a cabo de manera sincronizada con el procesamiento de la señal de luminancia.

La presente invención se describió anteriormente en detalle basándose en algunas realizaciones de la misma. Sin embargo, debe observarse que la presente invención no se limita en modo alguno a las realizaciones anteriores. Lista de signos de referencia

100 dispositivo de codificación predictiva de imágenes; 101 terminal de entrada; 102 unidad de división en bloques; 103 unidad de generación de señal predicha; 104 memoria de tramas; 105 unidad de resta; 106 unidad de transformada; 107 unidad de cuantificación; 108 unidad de cuantificación inversa; 109 unidad de transformada inversa; 110 unidad de suma; 111 unidad de codificación de coeficientes de transformada cuantificados; 112 terminal de salida; 113 memoria de información de predicción; 114 unidad de codificación de información de predicción; 121 unidad de derivación de información de movimiento; 122 unidad de selección de información de predicción de movimiento; 123 unidad de compensación de movimiento; 201 terminal de entrada; 202 unidad de análisis de datos; 203 unidad de cuantificación inversa; 204 unidad de transformada inversa; 205 unidad de suma; 206 terminal de salida; 207 unidad de decodificación de coeficientes de transformada cuantificados; 208 unidad de decodificación de información de predicción; 209 unidad de determinación de información de movimiento.

Claims

REIVINDICACIONES

Dispositivo de decodificación predictiva de imágenes para generar una señal predicha de una región objetivo, comprendiendo el dispositivo:

medios (202) de análisis de datos adaptados para extraer, a partir de datos comprimidos, datos codificados de información de indicación de la región objetivo y datos codificados de una señal residual de la región objetivo, identificando los datos codificados de información de indicación un conjunto de información de movimiento incluyendo dos fragmentos de información de movimiento asociados con regiones adyacentes, adyacentes a la región objetivo, incluyendo cada uno de los dos fragmentos de información de movimiento un número de trama y un vector de movimiento, identificándose el número de trama por una identificación de lista de imágenes de referencia y un índice de imágenes de referencia;

medios (208) de decodificación de información de predicción adaptados para decodificar los datos codificados de información de indicación para restaurar la información de indicación;

medios (121) de derivación de información de movimiento adaptados para derivar un conjunto de conjuntos de información de movimiento candidata, comprendiendo cada conjunto de información de movimiento dos fragmentos de información de movimiento para decodificación bipredictiva, en el que el conjunto de conjuntos información de movimiento candidata comprende todas las combinaciones por pares posibles de información de movimiento seleccionada de una pluralidad de regiones adyacentes de la región objetivo, en el que en cada uno de los conjuntos de información de movimiento candidata entre los dos fragmentos de información de movimiento y los números de trama respectivos son diferentes entre sí, o los vectores de movimiento respectivos son diferentes entre sí;

medios (209) de determinación de información de movimiento adaptados para seleccionar, de los conjuntos de información de movimiento candidata, un conjunto de información de movimiento que va a usarse en la generación de la señal predicha de la región objetivo basándose en la información de indicación;

medios (216) de compensación de movimiento adaptados para generar la señal predicha de la región objetivo combinando dos señales obtenidas a partir de una o más imágenes reconstruidas almacenadas en la memoria basándose en los dos fragmentos de información de movimiento que se identifican mediante el conjunto de información de movimiento seleccionado en los medios (209) de determinación de información de movimiento;

medios (104) de grabación de información de movimiento adaptados para almacenar información de movimiento utilizada para la generación de la señal predicha de la región objetivo en la memoria;

medios (203, 204, 207) de restauración de señal residual adaptados para restaurar una señal residual de la región objetivo a partir de los datos codificados de la señal residual;

medios (205, 104) de grabación de imagen adaptados para reconstruir una señal de píxel de la región objetivo basándose en la señal predicha y la señal residual restaurada, y para almacenar la señal de píxel reconstruida como una parte de una imagen reconstruida.

Método de decodificación predictiva de imágenes para generar una señal predicha de una región objetivo, comprendiendo el método:

extraer a partir de datos comprimidos, datos codificados de información de indicación, de la región objetivo y datos codificados de una señal residual de la región objetivo, identificando los datos codificados de información de indicación un conjunto de información de movimiento que incluye dos fragmentos de información de movimiento asociados con regiones adyacentes, adyacentes a la región objetivo, incluyendo cada uno de los dos fragmentos de información de movimiento un número de trama y un vector de movimiento, identificándose el número de trama mediante una identificación de lista de imágenes de referencia y un índice de imagen de referencia (S202);

decodificar los datos codificados de información de indicación para restaurar la información (S202) de indicación;

derivar un conjunto de conjuntos de información de movimiento candidata, comprendiendo cada conjunto de información de movimiento dos fragmentos de información de movimiento para codificación bipredictiva, en la que el conjunto de conjuntos de información de movimiento candidata comprende todas las combinaciones por pares posibles de información de movimiento seleccionada de una pluralidad de regiones adyacentes de la región objetivo, en el que en cada uno de los conjuntos de información de movimiento candidata entre los dos fragmentos de información de movimiento y los números de trama respectivos son diferentes entre sí, o los vectores (S300) de movimiento respectivos son diferentes entre sí; seleccionar, a partir de los conjuntos de información de movimiento candidata, un conjunto de información de movimiento que va a usarse en la generación de la señal predicha de la región objetivo basándose en la información (S300) de indicación;

generar la señal predicha de la región objetivo combinando dos señales obtenidas a partir de una o más imágenes reconstruidas almacenadas en la memoria basándose en los dos fragmentos de información de movimiento que se identifican mediante el conjunto (S207) de información de movimiento seleccionado; almacenar información de movimiento utilizada para la generación de la señal predicha de la región objetivo en la memoria (207);

restaurar una señal residual de la región objetivo a partir de los datos codificados de la señal (S208) residual;

reconstruir una señal de píxel de la región objetivo basándose en la señal predicha y la señal (S209) residual restaurada; y

almacenar la señal de píxel reconstruida, como parte de una imagen (S209) reconstruida,

Programa de decodificación predictiva de imágenes para generar una señal predicha de una región objetivo que comprende instrucciones que, cuando se ejecutan por un ordenador, hacen que el ordenador funcione como:

extraer de datos comprimidos, datos codificados de información de indicación de la región objetivo y datos codificados de una señal residual de la región objetivo, identificando los datos codificados de información de indicación un conjunto de información de movimiento que incluye dos fragmentos de información de movimiento con regiones adyacentes, adyacentes a la región objetivo, incluyendo cada uno de los dos fragmentos de información de movimiento un número de trama y un vector de movimiento, identificándose el número de trama mediante una identificación de lista de imágenes de referencia y un índice de imagen de referencia (S202);

decodificar los datos codificados de información de indicación para restaurar la información (S202) de indicación;

derivar un conjunto de conjuntos de información de movimiento candidata, comprendiendo cada conjunto de información de movimiento dos fragmentos de información de movimiento para codificación bipredictiva, en el que el conjunto de conjuntos de información de movimiento candidata comprende todas las combinaciones por pares posibles de información de movimiento seleccionada de una pluralidad de regiones adyacentes de la región objetivo, en el que cada uno de los conjuntos de información de movimiento candidata entre los dos fragmentos de información de movimiento y los números de trama respectivos son diferentes entre sí, o los vectores (S300) de movimiento respectivos son diferentes entre sí; seleccionar, a partir de los conjuntos de información de movimiento candidata, un conjunto de información de movimiento que va a usarse en la generación de la señal predicha de la región objetivo basándose en la información (S300) de indicación;

generar la señal predicha de la región objetivo combinando dos señales obtenidas a partir de una o más imágenes reconstruidas almacenadas en la memoria basándose en los dos fragmentos de información de movimiento que se identifican mediante en el conjunto (S207) de información de movimiento seleccionado; almacenar información de movimiento utilizada para la generación de la señal predicha de la región objetivo en la memoria (207);

restaurar una señal residual de la región objetivo a partir de los datos codificados de la señal (208) residual; reconstruir una señal de píxel de la región objetivo basándose en la señal predicha y la señal (S209) residual restaurada, y

almacenar la señal de píxel reconstruida como parte de una imagen reconstruida.