ES2301828T3

ES2301828T3 - Estimacion de movimiento con prediccion del peso.

Info

Publication number: ES2301828T3
Application number: ES03764471T
Authority: ES
Inventors: Jill Macdonald Boyce; Alan Jay Stein
Original assignee: Thomson Licensing SAS
Current assignee: Thomson Licensing SAS
Priority date: 2002-07-15
Filing date: 2003-07-11
Publication date: 2008-07-01
Anticipated expiration: 2023-07-11
Also published as: JP2005533464A; AU2003259110A1; WO2004008642A3; US20040008782A1; AU2003259110A8; BR0305517A; US7376186B2; MY137057A; EP1540824A2; MXPA05000672A; CN100450185C; DE60319239D1; JP4533841B2; DE60319239T2; EP1540824B1; BRPI0305517B1; CN1669330A; WO2004008642A2; TWI234402B; TW200412799A

Abstract

Un codificador de vídeo (300) para codificar datos de señales de vídeo destinados a un bloque de imágenes relacionado con al menos una determinada imagen de referencia, caracterizándose por el hecho de que el codificador comprende: un selector de factores de ponderación de imágenes de referencia (372) que tiene una salida indicativa de un factor de ponderación correspondiente al menos a dicha determinada imagen de referencia; un aplicador de factores de ponderación (374) en comunicación de señal con el selector de factores de ponderación de imágenes de referencia para aportar una versión ponderada de al menos dicha determinada imagen de referencia; y un estimador de movimientos (380) en comunicación de señal con el aplicador de factores de ponderación para aportar vectores de movimientos correspondientes a la versión ponderada de al menos dicha determinada imagen de referencia.

Description

Estimación de movimiento con predicción del peso.

Ámbito del invento

El presente invento tiene por objeto los codificadores y descodificadores de vídeo, y en particular la estimación de movimientos integrados con predicción del peso en codificadores y descodificadores de señal de vídeo.

Antecedentes del invento

Los datos de vídeo suelen tratarse y transferirse en forma de secuencias de bits. Gran parte de la eficacia compresiva de los codificadores y descodificadores ("CODEC") de compresión de señal de vídeo típicos se obtiene formando una predicción de una imagen de referencia correspondiente a la imagen que vaya a codificarse, y codificando la diferencia entre la imagen real y la predicción. El grado de proximidad logrado por la correlación entre la predicción y la imagen real es inversamente proporcional al número de bits necesarios para comprimir esa imagen, con el consiguiente incremento de la eficacia del proceso. Por tanto, es algo deseable para conseguir la mejor predicción posible de la imagen de referencia.

En muchas normas de compresión de señales de vídeo, entre ellas las MPEG-1, MPEG-2 y MPEG-4 del Moving Picture Experts Group (MPEG), se utiliza una versión con compensación de movimientos de una imagen de referencia anterior como predicción de la imagen real, y sólo se codifica la diferencia entre la imagen real y la predicción. Cuando se utiliza una predicción de imagen única (imagen "P"), la imagen de referencia no se escala al formarse la predicción con compensación de movimientos. Si se utilizan predicciones de imágenes bidireccionales (imágenes "B"), se forman predicciones intermedias a partir de dos imágenes diferentes y seguidamente se calcula el promedio conjunto de las dos predicciones intermedias, utilizando factores de ponderación iguales de (½, ½) para cada una, a fin de formar una sola predicción promedio. En estas normas MPEG, las dos imágenes de referencia siempre son una procedente de la dirección de avance y otra de la de retroceso para las imágenes B.

En US-5.436.665 se describe un dispositivo codificador que contiene un predictor adaptado para producir diversas señales predictivas a partir de una señal de imagen de baja resolución y de una señal de imagen de alta resolución; formándose la imagen de baja resolución mediante la reducción de la frecuencia de muestreo de la imagen de alta resolución y utilizándose la señal predictiva que minimiza un error de predicción para producir los datos codificados por el dispositivo codificador durante la predicción interfotogramas.

US-6.122.318 revela un dispositivo codificador de vídeo que codifica una señal de mapa alfanumérico como información subsidiaria relacionada con una imagen que contiene un objeto y un fondo, expresando la señal de mapa alfanumérico la forma de un objeto y su posición en un fotograma. El dispositivo codificador de vídeo codifica la señal de mapa alfanumérico utilizando codificación de direcciones relativas, y codifica un símbolo que representa una posición del siguiente píxel de cambio a codificarse respecto a un píxel de cambio de referencia mediante el uso de una tabla de codificación de longitud variable como el píxel de cambio ya codificado.

US-5.488.482 describe una grabadora de cintas de vídeo que registra y reproduce las señales de vídeo y sonoras en formato digital. Esta grabadora de cintas de vídeo contiene un dispositivo codificador de los datos digitales que, además de mejorar la compresión de los datos, aporta una gran calidad de imagen, con la consiguiente reducción del consumo de cinta de grabación, y hace posible una grabadora de cintas de vídeo compacta y liviana.

US 6 108 040 describe un método para detectar datos del vector de movimientos indicador del movimiento de una zona parcial de una imagen recibida desde cualquier zona de una imagen de referencia, calculándose como primer valor de la evaluación una primera distorsión entre una zona parcial constituida por campos de la imagen recibida y una zona parcial constituida por campos de la imagen de referencia; detectándose una posición de la zona parcial constituida por los campos de la imagen de referencia en la cual el primer valor de la evaluación se convierte en el valor mínimo detectado; configurándose una ventana de búsqueda en un fotograma de la imagen de referencia, basándose en una posición detectada de la zona parcial constituida por los campos de la imagen de referencia previamente detectada; calculándose como segundo valor de la evaluación una segunda distorsión entre una zona parcial constituida por un fotograma en la ventana de búsqueda configurada y una zona parcial constituida por un fotograma de la imagen recibida, y detectándose una posición de la zona parcial constituida por el fotograma de la imagen de referencia en la que el segundo valor de la evaluación se convierte en el valor mínimo.

Por tanto, los vectores de fotogramas pueden detectarse partiendo de las posiciones de detección de los vectores del campo, de manera que la cantidad de cálculos necesarios para recuperar vectores de fotogramas pueda reducirse notablemente sin degradar la precisión de la detección de los vectores de fotogramas.

Resumen del invento

Éstos y otros inconvenientes y desventajas de la tecnología actual se abordan con el presente invento, consistente en un codificador de vídeo que codifica datos de señales de vídeo para un bloque de imágenes relativo como mínimo a una determinada imagen de referencia según la reivindicación 1 y en un método de codificación de datos de señales de vídeo para un bloque de imágenes según la reivindicación 10.

Otras características del invento se describen en las reivindicaciones correspondientes.

Se aportan un codificador y un descodificador de vídeo que codifican y descodifican datos de señales de vídeo para un bloque de imágenes y un determinado índice de imágenes de referencia para predecir el bloque de imágenes, comprendiendo el codificador un selector de factores de ponderación de imágenes de referencia que tiene una salida indicativa de un factor de ponderación correspondiente al índice determinado de imágenes de referencia, un multiplicador en comunicación de señal con el selector de factores de ponderación de imágenes de referencia para aportar una versión ponderada de la imagen de referencia, y un estimador de movimientos en comunicación de señal con el multiplicador para aportar vectores de movimiento correspondientes a la versión ponderada de la imagen de referencia; y comprendiendo el correspondiente descodificador una unidad de factores de ponderación de imágenes de referencia con una salida para determinar un factor de ponderación correspondiente al índice determinado de imágenes de referencia.

Un método correspondiente codificador de datos de vídeo para un bloque de imágenes comprende la recepción de un bloque de imágenes sustancialmente sin comprimir, la asignación de un factor de ponderación para el bloque de imágenes correspondiente a una determinada imagen de referencia, la ponderación de la imagen de referencia por el factor de ponderación, el cálculo de los vectores del movimiento correspondiente a la diferencia entre el bloque de imágenes y la imagen de referencia ponderada, la compensación de movimientos de la imagen de referencia ponderada en correspondencia con los vectores del movimiento, el refinamiento de la selección del factor de ponderación en respuesta a la imagen de referencia ponderada y de movimientos compensados, la compensación de los movimientos de la imagen de referencia sin ponderar original en correspondencia con los vectores del movimiento, la multiplicación de la imagen de referencia original y de movimientos compensados por el factor de ponderación asignado para formar una imagen de referencia de movimientos compensados y ponderada, la sustracción de la imagen de referencia de movimientos compensados y ponderada del bloque de imágenes sustancialmente sin comprimir, y la codificación de una señal indicativa de la diferencia entre el bloque de imágenes sustancialmente sin comprimir y la imagen de referencia de movimientos compensados y ponderada.

Éstos y otros aspectos, características y ventajas del presente invento se desprenderán de la siguiente descripción de ejemplos de formas de realización, que debe leerse junto con los dibujos que la acompañan.

Breve descripción de los dibujos

El presente invento incorpora la estimación de movimientos integrados con la predicción de ponderaciones en codificadores y descodificadores de vídeo, según los ejemplos de las figuras siguientes, en las que:

La figura 1 presenta un esquema funcional de un codificador normal de vídeo;

La figura 2 presenta un esquema funcional de un codificador de vídeo con ponderación de las imágenes de referencia;

La figura 3 presenta un esquema funcional de un codificador de vídeo con estimación de movimientos integrados y predicción de ponderaciones según los principios del presente invento;

La figura 4 presenta un esquema funcional de un descodificador normal de vídeo;

La figura 5 presenta un esquema funcional de un descodificador de de vídeo con bipredicción adaptativa;

La figura 6 presenta un diagrama de flujo de un proceso codificador según los principios del presente invento; y

La figura 7 presenta un diagrama de flujo de un proceso descodificador según los principios del presente invento.

Descripción detallada de las formas de realización preferentes

Se aporta un proceso eficaz para la estimación de vectores de movimientos integrados y la selección adaptativa de factores de ponderación de imágenes de referencia. Se utiliza un proceso iterativo consistente en estimar y utilizar un factor de ponderación inicial en el proceso de estimación de movimientos. La estimación del factor de ponderación se refina basándose en los resultados del proceso de estimación de los movimientos. Cuando se utilizan factores de ponderación para codificar, un codificador de vídeo determina tanto los factores de ponderación como los vectores de los movimientos, si bien la mejor opción para cada uno de ellos depende del otro. Normalmente, la estimación de los movimientos es la parte del codificador de compresión de señales de vídeo digitales que requiere más
cálculos.

En algunas secuencias de señales de vídeo, sobre todo si hay desvanecimiento, la imagen real o el bloque de imágenes a codificar presenta una correlación más fuerte con una imagen de referencia modificada por un factor de ponderación que con la propia imagen de referencia. Los CODEC de señales de vídeo sin factores de ponderación aplicados a imágenes de referencia codifican las secuencias de desvanecimiento de manera muy ineficaz.

En la norma de compresión de señales de vídeo Joint Video Team ("JVT") que se propone, cada imagen P puede utilizar múltiples imágenes de referencia para predecir una imagen, pero cada bloque de movimientos individuales o región 8x8 de un macrobloque utiliza únicamente una sola imagen de referencia para la predicción. Además de codificarse y transmitirse los vectores del movimiento, se transmite un índice de imágenes de referencia para cada bloque de movimientos o región 8x8, que indica la imagen de referencia utilizada. Tanto en el codificador como en el descodificador se almacena un conjunto limitado de posibles imágenes de referencia, transmitiéndose el número de imágenes de referencia admisibles.

En la norma JVT, para las imágenes bipredictivas (también llamadas imágenes "B") se forman dos predictores por cada bloque de movimientos o región 8x8, cada uno de los cuales puede proceder de una imagen de referencia distinta, promediándose conjuntamente los dos predictores para formar un único predictor promediado. Para los bloques de movimientos codificados bipredictivamente, ambas imágenes de referencia pueden proceder de la dirección de avance o de la de retroceso, o bien una de la dirección de avance y otra de la de retroceso. Se mantienen dos listas de las imágenes de referencia disponibles que pueden utilizarse para la predicción. Las dos imágenes de referencia se conocen como predictores de la lista 0 y de la lista 1. Se codifica y transmite un índice para cada imagen de referencia, ref_idx_I0 y ref_idx_I1, para las imágenes de referencia de la lista 0 y de la lista 1, respectivamente. Las imágenes Joint Video Team ("JVT") bipredictivas o "B" permiten la ponderación adaptativa entre las dos predicciones; es decir:

Pred = [(PO) * (Pred0)] + [(P1) * (Pred1)] + D,

siendo P0 y P1 los factores de ponderación, Pred0 y Pred1 las predicciones de imágenes de referencia para las listas 0 y 1, respectivamente, y D una compensación.

Se han propuesto dos métodos para indicar los factores de ponderación. En el primero, los factores de ponderación se determinan por las direcciones utilizadas para las imágenes de referencia. Según este método, si el índice ref_idx_I0 es inferior o igual al ref_idx_I1, se utilizan los factores de ponderación de (½, ½); en caso contrario, los factores utilizados son (2, -1).

En el segundo método, se transmite cualquier número de factores de ponderación para cada fragmento. Seguidamente se transmite un índice de factores de ponderación por cada bloque de movimientos o región 8x8 de un macrobloque que utilice la predicción bidireccional. El descodificador utiliza el índice de factores de ponderación recibido para escoger el factor de ponderación apropiado, del conjunto transmitido, a utilizar cuando se descodifique el bloque de movimientos o región 8x8. Por ejemplo, si en la capa de fragmentos se han enviado tres factores de ponderación, éstos corresponderían a los índices de factores de ponderación 0, 1 y 2, respectivamente.

Se apreciará que cualquier diagrama de flujo, diagrama de transición de estado, pseudocódigo y similares representa diversos procesos sustancialmente representables en medios legibles por un ordenador y en consecuencia ejecutables con un ordenador o procesador, aunque dicho ordenador o procesador no se muestre explícitamente.

Las funciones de los diversos elementos presentados en las figuras pueden aportarse mediante el uso de hardware exclusivo, así como de hardware capaz de ejecutar software en asociación con el software apropiado. Cuando las aporta un procesador, dichas funciones pueden aportarse mediante un solo procesador exclusivo, un solo procesador compartido, o una diversidad de procesadores individuales, algunos de los cuales pueden compartirse. Además, el uso explícito del término "procesador" o "controlador" no deberá entenderse referido exclusivamente a hardware capaz de ejecutar software, y podrá incluir implícitamente, sin limitación, hardware de procesadores de señales digitales ("DSP"), memoria fija de lectura ("ROM") para almacenar software, memoria de acceso aleatorio ("RAM") y memoria permanente. También podrán incluirse otros tipos de hardware, tanto convencionales como especiales. De manera similar, los conmutadores presentados en las figuras sólo tienen carácter conceptual. Su función podrá realizarse mediante el uso de lógica de programas, mediante lógica exclusiva, mediante la interacción de control de programas y lógica exclusiva, o incluso manualmente, pudiendo seleccionar el implementador la técnica concreta como se entienda más concretamente por el contexto.

Como se aprecia en la figura 1, un codificador normal de señales de vídeo se indica generalmente por el numeral de referencia 100. Una entrada del codificador 100 se conecta en comunicación de señal con una entrada no inversora de un punto de concurrencia 110. La salida del punto de concurrencia 110 se conecta en comunicación de señal con una función de transformación de bloques 120. La transformación 120 se conecta en comunicación de señal con un cuantizador 130. La salida del cuantizador 130 se conecta en comunicación de señal con un codificador de longitud variable ("VLC") 140, siendo la salida del VLC 140 una salida externamente disponible del codificador 100.

La salida del cuantizador 130 también se conecta en comunicación de señal con un cuantizador inverso 150. El cuantizador inverso 150 se conecta en comunicación de señal con un transformador de bloques inverso 160, conectado a su vez en comunicación de señal con una memoria de imágenes de referencia 170. Una primera salida de la memoria de imágenes de referencia 170 se conecta en comunicación de señal con una primera entrada de un estimador de movimientos 180. La entrada del codificador 100 también se conecta en comunicación de señal con una segunda entrada del estimador de movimientos 180. La salida del estimador de movimientos 180 se conecta en comunicación de señal con una primera entrada de un compensador de movimientos 190. Una segunda salida de la memoria de imágenes de referencia 170 se conecta en comunicación de señal con una segunda entrada del compensador de movimientos 190. La salida del compensador de movimientos 190 se conecta en comunicación de señal con una entrada inversora del punto de concurrencia 110.

Pasando a la figura 2, un codificador de señal de vídeo con ponderación de imágenes de referencia se indica generalmente por el numeral de referencia 200. Una entrada del codificador 200 se conecta en comunicación de señal con una entrada no inversora de un punto de concurrencia 210. La salida del punto de concurrencia 210 se conecta en comunicación de señal con un transformador de bloques 220. El transformador 220 se conecta en comunicación de señal con un cuantizador 230. La salida del cuantizador 230 se conecta en comunicación de señal con un VLC 240, siendo la salida del VLC 240 una salida externamente disponible del codificador 200.

La salida del cuantizador 230 también se conecta en comunicación de señal con un cuantizador inverso 250. El cuantizador inverso 250 se conecta en comunicación de señal con un transformador de bloques inverso 260, conectado a su vez en comunicación de señal con una memoria de imágenes de referencia 270. Una primera salida de la memoria de imágenes de referencia 270 se conecta en comunicación de señal con una primera entrada de un asignador de factores de ponderación de imágenes de referencia 272. La entrada del codificador 200 también se conecta en comunicación de señal con una segunda entrada del asignador de factores de ponderación de imágenes de referencia 272. La salida del asignador de factores de ponderación de imágenes de referencia 272, que indica un factor de ponderación, se conecta en comunicación de señal con una primera entrada de un estimador de movimientos 280. Una segunda salida de la memoria de imágenes de referencia 270 se conecta en comunicación de señal con una segunda entrada del estimador de movimientos 280.

La entrada del codificador 200 también se conecta en comunicación de señal con una tercera entrada del estimador de movimientos 280. La salida del estimador de movimientos 280, que indica vectores de movimientos, se conecta en comunicación de señal con una primera entrada de un compensador de movimientos 290. Una tercera salida de la memoria de imágenes de referencia 270 se conecta en comunicación de señal con una segunda entrada del compensador de movimientos 290. La salida del compensador de movimientos 290, que indica una imagen de referencia con compensación de movimientos, se conecta en comunicación de señal con una primera entrada de un multiplicador 292. La salida del asignador de factores de ponderación de imágenes de referencia 272, que indica un factor de ponderación, se conecta en comunicación de señal con una segunda entrada del multiplicador 292. La salida del multiplicador 292 se conecta en comunicación de señal con una entrada inversora del punto de concurrencia 210.

Pasando a la figura 3, un codificador de señal de vídeo con estimación de movimientos integrados y predicción de ponderaciones se indica generalmente por el numeral de referencia 300. Una entrada del codificador 300 se conecta en comunicación de señal con una entrada no inversora de un punto de concurrencia 310. La salida del punto de concurrencia 310 se conecta en comunicación de señal con un transformador de bloques 320. El transformador 320 se conecta en comunicación de señal con un cuantizador 330. La salida del cuantizador 330 se conecta en comunicación de señal con un VLC 340, siendo la salida del VLC 340 una salida externamente disponible del codificador 300.

La salida del cuantizador 330 también se conecta en comunicación de señal con un cuantizador inverso 350. El cuantizador inverso 350 se conecta en comunicación de señal con un transformador de bloques inverso 360, conectado a su vez en comunicación de señal con una memoria de imágenes de referencia 370. Una primera salida de la memoria de imágenes de referencia 370 se conecta en comunicación de señal con una primera entrada de un selector de factores de ponderación de imágenes de referencia 372. La entrada del codificador 300 también se conecta en comunicación de señal con una segunda entrada del selector de factores de ponderación de imágenes de referencia 372 para aportar la imagen real al selector. La salida del selector de factores de ponderación de imágenes de referencia 372, que indica un factor de ponderación, se conecta en comunicación de señal con una primera entrada de un multiplicador 374. Una segunda entrada del multiplicador 374 se conecta en comunicación de señal con la salida de imágenes de referencia de la memoria de imágenes de referencia 370. Aunque se aluda simplemente a un multiplicador 374, deberá tenerse en cuenta que pueden construirse otros tipos de aplicadores de factores de ponderación distintos de un multiplicador, como apreciarán los conocedores de estas tecnologías, quedando todos esos tipos comprendidos en el espíritu y el alcance del presente invento.

La salida del multiplicador 374 se conecta en comunicación de señal con una memoria de imágenes de referencia ponderadas 376. La salida de la memoria de imágenes de referencia ponderadas 376 se conecta en comunicación de señal con una primera entrada de un estimador de movimientos 380 para aportar una imagen de referencia ponderada. La salida del estimador de movimientos 380 se conecta en comunicación de señal con un primer compensador de movimientos 382 para aportar vectores de movimientos. La salida del estimador de movimientos 380 también se conecta en comunicación de señal con una primera entrada de un segundo compensador de movimientos 390. Una segunda salida de la memoria de imágenes de referencia ponderadas 376 se conecta en comunicación de señal con una segunda entrada del primer compensador de movimientos 382.

La salida del primer compensador de movimientos 382, que indica una imagen de referencia con compensación de movimientos ponderada, se conecta en comunicación de señal con una primera entrada de un generador de diferencias absolutas 384. La entrada del codificador 300, que es la imagen real, también se conecta en comunicación de señal con una segunda entrada del generador de diferencias absolutas 384. La salida de la función de diferencias absolutas 384 se conecta en comunicación de señal con una tercera entrada del selector de factores de ponderación de imágenes de referencia 372.

Una tercera salida de la memoria de imágenes de referencia 370 se conecta en comunicación de señal con una segunda entrada del segundo compensador de movimientos 390. La salida del segundo compensador de movimientos 390, que indica una imagen de referencia con compensación de movimientos, se conecta en comunicación de señal con una primera entrada de un multiplicador 392. La salida del selector de factores de ponderación de imágenes de referencia 372, que indica un factor de ponderación, se conecta en comunicación de señal con una segunda entrada del multiplicador 392. La salida del multiplicador 392 se conecta en comunicación de señal con una entrada inversora del punto de concurrencia 310.

Como se aprecia en la figura 4, un descodificador normal de señales de vídeo se indica generalmente por el numeral de referencia 400. El descodificador de señales de vídeo 400 comprende un descodificador de longitud variable ("VLD") 410 conectado en comunicación de señal con un cuantizador inverso 420. El cuantizador inverso 420 se conecta en comunicación de señal con un transformador inverso 430. El transformador inverso 430 se conecta en comunicación de señal con un primer terminal de entrada de un punto sumador o de concurrencia 440, aportando la salida del punto de concurrencia 440 la salida del descodificador de vídeo 400. La salida del punto de concurrencia 440 se conecta en comunicación de señal con una memoria de imágenes de referencia 450. La memoria de imágenes de referencia 450 se conecta en comunicación de señal con un compensador de movimientos 460, que se conecta en comunicación de señal con un segundo terminal de entrada del punto de concurrencia 440.

Pasando a la figura 5, un descodificador de vídeo con bipredicción adaptativa se indica generalmente por el numeral de referencia 500. El descodificador de vídeo 500 comprende un VLD 510 conectado en comunicación de señal con un cuantizador inverso 520. El cuantizador inverso 520 se conecta en comunicación de señal con un transformador inverso 530. El transformador inverso 530 se conecta en comunicación de señal con un primer terminal de entrada de un punto de concurrencia 540, aportando la salida del punto de concurrencia 540 la salida del descodificador de vídeo 500. La salida del punto de concurrencia 540 se conecta en comunicación de señal con una memoria de imágenes de referencia 550. La memoria de imágenes de referencia 550 se conecta en comunicación de señal con un compensador de movimientos 560, que se conecta en comunicación de señal con una primera entrada de un multiplicador 570.

El VLD 510 también se conecta en comunicación de señal con una búsqueda de factores de ponderación de imágenes de referencia 580 para aportar un índice de coeficientes de bipredicción adaptativa ("ABP") a la búsqueda 580. Una primera salida de la búsqueda 580 es para aportar un factor de ponderación, y se conecta en comunicación de señal con una segunda entrada del multiplicador 570. La salida del multiplicador 570 se conecta en comunicación de señal con una primera entrada de un punto de concurrencia 590. Una segunda salida de la búsqueda 580 es para aportar una compensación, y se conecta en comunicación de señal con una segunda entrada del punto de concurrencia 590. La salida del punto de concurrencia 590 se conecta en comunicación de señal con un segundo terminal de entrada del punto de concurrencia 540.

Pasando a la figura 6, un proceso de determinación de factores de ponderación y vectores de movimientos se indica generalmente por el numeral de referencia 600. Aquí, un bloque de funciones 610 obtiene la estimación del factor de ponderación inicial para la imagen real o el bloque de imágenes ("cur") y la imagen de referencia ("ref"), calculando el factor de ponderación "w" = avg(cur)/avg(ref). El bloque 610 pasa el control a un bloque de decisiones 612 que determina si el factor de ponderación w es mayor que un valor de umbral T1 y menor que un valor de umbral T2. Si w queda entre T1 y T2, el control se pasa a un bloque de retorno 614 y w = 1 se utiliza como factor de ponderación inicial. Si w no queda entre T1 y T2, el control se pasa a un bloque de funciones 616 que aplica el factor de ponderación w a la imagen de referencia para formar una imagen de referencia ponderada wref. El bloque 616 pasa el control a un bloque de funciones 618 para realizar la estimación de los movimientos mediante la obtención de los vectores de movimientos ("MV") utilizando la imagen de referencia ponderada wref. El bloque 618 pasa el control a un bloque de funciones 620 que forma una imagen de referencia ponderada y de movimientos compensados, mcwref, aplicando para ello los MV a la wref. El bloque 620 pasa el control a un bloque de funciones 622 que calcula una medida de la diferencia, diff, siendo diff igual al valor absoluto de la suma de las diferencias en píxeles entre cur y wmcref.

El bloque 622 pasa el control a un bloque de decisiones 624 que determina si diff es mayor que la mejor diff anterior. Si diff es mayor que la mejor diff anterior, el control se pasa a un bloque de retorno 626, que utiliza la mejor diff anterior. Si diff no es mayor que la mejor diff anterior, el control se pasa a un bloque de decisiones 628 que determina si diff es menor que un valor de umbral T. Si diff es menor que el valor de umbral T, el control se pasa a un bloque de retorno 634 que utiliza las estimaciones actuales. Si diff no es menor que el valor de umbral T, el control se pasa a un bloque de funciones 630 que forma una imagen de referencia con compensación de movimientos, mcref, aplicando para ello los MV a ref. El bloque 630 pasa el control a un bloque de funciones 632 que refina la estimación del factor de ponderación y establece la igualdad entre w y avg(cur)/avg(mcref). El bloque 632 devuelve el control al bloque de funciones 616 para continuar el proceso. En consecuencia, la decisión de seguir refinando el factor de ponderación se basa en la comparación de una medida de la diferencia con un valor de umbral o con una tolerancia.

Pasando a la figura 7, un proceso ilustrativo de descodificación de datos de señales de vídeo para un bloque de imágenes se indica generalmente por el numeral de referencia 700. Este proceso comprende un bloque de inicio 710 que pasa el control a un bloque de entrada 712. El bloque de entrada 712 recibe los datos comprimidos del bloque de imágenes y pasa el control a un bloque de entrada 714. El bloque de entrada 714 recibe al menos un índice de imágenes de referencia con los datos para el bloque de imágenes, correspondiendo cada índice de imágenes de referencia a una imagen de referencia determinada. El bloque de entrada 714 pasa el control a un bloque de funciones 716, que determina un factor de ponderación correspondiente a cada índice de imágenes de referencia recibido, y pasa el control a un bloque de funciones opcionales 717. El bloque de funciones opcionales 717 determina una compensación correspondiente a cada índice de imágenes de referencia recibido, y pasa el control a un bloque de funciones 718. El bloque de funciones 718 recupera una imagen de referencia correspondiente a cada índice de imágenes de referencia recibido, y pasa el control a un bloque de funciones 720. A su vez, el bloque de funciones 720 compensa con movimientos la imagen de referencia recuperada y pasa el control a un bloque de funciones 722. El bloque de funciones 722 multiplica la imagen de referencia con compensación de movimientos por el factor de ponderación correspondiente y pasa el control a un bloque de funciones opcionales 723. El bloque de funciones opcionales 723 añade la imagen de referencia con compensación de movimientos a la compensación correspondiente y pasa el control a un bloque de funciones 724. A su vez, el bloque de funciones 724 forma una imagen de referencia con compensación de movimientos y ponderada, y pasa el control a un bloque final 726.

En la presente forma de realización ilustrativa, por cada fragmento o imagen que se codifique, se asocia un factor de ponderación a cada imagen de referencia permisible, respecto a la cual los bloques de la imagen real puedan codificarse. Cuando cada bloque individual de la imagen real se codifica o descodifica, el o los factores de ponderación y la o las compensaciones que correspondan a sus índices de imágenes de referencia se aplican a la predicción de referencia para formar un predictor de ponderaciones. Todos los bloques del fragmento que se codifiquen respecto a la misma imagen de referencia aplican el mismo factor de ponderación a la predicción de la imagen de referencia.

La conveniencia de utilizar, o no, la ponderación adaptativa al codificar una imagen puede indicarse en el conjunto de parámetros de imágenes o en el conjunto de parámetros de secuencias, o en el encabezamiento de la imagen o del fragmento. Para cada fragmento o imagen que utilice la ponderación adaptativa, puede transmitirse un factor de ponderación por cada imagen de referencia permisible que pueda utilizarse para codificar este fragmento o esta imagen. El número de imágenes de referencia permisibles se transmite en el encabezamiento del fragmento. Por ejemplo, si pueden utilizarse tres imágenes de referencia para codificar el fragmento real, se transmiten hasta tres factores de ponderación, y se les asocia a la imagen de referencia con el mismo índice.

Si no se transmite ningún factor de ponderación, se utilizan ponderaciones predeterminadas. En una forma de realización del presente invento, se utilizan ponderaciones predeterminadas de (½, ½) cuando no se transmiten factores de ponderación. Los factores de ponderación pueden transmitirse utilizando códigos de longitud variable o fija.

A diferencia de los sistemas típicos, cada factor de ponderación transmitido con cada fragmento, bloque o imagen corresponde a un determinado índice de imágenes de referencia. Anteriormente, ningún conjunto de factores de ponderación transmitidos con cada fragmento o imagen se asociaba a ninguna imagen de referencia determinada. En lugar de ello, se transmitía un índice de ponderación de bipredicciones adaptativas por cada bloque de movimientos o región 8x8 a fin de seleccionar el factor de ponderación procedente del conjunto transmitido que debía aplicarse para ese bloque de movimientos o para esa región 8x8.

En la actual forma de realización del presente invento, el índice de factores de ponderación para cada bloque de movimientos o región 8x8 no se transmite explícitamente. En lugar de ello, se utiliza el factor de ponderación asociado al índice de imágenes de referencia transmitido. Esto reduce espectacularmente la cantidad de sobrecarga en la secuencia de bits transmitida para permitir la ponderación adaptativa de las imágenes de referencia.

Este sistema y esta técnica pueden aplicarse a imágenes "P" predictivas, que se codifican con un solo predictor, o a imágenes "B" bipredictivas, que se codifican con dos predictores. Los procesos de descodificación, presentes tanto en el codificador como en los descodificadores, se describen más adelante para los casos de las imágenes P y B. Otra posibilidad consiste en aplicar esta técnica a sistemas de codificación que utilicen conceptos similares a los de las imágenes I, B y P.

Los mismos factores de ponderación pueden utilizarse para la predicción unidireccional en imágenes B y para la predicción bidireccional en imágenes B. Cuando se utiliza un solo predictor para un macrobloque, en imágenes P o para la predicción unidireccional en imágenes B, se transmite un solo índice de imágenes de referencia para el bloque. Cuando la compensación de movimientos que forma parte del proceso de descodificación ha producido un predictor, el factor de ponderación se aplica al predictor. Seguidamente, se añade el predictor ponderado al resto codificado y se procede al recorte de la suma, para formar la imagen descodificada. Para el uso en bloques de imágenes P o en bloques de imágenes B que sólo utilizan la predicción de lista 0, el predictor ponderado se forma como:

(1)Pred = W0 * Pred0 + D0

siendo W0 el factor de ponderación asociado a la imagen de referencia de la lista 0, D0 la compensación asociada a la imagen de referencia de la lista 0, y Pred0 el bloque de predicciones con compensación de movimientos procedente de la imagen de referencia de la lista 0.

Para el uso en bloques de imágenes B que sólo utilizan la predicción de lista 1, el predictor ponderado se forma como:

(2)Pred = W1 * Pred1 + D1

siendo W1 el factor de ponderación asociado a la imagen de referencia de la lista 1, D1 la compensación asociada a la imagen de referencia de la lista 1, y Pred1 el bloque de predicciones con compensación de movimientos procedente de la imagen de referencia de la lista 1.

Los predictores ponderados pueden recortarse para garantizar que los valores resultantes quedarán dentro de la banda permisible de valores de píxel, típicamente 0 a 255. La precisión de la multiplicación en las fórmulas de ponderación puede limitarse a cualquier número predeterminado de bits de resolución.

En el caso bipredictivo, se transmiten índices de imágenes de referencia para cada uno de los dos predictores. Se realiza la compensación de movimientos para formar los dos predictores. Cada predictor utiliza el factor de ponderación asociado a su índice de imágenes de referencia para formar dos predictores ponderados. Seguidamente, se obtiene el promedio de los dos predictores ponderados para formar un predictor promediado, que entonces se añade al resto codificado.

Para uso en bloques de imágenes B que utilizan predicciones de lista 0 y de lista 1, el predictor ponderado se forma como:

(3)Pred = (P0 * Pred0 + D0 + P1 * Pred1 + D1)/2

Es posible recortar el predictor ponderado o cualquier valor intermedio en el cálculo del predictor ponderado para garantizar que los valores resultantes quedarán dentro de la banda permisible de valores de píxel, típicamente 0 a 255.

En consecuencia, se aplica un factor de ponderación a la predicción de imágenes de referencia de un codificador y descodificador de compresión de señales de vídeo que utiliza múltiples imágenes de referencia. El factor de ponderación se adapta para bloques de movimientos individuales dentro de una imagen, basándose en el índice de imágenes de referencia que se utiliza para ese bloque de movimientos. Como el índice de imágenes de referencia ya se ha transmitido en la secuencia de bits de señales de vídeo comprimidas, la sobrecarga adicional para adaptar el factor de ponderación en cada bloque de movimientos se reduce espectacularmente. Todos los bloques de movimientos que se codifiquen respecto a la misma imagen de referencia aplican el mismo factor de ponderación a la predicción de la imagen de referencia.

Las técnicas de estimación de los movimientos han sido objeto de amplios estudios. Para cada bloque de movimientos de una imagen que se esté codificando, se escoge un vector de movimientos que representa un desplazamiento del bloque de movimientos respecto a una imagen de referencia. En un método de búsqueda exhaustivo dentro de una región de búsqueda, se comprueban todos los desplazamientos comprendidos en una banda predeterminada de compensaciones relativas a la posición del bloque de movimientos. La comprobación comprende calcular la suma de la diferencia absoluta ("SAD") o del error medio cuadrático ("MSE") de cada píxel del bloque de movimientos de la imagen real respecto al bloque de movimientos desplazados de una imagen de referencia. La compensación con la SAD mínima o el MSE mínimo se selecciona como vector de movimientos. Se han propuesto numerosas variaciones de esta técnica, como la búsqueda en tres fases y la estimación de movimientos optimizados con distorsión de la velocidad, todas las cuales comprenden la fase del cálculo de la SAD o del MSE del bloque de movimientos reales respecto a un bloque de movimientos desplazados de una imagen de referencia.

Los costes de los cálculos necesarios para determinar los vectores de movimientos y los factores de ponderación de imágenes de referencia adaptativas pueden reducirse utilizando un proceso iterativo, sin renunciar a la selección de vectores de movimientos y de factores de ponderación capaces de conseguir grandes eficacias de compresión. Se describe un proceso de determinación de factores de ponderación y de vectores de movimientos en una forma de realización ilustrativa, partiendo del supuesto de que se aplica un único factor de ponderación a la totalidad de la imagen de referencia, aunque la aplicación de los principios del presente invento no se limite a dicho caso. Dicho proceso también podría aplicarse a regiones más pequeñas de la imagen, como fragmentos, por ejemplo. Además, aunque se describa una determinada forma de realización ilustrativa del invento que utiliza una sola imagen de referencia, el presente invento también puede aplicarse a la predicción de múltiples imágenes de referencia y a imágenes bipredictivas.

Normalmente, el cálculo del vector de movimientos para un bloque de movimientos puede efectuarse con la máxima precisión cuando se conoce el factor de ponderación a utilizar. En una forma de realización ilustrativa, la estimación del factor de ponderación se efectúa utilizando los valores en píxeles de la imagen de referencia y de la imagen real. El factor de ponderación puede limitarse a un número de bits de resolución. Si el factor de ponderación está muy próximo al 1, no hace falta considerar el factor de ponderación en el proceso de estimación de los movimientos, y la estimación normal de los movimientos puede efectuarse asumiendo que el factor de ponderación es igual a 1. En caso contrario, la estimación del factor de ponderación se aplica a la imagen de referencia. Seguidamente, la estimación de los movimientos se realiza utilizando cualquier método que calcule la SAD o el MSE, pero realizándose el cálculo de la SAD o del MSE entre el bloque de movimientos de la imagen real y el bloque de movimientos desplazados de la versión ponderada de la imagen de referencia, en lugar de la imagen de referencia sin ponderar. Una vez seleccionados los vectores de movimientos, la estimación del factor de ponderación puede refinarse, si es necesario.

Los vectores de movimientos reales se aplican a la imagen de referencia ponderada para formar la imagen de referencia con compensación de movimientos y ponderada. Se calcula una medida de la diferencia entre la imagen real y la imagen de referencia con compensación de movimientos y ponderada. Si la medida de la diferencia es inferior a un valor de umbral, o si es inferior a la mejor medida de la diferencia anterior, el proceso queda completado y se aceptan los vectores de movimientos candidatos reales y el factor de ponderación.

Si la medida de la diferencia es superior a algún valor de umbral, el factor de ponderación puede refinarse. En este caso, se forma una imagen de referencia con compensación de movimientos pero sin ponderar, basada en los vectores de movimientos candidatos reales. La estimación del factor de ponderación se refina utilizando la imagen de referencia con compensación de movimientos y la imagen real, en lugar de la imagen de referencia sin compensar, como se hizo al formar la estimación inicial del factor de ponderación.

El proceso de selección procede a iterar, aplicando a la imagen de referencia el factor de ponderación recién refinado, para formar la imagen de referencia ponderada. El proceso iterativo continúa hasta que la medida de la diferencia sea igual o superior a la mejor medida de la diferencia anterior, o inferior a un valor de umbral, o bien hasta que se complete un número definido de ciclos. Si la medida de la diferencia de la iteración actual es superior a la de la mejor iteración anterior, se utilizan el factor de ponderación y los vectores de movimientos correspondientes a la mejor iteración anterior. Si la medida de la diferencia de la iteración actual es inferior a un valor de umbral, se utilizan el factor de ponderación y los vectores de movimientos actuales. Si se ha completado el máximo número de ciclos de iteración, se utilizan el factor de ponderación y los vectores de movimientos de la iteración anterior que tuvo la mejor medida de la diferencia.

En una forma de realización posible, la estimación inicial del factor de ponderación, w, es la proporción existente entre el valor promedio de los píxeles de la imagen real, cur, dividido por el valor promedio de los píxeles de la imagen de referencia, ref, siendo:

(4)w = avg(cur)/avg(ref)

Las estimaciones del refinamiento son la proporción existente entre el promedio de los píxeles de la imagen real y el promedio de los píxeles de la imagen de referencia con compensación de movimientos, mcref, siendo:

(5)w = avg(cur)/avg(mcref)

La medida de la diferencia, diff, es el valor absoluto del promedio de las diferencias en píxeles entre la imagen real, cur, y la imagen de referencia con compensación de movimientos y ponderada, wmcref, siendo:

(6)diff = | \Sigma cur - wmcref |

En otra forma de realización, la medida de la diferencia es la suma de las diferencias absolutas de los píxeles de la imagen real y de los píxeles de la imagen de referencia con compensación de movimientos y ponderada, siendo:

(7)diff = \Sigma | cur - wmcref |

Cuando se realiza la estimación de los movimientos basándose en los bloques, el mismo píxel de una imagen de referencia sirve para numerosos cálculos de la SAD. En una forma de realización ilustrativa, durante el proceso de estimación de los movimientos, una vez que se ha aplicado un factor de ponderación a un píxel de una imagen de referencia, el píxel ponderado se almacena, además del píxel normal. El almacenamiento puede efectuarse para una región de la imagen o para la totalidad de la imagen.

Los valores de la imagen de referencia ponderada pueden recortarse para almacenarlos con el mismo número de bits que una referencia sin ponderar, por ejemplo 8 bits, o pueden almacenarse utilizando más bits. Si se realiza el recorte para el proceso de compensación de movimientos, lo cual es más eficaz en cuanto a la memoria, el factor de ponderación vuelve a aplicarse a la imagen de referencia para el vector de movimientos seleccionado real, la diferencia se calcula utilizando bits adicionales, y el recorte se realiza después de calcularse la diferencia para evitar desajustes con un descodificador, que podrían ocurrir si el descodificador no realiza el recorte después de aplicarse el factor de ponderación.

Cuando se utilizan múltiples imágenes de referencia para codificar una imagen, puede calcularse un factor de ponderación separado para cada imagen de referencia. Durante la estimación de los movimientos, se seleccionan un vector de movimientos y una imagen de referencia para cada bloque de movimientos. Para cada iteración del proceso, se obtienen vectores de movimientos y factores de ponderación para cada imagen de referencia.

En una forma de realización preferente, durante la estimación de los movimientos se determina la mejor imagen de referencia para un bloque de movimientos determinado. El cálculo de la medida de la diferencia se realiza separadamente para cada imagen de referencia, empleándose en el cálculo únicamente los bloques de movimientos que utilicen esa imagen de referencia. El refinamiento de la estimación del factor de ponderación para una imagen de referencia determinada también emplea únicamente los bloques de movimientos codificados utilizando esa imagen de referencia. En la codificación bipredictiva, los factores de ponderación y los vectores de movimientos pueden determinarse separadamente para cada una de las dos predicciones, con cuyo valor promedio se formará la predicción promediada.

Los principios del presente invento pueden aplicarse a muchos tipos diferentes de algoritmos de estimación de movimientos. Cuando se aplican con enfoques jerárquicos, la iteración de la selección de los factores de ponderación y de la selección de los vectores de movimientos puede utilizarse con cualquier nivel de la jerarquía de estimación de movimientos. Por ejemplo, el enfoque iterativo podría utilizarse para estimar los movimientos del elemento de imagen entero ("pel"). Una vez obtenidos el factor de ponderación y los vectores de movimientos enteros utilizando el algoritmo iterativo aportado, los vectores de movimientos "sub-pel" pueden obtenerse sin necesidad de otra iteración de la selección del factor de ponderación.

Es sumamente preferible que los principios del presente invento se implementen como una combinación de hardware y software. También es preferible que el software se implemente como un programa de aplicación perceptiblemente incorporado a una unidad de almacenamiento de programas. El programa de aplicación puede cargarse y ejecutarse en una máquina que comprenda cualquier arquitectura adecuada. Es preferible que dicha máquina se implemente en una plataforma informática constituida por hardware como, por ejemplo, una o más unidades centrales de proceso ("CPU"), una memoria de acceso aleatorio ("RAM") e interfaces de entrada/salida ("I/O"). Dicha plataforma informática también podrá comprender un sistema operativo y un código de microinstrucciones. Los diversos procesos y funciones descritos en el presente documento podrán formar parte del código de microinstrucciones o del programa de aplicación, o de cualquier combinación de ambos, que pueda ejecutarse por medio de una CPU. Además, podrán conectarse otras unidades periféricas diversas a la plataforma informática; por ejemplo, otra unidad de almacenamiento de datos y una impresora.

Claims

1. Un codificador de vídeo (300) para codificar datos de señales de vídeo destinados a un bloque de imágenes relacionado con al menos una determinada imagen de referencia, caracterizándose por el hecho de que el codificador comprende: un selector de factores de ponderación de imágenes de referencia (372) que tiene una salida indicativa de un factor de ponderación correspondiente al menos a dicha determinada imagen de referencia; un aplicador de factores de ponderación (374) en comunicación de señal con el selector de factores de ponderación de imágenes de referencia para aportar una versión ponderada de al menos dicha determinada imagen de referencia; y un estimador de movimientos (380) en comunicación de señal con el aplicador de factores de ponderación para aportar vectores de movimientos correspondientes a la versión ponderada de al menos dicha determinada imagen de referencia.

2. Un codificador de vídeo (300) como el definido en la reivindicación 1, que también comprende una memoria de imágenes de referencia (370) en comunicación de señal con el selector de factores de ponderación de imágenes de referencia (372) para aportar al menos dicha determinada imagen de referencia y el correspondiente índice determinado de imágenes de referencia.

3. Un codificador de vídeo (300) como el definido en la reivindicación 2, que también comprende un codificador de longitud variable (340) en comunicación de señal con la memoria de imágenes de referencia (370) para codificar el índice determinado de imágenes de referencia correspondiente al menos a dicha determinada imagen de referencia.

4. Un codificador de vídeo (300) como el definido en la reivindicación 1, que también comprende una memoria de imágenes de referencia ponderadas (376) en comunicación de señal con el selector de factores de ponderación de imágenes de referencia para almacenar una versión ponderada de la imagen de referencia.

5. Un codificador de vídeo (300) como el definido en la reivindicación 1, que también comprende un compensador de movimientos (390) en comunicación de señal con el selector de factores de ponderación de imágenes de referencia (372) para aportar imágenes de referencia con compensación de movimientos que respondan al selector de factores de ponderación de imágenes de referencia.

6. Un codificador de vídeo (300) como el definido en la reivindicación 5, que también comprende un multiplicador (392) en comunicación de señal con el compensador de movimientos (390) y el selector de factores de ponderación de imágenes de referencia (372) para aplicar un factor de ponderación a una imagen de referencia con compensación de movimientos.

7. Un codificador de vídeo (300) como el definido en la reivindicación 1, que también comprende un compensador de movimientos (382) en comunicación de señal con el estimador de movimientos (380) para aportar imágenes de referencia con compensación de movimientos y ponderadas que respondan al selector de factores de ponderación de imágenes de referencia y al estimador de movimientos.

8. Un codificador de vídeo (300) como el definido en la reivindicación 7 utilizable con predictores de imágenes bipredictivas, comprendiendo además dicho codificador medios para formar predictores primero y segundo procedentes de dos imágenes de referencia diferentes.

9. Un codificador de vídeo (300) como el definido en la reivindicación 8, en el que las dos imágenes de referencia diferentes proceden de la misma dirección respecto al bloque de imágenes.

10. Un método (600) para codificar datos de vídeo destinados a un bloque de imágenes relacionado con al menos una determinada imagen de referencia, caracterizándose dicho método por las fases de: recepción de un bloque de imágenes que van a comprimirse; asignación (610) de un factor de ponderación al bloque de imágenes correspondiente al menos a dicha determinada imagen de referencia; ponderación (616) de al menos dicha determinada imagen de referencia por el factor de ponderación; cálculo (616) de los vectores de movimientos correspondientes a la diferencia entre el bloque de imágenes y la imagen de referencia ponderada; compensación de los movimientos (620) de la imagen de referencia ponderada en correspondencia con los vectores de movimientos; y refinamiento (632) de la selección del factor de ponderación en respuesta a la imagen de referencia con compensación de movimientos y ponderada.

11. Un método como el definido en la reivindicación 10, que también comprende: la compensación de los movimientos (630) de la imagen de referencia original sin ponderar en correspondencia con los vectores de movimientos; la multiplicación de la imagen de referencia original con compensación de movimientos por el factor de ponderación asignado, para formar una imagen de referencia con compensación de movimientos y ponderada; la sustracción de la imagen de referencia con compensación de movimientos y ponderada, del bloque de imágenes sustancialmente sin comprimir; y la codificación de una señal indicativa de la diferencia entre el bloque de imágenes sustancialmente sin comprimir y la imagen de referencia con compensación de movimientos y ponderada.

12. Un método como el definido en la reivindicación 10, en el que el cálculo de los vectores de movimientos comprende: la comprobación dentro de una región de búsqueda de todos los desplazamientos ocurridos dentro de una banda predeterminada de compensaciones respecto al bloque de imágenes; el cálculo de al menos una suma de la diferencia absoluta y del error medio cuadrático de cada píxel del bloque de imágenes con una imagen de referencia con compensación de movimientos; y la selección, como vector de movimientos, de la compensación con la suma más baja de la diferencia absoluta y del error cuadrático medio.

13. Un método como el definido en la reivindicación 10, en el que se utilizan predictores de imágenes bipredictivas, comprendiendo además dicho método: la asignación de un segundo factor de ponderación al bloque de imágenes correspondiente a una segunda determinada imagen de referencia; la ponderación de la segunda imagen de referencia por el segundo factor de ponderación; el cálculo de los segundos vectores de movimientos correspondientes a la diferencia entre el bloque de imágenes y la segunda imagen de referencia ponderada; la compensación de los movimientos de la segunda imagen de referencia ponderada en correspondencia con los segundos vectores de movimientos; y el refinamiento de la selección del segundo factor de ponderación en respuesta a la segunda imagen de referencia con compensación de movimientos y ponderada.

14. Un método como el definido en la reivindicación 11, en el que se utilizan predictores de imágenes bipredictivas, comprendiendo además dicho método: la asignación de un segundo factor de ponderación al bloque de imágenes correspondiente a una segunda determinada imagen de referencia; la ponderación de la segunda imagen de referencia por el segundo factor de ponderación; el cálculo de los segundos vectores de movimientos correspondientes a la diferencia entre el bloque de imágenes y la segunda imagen de referencia ponderada; la compensación de los movimientos de la segunda imagen de referencia ponderada en correspondencia con los segundos vectores de movimientos; el refinamiento de la selección del segundo factor de ponderación en respuesta a la segunda imagen de referencia con compensación de movimientos y ponderada; la compensación de los movimientos de la segunda imagen de referencia original sin ponderar en correspondencia con los segundos vectores de movimientos; la multiplicación de la segunda imagen de referencia original con compensación de movimientos por el segundo factor de ponderación asignado, para formar una segunda imagen de referencia con compensación de movimientos y ponderada; la sustracción de la segunda imagen de referencia con compensación de movimientos y ponderada, del bloque de imágenes sustancialmente sin comprimir; y la codificación de una señal indicativa de la diferencia entre el bloque de imágenes sustancialmente sin comprimir y la segunda imagen de referencia con compensación de movimientos y ponderada.

15. Un método como el definido en la reivindicación 13, en el que las imágenes de referencia determinadas primera y segunda proceden de la misma dirección respecto al bloque de imágenes.

16. Un método como el definido en la reivindicación 13, en el que el cálculo de los vectores de movimientos comprende: la comprobación dentro de una región de búsqueda de todos los desplazamientos ocurridos dentro de una banda predeterminada de compensaciones respecto al bloque de imágenes; el cálculo de al menos una suma de la diferencia absoluta y del error medio cuadrático de cada píxel del bloque de imágenes con una primera imagen de referencia con compensación de movimientos correspondiente al primer predictor; la selección, como vector de movimientos para el primer predictor, de una compensación con la suma más baja de la diferencia absoluta y del error cuadrático medio; el cálculo de al menos una suma de la diferencia absoluta y del error medio cuadrático de cada píxel del bloque de imágenes con una segunda imagen de referencia con compensación de movimientos correspondiente al segundo predictor; y la selección, como vector de movimientos para el segundo predictor, de una compensación con la suma más baja de la diferencia absoluta y del error cuadrático medio.

17. Un método como el definido en la reivindicación 10, en el que la ponderación de la imagen de referencia por el factor de ponderación comprende: la determinación de si el factor de ponderación se acerca a un valor aproximado de 1; y la utilización de la imagen de referencia original como imagen de referencia ponderada, si el factor de ponderación se acerca a un valor aproximado de 1.

18. Un método como el definido en la reivindicación 10, en el que el refinamiento de la selección del factor de ponderación en respuesta a la imagen de referencia con compensación de movimientos y ponderada comprende: el cálculo de una diferencia entre el bloque de imágenes y la imagen de referencia con compensación de movimientos y ponderada; la comparación de la diferencia calculada con una tolerancia predeterminada; y el nuevo refinamiento del factor de ponderación, si la diferencia calculada queda fuera de la tolerancia predeterminada.