ES2636947T3 - Procedimiento de descodificación de imágenes en movimiento - Google Patents

Procedimiento de descodificación de imágenes en movimiento Download PDF

Info

Publication number
ES2636947T3
ES2636947T3 ES14197727.2T ES14197727T ES2636947T3 ES 2636947 T3 ES2636947 T3 ES 2636947T3 ES 14197727 T ES14197727 T ES 14197727T ES 2636947 T3 ES2636947 T3 ES 2636947T3
Authority
ES
Spain
Prior art keywords
image
weighting coefficients
linear prediction
predictive
block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
ES14197727.2T
Other languages
English (en)
Inventor
Kiyofumi Abe
Shinya Kadono
Satoshi Kondo
Makoto Hagai
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Godo Kaisha IP Bridge 1
Original Assignee
Godo Kaisha IP Bridge 1
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=31721895&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=ES2636947(T3) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Godo Kaisha IP Bridge 1 filed Critical Godo Kaisha IP Bridge 1
Application granted granted Critical
Publication of ES2636947T3 publication Critical patent/ES2636947T3/es
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/177Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/573Motion compensation with multiple frame prediction using two or more reference frames in a given prediction direction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/577Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/58Motion compensation with long-term prediction, i.e. the reference frame for a current frame not being the temporally closest one
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Abstract

Un procedimiento de descodificación de imágenes para descodificar un bloque codificado haciendo referencia a dos imágenes de referencia, comprendiendo el procedimiento de descodificación: descodificar la señal de imagen codificada para obtener: un primer índice de referencia que identifica una primera imagen de referencia para un bloque actual que va a descodificarse; un segundo índice de referencia que identifica una segunda imagen de referencia para el bloque actual que va a descodificarse; comandos que indican una correspondencia entre índices de referencia e imágenes de referencia; una pluralidad de conjuntos de coeficientes de ponderación utilizados para generar una imagen predictiva; y un error de predicción; designar, basándose en los comandos y el primer y el segundo índices de referencia, la primera imagen de referencia y la segunda imagen de referencia a las que se hace referencia cuando el bloque actual se descodifica mediante compensación de movimiento; especificar un primer conjunto de coeficientes de ponderación que corresponde al primer índice de referencia y un segundo conjunto de coeficientes de ponderación que corresponde al segundo índice de referencia, de entre la pluralidad de conjuntos de coeficientes de ponderación; generar una primera imagen predictiva cambiando la escala de valores de píxel de un primer bloque de referencia utilizando el primer conjunto de coeficientes de ponderación especificado, y generar una segunda imagen predictiva cambiando la escala de valores de píxel de un segundo bloque de referencia utilizando el segundo conjunto de coeficientes de ponderación especificado, obteniéndose el primer bloque de referencia a partir de la primera imagen de referencia designada en dicha designación y obteniéndose el segundo bloque de referencia a partir de la segunda imagen de referencia designada en dicha designación; generar una imagen predictiva del bloque actual basándose en un valor medio de la primera imagen predictiva y la segunda imagen predictiva; y generar una imagen reconstruida añadiendo la imagen predictiva y el error de predicción, en el que los comandos comprenden primeros comandos y segundos comandos, y los primeros comandos indican una correspondencia entre los primeros índices de referencia y las primeras imágenes de referencia, siendo cada uno de los primeros índices de referencia un índice para designar la primera imagen de referencia, y los segundos comandos indican una correspondencia entre los segundos índices de referencia y las segundas imágenes de referencia, siendo cada uno de los segundos índices de referencia un índice para designar la segunda imagen de referencia, y en el que la pluralidad de conjuntos de coeficientes de ponderación utilizados para generar la primera imagen predictiva y la segunda imagen predictiva están ubicados en una cabecera de sección de la señal de imagen codificada, y en el que el bloque actual es un bloque incluido en una imagen B y el bloque actual se descodifica designando la primera imagen de referencia y la segunda imagen de referencia a las que se hace referencia, y en el que el primer conjunto de coeficientes de ponderación comprende una primera parte w1 y una segunda parte c1, y el segundo conjunto de coeficientes de ponderación comprende una primera parte w2 y una segunda parte c2, y la primera parte w1 se utiliza para cambiar la escala de los valores de píxel del primer bloque de referencia y la primera parte w2 se utiliza para cambiar la escala de los valores de píxel del segundo bloque de referencia, y la segunda parte c1 y la segunda parte c2 se utilizan para aumentar los valores de píxel de la imagen predictiva por un valor medio de c1 y c2, y caracterizado porque al menos dos primeros índices de referencia se asignan a la primera imagen de referencia a la que hace referencia el bloque actual y la primera imagen de referencia a la que hace referencia el bloque actual se designa por uno de los al menos dos primeros índices de referencia, y al menos dos segundos índices de referencia se asignan a la segunda imagen de referencia a la que hace referencia el bloque actual y la segunda imagen de referencia a la que hace referencia el bloque actual se designa por uno de los al menos dos segundos índices de referencia.

Description

DESCRIPCION
Procedimiento de descodificacion de imagenes en movimiento 5 Campo tecnico
La presente invencion se refiere a un procedimiento de codificacion de imagenes en movimiento y a un procedimiento de descodificacion de imagenes en movimiento y, en particular, a un procedimiento de codificacion y a un procedimiento de descodificacion que utilizan una prediccion inter-imagen con referencia a imagenes 10 codificadas previamente.
Tecnica anterior
Con el desarrollo de las aplicaciones multimedia, manejar de manera mtegra todo tipo de informacion multimedia tal 15 como video, audio y texto se ha convertido en algo habitual. Para ese fin, la digitalizacion de toda esta informacion multimedia permite tratarla de manera mtegra. Sin embargo, puesto que las imagenes digitalizadas tienen una enorme cantidad de datos, las tecnicas de compresion de informacion de imagenes son absolutamente necesarias para almacenar y transmitir tal informacion. Tambien es importante normalizar tales tecnicas de compresion para el interfuncionamiento de los datos de imagenes comprimidas. Existen normas internacionales para las tecnicas de 20 compresion de imagenes, tales como H.261 y H.263 normalizadas por la Union Internacional de Telecomunicaciones - Sector de Normalizacion de las Telecomunicaciones (ITU-T) y MpEG-1, MPEG-4 y otras normas normalizadas por la Organizacion Internacional de Normalizacion (ISO). La ITU esta trabajando actualmente en la normalizacion de H.26L como la norma mas reciente para la codificacion de imagenes.
25 En general, en la codificacion de imagenes en movimiento, la cantidad de informacion se comprime reduciendo las redundancias tanto en direcciones temporales como espaciales. Por lo tanto, en la codificacion de prediccion inter- imagen, que tiene como objetivo reducir la redundancia temporal, el movimiento de una imagen actual se estima por cada bloque con referencia a imagenes anteriores o posteriores para crear una imagen predictiva, codificandose posteriormente valores diferenciales entre las imagenes predictivas obtenidas y la imagen actual.
30
En este caso, el termino “imagen” representa una unica capa de una imagen y representa un cuadro cuando se utiliza en el contexto de una imagen progresiva, mientras que representa un cuadro o un campo en un contexto de una imagen entrelazada. En este caso, la imagen entrelazada es un unico cuadro que esta formado por dos campos que tienen tiempos diferentes, respectivamente. En el proceso de codificacion y de descodificacion de la imagen 35 entrelazada, un unico cuadro puede tratarse como un cuadro, como dos campos, como una estructura de cuadros o una estructura de campos en cada bloque del cuadro.
La siguiente descripcion se proporcionara suponiendo que una imagen es un cuadro en una imagen progresiva, pero puede darse la misma descripcion incluso suponiendo que una imagen es un cuadro o un campo en una imagen 40 entrelazada.
La FIG. 30 es un diagrama que explica tipos de imagenes y las relaciones de referencia entre las mismas.
Una imagen tal como la imagen I1, que es una prediccion intra-imagen codificada sin hacer referencia a ninguna 45 imagen, se denomina como una imagen I. Una imagen tal como la imagen P10, que es una prediccion inter-imagen codificada con referencia a solamente una imagen, se denomina como una imagen P. Y una imagen, que puede ser una prediccion inter-imagen codificada con referencia a dos imagenes al mismo tiempo, se denomina como una imagen B.
50 Las imagenes B, como las imagenes B6, B12 y B18, pueden hacer referencia a dos imagenes ubicadas en direcciones temporales arbitrarias. Las imagenes de referencia pueden estar designadas en cada bloque, con respecto a las cuales se estima el movimiento, y se discriminan entre una primera imagen de referencia descrita anteriormente en un flujo codificado obtenido codificando imagenes y una segunda imagen de referencia descrita posteriormente en el flujo codificado.
55
Sin embargo, para codificar y descodificar imagenes anteriores es necesario que las imagenes de referencia ya esten codificadas y descodificadas. Las FIG. 31A y 31B muestran ejemplos de orden de codificacion y descodificacion de imagenes B. La FIG. 31A muestra un orden de visualizacion de las imagenes, y la FIG. 3lB muestra un orden de codificacion y descodificacion reordenado a partir del orden de visualizacion mostrado en la
FIG. 31A. Estos diagramas muestran que las imagenes se reordenan de manera que las imagenes a las que se hace referencia mediante las imagenes B3 y B6 ya estan codificadas y descodificadas.
Un procedimiento para crear una imagen predictiva en caso de que la imagen B mencionada anteriormente este 5 codificada con referencia a dos imagenes al mismo tiempo se explicara en detalle utilizando la FIG. 32. Debe observarse que una imagen predictiva se crea descodificandose exactamente de la misma manera.
La imagen B4 es una imagen B actual que va a codificarse, y los bloques BL01 y BL02 son bloques actuales que van a codificarse y que pertenecen a la imagen B actual. Haciendo referencia a un bloque BL11 que pertenece a la 10 imagen P2 como una primera imagen de referencia y a un bloque BL21 que pertenece a la imagen P3 como una segunda imagen de referencia, se crea una imagen predictiva para el bloque bL01. Asimismo, haciendo referencia a un bloque BL12 que pertenece a la imagen P2 como una primera imagen de referencia y a un bloque BL22 que pertenece a la imagen P1 como una segunda imagen de referencia, se crea una imagen predictiva para el bloque BL02 (vease el documento 1, el cual no es una patente).
15
La FIG. 33 es un diagrama que explica un procedimiento para crear una imagen predictiva para el bloque actual BL01 que va a codificarse utilizando los dos bloques BL11 y BL21 a los que se hace referencia. La siguiente explicacion supondra en este caso que el tamano de cada bloque es de 4 por 4 pfxeles. Suponiendo que Q1(i) es un valor de pixel de BL11, que Q2(i) es un valor de pixel de BL21 y que P(i) es un valor de pixel de la imagen predictiva 20 para el bloque objetivo BL01, el valor de pixel P(i) puede calcularse mediante una ecuacion de prediccion lineal como la siguiente ecuacion 1. “i” indica la posicion de un pixel y, en este ejemplo, “i” tiene valores comprendidos entre 0 y 15.
P(i) = (w1 x Q1(i) + w2 x Q2(i))/pow(2, d) + c ...Ecuacion 1 25
(donde pow(2, d) indica la “d”-esima potencia de 2)
“w1”, “w2”, “c” y “d” son los coeficientes para llevar a cabo una prediccion lineal, y estos cuatro coeficientes se tratan como un conjunto de coeficientes de ponderacion. Este conjunto de coeficientes de ponderacion se determina 30 mediante un mdice de referencia que designa una imagen a la que cada bloque hace referencia. Por ejemplo, cuatro valores de w1_1, w2_1, c_1 y d_1 se utilizan para BL01, y w1_2, w2_2, c_2 y d_2 se utilizan para BL02, respectivamente.
A continuacion, se explicaran los indices de referencia que designan imagenes de referencia con relacion a la FIG. 35 34 y la FIG. 35. Un valor denominado como numero de imagen, que aumenta en valores de uno cada vez que una imagen se almacena en una memoria, se asigna a cada imagen. Dicho de otro modo, un numero de imagen con un valor resultante de sumar uno al valor maximo de numeros de imagen existentes, se asigna a una imagen recien almacenada. Sin embargo, una imagen de referencia no se designa realmente utilizando este numero de imagen, sino utilizando un valor denominado como mdice de referencia, el cual se define por separado. Los indices que 40 indican primeras imagenes de referencia se denominan primeros indices de referencia, y los indices que indican segundas imagenes de referencia se denominan segundos indices de referencia, respectivamente.
La FIG. 34 es un diagrama que explica un procedimiento para asignar dos indices de referencia a numeros de imagen. Cuando hay una secuencia de imagenes ordenadas en el orden de visualizacion, los numeros de imagen se 45 asignan en el orden de codificacion. Los comandos para asignar los indices de referencia a los numeros de imagen se describen en una cabecera de una seccion que es una subdivision de una imagen, como la unidad de codificacion, y, por tanto, la asignacion de los mismos se actualiza cada vez que se codifica una seccion. El comando indica el valor diferencial entre un numero de imagen que tiene asignado un mdice de referencia actual y un numero de imagen que tiene asignado un mdice de referencia inmediatamente antes de la asignacion actual, en 50 serie mediante el numero de indices de referencia.
Tomando el primer mdice de referencia de la FIG. 34 como un ejemplo, puesto que primero se proporciona “-1” como un comando, se resta 1 al numero de imagen 16 de la imagen actual que va a codificarse y, por tanto, el mdice de referencia 0 se asigna al numero de imagen 15. Despues, puesto que se proporciona “-4”, se resta 4 al numero 55 de imagen 15 y, por tanto, el mdice de referencia 1 se asigna al numero de imagen 11. Los indices de referencia posteriores se asignan a numeros de imagen respectivos en el mismo procesamiento. Lo mismo se aplica a los segundos indices de referencia.
La FIG. 35 muestra el resultado de la asignacion de los indices de referencia. Los primeros indices de referencia y
los segundos mdices de referencia se asignan a respectivos numeros de imagen por separado, pero, examinando cada mdice de referencia, resulta evidente que un mdice de referencia se asigna a un numero de imagen.
A continuacion, se explicara, con referencia a la FIG. 36 y a la FIG. 37, un procedimiento para determinar los 5 conjuntos de coeficientes de ponderacion que se utilizaran.
Un flujo codificado de una imagen esta formado por un area de informacion comun de imagen y por una pluralidad de areas de datos de seccion. La FIG. 36 muestra una estructura de un area de datos de seccion de las mismas. El area de datos de seccion esta formada por un area de cabecera de seccion y por una pluralidad de areas de datos 10 de bloque. Como un ejemplo de un area de datos de bloque, en este caso se muestran areas de bloque correspondientes a BL01 y BL02 en la FIG. 32.
“refl” y “ref2” incluidos en el bloque BL01 indican el primer mdice de referencia y el segundo mdice que indican dos imagenes de referencia para este bloque, respectivamente. En el area de cabecera de seccion, datos (pconjuntoO, 15 pconjuntol, pconjunto2, pconjunto3 y pconjunto4) para determinar los conjuntos de coeficientes de ponderacion para la prediccion lineal se describen para refl y ref2, respectivamente. La FIG. 37 muestra tablas de los datos mencionados anteriormente incluidos en el area de cabecera de seccion, a modo de ejemplo.
Cada dato indicado por un identificador “pconjunto” tiene cuatro valores, w1, w2, c y d, y esta estructurado para ser 20 referenciado directamente mediante los valores de refl y refl. Ademas, en el area de cabecera de seccion se describe una secuencia de comandos idx_cmd1 e idx_cmd2 para asignar los indices de referencia a los numeros de imagen.
Utilizando refl y ref2 descritos en BL01 en la FIG. 36, un conjunto de coeficientes de ponderacion se selecciona a 25 partir de la tabla para refl y otro conjunto de los mismos se selecciona a partir de la tabla para ref2. Llevando a cabo una prediccion lineal de la ecuacion 1 utilizando conjuntos de coeficientes de ponderacion respectivos, se generan dos imagenes predictivas. Una imagen predictiva deseada puede obtenerse calculando el promedio de estas dos imagenes predictivas por cada pixel.
30 Ademas, hay otro procedimiento para obtener una imagen predictiva utilizando una ecuacion fija predeterminada, diferente al procedimiento mencionado anteriormente para generar una imagen predictiva utilizando una ecuacion de prediccion obtenida mediante conjuntos de coeficientes de ponderacion de coeficientes de prediccion lineal. En el primer procedimiento, en caso de que una imagen designada por un primer mdice de referencia aparezca, en el orden de visualizacion, despues de una imagen designada por un segundo mdice de referencia, se selecciona la 35 siguiente ecuacion 2a, que es una ecuacion fija compuesta por coeficientes fijos, y, en otros casos, se selecciona la siguiente ecuacion 2b, que es una ecuacion fija compuesta por coeficientes fijos, para generar una imagen predictiva.
P(i) = 2 x Ql(i) - Q2(i) ...Ecuacion 2a 40 P8i) = (Q1(i) + Q2(i))/2 ...Ecuacion 2b
Como resulta evidente a partir de lo anterior, este procedimiento tiene la ventaja de que no es necesario codificar ni transmitir los conjuntos de coeficientes de ponderacion para obtener la imagen predictiva ya que la ecuacion de prediccion es fija. Este procedimiento tiene otra ventaja ya que no es necesario codificar ni transmitir un indicador 45 para designar los conjuntos de coeficientes de ponderacion de coeficientes de prediccion lineal ya que la ecuacion fija se selecciona en funcion de la relacion posicional entre las imagenes. Ademas, este procedimiento permite una reduccion significativa de la cantidad de procesamiento para la prediccion lineal gracias a una formula sencilla de prediccion lineal.
50 (Documento 1, que no es una patente)
ITU-T Rec. H.264 | ISO/IEC 14496-10 AVC Borrador del Comite Conjunto (CD)
(10/05/2002)
(P.34 8.4.3 Re-Mapping of frame numbers indicator,
55 P.105 11.5 Prediction signal generation procedure)
(Documento 2, que no es una patente)
ITU-T Rec. H.264 I ISO/IEC 14496-10 AVC Borrador del comite final (FCD)
MPEG documento N4920 ISSN 0000-0365 (2002-08-11)
(P.37-47, 7.4.3 Slice header semantics to 7.4.5.1 Macroblock Prediction Semantics,
5 P. 53-60, 8.3.6 Decoder process for management and use of the reference picture buffer, P.119-121, 10.4 Weighted prediction signal generation procedure)
En el procedimiento para crear una imagen predictiva utilizando conjuntos de coeficientes de ponderacion segun la ecuacion 1, puesto que el numero de comandos para asignar indices de referencia a imagenes de referencia es el 10 mismo que el numero de imagenes de referencia, solo se asigna un mdice de referencia a una imagen de referencia y, por tanto, los conjuntos de coeficientes de ponderacion utilizados para la prediccion lineal de los bloques que hacen referencia a la misma imagen de referencia tienen exactamente los mismos valores. No hay ningun problema si las imagenes cambian de manera uniforme en una imagen en su totalidad, pero hay una alta probabilidad de que no pueda generarse la imagen predictiva optima si las imagenes respectivas cambian de diferente manera. Ademas, 15 existe el problema adicional de que aumenta la cantidad de procesamiento para la prediccion lineal debido a que la ecuacion incluye multiplicaciones.
Descripcion de la invencion
20 En la reivindicacion 1 se define un procedimiento de descodificacion de imagenes para descodificar un bloque codificado haciendo referencia a dos imagenes de referencia segun la presente invencion. En la reivindicacion 2 se define un aparato de descodificacion que descodifica un bloque codificado haciendo referencia a dos imagenes de referencia segun la presente invencion. En la reivindicacion 3 se define un medio legible por ordenador no transitorio que tiene un programa almacenado en el mismo para hacer que un ordenador lleve a cabo un procedimiento de 25 descodificacion para descodificar un bloque codificado haciendo referencia a dos imagenes de referencia segun la presente invencion.
Breve descripcion de los dibujos
30
La FIG. 1 es un diagrama de bloques que muestra una estructura de un aparato de codificacion en una primera realizacion de la presente invencion.
La FIG. 2 es un diagrama de bloques que muestra una estructura de un aparato de descodificacion en una sexta 35 realizacion de la presente invencion.
La FIG. 3 es un diagrama esquematico para explicar un procedimiento para asignar indices de referencia a numeros de imagen.
40 La FIG. 4 es un diagrama esquematico que muestra un ejemplo de relacion entre indices de referencia y numeros de imagen.
La FIG. 5 es un diagrama esquematico para explicar operaciones para compensacion de movimiento.
45 La FIG. 6 es un diagrama esquematico para explicar una estructura de un flujo codificado.
La FIG. 7 es un diagrama esquematico que muestra un ejemplo de conjuntos de coeficientes de ponderacion de coeficientes de prediccion lineal.
50 La FIG. 8 es un diagrama de bloques funcionales que muestra la generacion de una imagen predictiva en un aparato de codificacion.
La FIG. 9 es otro diagrama de bloques funcionales que muestra la generacion de una imagen predictiva en el aparato de codificacion.
55
Las FIG. 10A y 10B son otros diagramas de bloques funcionales adicionales que muestran la generacion de una imagen predictiva en el aparato de codificacion.
La FIG. 11 es otro diagrama de bloques funcionales adicional que muestra la generacion de una imagen predictiva
5
10
15
20
25
30
35
40
45
50
55
en el aparato de codificacion.
La FIG. 12 es un diagrama esquematico para explicar una estructura de un flujo codificado.
La FIG. 13 es un diagrama esquematico que muestra un ejemplo de conjuntos de coeficientes de ponderacion de coeficientes de prediccion lineal.
La FIG. 14 es un diagrama esquematico para explicar una estructura de un flujo codificado.
La FIG. 15 es un diagrama esquematico que muestra un ejemplo de conjuntos de coeficientes de ponderacion de coeficientes de prediccion lineal.
La FIG. 16 es un diagrama de bloques funcionales que muestra la generacion de una imagen predictiva en el aparato de codificacion.
Las FIG. 17A y 17B son diagramas esquematicos para explicar una estructura de un flujo codificado y un ejemplo de indicadores.
La FIG. 18 es un diagrama de bloques funcionales que muestra la generacion de una imagen predictiva en un aparato de descodificacion.
La FIG. 19 es otro diagrama de bloques funcionales que muestra la generacion de una imagen predictiva en el aparato de descodificacion.
Las FIG. 20A y 20B son otros diagramas de bloques funcionales adicionales que muestran la generacion de una imagen predictiva en el aparato de descodificacion.
La FIG. 21 es otro diagrama de bloques funcionales adicional que muestra la generacion de una imagen predictiva en el aparato de descodificacion.
La FIG. 22 es otro diagrama de bloques funcionales adicional que muestra la generacion de una imagen predictiva en el aparato de descodificacion.
La FIG. 23 es un diagrama esquematico para explicar una estructura de un flujo codificado.
La FIG. 24 es un diagrama esquematico para explicar una estructura de un flujo codificado.
Las FIG. 25A, B y C son ilustraciones de un medio de grabacion para almacenar un programa para llevar a cabo el procedimiento de codificacion de imagenes en movimiento y el procedimiento de descodificacion de imagenes en movimiento de cada una de las realizaciones mencionadas anteriormente utilizando un sistema informatico.
La FIG. 26 es un diagrama de bloques que muestra una configuracion global de un sistema de suministro de contenido.
La FIG. 27 es una vista externa de un telefono movil.
La FIG. 28 es un diagrama de bloques que muestra una estructura del telefono movil.
La FIG. 29 es un diagrama que muestra un ejemplo de un sistema de radiodifusion digital.
La FIG. 30 es un diagrama esquematico para explicar las relaciones de referencia entre imagenes en una tecnica anterior.
Las FIG. 31A y B son diagramas esquematicos para explicar la reordenacion de imagenes en la tecnica anterior.
La FIG. 32 es un diagrama esquematico para explicar operaciones para compensacion de movimiento en la tecnica anterior.
La FIG. 33 es un diagrama esquematico para explicar operaciones para procesamiento de prediccion lineal en la
tecnica anterior.
La FIG. 34 es un diagrama esquematico para explicar un procedimiento para asignar indices de referencia a numeros de imagen en la tecnica anterior.
La FIG. 35 es un diagrama esquematico que muestra un ejemplo de relacion entre indices de referencia y numeros de imagen en la tecnica anterior.
La FIG. 36 es un diagrama esquematico para explicar una estructura de un flujo codificado en la tecnica anterior.
10
La FIG. 37 es un diagrama esquematico que muestra un ejemplo de conjuntos de coeficientes de ponderacion de coeficientes de prediccion lineal en la tecnica anterior.
La FIG. 38 es un diagrama esquematico para explicar una estructura de un flujo codificado en la tecnica anterior.
15
La FIG. 39 es un diagrama esquematico para explicar la relacion entre numeros de imagen e informacion de orden de visualizacion.
Las FIG. 40A y 40B son diagramas esquematicos para explicar una estructura de un flujo codificado y un ejemplo de 20 indicadores.
Las FIG. 41A y 41B son diagramas esquematicos para explicar una estructura de un flujo codificado y un ejemplo de indicadores.
25 Mejor modo de llevar a cabo la invencion (Primera realizacion)
La FIG. 1 es un diagrama de bloques que muestra la estructura de un aparato de codificacion de imagenes en 30 movimiento en la primera realizacion de la presente invencion. El procedimiento de codificacion de imagenes en movimiento ejecutado en este aparato de codificacion de imagenes en movimiento, espedficamente, (1) una vision general de la codificacion, (2) un procedimiento para asignar indices de referencia y (3) un procedimiento para generar una imagen predictiva, se explicara en este orden utilizando el diagrama de bloques mostrado en la FIG. 1.
35 (1) Vision general de la codificacion
Una imagen en movimiento que va a codificarse se introduce en una memoria de imagenes 101, imagen a imagen en el orden de visualizacion, y las imagenes introducidas se reordenan en el orden de codificacion. Las FIG. 31A y 31B son diagramas que muestran un ejemplo de reordenacion de imagenes. La FIG. 31A muestra un ejemplo de 40 imagenes en el orden de visualizacion y la FIG. 31B muestra un ejemplo de las imagenes reordenadas en el orden de codificacion. En este caso, puesto que las imagenes B3 y B6 hacen referencia a imagenes anteriores y posteriores en el tiempo, las imagenes de referencia necesitan codificarse antes de codificar estas imagenes actuales y, por tanto, las imagenes estan reordenadas en la FIG. 31B de manera que las imagenes P4 y P7 se han codificado con anterioridad. Cada una de las imagenes esta dividida en bloques, cada uno de los cuales se 45 denomina como un macrobloque de 16 pfxeles horizontales por 16 pfxeles verticales, por ejemplo, llevandose a cabo el siguiente proceso en cada bloque.
Una senal de imagen de entrada lefda de la memoria de imagenes 101 se introduce en una unidad de calculo diferencial 112. La unidad de calculo diferencial 112 calcula una diferencia entre la senal de imagen de entrada y la 50 senal de imagen predictiva proporcionada por una unidad de codificacion de compensacion de movimiento 107 y proporciona la senal de imagen diferencial obtenida (senal de error de prediccion) a una unidad de codificacion de errores de prediccion 102. La unidad de codificacion de errores de prediccion 102 lleva a cabo un procesamiento de codificacion de imagenes, tal como una transformacion y cuantificacion de frecuencia, y proporciona una senal de error codificada. La senal de error codificada se introduce en una unidad de descodificacion de errores de prediccion 55 104, que lleva a cabo un procesamiento de descodificacion de imagenes, tal como una cuantificacion inversa y una transformacion de frecuencia inversa, y proporciona una senal de error descodificada. Una unidad de suma 113 suma la senal de error descodificada y la senal de imagen predictiva para generar una senal de imagen reconstruida y almacena, en una memoria de imagenes 105, las senales de imagenes reconstruidas a las que puede hacerse referencia en la prediccion inter-imagen posterior a partir de las senales de imagenes reconstruidas obtenidas.
Por otra parte, la senal de imagen de entrada ^da por macrobloque a partir de la memoria de imagenes 101 tambien se introduce en una unidad de estimacion de vectores de movimiento 106. Aqm, las senales de imagenes reconstruidas almacenadas en la memoria de imagenes 105 se buscan para estimar un area de imagen que sea lo 5 mas similar a la senal de imagen de entrada y, por tanto, determinar un vector de movimiento que apunte a la posicion del area de imagen. La estimacion de vectores de movimiento se lleva a cabo por cada bloque, que es una subdivision de un macrobloque, y los vectores de movimiento obtenidos se almacenan en una unidad de almacenamiento de vectores de movimiento 108.
10 En este momento, puesto que una pluralidad de imagenes puede utilizarse como referencia en la norma H.26L, la cual esta considerandose actualmente para su normalizacion, en cada bloque se necesitan numeros de identificacion para designar imagenes de referencia. Los numeros de identificacion se denominan indices de referencia, y una unidad de conversion de mdice de referencia / numero de imagen 111 establece una correspondencia entre los indices de referencia y los numeros de imagen de las imagenes almacenadas en la 15 memoria de imagenes 105 para permitir la designacion de las imagenes de referencia. El funcionamiento de la unidad de conversion de mdice de referencia / numero de imagen 111 se explicara en detalle en la seccion (2).
La unidad de codificacion de compensacion de movimiento 107 extrae el area de imagen mas adecuada para la imagen predictiva de entre las senales de imagenes reconstruidas almacenadas en la memoria de imagenes 105 20 utilizando los vectores de movimiento estimados mediante el procesamiento mencionado anteriormente y los indices de referencia. El procesamiento de conversion de valores de pixel, tal como el procesamiento de interpolacion mediante prediccion lineal, se lleva a cabo en los valores de pixel del area de imagen obtenida para obtener la imagen predictiva final. Los coeficientes de prediccion lineal utilizados para ese fin se generan por la unidad de generacion de coeficientes de prediccion lineal 110 y se almacenan en la unidad de almacenamiento de coeficientes 25 de prediccion lineal 109. Este procedimiento de generacion de imagenes predictivas se explicara en detalle en la seccion (3).
La unidad de generacion de flujos codificados 103 lleva a cabo una codificacion de longitud variable para la informacion codificada, tal como los coeficientes de prediccion lineal, los indices de referencia, los vectores de 30 movimiento y las senales de error codificadas proporcionadas como resultado de la anterior serie de procesamiento para obtener un flujo codificado que va a proporcionarse desde este aparato de codificacion.
El flujo de operaciones en el caso de la codificacion de prediccion inter-imagen se ha descrito anteriormente, y un conmutador 114 y un conmutador 115 conmutan entre una codificacion de prediccion inter-imagen y una codificacion 35 de prediccion intra-imagen. En el caso de la codificacion de prediccion intra-imagen, una imagen predictiva no se genera mediante compensacion de movimiento, sino que una senal de imagen diferencial se genera calculando la diferencia entre un area actual y una imagen predictiva del area actual que se genera a partir de un area codificada en la misma imagen. La unidad de codificacion de errores de prediccion 102 convierte la senal de imagen diferencial en la senal de error codificada de la misma manera que la codificacion de prediccion inter-imagen, y la unidad de 40 generacion de flujos codificados 103 lleva a cabo una codificacion de longitud variable para la senal para obtener un flujo codificado que va a proporcionarse.
(2) Procedimiento de asignacion de indices de referencia
45 A continuacion, se explicara, utilizando la FIG. 3 y la FIG. 4, el procedimiento mediante el cual la unidad de conversion de mdice de referencia / numero de imagen 111 mostrada en la FIG. 1 asigna indices de referencia.
La FIG. 3 es un diagrama que explica el procedimiento para asignar dos indices de referencia a numeros de imagen. Suponiendo que hay una secuencia de imagenes ordenadas en el orden de visualizacion, como se muestra en este 50 diagrama, se asignan numeros de imagen a las imagenes en el orden de codificacion. Los comandos para asignar indices de referencia a numeros de imagen estan descritos en una cabecera de cada seccion, que es una subdivision de una imagen, como la unidad de codificacion, y, por tanto, la asignacion de los mismos se actualiza cada vez que se codifica una seccion. El comando indica, en serie mediante el numero de indices de referencia, el valor diferencial entre un numero de imagen que tiene asignado un mdice de referencia actual y un numero de 55 imagen que tiene asignado un mdice de referencia inmediatamente antes de la asignacion actual.
Tomando los primeros indices de referencia de la FIG. 3 como ejemplo, puesto que primero se proporciona “-1” como un comando, una imagen con numero de imagen 15 se asigna al numero de mdice de referencia 0 restando 1 al numero de imagen actual 16. Despues, se proporciona "-4" como un comando, por lo que una imagen con numero
de imagen 11 se asigna al numero de mdice de referencia 1 restando 4 al numero de imagen 15 que se ha asignado junto antes del mismo. Cada uno de los numeros de imagen posteriores se asigna de la misma manera. Lo mismo se aplica a los segundos indices de referencia.
5 Segun el procedimiento de asignacion de indices de referencia convencional mostrado en la FIG. 34, todos los indices de referencia se hacen corresponder con numeros de imagen respectivos. Por otro lado, en el ejemplo de la FIG. 3, aunque se utiliza exactamente el mismo procedimiento de asignacion, una pluralidad de indices de referencia se hace corresponder con el mismo numero de imagen modificando los valores de los comandos.
10 La FIG. 4 muestra el resultado de la asignacion de los indices de referencia. Este diagrama muestra que el primer mdice de referencia y el segundo mdice de referencia se asignan a cada numero de imagen por separado, pero una pluralidad de indices de referencia se asigna a un numero de imagen en algunos casos. En el procedimiento de codificacion de la presente invencion, se supone que una pluralidad de indices de referencia se asigna a al menos un numero de imagen, como este ejemplo.
15
Si los indices de referencia se utilizan solamente para determinar imagenes de referencia, el procedimiento convencional de asignacion uno a uno de indices de referencia a numeros de imagen es el procedimiento de codificacion mas eficaz. Sin embargo, en caso de que un conjunto de coeficientes de ponderacion de coeficientes de prediccion lineal se seleccione para generar una imagen predictiva utilizando indices de referencia, tienen que 20 utilizarse los mismos coeficientes de prediccion lineal para todos los bloques que tengan las mismas imagenes de referencia, por lo que hay una posibilidad extremadamente alta de que no pueda generarse la imagen predictiva optima.
Por lo tanto, si es posible asignar una pluralidad de indices de referencia a un numero de imagen como en el caso 25 de la presente invencion, el conjunto de coeficientes de ponderacion optimo de coeficientes de prediccion lineal puede seleccionarse para cada bloque de entre una pluralidad de conjuntos candidatos incluso si todos los bloques tienen la misma imagen de referencia y, por tanto, puede generarse la imagen predictiva con una mayor eficacia de codificacion.
30 Debe observarse que la descripcion anterior muestra el caso en que los numeros de imagen se proporcionan suponiendo que todas las imagenes de referencia estan almacenadas en una memoria de referencia. Sin embargo, a una imagen actual se le proporciona un numero de imagen que es superior en un valor de uno al numero de una imagen que se ha codificado inmediatamente antes que la imagen actual, solamente cuando se almacena la imagen actual que se ha codificado en ultimo lugar, por lo que la continuidad de los numeros de imagen se mantiene en la 35 memoria de referencia incluso si algunas imagenes no se almacenan y, por tanto, el procedimiento mencionado anteriormente puede utilizarse sin cambios.
(3) Procedimiento para generar imagenes predictivas
40 A continuacion, se explicara, utilizando la FIG. 5, el procedimiento de generacion de imagenes predictivas en la unidad de codificacion de compensacion de movimiento 107 mostrada en la FIG. 1. Aunque el procedimiento de generacion de imagenes predictivas mediante prediccion lineal es exactamente igual al procedimiento convencional, la flexibilidad en la seleccion de coeficientes de prediccion lineal aumenta debido a que una pluralidad de numeros de indices de referencia puede hacerse corresponder con la misma imagen.
45
La imagen B16 es una imagen B actual que va a codificarse, y los bloques BL01 y BL02 son bloques actuales que van a codificarse y que pertenecen a la imagen B. La imagen P11 y la imagen B15 se utilizan como la primera imagen de referencia y como la segunda imagen de referencia para BL01, y la imagen predictiva se genera con referencia a los bloques BL11 y BL21 que pertenecen a las imagenes P11 y B15, respectivamente. De la misma 50 manera, la imagen P11 y la imagen B15 se utilizan como la primera imagen de referencia y como la segunda imagen de referencia para BL02, la imagen predictiva se genera con referencia a los bloques BL12 y BL22 que pertenecen a esas imagenes de referencia, respectivamente.
Aunque BL01 y BL02 hacen referencia a las mismas imagenes como su primera imagen de referencia y la segunda 55 imagen de referencia, es posible asignar diferentes valores al primer mdice de referencia ref1 y al segundo mdice de referencia ref2 para BL01 y BL02 utilizando el procedimiento de asignacion de indices de referencia explicado en la seccion (2). Tomando la FIG. 4 como un ejemplo, 1 y 3 se asignan al primer mdice de referencia correspondiente al numero de imagen 11, mientras que 1 y 6 se asignan al segundo mdice de referencia correspondiente al numero de imagen 15.
Como resultado, se supone que hay cuatro combinaciones de estos mdices de referencia, (refl, ref2) = (1, 1), (1, 6), (3, 1) y (3, 6) y, por tanto, es posible seleccionar la combinacion para obtener el conjunto de coeficientes de ponderacion optimo para cada bloque de entre estas combinaciones. En la FIG. 5, ref1 = 1 y ref2 = 1 se asignan a 5 BL01, y refl = 3 y ref2 = 6 se asignan a BL02, por ejemplo.
Segun el procedimiento de asignacion de referencia convencional mostrado en la FIG. 35, solo una combinacion de (ref1, ref2) = (1, 1) puede seleccionarse para BL01 y BL02 en el caso de la FIG. 5, y, por tanto, solo puede seleccionarse un conjunto de coeficientes de ponderacion de coeficientes de prediccion lineal. Por otro lado, segun 10 la presente invencion, hay cuatro opciones disponibles y puede decirse que la posibilidad de seleccionar el conjunto de coeficientes de ponderacion optimo aumenta.
Un flujo codificado de una imagen esta formado por un area de informacion comun de imagen y por una pluralidad de areas de datos de seccion. La FIG. 6 muestra la estructura del area de datos de seccion en el flujo codificado. El 15 area de datos de seccion esta formada ademas por un area de cabecera de seccion y por una pluralidad de areas de datos de bloque. Este diagrama muestra cada una de las areas de bloque correspondientes a BL01 y BL02 en la FIG. 5 como un ejemplo del area de datos de bloque. "ref1" y "ref2" incluidos en BL01 designan el primer mdice de referencia y el segundo mdice de referencia, respectivamente, indicando dos imagenes a las que hace referencia el bloque BL01.
20
Ademas, en el area de cabecera de seccion, datos (pconjuntoO, pconjunto1, pconjunto2...) para proporcionar los conjuntos de coeficientes de ponderacion para llevar a cabo la prediccion lineal mencionada anteriormente se describen para ref1 y ref2, respectivamente. En esta area, pueden fijarse “pconjuntos” en un numero equivalente al numero de indices de referencia explicados en la seccion (2). De manera mas espedfica, en caso de que diez 25 indices de referencia, comprendidos entre 0 y 9, se utilicen como cada uno del primer mdice de referencia y del segundo mdice de referencia, diez "pconjuntos" de 0 a 9 tambien pueden fijarse para ref1 y ref2.
La FIG. 7 muestra un ejemplo de tablas de los conjuntos de coeficientes de ponderacion incluidos en el area de cabecera de seccion. Cada dato indicado por un pconjunto identificador tiene cuatro valores w1, w2, c y d, y estas 30 tablas estan estructuradas de manera que los valores de ref1 y ref2 pueden hacer referencia a los datos directamente. Ademas, las secuencias de comandos idx_cmd1 e idx_cmd2 para asignar los indices de referencia a los numeros de imagen estan descritas en el area de cabecera de seccion.
Utilizando ref1 y ref2 descritos en BL01 en la FIG. 6, un conjunto de coeficientes de ponderacion se selecciona de 35 cada una de las tablas para ref1 y ref2 de la FIG. 7. Llevando a cabo una prediccion lineal en los valores de pixel de las imagenes de referencia utilizando estos dos conjuntos de coeficientes de ponderacion, se genera una imagen predictiva.
Tal y como se ha descrito anteriormente, utilizando el procedimiento de codificacion en el que una pluralidad de 40 indices de referencia se asigna a un numero de imagen, puede generarse una pluralidad de candidatos para los conjuntos de coeficientes de ponderacion de coeficientes de prediccion lineal y, por tanto, puede seleccionarse el mejor de los mismos. Por ejemplo, en caso de que se asignen dos primeros indices de referencia y dos segundos indices de referencia, hay cuatro conjuntos de coeficientes de ponderacion disponibles como candidatos para su seleccion, y en caso de se asignen tres primeros indices de referencia y tres segundos indices de referencia, hay 45 nueve conjuntos de coeficientes de ponderacion disponibles como candidatos para su seleccion.
En particular, este procedimiento de prediccion lineal tiene un efecto importante en caso de que el brillo de toda la imagen o de parte de la misma cambie significativamente, como un desvanecimiento y un centelleo. En muchos casos, el grado de cambio en el brillo es diferente entre las partes de una imagen. Por lo tanto, la estructura de la 50 presente invencion en la que puede seleccionarse el mejor conjunto para cada bloque de entre una pluralidad de conjuntos de coeficientes de ponderacion es muy eficaz en la codificacion de imagenes.
A continuacion, se explicara en detalle el flujo de procesamiento desde la determinacion de conjuntos de coeficientes de ponderacion hasta la generacion de una imagen predictiva.
La FIG. 8 es un diagrama de bloques funcionales que muestra la estructura funcional para generar una imagen predictiva en la unidad de generacion de coeficientes de prediccion lineal 110, la unidad de almacenamiento de coeficientes de prediccion lineal 109 y la unidad de codificacion de compensacion de movimiento 107.
5
10
15
20
25
30
35
40
45
50
55
Una imagen predictiva se genera a traves de la unidad de generacion de coeficientes de prediccion lineal 110, la unidad de almacenamiento de coeficientes de prediccion lineal 109a, la unidad de almacenamiento de coeficientes de prediccion lineal 109b, la unidad de calculo de promedios 107a y la unidad de operaciones de prediccion lineal 107b.
Los conjuntos de coeficientes de ponderacion generados por la unidad de generacion de coeficientes de prediccion lineal 110 se almacenan en la unidad de almacenamiento de coeficientes de prediccion lineal 109a y en la unidad de almacenamiento de coeficientes lineales 109b. La unidad de calculo de promedios 107a obtiene, a partir de la unidad de almacenamiento de coeficientes de prediccion lineal 109a, un conjunto de coeficientes de ponderacion (w1_1, w2_1, c_1, d_1) seleccionado por el primer mdice de referencia ref1 determinado por el procesamiento de estimacion de movimiento y, ademas, obtiene, a partir de la unidad de almacenamiento de coeficientes lineales 109b, un conjunto de coeficientes de ponderacion (w1_2, w2_2, c_2, d_2) seleccionado por el segundo mdice de referencia ref2.
Despues, la unidad de calculo de promedios 107a calcula el promedio, para parametros respectivos, de los conjuntos de coeficientes de ponderacion a partir de las unidades de almacenamiento de coeficientes de prediccion lineal 109a y 109b para considerarlo como el conjunto de coeficientes de ponderacion (w1, w2, c, d) que va a utilizarse para la prediccion lineal real, y lo proporciona a la unidad de operaciones de prediccion lineal 107b. La unidad de operaciones de prediccion lineal 107b calcula la imagen predictiva utilizando la ecuacion 1 en funcion del conjunto de coeficientes de ponderacion obtenido (w1, w2, c, d) para proporcionarse.
La FIG. 9 es un diagrama de bloques funcionales que muestra otra estructura funcional para generar una imagen predictiva. Una imagen predictiva se genera a traves de la unidad de generacion de coeficientes de prediccion lineal 110, la unidad de almacenamiento de coeficientes de prediccion lineal 109a, la unidad de almacenamiento de coeficientes de prediccion lineal 109b, la unidad de funcionamiento de prediccion lineal 107c, la unidad de operaciones de prediccion lineal 107d y la unidad de calculos de promedios 107e.
Los conjuntos de coeficientes de ponderacion generados por la unidad de generacion de coeficientes de prediccion lineal 110 se almacenan en la unidad de almacenamiento de coeficientes de prediccion lineal 109a y en la unidad de almacenamiento de coeficientes de prediccion lineal 109b. La unidad de operaciones de prediccion lineal 107c obtiene, a partir de la unidad de almacenamiento de coeficientes de prediccion lineal 109a, un conjunto de coeficientes de ponderacion (w1_1, w2_1, c_1, d_1) seleccionado por el primer mdice de referencia ref1 determinado por el procesamiento de estimacion de movimiento, y calcula la imagen predictiva utilizando la ecuacion 1 en funcion del conjunto de coeficientes de ponderacion para proporcionarse a la unidad de calculo de promedios 107e.
De la misma manera, la unidad de operaciones de prediccion lineal 107d obtiene, a partir de la unidad de almacenamiento de coeficientes de prediccion lineal 109b, un conjunto de coeficientes de ponderacion (w1_2, w2_2, c_2, d_2) seleccionado por el segundo mdice de referencia determinado por el procesamiento de estimacion de movimiento, y calcula la imagen predictiva utilizando la ecuacion 1 basandose en el conjunto de coeficientes de ponderacion para proporcionarse a la unidad de calculo de promedios 107e.
La unidad de calculo de promedios 107e calcula el promedio de valores de pixel respectivos de imagenes predictivas proporcionadas por la unidad de operaciones de prediccion lineal 107c y por la unidad de operaciones de prediccion lineal 107d respectivamente para generar la imagen predictiva final que va a proporcionarse.
La FIG. 10A es un diagrama de bloques funcionales que muestra otra estructura funcional para generar una imagen predictiva. Una imagen predictiva se genera a traves de la unidad de generacion de coeficientes de prediccion lineal 110, la unidad de almacenamiento de coeficientes de prediccion lineal 109c, la unidad de almacenamiento de prediccion lineal 109d, la unidad de calculo de promedios 107f y la unidad de operaciones de prediccion lineal 107g.
Los conjuntos de coeficientes de ponderacion generados por la unidad de generacion de coeficientes de prediccion lineal 110 se almacenan en la unidad de almacenamiento de coeficientes de prediccion lineal 109c y en la unidad de almacenamiento de coeficientes de prediccion lineal 109d. La unidad de calculo de promedios 107f obtiene, a partir de la unidad de almacenamiento de coeficientes de prediccion lineal 109c, los parametros de c_1 y d_1 en un conjunto de coeficientes de ponderacion (w1_1, w2_1, c_1, d_1) seleccionado por el primer mdice de referencia ref1 determinado por el procesamiento de estimacion de movimiento y, asimismo, obtiene, a partir de la unidad de almacenamiento de coeficientes de prediccion lineal 109d, los parametros de c_2 y d_2 en un conjunto de coeficientes de ponderacion (w1_2, w2_2, c_2, d_2) seleccionado por el segundo mdice de referencia ref2. La
unidad de calculo de promedios 107f calcula el promedio de c_1 y c_2 y el promedio de d_1 y d_2 obtenidos a partir de la unidad de almacenamiento de coeficientes de prediccion lineal 109c y de la unidad de almacenamiento de coeficientes de prediccion lineal 109d para obtener c y d para proporcionarse a la unidad de operaciones de prediccion lineal 107g.
5
Ademas, la unidad de operaciones de prediccion lineal 107g obtiene el parametro de w1_1 del conjunto de coeficientes de ponderacion mencionado anteriormente (w1_1, w2_1, c_1, d_1) a partir de la unidad de
almacenamiento de coeficientes de prediccion lineal 109c, obtiene el parametro de w2_2 del conjunto de coeficientes de ponderacion mencionado anteriormente (w1_2, w2_2, c_2, d_2) a partir de la unidad de
10 almacenamiento de coeficientes de prediccion lineal 109d, y obtiene c y d que son los promedios calculados por la unidad de calculo de promedios 107f, y despues calcula la imagen predictiva utilizando la ecuacion 1 para proporcionarse.
De manera mas espedfica, cuando se determina el conjunto de coeficientes de ponderacion (w1, w2, c, d), que se 15 utiliza realmente para la prediccion lineal, de entre el conjunto de coeficientes de ponderacion (w1_1, w2_1, c_1, d_1) obtenido a partir de la unidad de almacenamiento de coeficientes de prediccion lineal y el conjunto de
coeficientes de ponderacion (w1_2, w2_2, c_2, d_2) obtenido a partir de la unidad de almacenamiento de
coeficientes de prediccion lineal 109d, la unidad de operaciones de prediccion lineal 107g utiliza la siguiente regla:
20 w1 = w1_1 w2 = w2_2
c = (promedio de c_1 y c_2) d = (promedio de d_1 y d_2)
25 Tal y como se ha descrito anteriormente, en la generacion de la imagen predictiva como se explico en la FIG. 10A, la unidad de almacenamiento de coeficientes de prediccion lineal 109c no necesita a w2_1 del conjunto de coeficientes de ponderacion. Por lo tanto, w2 no es necesario para el conjunto de coeficientes de ponderacion para ref1 y, por tanto, la cantidad de datos de un flujo codificado puede reducirse.
30 Ademas, la unidad de almacenamiento de coeficientes de prediccion lineal 109d no necesita a w1_2 del conjunto de coeficientes de ponderacion. Por lo tanto, w1 no es necesario para el conjunto de coeficientes de ponderacion para ref2 y, por tanto, la cantidad de datos de un flujo codificado puede reducirse.
La FIG. 10B es un diagrama de bloques funcionales que muestra otra estructura funcional para generar una imagen 35 predictiva. Una imagen predictiva se genera a traves de la unidad de generacion de coeficientes de prediccion lineal 110, la unidad de almacenamiento de coeficientes de prediccion lineal 109e, la unidad de almacenamiento de coeficientes de prediccion lineal 109f y la unidad de operaciones de prediccion lineal 107h.
Los conjuntos de coeficientes de ponderacion generados por la unidad de generacion de coeficientes de prediccion 40 lineal 110 se almacenan en la unidad de almacenamiento de coeficientes de prediccion lineal 109e y en la unidad de almacenamiento de coeficientes de prediccion lineal 109f. La unidad de operaciones de prediccion lineal 107h obtiene, a partir de la unidad de almacenamiento de coeficientes de prediccion lineal 109e, los parametros de w1_1, c_1 y d_1 que son parte de un conjunto de coeficientes de ponderacion (w1_1, w2_1, c_1, d_1) seleccionado por el primer mdice de referencia ref1 determinado por el procesamiento de estimacion de movimiento y, asimismo, 45 obtiene, a partir de la unidad de almacenamiento de coeficientes de prediccion lineal 109f, el parametro de w2_2 que es parte de un conjunto de coeficientes de ponderacion (w1_2, w2_2, c_2, d_2) seleccionado en funcion del segundo mdice de referencia ref2. La unidad de operaciones de prediccion lineal 107h calcula una imagen predictiva utilizando la ecuacion 1 basandose en w1_1, c_1, d_1, w2_2 obtenidos a partir de la unidad de almacenamiento de coeficientes de prediccion lineal 109e y de la unidad de almacenamiento de coeficientes de prediccion 109f para 50 proporcionarse.
De manera mas espedfica, cuando se determina el conjunto de coeficientes de ponderacion (w1, w2, c, d), que se utiliza realmente para la prediccion lineal, de entre el conjunto de coeficientes de ponderacion (w1_1, w2_1, c_1, d_1) obtenido a partir de la unidad de almacenamiento de coeficientes de prediccion lineal 109e y el conjunto de 55 coeficientes de ponderacion (w1_2, w2_2, c_2, d_2) obtenido a partir de la unidad de almacenamiento de coeficientes de prediccion lineal 109f, la unidad de operaciones de prediccion lineal 107h utiliza las siguiente regla.
w1 = w1_1 w2 = w2_2
c = c_1 d = d_1
En la generacion de la imagen predictiva como se explico en la FIG. 10B, la unidad de almacenamiento de 5 coeficientes de prediccion lineal 109e no necesita a w2_1 del conjunto de coeficientes de ponderacion. Por lo tanto, w2 no es necesario para el conjunto de coeficientes de ponderacion de refl y, por tanto, la cantidad de datos de un flujo codificado puede reducirse.
Ademas, la unidad de almacenamiento de coeficientes de prediccion lineal 109f no necesita a w1_2, c_2 y d_2 del 10 conjunto de coeficientes de ponderacion. Por lo tanto, w1, c y d no son necesarios para el conjunto de coeficientes de ponderacion para ref2 y, por tanto, la cantidad de datos de un flujo codificado puede reducirse.
Ademas, tambien es posible utilizar uno o mas parametros de entre w1, w2, c y d como valores fijos. La FIG. 11 es un diagrama de bloques funcionales en el caso en que solo se utiliza "d" como un valor fijo para la estructura 15 funcional de la FIG. 10A. Una imagen predictiva se genera a traves de la unidad de generacion de coeficientes de prediccion lineal 110, la unidad de almacenamiento de coeficientes de prediccion lineal 109i, la unidad de almacenamiento de coeficientes de prediccion lineal 109j, la unidad de calculo de promedios 107j y la unidad de operaciones de prediccion lineal 107k.
20 Los coeficientes seleccionados por el primer mdice de referencia ref1 a partir de la unidad de almacenamiento de coeficientes de prediccion lineal 109i son solamente (w1_1, c_1), y los coeficientes seleccionados por el segundo mdice de referencia ref2 a partir de la unidad de almacenamiento de coeficientes de prediccion lineal 109j son solamente (w2_2, c_2). La unidad de calculo de promedios 107j calcula el promedio de c_1 y c_2 obtenidos a partir de la unidad de almacenamiento de coeficientes de prediccion 109i y de la unidad de almacenamiento de 25 coeficientes de prediccion lineal 109j para obtener "c" y lo proporciona a la unidad de operaciones de prediccion lineal 107k.
La unidad de operaciones de prediccion lineal 107k obtiene el parametro de w1_1 a partir de la unidad de almacenamiento de coeficientes de prediccion lineal 109i, el parametro de w2_2 a partir de la unidad de 30 almacenamiento de coeficientes de prediccion lineal 109j, y el parametro de c a partir de la unidad de calculo de promedios 107j y despues calcula la imagen predictiva basandose en la ecuacion 1 utilizando un valor fijo predeterminado como un parametro de d, y proporciona la imagen predictiva. De manera mas espedfica, los siguientes valores se introducen como los coeficientes (w1, w2, c, d) de la ecuacion 1.
35 w1 = w1_1 w2 = w2_2
c = (promedio de c_1 y c_2) d = (valor fijo)
40 La asignacion de los valores anteriores en la ecuacion 1 proporciona la siguiente ecuacion 1a.
P(i) = (w1_1 x Q1(i) + w2_2 x Q2(i))/pow(2, d) + (c_1 + c_2)/2 ...Ecuacion 1a
(donde pow(2, d) indica la “d”-esima potencia de 2)
45
Ademas, modificando la ecuacion 1a se obtiene la siguiente ecuacion 1b. Es posible que la unidad de operaciones de prediccion lineal 107k trate el procedimiento de operaciones de prediccion lineal exactamente de la misma manera en el formato de la ecuacion 1b o de la ecuacion 1.
50 P(i) = (w1_1 x Q1(i)/pow(2, d-1) + c_1 + w2_2 x Q2(i)/pow(2, d-1) + c_2)/2 ...Ecuacion 1b
(donde pow(2, d-1) indica la “d-1”-esima potencia de 2)
Aunque en la ecuacion 1b se utiliza pow(2, d-1), el sistema puede estructurarse utilizando pow(2, d') introduciendo d' 55 (suponiendo que d' = d-1) en la unidad de operaciones de prediccion lineal 107k, ya que d es un valor fijo.
Ademas, en la generacion de la imagen predictiva como se explica en la FIG. 11, la unidad de almacenamiento de coeficientes de prediccion lineal 109i solo necesita w1_1 y c_1 de entre los conjuntos de coeficientes de ponderacion para ello, y la unidad de almacenamiento de coeficientes de prediccion lineal 109j solo necesita a w2_2 y c_2 de
entre los conjuntos de coeficientes de ponderacion para ello. Por lo tanto, no es necesario codificar parametros diferentes a los parametros requeridos anteriormente y, por tanto, la cantidad de datos del flujo codificado puede reducirse.
5 Debe observarse que es posible utilizar un valor fijo predeterminado como un valor de d en cualquiera de los casos, pero el valor fijo puede conmutar por cada seccion describiendose el valor fijo en la cabecera de seccion. Asimismo, el valor fijo puede conmutar por cada imagen o por cada secuencia describiendose en el area de informacion comun de imagen o en el area de informacion comun de secuencia.
10 La FIG. 12 muestra un ejemplo de una estructura de un area de datos de seccion en caso de que se utilice el procedimiento de prediccion lineal mencionado anteriormente. Esto es diferente de la FIG. 6 en que solamente "d" se describe en el area de cabecera de seccion y solamente se describen w1_1 y c_1 como pconjunto para refl. La FIG. 13 muestra tablas que muestran un ejemplo de los conjuntos de coeficientes de ponderacion anteriores incluidos en el area de cabecera de seccion. Cada dato indicado por el identificador “pconjunto” tiene dos valores de w1_1 y c_1 15 o w2_2 y c_2, y esta estructurado para que los valores de refl y ref2 hagan referencia a los mismos directamente.
Debe observarse que la unidad de generacion de coeficientes de prediccion lineal 110 genera los conjuntos de coeficientes de ponderacion examinando las caractensticas de una imagen, y la unidad de codificacion de compensacion de movimiento 107 crea una imagen predictiva utilizando cualquiera de los procedimientos explicados 20 en la FIG. 8, la FIG. 9, la FIG. 10 y la FIG. 11, y determina la combinacion de dos indices de referencia ref1 y ref2 para minimizar el error de prediccion. En caso de que se utilice cualquiera de los procedimientos de la FIG. 10a, la FIG. 10B y la FIG. 11 que no requieren todos los parametros, es posible omitir el procesamiento de crear parametros innecesarios en la fase en la que la unidad de generacion de coeficientes de prediccion lineal 110 del aparato de codificacion crea los conjuntos de coeficientes de ponderacion.
25
En los procedimientos de la FIG. 10A, la FIG. 10B y la FIG. 11, la unidad de generacion de coeficientes de prediccion lineal 110 puede buscar y crear los conjuntos optimos de coeficientes de ponderacion para ref1 y ref2, w1_1 y w2_2, por ejemplo, por separado, cuando se crean tales conjuntos de coeficientes de ponderacion. Dicho de otro modo, utilizando estos procedimientos, es posible reducir la cantidad de procesamiento ejecutado por el aparato 30 de codificacion para crear conjuntos de coeficientes de ponderacion.
Debe observarse que los procedimientos de codificacion mencionados anteriormente se refieren a una imagen B que tiene dos imagenes de referencia, pero tambien es posible ejecutar el mismo procesamiento en el modo de codificacion de una imagen de referencia para una imagen P o una imagen B que tiene solamente una imagen de 35 referencia. En este caso, utilizando solamente uno de entre el primer mdice de referencia y el segundo mdice de referencia, pconjunto e idx_cmd para ref1 o ref2 se describen solamente en el area de cabecera de seccion incluida en el flujo codificado de la FIG. 6, segun el mdice de referencia descrito en el area de datos de bloque.
Ademas, como un procedimiento de prediccion lineal, se utiliza la siguiente ecuacion 3 en lugar de la ecuacion 1 40 explicada en el procedimiento convencional. En este caso, Q1(i) es un valor de pixel de un bloque al que se hace referencia, P(i) es un valor de pixel de una imagen predictiva de un bloque actual que va a codificarse, y w1, w2, c y d son coeficientes de prediccion lineal proporcionados por el conjunto de coeficientes de ponderacion seleccionado.
P(i) = (w1 x Q1(i) + w2 x Q1(i))/pow(2, d) + c ...Ecuacion 3 45
(donde pow(2, d) indica la "d"-esima potencia de 2)
Debe observarse que es posible utilizar la ecuacion 4 como una ecuacion de prediccion lineal, en lugar de la ecuacion 3. En este caso, Q1(i) es un valor de pixel de un bloque al que se hace referencia, P(i) es un valor de pixel 50 de una imagen predictiva de un bloque actual que va a codificarse, y w1, c y d son coeficientes de prediccion lineal proporcionados por el conjunto de coeficientes de ponderacion seleccionado.
P(i) = (w1 x Q1(i))/pow(2, d) + c ...Ecuacion 4
55 (donde pow(2, d) indica la “d”-esima potencia de 2)
La utilizacion de la ecuacion 1 y de la ecuacion 3 requiere cuatro parametros w1, w2, c y d, mientras que la utilizacion de la ecuacion 4 requiere solamente tres parametros w1, c y d para la prediccion lineal. Dicho de otro modo, en caso de que cualquiera de entre el primer mdice de referencia y el segundo mdice de referencia se utilice
para una imagen en su totalidad, como una imagen P, es posible reducir a tres el numero de elementos de datos de cada conjunto de coeficientes de ponderacion que va a describirse en el area de cabecera de seccion.
Cuando se utiliza la ecuacion 3, es posible realizar una prediccion lineal disponible para imagenes B e imagenes P 5 de manera adaptativa sin cambios en la estructura. Cuando se utiliza la ecuacion 4, la cantidad de datos que va a describirse en el area de cabecera de una imagen P puede reducirse y, por tanto, es posible conseguir la reduccion de la cantidad de procesamiento gracias a un calculo simplificado. Sin embargo, puesto que el procedimiento de asignacion de indices de referencia sugerido por la presente invencion puede aplicarse directamente a cualquiera de los procedimientos anteriores, puede crearse una imagen predictiva con una alta eficacia de codificacion, que es 10 extremadamente eficaz en la codificacion de imagenes.
Por cierto, las imagenes a las que se hace referencia en una compensacion de movimiento se determinan designando los indices de referencia asignados a las respectivas imagenes. En ese caso, el numero maximo de imagenes que estan disponibles como referencia se ha descrito en el area de informacion comun de imagen del flujo 15 codificado.
La FIG. 38 es un diagrama esquematico de un flujo codificado en el que se describe el numero maximo de imagenes que estan disponibles como referencia. Como muestra este diagrama, el numero maximo de imagenes para Max_pic1 de refl y el numero maximo de imagenes para Max_pic2 de ref2 estan descritos en la informacion comun 20 de imagen del flujo codificado.
La informacion requerida para la codificacion no es el numero maximo de imagenes reales, sino el valor maximo de mdice de referencia disponible para designar imagenes.
25 Puesto que en el procedimiento convencional se asigna un mdice de referencia a una imagen, la descripcion mencionada anteriormente del numero maximo de imagenes no genera ninguna contradiccion. Sin embargo, el diferente numero de indices de referencia y de imagenes influye significativamente en caso de que una pluralidad de indices de referencia se asigne a un numero de imagen, como la presente invencion.
30 Tal y como se ha descrito anteriormente, las secuencias de comandos idx_cmd1 e idx_cmd2 se describen en un flujo codificado con el fin de asignar indices de referencia a numeros de imagen. Los numeros de imagen y los indices de referencia se hacen corresponder entre sf en funcion de cada comando de estas secuencias de comandos idx_cmd1 e idx_cmd2. Para ese fin, conocer el valor maximo de mdice de referencia muestra que todos los indices de referencia y los numeros de imagen se han hecho corresponder entre sf, concretamente, el final de los 35 comandos de las secuencias de comandos idx_cmd1 e idx_cmd2.
Por lo tanto, en la presente realizacion, el numero maximo de indices de referencia disponibles, en lugar del numero maximo de imagenes en la tecnica anterior, se describe en el area de informacion comun de imagen, que es la cabecera de la imagen. Como alternativa, se describen tanto el numero maximo de imagenes como el numero 40 maximo de indices de referencia.
La FIG. 23 muestra un area de informacion comun de imagen en un flujo codificado de una imagen en la que esta descrito el numero maximo de indices de referencia. En el area de informacion comun de imagen estan descritos el numero maximo de indices de referencia disponibles para Max_idx1 de refl y el numero maximo de indices de 45 referencia disponibles para Max_idx2 de ref2.
En la FIG. 23, el numero maximo de indices de referencia esta descrito en la informacion comun de imagen, pero puede estar estructurado de manera que el numero maximo de indices de referencia este descrito en el area de datos de seccion, asf como en la informacion comun de imagen. Por ejemplo, el numero maximo de indices de 50 referencia requerido para cada seccion puede describirse claramente, en caso de que el numero maximo de indices de referencia requeridos para cada seccion sea significativamente diferente del numero maximo de los mismos descrito en el area de informacion comun de imagen, de seccion a seccion; por ejemplo, el numero maximo de indices de referencia en una imagen es 8, el numero maximo de indices de referencia requeridos para la seccion 1 de la imagen es 8 y el numero maximo de indices de referencia requeridos para la seccion 2 es 4.
55
Dicho de otro modo, puede estar estructurado de manera que el numero maximo de indices de referencia descrito en la informacion comun de imagen este fijado como un valor por defecto comun a todas las secciones de la imagen y que el numero maximo de indices de referencia requerido para una seccion, que es diferente del valor por defecto, este descrito en la cabecera de seccion.
Aunque la FIG. 23 y la FIG. 38 muestran ejemplos en los que un flujo codificado esta formado por un area de informacion comun de imagen y por areas de datos de seccion, el area de informacion comun de imagen y las areas de datos de seccion pueden tratarse como flujos codificados diferentes exactamente de la misma manera que un 5 flujo codificado.
(Segunda realizacion)
A continuacion, se explicara el procedimiento de codificacion de imagenes en movimiento de la segunda realizacion 10 de la presente invencion. Puesto que la estructura del aparato de codificacion, el flujo de procesamiento de codificacion y el procedimiento de asignacion de indices de referencia son exactamente identicos a los de la primera realizacion, no se repetira la explicacion de los mismos.
En la primera realizacion, la prediccion lineal se lleva a cabo en cada pixel para generar una imagen predictiva en 15 una compensacion de movimiento utilizando la ecuacion 1, la ecuacion 3 o la ecuacion 4. Sin embargo, todas estas ecuaciones incluyen multiplicaciones, lo que provoca un aumento significativo de la cantidad de procesamiento considerando que estas multiplicaciones se llevan a cabo en todos los pfxeles.
Por lo tanto, es posible utilizar la ecuacion 5 en lugar de la ecuacion 1, la ecuacion 6 en lugar de la ecuacion 3, y la 20 ecuacion 7 en lugar de la ecuacion 4. Estas ecuaciones permiten calculos utilizando solamente operaciones de desplazamiento de bits sin utilizar multiplicaciones y, por tanto, permiten reducir la cantidad de procesamiento. En las siguientes ecuaciones, Q1(i) y Q2(i) son valores de pixel de bloques a los que se hace referencia, P(i) es un valor de pixel de una imagen predictiva de un bloque actual que va a codificarse, y 'm', 'n' y 'c' son coeficientes de prediccion lineal proporcionados por un conjunto de coeficientes de ponderacion seleccionado.
25
P(i) = ± pow(2, m) x Q1(i) ± pow(2, n) * Q2(i) + c ...Ecuacion 5 p(i) = ± pow(2, m) * Q1(i) ± pow(2, n) * Q1(i) + c ...Ecuacion 6 P(i) = ± pow(2, m) * Q1(i) + c ...Ecuacion 7
30 (donde pow(2, m) indica la “m”-esima potencia de 2, y pow(2, n) indica la "n"-esima potencia de 2)
Al igual que en la primera realizacion, la ecuacion 5 se utiliza para generar una imagen predictiva con referencia a dos imagenes al mismo tiempo, y la ecuacion 6 o la ecuacion 7 se utiliza para generar una imagen predictiva con referencia a solamente una imagen. Puesto que estas ecuaciones requieren identificadores que indican signos mas 35 o menos, conjuntos de coeficientes de ponderacion requeridos para las operaciones de prediccion son (signo1, m, signo2, n, c) para las ecuaciones 5 y 6, y (signo1, m, c) para la ecuacion 7. "signo1" y "signo2" son parametros que identifican el primer y el segundo signo mas y menos, respectivamente. Aunque el numero de parametros es mayor que en la primera realizacion, la cantidad de procesamiento aumenta poco ya que el signo1 y el signo2 pueden representarse mediante 1 bit.
40
A continuacion, se explicara en detalle el flujo de procesamiento desde la determinacion de conjuntos de coeficientes de ponderacion hasta la generacion de una imagen predictiva con referencia a dos imagenes a la vez utilizando la ecuacion 5.
45 En primer lugar, se explicara el caso en que la estructura funcional para la generacion de una imagen predictiva es como la mostrada en la FIG. 8. La unidad de calculo de promedios 107a obtiene el conjunto de coeficientes de ponderacion (signo1_1, m_1, signo2_1, n_1, c_1) a partir de la unidad de almacenamiento de coeficientes de prediccion lineal 109a. Ademas, la unidad de calculo de promedios 107a obtiene el conjunto de coeficientes de ponderacion (signo1_2, m_2, signo2_2, n_2, c_2) a partir de la unidad de almacenamiento de coeficientes de 50 prediccion lineal 109b.
La unidad de calculo de promedios 107a calcula, para parametros respectivos, el promedio de los conjuntos de coeficientes de ponderacion obtenidos a partir de la unidad de almacenamiento de coeficientes de prediccion lineal 109a y de la unidad de almacenamiento de coeficientes de prediccion lineal 109b para considerar el promedio como 55 el conjunto de coeficientes de ponderacion (signo1, m, signo2, n, c). La unidad de operaciones de prediccion lineal 107b calcula la imagen predictiva utilizando la ecuacion 5 basandose en el conjunto de coeficientes de ponderacion (signo1, m, signo2, n, c) proporcionado por la unidad de calculo de promedios 107a.
Debe observarse que la FIG. 8 muestra el conjunto de coeficientes de ponderacion (w1_1, w2_1, c_1, d_1), y
similares obtenidos a partir de la unidad de almacenamiento de coeficientes de prediccion lineal 109a y similares, que se calculan en caso de utilizar la ecuacion 1 explicada en la primera realizacion, y no muestra los parametros utilizados en caso de que la imagen predictiva se obtenga utilizando la ecuacion 5, ya que los parametros utilizados en el primer caso pueden sustituirse por los parametros del segundo caso. Esto tambien se aplica a los casos de la 5 FIG. 9 y de la FIG. 10 que se describen mas adelante.
A continuacion, se explicara el caso en que la estructura funcional para la generacion de una imagen predictiva es como la mostrada en la FIG. 9. La unidad de operaciones de prediccion lineal 107c calcula una imagen predictiva 1 basandose en el conjunto de coeficientes de ponderacion (signo1_1, m_1, signo2_1, n_1, c_1) obtenido a partir de 10 la unidad de almacenamiento de coeficientes de prediccion lineal 109a. La unidad de operaciones de prediccion lineal 107d calcula una imagen predictiva 2 basandose en el conjunto de coeficientes de ponderacion (signo1_2, m_2, signo2_2, n_2, c_2) obtenido a partir de la unidad de almacenamiento de coeficientes de prediccion lineal 109b. Ademas, la unidad de calculo de promedios 107e calcula, para pfxeles respectivos, el promedio de las imagenes predictivas calculadas por las unidades de operaciones de prediccion lineal 107c y 107d para obtener una 15 imagen predictiva.
En este caso, la unidad de operaciones de prediccion lineal 107c calcula en primer lugar la imagen predictiva utilizando la ecuacion 5 basandose en el conjunto de coeficientes de ponderacion (signo1_1, m_1, signo2_1, n_1, c_1), por lo que es posible calcular la imagen predictiva utilizando operaciones de desplazamiento de bits sin utilizar 20 multiplicaciones. Esto tambien se aplica a la unidad de operaciones de prediccion lineal 107d. Por otro lado, en el caso de la FIG. 8, puesto que se calcula en primer lugar el promedio del conjunto de coeficientes de ponderacion (signo1_1, m_1, signo2_1, n_1, c_1) y del conjunto de coeficientes de ponderacion (signo1_2, m_2, signo2_2, n_2, c_2), el promedio de m_1 y de m_2 o el promedio de n_1 y de n_2, en concreto los exponentes de 2, pueden no ser numeros enteros y, por tanto, existe la posibilidad de que aumente la cantidad de procesamiento. Ademas, si los 25 exponentes de 2 se redondean a numeros enteros, existe otra posibilidad de aumenten los errores.
A continuacion, se explicara el caso en que una imagen predictiva se genera en la estructura funcional mostrada en la FIG. 10A. La unidad de operaciones de prediccion lineal 107g calcula una imagen predictiva utilizando la ecuacion 5, basandose en los parametros signo1_1 y m_1 que se obtienen a partir de la unidad de almacenamiento de 30 coeficientes de prediccion lineal 109c y utilizados para operaciones de desplazamiento de bits, los parametros signo2_2 y n_2 que se obtienen a partir de la unidad de almacenamiento de coeficientes de prediccion lineal 109d y utilizados para operaciones de desplazamiento de bits, y el promedio c calculado por la unidad de calculo de promedios 107f a partir de los parametros c_1 y c_2 que se obtienen a partir de las unidades de almacenamiento de coeficientes de prediccion lineal 109c y 109d.
35
En este caso, puesto que los coeficientes utilizados para las operaciones de desplazamiento de bits son los valores que se obtienen directamente a partir de la unidad de almacenamiento de coeficientes de prediccion lineal 109c o de la unidad de almacenamiento de coeficientes de prediccion lineal 109d, los exponentes de 2 en la ecuacion 5 son numeros enteros. Por lo tanto, los calculos pueden llevarse a cabo utilizando operaciones de desplazamiento de bits 40 y, por tanto, puede reducirse la cantidad de procesamiento.
Se explicara el caso en que una imagen predictiva se genera en la estructura funcional mostrada en la FIG. 10B. La unidad de operaciones de prediccion lineal 107h calcula una imagen predictiva utilizando la ecuacion 5 basandose en los parametros signo1_1, m_1 y c_1, que se obtienen a partir de la unidad de almacenamiento de coeficientes de 45 prediccion lineal 109e, y en los parametros signo2_2 y n_2, que se obtienen a partir de la unidad de almacenamiento de coeficientes de prediccion lineal 109f.
En este caso, puesto que los coeficientes utilizados para las operaciones de desplazamiento de bits son valores que se obtienen directamente a partir de la unidad de almacenamiento de coeficientes de prediccion lineal 109e o de la 50 unidad de almacenamiento de coeficientes de prediccion lineal 109f, los exponentes de 2 en la ecuacion 5 son numeros enteros. Por lo tanto, la imagen predictiva puede calcularse utilizando operaciones de desplazamiento de bits y, por tanto, puede reducirse la cantidad de procesamiento.
En los casos de las FIG. 10A y 10B, hay parametros que no necesitan anadirse al flujo codificado para su 55 transmision, como es el caso de las FIG. 10A y 10B en la primera realizacion, y la cantidad de datos del flujo codificado puede reducirse.
Utilizando las ecuaciones de prediccion lineal explicadas en la segunda realizacion, los calculos pueden realizarse utilizando operaciones de desplazamiento de bits sin utilizar multiplicaciones, por lo que la cantidad de
procesamiento puede reducirse significativamente con respecto a la primera realizacion.
En la presente realizacion, la prediccion lineal se lleva a cabo utilizando las ecuaciones 5, 6 y 7 en lugar de las ecuaciones 1, 3 y 4, y utilizando el conjunto de parametros que va a codificarse (signol, m, signo2, n, c) en lugar de 5 (w1, w2, c, d), de manera que los calculos pueden realizarse utilizando solamente operaciones de desplazamiento de bits y, por tanto, se consigue una reduccion de la cantidad de procesamiento. Sin embargo, tambien es posible, como otro enfoque, utilizar las ecuaciones 1, 3 y 4 y (w1, w2, c, d) tal cual, limitando los valores seleccionables de w1 y w2 a solamente los valores disponibles para operaciones de desplazamiento de bits, de manera que los calculos pueden realizarse utilizando solamente operaciones de desplazamiento de bits, consiguiendo por tanto una 10 reduccion de la cantidad de procesamiento.
Cuando se determinan los valores de w1 y w2, la unidad de generacion de coeficientes de prediccion lineal 110 de la FIG. 1 selecciona solamente, como una de las opciones, los valores disponibles para operaciones de desplazamiento de bits y describe los valores seleccionados directamente en los flujos codificados de la FIG. 6 y de 15 la FlG. 12, como los valores de w1 y w2 en los mismos. Como resultado, es posible reducir la cantidad de procesamiento para la prediccion lineal incluso exactamente en la misma estructura que la de la primera realizacion. Tambien es posible determinar los coeficientes facilmente ya que las opciones de los coeficientes son limitadas.
Ademas, como un procedimiento para tal limitacion, es posible limitar los valores de w1 y w2 de manera que siempre 20 se seleccione 1 para tales valores y generar los valores optimos de solamente c1 y c2, que son componentes de CC, en la unidad de generacion de coeficientes de prediccion 110. Tomando la estructura de la FIG. 11 como ejemplo, (1, c_1) para ref1 y (1, c_2) para ref2 se codifican como conjuntos de parametros. En este caso, el valor de pixel P(i) de la imagen predictiva se calcula mediante la siguiente ecuacion en la que w1_1 y w2_2 de la ecuacion 1a se sustituyen por 1.
25
P(i) = (Q1(i) + Q2(i))/pow(2, d) + (c_1 + c_2)/2 (donde pow(2, d) indica la “d”-esima potencia de 2)
30 Por consiguiente, es posible reducir significativamente la cantidad de procesamiento para la prediccion lineal incluso exactamente en la misma estructura que la de la primera realizacion. Tambien es posible simplificar significativamente el procedimiento para determinar coeficientes ya que los coeficientes necesarios son solamente c_1 y c_2.
35 La FIG. 24 muestra un ejemplo en el que un indicador sft_flg, que indica si es posible o no llevar a cabo una prediccion lineal utilizando solamente operaciones de desplazamiento de bits, y un indicador cc_flg, que indica si es posible o no llevar a cabo una prediccion lineal utilizando solamente c, que una componente de cc, estan descritos en informacion comun de imagenes en un flujo codificado de una imagen. Un aparato de descodificacion puede descodificar la imagen sin hacer referencia a estos indicadores. Sin embargo, haciendo referencia a estos 40 indicadores, es posible llevar a cabo una descodificacion en la estructura adecuada para una prediccion lineal utilizando solamente operaciones de desplazamiento de bits, o una descodificacion en la estructura adecuada para una prediccion lineal utilizando solamente una componente de CC, por lo que estos indicadores pueden ser informacion muy importante dependiendo de la estructura del aparato de descodificacion.
45 Aunque la FIG. 24 muestra el ejemplo en el que un flujo codificado esta formado por un area de informacion comun de imagen y por areas de datos de seccion, el area de informacion comun de imagen y las areas de datos de seccion pueden tratarse como flujos codificados diferentes exactamente de la misma manera que un flujo codificado. Ademas, en el ejemplo de la FIG. 24, sft_flg y cc_flg estan descritos en el area de informacion comun de imagen, pero pueden tratarse exactamente de la misma manera incluso si estan descritos en el area de informacion comun 50 de secuencia o en otra area de informacion comun independiente. Ademas, no solo es posible utilizar los dos indicadores sft_flg y cc_flg al mismo tiempo, sino que tambien puede utilizarse uno de ellos, y pueden tratarse de la misma manera en el segundo caso.
(Tercera realizacion)
55
Se explicara el procedimiento de codificacion de imagenes en movimiento de la tercera realizacion de la presente invencion. Puesto que la estructura del aparato de codificacion, el flujo de procesamiento de codificacion y el procedimiento de asignacion de indices de referencia son exactamente identicos a los de la primera realizacion, no se repetira la explicacion de los mismos.
Como se explico en el apartado de la tecnica anterior, existe un procedimiento para generar una imagen predictiva utilizando una ecuacion fija predeterminada, tal como la ecuacion 2a y la ecuacion 2b, a diferencia de la primera y de la segunda realizacion en las que una imagen predictiva se genera utilizando una ecuacion de prediccion obtenida a 5 partir de conjuntos de coeficientes de ponderacion de coeficientes de prediccion lineal. Este procedimiento convencional tiene la ventaja de que la cantidad de datos para la codificacion puede reducirse gracias a que no es necesario codificar ni transmitir los conjuntos de coeficientes de ponderacion utilizados para generar la imagen predictiva. Ademas, la cantidad de procesamiento para la prediccion lineal puede reducirse significativamente ya que las ecuaciones de la prediccion lineal son simples. Sin embargo, el procedimiento que utiliza las ecuaciones fijas 10 tiene el problema de que la precision de prediccion es menor debido a que solo pueden seleccionarse dos ecuaciones de prediccion lineal, la 2a y la 2b.
Por lo tanto, en la presente realizacion, las ecuaciones 8a y 8b se utilizan en lugar de las ecuaciones 2a y 2b. Estas ecuaciones 8a y 8b se obtienen anadiendo C1 y C2 a las ecuaciones 2a y 2b. Puesto que solo aumenta el numero 15 de sumas en la operacion, la cantidad de procesamiento aumenta muy poco en comparacion con las ecuaciones originales 2a y 2b. En las siguientes ecuaciones, Q1(i) y Q2(i) son valores de pixel de bloques a los que se hace referencia, P(i) es un valor de pixel de una imagen predictiva de un bloque actual que va a codificarse, y C1 y C2 son coeficientes de prediccion lineal proporcionados por un conjunto de coeficientes de ponderacion seleccionado.
20 P(i) = 2 x (Qi(i) + C1) - (Q2(i) + C2) ...Ecuacion 8a P(i) = (Q1(i) + C1 + Q2(i) +C2)/2 ...Ecuacion 8b
Las ecuaciones 8a y 8b son ecuaciones de prediccion para generar una imagen predictiva con referencia a dos imagenes al mismo tiempo, pero cuando se genera una imagen predictiva con referencia a una imagen solamente, 25 la ecuacion 9 se utiliza en lugar de la ecuacion 3 o la ecuacion 4 explicadas en las realizaciones anteriores.
P(i) = Q1(i) + C1 ...Ecuacion 9
Los conjuntos de coeficientes de ponderacion para utilizar este procedimiento son solamente (C1) para refl y (C2) 30 para ref2. Por lo tanto, un ejemplo de un flujo codificado de una imagen obtenida utilizando este procedimiento es como el mostrado en la FIG. 14. En el area de cabecera de seccion, los conjuntos de coeficientes de ponderacion para la prediccion lineal (pconjuntoO, pconjuntol, pconjunto2...) se describen para refl y ref2 por separado, y cada uno de los conjuntos de coeficientes de ponderacion incluye solamente a C. Asimismo, la FIG. 15 muestra un ejemplo de conjuntos de coeficientes de ponderacion incluidos en el area de cabecera de seccion. A diferencia de la 35 FIG. 7, cada uno de los conjuntos de coeficientes de ponderacion de la FIG. 15 incluye solamente a C.
La FIG. 16 es un diagrama de bloques que muestra la estructura funcional para generar una imagen predictiva a traves de la unidad de generacion de coeficientes de prediccion lineal 110, la unidad de almacenamiento de coeficientes de prediccion lineal 109 y la unidad de codificacion de compensacion de movimiento 107 de la FIG. 1. 40
Una imagen predictiva se genera a traves de la unidad de generacion de coeficientes de prediccion lineal 110, la unidad de almacenamiento de coeficientes de prediccion lineal 109g, la unidad de almacenamiento de coeficientes de prediccion lineal 109h y la unidad de operaciones de prediccion lineal 107i.
45 Los conjuntos de coeficientes de ponderacion generados por la unidad de generacion de coeficientes de prediccion lineal 110 se almacenan en la unidad de almacenamiento de coeficientes de prediccion lineal 109g y en la unidad de almacenamiento de coeficientes de prediccion lineal 109h. Utilizando el primer mdice de referencia ref1 y el segundo mdice de referencia ref2 determinados por el procesamiento de estimacion de movimiento, los conjuntos de coeficientes de ponderacion (C1) y (C2), que tienen un elemento respectivamente, se obtienen a partir de las 50 unidades de almacenamiento de coeficientes de prediccion lineal 109g y 109h. Estos valores se introducen en la unidad de operaciones de prediccion lineal 107i, donde se lleva a cabo una prediccion lineal en los mismos utilizando las ecuaciones 8a y 8b, generandose entonces la imagen predictiva.
Asimismo, cuando la prediccion lineal se lleva a cabo con referencia a una imagen solamente, se obtiene uno 55 cualquiera de los conjuntos de coeficientes de ponderacion (C1) y (C2) utilizando solamente uno de entre ref1 y ref2 de la FIG. 16, la prediccion lineal se lleva a cabo utilizando la ecuacion 9, y despues se genera la imagen predictiva.
Debe observarse que la unidad de generacion de coeficientes de prediccion lineal 110 genera los conjuntos de coeficientes de ponderacion (C1) y (C2) examinando las caractensticas de una imagen, crea una imagen predictiva
utilizando el procedimiento explicado en la FIG. 16 y despues determina una combinacion de los dos mdices de referencia refl y ref2 para minimizar el error de prediccion.
Puesto que la presente realizacion requiere solamente que se utilice un parametro para refl y ref2, el aparato de 5 codificacion puede determinar facilmente los valores de los parametros y, ademas, la cantidad de datos que va a describirse en el flujo codificado puede reducirse. Ademas, puesto que las ecuaciones de prediccion lineal no requieren operaciones complicadas tales como multiplicaciones, la cantidad de operaciones tambien puede minimizarse. Ademas, la utilizacion de los coeficientes C1 y C2 permite una mejora radical de la baja precision de prediccion, considerada como una desventaja del procedimiento convencional que utiliza una ecuacion fija.
10
Debe observarse que es posible utilizar el procedimiento de prediccion lineal explicado En la presente realizacion, independientemente de si una pluralidad de indices de referencia puede hacer referencia o no a la misma imagen.
(Cuarta realizacion)
15
Se explicara el procedimiento de codificacion de imagenes en movimiento de la cuarta realizacion de la presente invencion. Puesto que la estructura del aparato de codificacion, el flujo de procesamiento de codificacion y el procedimiento de asignacion de indices de referencia son exactamente identicos a los de la primera realizacion, no se repetira la explicacion de los mismos.
20
Informacion de orden de visualizacion que indica el tiempo de visualizacion, o una alternativa a la misma, asf como un numero de imagen se asignan a cada imagen. La FlG. 39 es un diagrama que muestra un ejemplo de numeros de imagen y la informacion de orden de visualizacion correspondiente. Determinados valores se asignan a la informacion de orden de visualizacion segun el orden de visualizacion. En este ejemplo se utiliza el valor que 25 aumenta de uno en uno para cada imagen. En la cuarta realizacion se explicara un procedimiento para generar valores de coeficientes utilizados en una ecuacion para una prediccion lineal que utiliza esta informacion de orden de visualizacion.
En la primera realizacion, la prediccion lineal se lleva a cabo para cada pixel utilizando la ecuacion 1, la ecuacion 3 o 30 la ecuacion 4 cuando se genera una imagen predictiva en la compensacion de movimiento. Sin embargo, puesto que la prediccion lineal requiere datos de coeficientes, tales datos de coeficientes se describen en las areas de cabecera de seccion en un flujo codificado como conjuntos de coeficientes de ponderacion que van a utilizarse para la creacion de la imagen predictiva. Aunque este procedimiento consigue una alta eficacia de codificacion, requiere un procesamiento adicional para crear datos de los conjuntos de coeficientes de ponderacion y provoca un aumento en 35 la cantidad de bits ya que los conjuntos de coeficientes de ponderacion se describen en el flujo codificado.
Por lo tanto, tambien es posible llevar a cabo una prediccion lineal utilizando la ecuacion 10, la ecuacion 11a y la ecuacion 12a en lugar de la ecuacion 1. Utilizando estas ecuaciones, los coeficientes de ponderacion pueden determinarse en funcion de solamente la informacion de orden de visualizacion de cada imagen de referencia, por lo 40 que no es necesario codificar los conjuntos de coeficientes de ponderacion por separado.
En las siguientes ecuaciones, Q1(i) y Q2(i) son valores de pixel de bloques a los que se hace referencia, P(i) es un valor de pixel de una imagen predictiva de un bloque actual que va a codificarse, V0 y V1 son coeficientes de ponderacion, T0 es la informacion de orden de visualizacion de la imagen actual que va a codificarse, T1 es la 45 informacion de orden de visualizacion de la imagen designada por el primer mdice de referencia y T2 es la informacion de orden de visualizacion de la imagen designada por el segundo mdice de referencia.
P(i) = V1 x Q1(i) + V2 x Q2(i) ...Ecuacion 10 V1 = (T2 - T0)/(T2 - T1) ...Ecuacion 11a 50 V2 = (T0 - T1)/(T2 - T1) ...Ecuacion 12a
Cuando se supone, por ejemplo, que la imagen actual que va a codificarse en la n° 16, que la imagen designada por el primer mdice de referencia es la n° 11 y que la imagen designada por el segundo mdice de referencia es la n° 10, la informacion de orden de visualizacion de las imagenes respectivas es 15, 13 y 10 y, por tanto, se determinan las 55 siguientes ecuaciones de prediccion lineal.
V1 = (10 - 15)/(10 - 13) = 5/3 V2 = (15 - 13) / (10 - 13) = - 2/3 P(i) = 5/3 x Q1(i) - 2/3 x Q2(i)
En comparacion con el procedimiento que lleva a cabo una prediccion lineal utilizando los conjuntos de coeficientes de ponderacion de la ecuacion 1, las ecuaciones anteriores tienen una menor flexibilidad en lo que respecta a valores de coeficiente y, por tanto, puede decirse que es imposible crear la imagen predictiva optima. Sin embargo, 5 en comparacion con el procedimiento de conmutar las dos ecuaciones fijas 2a y 2b dependiendo de la relacion posicional entre dos imagenes de referencia, las ecuaciones anteriores son ecuaciones de prediccion lineal mas eficientes.
Cuando el primer mdice de referencia y el segundo mdice de referencia hacen referencia a la misma imagen, la 10 ecuacion lla y la ecuacion 12a no se cumplen porque T1 es igual a T2. Por tanto, cuando las dos imagenes de referencia tienen la misma informacion de orden de visualizacion, se llevara a cabo una prediccion lineal utilizandose 1/2 como el valor de V1 y V2. En ese caso, las ecuaciones de prediccion lineal son las siguientes.
V1 = 1/2 15 V2 = 1/2
P(i) = 1/2 x Q1(i) + 1/2 x Q2(i)
Ademas, las ecuaciones 11a y 12a no se cumplen porque T1 es igual a T2 cuando el primer mdice de referencia y el segundo mdice de referencia hacen referencia a imagenes diferentes pero estas imagenes tienen la misma 20 informacion de orden de visualizacion. Como se menciono anteriormente, cuando las dos imagenes de referencia tienen la misma informacion de orden de visualizacion, se llevara a cabo una prediccion lineal utilizando 1/2 como el valor de V1 y V2.
Tal y como se ha descrito anteriormente, cuando dos imagenes de referencia tienen la misma informacion de orden 25 de visualizacion, es posible utilizar un valor predeterminado como coeficiente. Tal coeficiente predeterminado puede ser uno que tenga el mismo peso que 1/2 como se mostro en el ejemplo anterior.
Por otro lado, la utilizacion de la ecuacion 10 en las realizaciones anteriores requiere multiplicaciones y divisiones para la prediccion lineal. Puesto que la operacion de prediccion lineal que utiliza la ecuacion 10 es la operacion para 30 todos los pfxeles de un bloque actual que va a codificarse, la adicion de multiplicaciones provoca un aumento significativo en la cantidad de procesamiento.
Por tanto, la aproximacion de V1 y V2 a las potencias de 2 como el caso de la segunda realizacion hace posible llevar a cabo una operacion de prediccion lineal utilizando solamente operaciones de desplazamiento y, por tanto, 35 reducir la cantidad de procesamiento. Las ecuaciones 11b y 12b se utilizan como ecuaciones de prediccion lineal para ese caso en lugar de las ecuaciones 11a y 12a. En las siguientes ecuaciones, v1 y v2 son numeros enteros.
V1 = ± pow(2, v1) = apx((T2 - T0)/(T2 - T1)) ...Ecuacion 11b V2 = ± pow(2, v2) = apx((T0 - T1)/(T2 - T1)) ...Ecuacion 12b 40
(donde pow(2, v1) indica la “v1”-esima potencia de 2 y pow(2, v2) indica la “v2”-esima potencia de 2)
(donde = apx() indica que el valor dentro de () se aproximara al valor de la izquierda)
Debe observarse que tambien es posible utilizar las ecuaciones 11c y 12c en lugar de las ecuaciones 11a y 12a, 45 donde v1 es un numero entero.
V1 = ± pow(2, v1) = apx((T2 - T0)/(T2 - T1) ...Ecuacion 11c V2 = 1 - V1 ...Ecuacion 12c
50 (donde pow(2, v1) indica la “v1”-esima potencia de 2)
(donde = apx() indica que el valor dentro de () se aproximara al valor de la izquierda)
Debe observarse que tambien es posible utilizar las ecuaciones 11d y 12d en lugar de las ecuaciones 11a y 12a, donde v1 es un numero entero.
V1 = 1 - V2 ...Ecuacion 11d
V2 = ± pow(2, v2) = apx((T0 - T1)/(T2 - T1) ...Ecuacion 12d (donde pow(2, v2) indica la “v2”-esima potencia de 2)
(donde = apx() indica que el valor dentro de () se aproximara al valor de la izquierda)
Debe observarse que el valor de V1 y V2 aproximado a la potencia de 2 sera, tomando la ecuacion 11b como ejemplo, el valor de +pow(2, v1) obtenido cuando los valores de +pow(2, v1) y (T2 - T0) / (T2 - T1) se aproximan 5 mucho entre sf a medida que el valor de v1 cambia en valores de uno.
Por ejemplo, en la FIG. 39, cuando la imagen actual que va a codificarse es la n° 16, la imagen designada por el primer mdice de referencia es la n° 11 y la imagen designada por el segundo mdice de referencia es la n° 10, la informacion de orden de visualizacion de las respectivas imagenes es 15, 13 y 10, de manera que (T2 -T0) / (T2 - 10 T1) y +pow(2, v1) se determinan de la siguiente manera.
(T2 - T0)/(T2 - T1) = (10 - 15)/(10 - 13) = 5/3 +pow(2, 0) = 1 +pow(2, 1) = 2 15
Puesto que 5/3 tiene un valor mas aproximado a 2 que a 1, como resultado de la aproximacion se obtiene que V1 = 2.
Como otro procedimiento de aproximacion, tambien es posible conmutar entre una aproximacion de redondeo por 20 exceso y una aproximacion de redondeo por defecto dependiendo de la relacion entre dos valores de informacion de orden de visualizacion T1 y T2.
En ese caso, la aproximacion de redondeo por exceso se lleva a cabo en V1 y en V2 cuando T1 es posterior a T2, y la aproximacion de redondeo por defecto se lleva a cabo en V1 y en V2 cuando T1 es anterior a T2. Tambien es 25 posible, de manera inversa, llevar a cabo una aproximacion de redondeo por defecto de V1 y de V2 cuando T1 es posterior a T2, y una aproximacion de redondeo por exceso de V1 y de V2 cuando T1 es anterior a T2.
Como otro procedimiento de aproximacion que utiliza informacion de orden de visualizacion, la aproximacion de redondeo por exceso se lleva a cabo en una ecuacion para V1 y la aproximacion de redondeo por defecto se lleva a 30 cabo en una ecuacion para V2 cuando T1 es posterior a T2. Como resultado, la diferencia entre los valores de los dos coeficientes aumenta y es posible obtener valores adecuados para una extrapolacion. Por el contrario, cuando T1 es anterior a T2, se comparan el valor de la ecuacion para V1 y el valor en la ecuacion para V2 y despues se lleva a cabo una aproximacion de redondeo por exceso en el valor inferior y se lleva a cabo una aproximacion de redondeo por defecto en el valor superior. Como resultado, la diferencia entre los valores de los dos coeficientes 35 disminuye, por lo que es posible obtener valores adecuados para una interpolacion.
Por ejemplo, en la FIG. 39, cuando la imagen actual que va a codificarse es la n° 16, la imagen designada por el primer mdice de referencia es la n° 11 y la imagen designada por el segundo mdice de referencia es la n° 10, la informacion de orden de visualizacion de las imagenes respectivas es 15, 13 y 10. Puesto que T1 es posterior a T2, 40 se lleva a cabo una aproximacion de redondeo por exceso en la ecuacion para V1 y se lleva a cabo una aproximacion de redondeo por defecto en la ecuacion para V2. Como resultado, las ecuaciones 11b y 12b se calculan de la siguiente manera.
(1) Ecuacion 11b
45 (T2 -T0)/(T2 - T1) = (10 - 15)/(10 - 13) = 5/3 +pow(2, 0) = 1 +pow(2, 1) = 2
Como resultado de la aproximacion de redondeo por exceso, se obtiene que V1 = 2.
50
(2) Ecuacion 12b
(T0 -T1)/(T2 - T1) = (15 - 13)/(10 - 13) = -2/3 -pow(2, 0) = -1 -pow(2, -1) = -1/2 55
Como resultado de la aproximacion de redondeo por defecto, se obtiene que V2 = -1. Debe observarse que, aunque la ecuacion 10 es solamente una ecuacion para una prediccion lineal en las realizaciones anteriores, tambien es posible combinar este procedimiento con el procedimiento de prediccion lineal mediante la utilizacion de las dos ecuaciones fijas 2a y 2b explicadas en la seccion de la tecnica anterior. En ese caso, la ecuacion 10 se utiliza en
lugar de la ecuacion 2a, y la ecuacion 2b se utiliza tal cual. Dicho de otro modo, la ecuacion 10 se utiliza cuando la imagen designada por el primer mdice de referencia aparece detras de la imagen designada por el segundo mdice de referencia en el orden de visualizacion, mientras que la ecuacion 2b se utiliza en otros casos.
5 Por el contrario, tambien es posible utilizar la ecuacion 10 en lugar de la ecuacion 2b y utilizar la ecuacion 2a tal cual. Dicho de otro modo, la ecuacion 2a se utiliza cuando la imagen designada por el primer mdice de referencia aparece detras de la imagen designada por el segundo mdice de referencia, y la ecuacion 10 se utiliza en otros casos. Sin embargo, cuando las dos imagenes de referencia tienen la misma informacion de orden de visualizacion, se lleva a cabo una prediccion lineal utilizando 1/2 como el valor de V1 y V2.
10
Tambien es posible describir solamente el coeficiente C en las areas de cabecera de seccion que van a utilizarse para la prediccion lineal, de la misma manera que el concepto de la tercera realizacion. En ese caso, se utiliza la ecuacion 13 en lugar de la ecuacion 10. V1 y V2 se obtienen de la misma manera que las realizaciones anteriores.
15 P(i) = V1 x (Q1(i) + C1) + V2 x (Q2(i) + C2) ...Ecuacion 13
El procesamiento para generar coeficientes C es necesario y, ademas, el coeficiente C necesita codificarse en el area de cabecera de seccion, pero la utilizacion de C1 y de C2 permite una prediccion lineal mas precisa incluso si la precision de V1 y V2 es baja. Esto es particularmente eficaz en caso de que V1 y V2 se aproximen a las potencias 20 de 2 para llevar a cabo una prediccion lineal.
Debe observarse que utilizando la ecuacion 13, la prediccion lineal puede llevarse a cabo de la misma manera en caso de que se asigne un mdice de referencia a una imagen y en caso de que se asigne una pluralidad de indices de referencia a una imagen.
25
En el calculo de los valores de cada una de las ecuaciones 11a, 12a, 11b, 12b, 11c, 12c, 11d y 12d, las combinaciones de los valores disponibles estan limitadas en cierto modo en cada seccion. Por tanto, solo es necesaria una operacion para codificar una seccion, a diferencia de la ecuacion 10 o la ecuacion 13 en las que la operacion necesita llevarse a cabo para todos los pfxeles de un bloque actual que va a codificarse y, por tanto, 30 parece que no afecta en gran medida a la cantidad de procesamiento total.
Debe observarse que la informacion de orden de visualizacion En la presente realizacion, no esta limitada al orden de visualizacion, sino que puede ser el tiempo de visualizacion real o el orden de imagenes respectivas empezando por una imagen predeterminada, cuyo valor aumenta segun transcurre el tiempo de visualizacion.
35
(Quinta realizacion)
Se explicara el procedimiento de codificacion de imagenes en movimiento de la quinta realizacion de la presente invencion. Puesto que la estructura del aparato de codificacion, el flujo de procesamiento de codificacion y el 40 procedimiento de asignacion de indices de referencia son exactamente identicos a los de la primera realizacion, no se repetira la explicacion de los mismos.
En el procedimiento convencional, es posible conmutar entre la generacion de una imagen predictiva mediante la utilizacion de ecuaciones fijas y la generacion de una imagen predictiva mediante la utilizacion de conjuntos de 45 coeficientes de ponderacion de coeficientes de prediccion lineal, utilizando indicadores descritos en un area de informacion comun de imagen en un flujo codificado, si fuera necesario.
En la presente realizacion, se explicara otro procedimiento para conmutar los diversos procedimientos de prediccion lineal explicados de la primera a la cuarta realizaciones anteriores.
50
La FIG. 17A muestra la estructura utilizada para el caso en que cinco indicadores (p_flag, c_flag, d_flag, t_flag, s_flag) para controlar la conmutacion anterior estan descritos en el area de cabecera de seccion del flujo codificado.
Tal y como se muestra en la FIG. 17B, p_flag es un indicador que indica si los coeficientes de ponderacion se han 55 codificado o no. c_flag es un indicador que indica si solo se han codificado o no los datos del parametro C (C1 y C2), de entre los parametros para ref1 y ref2. t_flag es un indicador que indica si los coeficientes de ponderacion para la prediccion lineal van a codificarse o no utilizando la informacion de orden de visualizacion de las imagenes de referencia. Por ultimo, s_flag es un indicador que indica si los coeficientes de ponderacion para la prediccion lineal van a aproximarse o no a las potencias de 2 para el calculo mediante la utilizacion de operaciones de
desplazamiento.
Ademas, d_flag es un indicador que indica si conmutar o no dos ecuaciones fijas predeterminadas, como las ecuaciones 2a y 2b, dependiendo de la relacion posicional temporal entre la imagen designada por refl y la imagen 5 designada por ref2, cuando se lleva a cabo una prediccion lineal utilizando tales dos ecuaciones fijas. De manera mas espedfica, cuando este indicador indica la conmutacion de las ecuaciones, la ecuacion 2a se utiliza en caso de que la imagen designada por refl sea posterior a la imagen designada por ref2 en el orden de visualizacion, y la ecuacion 2b se utiliza en otros casos para llevar a cabo una prediccion lineal, como es el caso del procedimiento convencional. Por otro lado, cuando este indicador indica no conmutar las ecuaciones, la ecuacion 2b siempre se 10 utiliza para llevar a cabo la prediccion lineal, independientemente de la relacion posicional entre la imagen designada por refl y la imagen designada por ref2.
Debe observarse que incluso si se utiliza la ecuacion 2a en lugar de la ecuacion 2b como una ecuacion que va a utilizarse sin conmutacion, la ecuacion 2a puede tratarse de la misma manera que la ecuacion 2b.
15
En el aparato de codificacion mostrado en la FIG. 1, la unidad de codificacion de compensacion de movimiento 107 determina si codificar o no los datos relacionados con los conjuntos de coeficientes de ponderacion por cada seccion, proporciona la informacion del indicador p_flag a la unidad de generacion de flujos codificados 103 en funcion de la determinacion y describe la informacion en el flujo codificado mostrado en la FIG. 17A. Como resultado, 20 es posible utilizar los conjuntos de coeficientes de ponderacion en un aparato de mayor rendimiento para llevar a cabo una prediccion lineal y no utilizar los conjuntos de coeficientes de ponderacion en un aparato de menor rendimiento para llevar a cabo la prediccion lineal.
Asimismo, en el aparato de codificacion mostrado en la FIG. 1, la unidad de codificacion de compensacion de 25 movimiento 107 determina, por cada seccion, si codificar o no solamente los datos relacionados con el parametro C (C1 y C2) correspondiente a las componentes de CC de los datos de imagen, proporciona la informacion del indicador c_flag a la unidad de generacion de flujos codificados 103 en funcion de la determinacion y describe la informacion en el flujo codificado mostrado en la FIG. 17A. Como resultado, es posible utilizar todos los conjuntos de coeficientes de ponderacion en un aparato de mayor rendimiento para llevar a cabo una prediccion lineal y utilizar 30 solamente las componentes de CC en un aparato de menor rendimiento para llevar a cabo la prediccion lineal.
Asimismo, en el aparato de codificacion mostrado en la FIG. 1, cuando la prediccion lineal se lleva a cabo utilizando ecuaciones fijas, la unidad de codificacion de compensacion de movimiento 107 determina, por cada seccion, si llevar a cabo o no una codificacion conmutando dos ecuaciones, proporciona la informacion del indicador d_flag a la 35 unidad de generacion de flujos codificados 103 en funcion de la determinacion y describe la informacion en el flujo codificado mostrado en la FIG. 17A. Como resultado, es posible utilizar una cualquiera de las ecuaciones fijas para la prediccion lineal en caso de que haya un ligero cambio temporal en el brillo de una imagen y conmutar entre las dos ecuaciones fijas para la prediccion lineal en caso de que el brillo de la imagen cambie a medida que pasa el tiempo.
40
Asimismo, en el aparato de codificacion mostrado en la FIG. 1, la unidad de codificacion de compensacion de movimiento 107 determina, para cada seccion, si generar o no coeficientes para la prediccion lineal utilizando la informacion de orden de visualizacion de las imagenes de referencia, proporciona la informacion del indicador t_flag a la unidad de generacion de flujos codificados 103 en funcion de la determinacion y describe la informacion en el 45 flujo codificado mostrado en la FIG. 17A. Como resultado es posible codificar los conjuntos de coeficientes de ponderacion para la prediccion lineal en caso de que haya suficiente espacio a codificar en el flujo codificado y generar los coeficientes a partir de la informacion de orden de visualizacion para la prediccion lineal en caso de que haya mas espacio a codificar.
50 Asimismo, en el aparato de codificacion mostrado en la FIG. 1, la unidad de codificacion de compensacion de movimiento 107 determina, por cada seccion, si aproximar o no los coeficientes para la prediccion lineal a las potencias de 2 para permitir el calculo de estos coeficientes mediante operaciones de desplazamiento, proporciona la informacion del indicador s_flag a la unidad de generacion de flujos codificados 103 en funcion de la determinacion y describe la informacion en el flujo codificado mostrado en la FIG. 17A. Como resultado, es posible 55 utilizar los coeficientes de ponderacion sin aproximarse en un aparato de mayor rendimiento para llevar a cabo una prediccion lineal y utilizar los coeficientes de ponderacion aproximandose a las potencias de 2 en un aparato de menor rendimiento para llevar a cabo la prediccion lineal que puede realizarse solamente mediante operaciones de desplazamiento.
Por ejemplo, el caso de (1) (p, c, d, t, s_flag) = (1, 0, 0, 0, 1) muestra que se codifican todos los conjuntos de coeficientes de ponderacion y que se lleva a cabo una prediccion lineal solamente mediante operaciones de desplazamiento representandose los coeficientes como las potencias de 2 explicadas en la segunda realizacion para generar una imagen predictiva.
5
El caso de (2) (p, c, d, t, s_flag) = (1, 1, 1, 0, 0) muestra que solamente se codifican los datos relacionados con el parametro C (C1 y C2), se utiliza el procedimiento para generar una imagen predictiva anadiendo el coeficiente C a las ecuaciones fijas como explicadas en la tercera realizacion y, ademas, las dos ecuaciones fijas conmutan para su utilizacion.
10
En el caso de (3) (p, c, d, t, s_flag) = (0, 0, 0, 0, 0), ningun conjunto de coeficiente de ponderacion se codifica. Dicho de otro modo, muestra que se utiliza el procedimiento para generar una imagen predictiva utilizando solamente la ecuacion 2b de entre las ecuaciones fijas del procedimiento convencional.
15 El caso de (4) (p, c, d, t, s_flag) = (0, 0, 1, 1, 1) muestra que no se codifica ningun conjunto de coeficientes de ponderacion, sino que los coeficientes de ponderacion se generan a partir de la informacion de orden de visualizacion de las imagenes de referencia y la prediccion lineal se lleva a cabo solamente mediante operaciones de desplazamiento aproximandose los coeficientes generados a las potencias de 2 y, despues, dos ecuaciones fijas conmutan para utilizarse en la generacion de una imagen predictiva.
20
Debe observarse que, en la presente realizacion, las determinaciones se realizan utilizando cinco indicadores (p_flag, c_flag, d_flag, t_flag, s_flag), cada uno de los cuales es 1 bit, pero tambien es posible representar las determinaciones solamente con un indicador de 5 bits en lugar de estos cinco indicadores. En ese caso es posible una codificacion utilizando una codificacion de longitud variable, no mediante la representacion con 5 bits.
25
Debe observarse que, En la presente realizacion, se utilizan los cinco indicadores (p_flag, c_flag, d_flag, t_flag, s_flag), cada uno de los cuales es 1 bit, pero esto tambien puede aplicarse al caso en que el procedimiento de prediccion lineal conmuta utilizando solamente algunos de estos indicadores. En ese caso, solo se codifican y se describen los indicadores necesarios para la prediccion lineal de entre los indicadores mostrados en la FIG. 17A.
30
El procedimiento convencional permite conmutar, en cada imagen, entre el procedimiento de generacion de imagenes predictivas mediante la utilizacion de ecuaciones fijas y el procedimiento de generacion de imagenes predictivas mediante la utilizacion de conjuntos de coeficientes de ponderacion de coeficientes de prediccion lineal, proporcionando un indicador para conmutar estos procedimientos en un area de informacion comun de imagen en 35 un flujo codificado. Sin embargo, en el procedimiento convencional, el procedimiento de generacion de imagenes predictivas solo puede conmutarse por cada imagen.
Tal y como se ha explicado anteriormente, la presente realizacion permite conmutar el procedimiento de generacion de imagenes predictivas en cada seccion, que es una subdivision de una imagen, proporcionando este indicador de 40 conmutacion en una cabecera de seccion de un flujo codificado. Por lo tanto, es posible generar una imagen predictiva utilizando los coeficientes de ponderacion en una seccion que tiene imagenes complejas y generar una imagen predictiva utilizando ecuaciones fijas en una seccion que tiene imagenes simples y, por tanto, es posible mejorar la calidad de la imagen minimizando al mismo tiempo el aumento de la cantidad de procesamiento.
45 Debe observarse que, en la presente realizacion, cinco indicadores (p_flag, c_flag, d_flag, t_flag, s_flag) estan descritos en un area de cabecera de seccion para determinar si los coeficientes se codifican o no para cada seccion, pero tambien es posible conmutar la determinacion por cada imagen describiendo estos indicadores en el area de informacion comun de imagen. Ademas, tambien es posible generar una imagen predictiva utilizando el procedimiento optimo en cada bloque proporcionando el indicador de conmutacion en cada bloque, que es una 50 subdivision de una seccion.
Debe observarse que la informacion de orden de visualizacion En la presente realizacion, no esta limitada al orden de visualizacion, sino que puede ser el tiempo de visualizacion real o el orden de imagenes respectivas empezando por una imagen predeterminada, cuyo valor aumenta a medida que transcurre el tiempo de visualizacion.
55
(Sexta realizacion)
La FIG. 2 es un diagrama de bloques que muestra la estructura de un aparato de descodificacion de imagenes en movimiento de la sexta realizacion de la presente invencion. Utilizando este diagrama de bloques mostrado en la
FIG. 2, el procedimiento de descodificacion de imagenes en movimiento ejecutado por este aparato de descodificacion de imagenes en movimiento se explicara en el siguiente orden: (1) una vision general de descodificacion, (2) un procedimiento para asignar indices de referencia y (3) un procedimiento para generar una imagen predictiva. En este caso, se supone que un flujo codificado que se genero mediante el procedimiento de 5 codificacion de imagenes en movimiento de la primera realizacion se introduce en el presente aparato de descodificacion.
(1) Vision general de descodificacion
10 En primer lugar, la unidad de analisis de flujos codificados 201 extrae del area de cabecera de seccion la secuencia de datos de conjuntos de coeficientes de ponderacion para la prediccion lineal y la secuencia de comandos para la asignacion de indices de referencia, y del area de informacion de bloques codificados diversa informacion tal como la informacion de indices de referencia, la informacion de vectores de movimiento y los datos de errores de prediccion codificados. La FIG. 6 muestra la diversa informacion codificada mencionada anteriormente del flujo 15 codificado.
La secuencia de datos de los conjuntos de coeficientes de ponderacion para la prediccion lineal extrafda por la unidad de analisis de flujos codificados 201 se proporciona a una unidad de almacenamiento de coeficientes de prediccion lineal 206, la secuencia de comandos para la asignacion de indices de referencia se proporciona a una 20 unidad de conversion de mdice de referencia / numero de imagen 207, los indices de referencia se proporcionan a una unidad de descodificacion de compensacion de movimiento 204, la informacion de vector de movimiento se proporciona a una unidad de almacenamiento de vectores de movimiento 205 y la senal de error de prediccion codificada se proporciona a una unidad de descodificacion de errores de prediccion 202, respectivamente.
25 La unidad de descodificacion de errores de prediccion 202 lleva a cabo un procesamiento de descodificacion de imagenes, tal como una cuantificacion inversa y una transformada de frecuencia inversa para la senal de error de prediccion codificada introducida, y proporciona una senal de error descodificada. La unidad de suma 208 suma la senal de error de prediccion descodificada y la senal de imagen predictiva proporcionada por la unidad de descodificacion de compensacion de movimiento 204 para generar una senal de imagen reconstruida. La senal de 30 imagen reconstruida obtenida se almacena en una memoria de imagenes 203 para su utilizacion como referencia en la prediccion inter-imagen posterior y se proporciona para su visualizacion.
La unidad de descodificacion de compensacion de movimiento 204 extrae el area de imagen mas adecuada como una imagen predictiva de entre las senales de imagenes reconstruidas almacenadas en la memoria de imagenes 35 203, utilizando los vectores de movimiento introducidos desde la unidad de almacenamiento de vectores de movimiento 205 y los indices de referencia introducidos desde la unidad de analisis de flujos codificados 201. En este momento, la unidad de conversion de mdice de referencia / numero de imagen 207 designa las imagenes de referencia en la memoria de imagenes 203 basandose en la correspondencia entre los indices de referencia proporcionados por la unidad de analisis de flujos codificados 201 y los numeros de imagen.
40
El funcionamiento de la unidad de conversion de mdice de referencia / numero de imagen 207 se explicara en detalle en la seccion (2). Ademas, la unidad de descodificacion de compensacion de movimiento 204 lleva a cabo un procesamiento de conversion de valores de pixel, tal como un procesamiento de interpolacion mediante una prediccion lineal en valores de pixel en el area de imagen extrafda, para generar la imagen predictiva final. Los 45 coeficientes de prediccion lineal utilizados para ese procesamiento se obtienen a partir de los datos almacenados en la unidad de almacenamiento de coeficientes de prediccion lineal 206 utilizando los indices de referencia como claves de busqueda.
Este procedimiento de generacion de imagenes predictivas se explicara en detalle en la seccion (3).
50
La imagen descodificada generada a traves de la serie de procesos mencionada anteriormente se almacena en la memoria de imagenes 203 y se proporciona como una senal de imagen para su visualizacion segun el tiempo de visualizacion.
55 El flujo de operaciones en el caso de la descodificacion de prediccion inter-imagen se ha descrito anteriormente, pero un conmutador 209 conmuta entre la descodificacion de prediccion inter-imagen y la descodificacion de prediccion intra-imagen. En el caso de la descodificacion intra-imagen, una imagen predictiva no se genera mediante compensacion de movimiento, sino que una imagen descodificada se genera generando una imagen predictiva de un area actual que va a descodificarse a partir de un area descodificada de la misma imagen y anadiendo la imagen
predictiva. La imagen descodificada se almacena en la memoria de imagenes 203, como en el caso de la descodificacion de prediccion inter-imagen, y se proporciona como una senal de imagen para su visualizacion segun el tiempo de visualizacion.
5 (2) Procedimiento de asignacion de indices de referencia
A continuacion, se explicara, utilizando la FIG. 3 y la FIG. 4, un procedimiento de asignacion de indices de referencia en la unidad de conversion de mdice de referencia / numero de imagen 207 de la FIG. 2.
10 La FIG. 3 es un diagrama que explica un procedimiento para asignar dos indices de referencia a numeros de imagen. Cuando hay una secuencia de imagenes ordenadas en el orden de visualizacion, los numeros de imagen se asignan en el orden de descodificacion. Los comandos para asignar los indices de referencia a los numeros de imagen se describen en una cabecera de una seccion, que es una subdivision de una imagen, como la unidad de descodificacion y, por tanto, la asignacion de los mismos se actualiza cada vez que se descodifica una seccion. El 15 comando indica, en serie mediante el numero de indices de referencia, el valor diferencial entre un numero de imagen que tiene asignado un mdice de referencia actual y un numero de imagen al que se le asigna un mdice de referencia inmediatamente antes que la asignacion actual.
Tomando el primer mdice de referencia de la FIG. 3 como un ejemplo, puesto que primero se proporciona “-1” como 20 un comando, se resta 1 al numero de imagen 16 de la imagen actual que va a descodificarse y, por tanto, el mdice de referencia 0 se asigna al numero de imagen 15. Despues, puesto que se proporciona "-4", se resta 4 al numero de imagen 15 y, por tanto, el mdice de referencia 1 se asigna al numero de imagen 11. Los indices de referencia posteriores se asignan a numeros de imagen respectivos de la misma manera. Lo mismo se aplica a los segundos indices de referencia.
25
Segun el procedimiento de asignacion de indices de referencia convencional mostrado en la FIG. 34, todos los indices de referencia se hacen corresponder con numeros de imagen respectivos. Por otro lado, en el ejemplo de la FIG. 3, el procedimiento de asignacion es exactamente igual al procedimiento convencional, pero una pluralidad de indices de referencia se hacen corresponder con el mismo numero de imagen modificando los valores de los 30 comandos.
La FIG. 4 muestra el resultado de la asignacion de los indices de referencia. Este diagrama muestra que los primeros indices de referencia y los segundos indices de referencia se asignan a numeros de imagen respectivos por separado, pero una pluralidad de indices de referencia se asigna a un numero de imagen en algunos casos. En 35 el procedimiento de descodificacion de la presente invencion, se supone que una pluralidad de indices de referencia se asigna a al menos un numero de imagen, como este ejemplo.
Si los indices de referencia se utilizan solamente para determinar imagenes de referencia, el procedimiento convencional de asignacion uno a uno de indices de referencia a numeros de imagen es el procedimiento mas 40 eficaz. Sin embargo, en caso de que un conjunto de coeficientes de ponderacion de coeficientes de prediccion lineal se seleccione para la generacion de una imagen predictiva utilizando indices de referencia, los mismos coeficientes de prediccion lineal tienen que utilizarse para todos los bloques que tengan las mismas imagenes de referencia, de manera que hay una probabilidad extremadamente alta de que no pueda generarse la imagen predictiva optima. Por tanto, si es posible asignar una pluralidad de indices de referencia a un numero de imagen como en el caso de la 45 presente invencion, el conjunto de coeficientes de ponderacion optimo de coeficientes de prediccion lineal puede seleccionarse de entre una pluralidad de conjuntos candidatos para cada bloque incluso si todos los bloques tienen la misma imagen de referencia y, por tanto, puede generarse la imagen predictiva con una mayor precision de prediccion.
50 Debe observarse que la descripcion anterior muestra el caso en que los numeros de imagen se proporcionan suponiendo que todas las imagenes de referencia se almacenan en una memoria de referencia. Sin embargo, puesto que a una imagen actual se le proporciona un numero de imagen que supera en un valor de uno al numero de una imagen que se codifico inmediatamente antes que la imagen actual, solo cuando se almacena la imagen actual que se codifico en ultimo lugar, la continuidad de los numeros de imagen se mantiene en la memoria de 55 referencia incluso si algunas imagenes no se almacenan y, por tanto, el procedimiento mencionado anteriormente puede utilizarse sin cambios.
(3) Procedimiento de generacion de imagenes predictivas
A continuacion, se explicara, utilizando la FIG. 5, el procedimiento de generacion de imagenes predictivas en la unidad de descodificacion de compensacion de movimiento 204 de la FIG. 2. Aunque el procedimiento de generacion de imagenes predictivas mediante prediccion lineal es exactamente identico al procedimiento convencional, la flexibilidad en la seleccion de coeficientes de prediccion lineal aumenta debido a que una pluralidad 5 de numeros de indices de referencia puede hacerse corresponder con la misma imagen.
La imagen B16 es una imagen B actual que va a descodificarse, y los bloques BL01 y BL02 son bloques actuales que van a descodificarse y que pertenecen a la imagen B. La imagen P11 y la imagen B15 se utilizan como la primera imagen de referencia y la segunda imagen de referencia para BL01, y la imagen predictiva se genera con 10 referencia a los bloques BL11 y BL21 que pertenecen a las imagenes P11 y B15, respectivamente. De la misma manera, la imagen Pl1 y la imagen B15 se utilizan como la primera imagen de referencia y la segunda imagen de referencia para BL02, y la imagen predictiva se genera con referencia a los bloques BL12 y BL22, respectivamente.
Aunque BL01 y BL02 hacen referencia a las mismas imagenes como su primera imagen de referencia y su segunda 15 imagen de referencia, es posible asignar diferentes valores al primer mdice de referencia refl y al segundo mdice de referencia ref2 para BLOl y BL02, respectivamente, utilizando el procedimiento de asignacion de indices de referencia explicado en la seccion (2). Tomando la FIG. 4 como un ejemplo, 1 y 3 se asignan al primer mdice de referencia correspondiente al numero de imagen 11, mientras que 1 y 6 se asignan al segundo mdice de referencia correspondiente al numero de imagen 15. Como resultado, se suponen cuatro combinaciones de estos indices de 20 referencia (ref1, ref2) = (1, 1), (1, 6), (3, 1) y (3, 6) y, por tanto, es posible seleccionar la combinacion para obtener el conjunto de coeficientes de ponderacion optimo por cada bloque de entre estas combinaciones. En la FIG. 5, ref1 = 1 y ref2 = 1 se asignan para BL01, y ref1 = 3 y ref2 = 6 se asignan para BL02, por ejemplo.
Segun el procedimiento de asignacion de referencia convencional mostrado en la FIG. 35, solo una combinacion de 25 (ref1, ref2) = (1, 1) puede seleccionarse para BL01 y BL02 en el caso de la FIG. 5 y, por tanto, solo puede seleccionarse un conjunto de coeficientes de ponderacion de coeficientes de prediccion lineal. Por otro lado, segun la presente invencion, hay cuatro opciones disponibles y puede decirse que la posibilidad de seleccion del conjunto de coeficientes de ponderacion optimo aumenta.
30 Un flujo codificado de una imagen esta formado por un area de informacion comun de imagen y por una pluralidad de areas de datos de seccion. La FIG. 6 muestra la estructura del area de datos de seccion en el flujo codificado. El area de datos de seccion esta formada ademas por un area de cabecera de seccion y por una pluralidad de areas de datos de bloque. Este diagrama muestra cada area de bloque correspondiente a BL01 y a BL02 de la FIG. 5 como un ejemplo del area de datos de bloque.
35
“ref1” y “ref2” incluidos en BL01 designan el primer mdice de referencia y el segundo mdice de referencia, respectivamente, que indican dos imagenes a las que hace referencia el bloque BL01. Ademas, en el area de cabecera de seccion, datos para proporcionar los conjuntos de coeficientes de ponderacion para la prediccion lineal mencionada anteriormente (pconjunto0, pconjunto1, pconjunto2...), se describen para ref1 y ref2, respectivamente. 40 En esta area puede fijarse un numero de “pconjuntos” equivalente al numero de indices de referencia explicado en la seccion (2). De manera mas espedfica, en caso de que diez indices de referencia, comprendidos entre 0 y 9, se utilicen como cada uno del primer mdice de referencia y del segundo mdice de referencia, diez "pconjuntos" comprendidos entre 0 y 9 pueden fijarse para ref1 y ref2.
45 La FIG. 7 muestra un ejemplo de tablas de los conjuntos de coeficientes de ponderacion incluidos en el area de cabecera de seccion. Cada dato indicado por un identificador pconjunto tiene cuatro valores w1, w2, c y d, y estas tablas estan estructuras de manera que los valores de ref1 y ref2 pueden hacer referencia directa a esos valores. Ademas, las secuencias de comandos idx_cmd1 e idx_cmd2 para asignar los indices de referencia a los numeros de imagen se describen en el area de cabecera de seccion.
50
Utilizando ref1 y ref2 descritos en BL01 en la FIG. 6, un conjunto de coeficientes de ponderacion se selecciona a partir de cada una de las tablas para ref1 y ref2 en la FIG. 7. Llevando a cabo una prediccion lineal en los valores de pixel de las imagenes de referencia utilizando estos dos conjuntos de coeficientes de ponderacion, se genera una imagen predictiva.
55
A continuacion, se explicara el flujo de procesamiento desde la determinacion de conjuntos de coeficientes de ponderacion hasta la generacion de una imagen predictiva.
La FIG. 18 es un diagrama de bloques funcionales que muestra una estructura funcional para generar una imagen
predictiva en la unidad de almacenamiento de coeficientes de prediccion lineal 206 y en la unidad de descodificacion de compensacion de movimiento 204.
Una imagen predictiva se genera a traves de la unidad de almacenamiento de coeficientes de prediccion lineal 206a, 5 la unidad de almacenamiento de coeficientes de prediccion lineal 206b, la unidad de calculo de promedios 204a y la unidad de operaciones de prediccion lineal 204b.
La unidad de calculo de promedios 204a obtiene, a partir de la unidad de almacenamiento de coeficientes de prediccion lineal 206a, un conjunto de coeficientes de ponderacion (w1_1, w2_1, c_1, d_1) seleccionado por refl 10 proporcionado por la unidad de analisis de flujos codificados 201 y obtiene, a partir de la unidad de almacenamiento de coeficientes de prediccion lineal 206b, un conjunto de coeficientes de ponderacion (w1_2, w2_2, c_2, d_2) seleccionado por ref2 proporcionado por la unidad de analisis de flujos codificados 201.
La unidad de calculo de promedios 204a calcula el promedio, para parametros respectivos, de los conjuntos de 15 coeficientes de ponderacion obtenidos a partir de las unidades de almacenamiento de coeficientes de prediccion lineal 206a y 206b, respectivamente, para proporcionar los promedios a la unidad de operaciones de prediccion lineal 204b como el conjunto de coeficientes de ponderacion (w1, w2, c, d) que se utiliza realmente para la prediccion lineal. La unidad de operaciones de prediccion lineal 204b calcula la imagen predictiva utilizando la ecuacion 1 basandose en el conjunto de coeficientes de ponderacion (w1, w2, c, d) para proporcionarse.
20
La FIG. 19 es un diagrama de bloques funcionales que muestra otra estructura funcional para generar una imagen predictiva. Una imagen predictiva se genera a traves de la unidad de almacenamiento de coeficientes de prediccion lineal 206a, la unidad de almacenamiento de coeficientes de prediccion lineal 206b, la unidad de operaciones de prediccion lineal 204c, la unidad de operaciones de prediccion lineal 204d y la unidad de calculo de promedios 204e. 25
La unidad de operaciones de prediccion lineal 204c obtiene, a partir de la unidad de almacenamiento de coeficientes de prediccion lineal 206a, un conjunto de coeficientes de ponderacion (w1_1, w2_1, c_1, d_1) seleccionado por ref1 proporcionado por la unidad de analisis de flujos codificados 201, y calcula la imagen predictiva utilizando la ecuacion 1 basandose en el conjunto de coeficientes de ponderacion para proporcionarse a la unidad de calculo de 30 promedios 204e.
De la misma manera, la unidad de operaciones de prediccion lineal 204d obtiene, a partir de la unidad de almacenamiento de coeficientes de prediccion lineal 206b, un conjunto de coeficientes de ponderacion (w1_2, w2_2, c_2, d_2) seleccionado por ref2 proporcionado por la unidad de analisis de flujos codificados 201, y calcula la 35 imagen predictiva utilizando la ecuacion 1 basandose en el conjunto de coeficientes de ponderacion para proporcionarse a la unidad de calculo de promedios 204e.
La unidad de calculo de promedios 204e calcula el promedio, para valores de pixel respectivos, de las imagenes predictivas proporcionadas por la unidad de operaciones de prediccion lineal 204c y la unidad de operaciones de 40 prediccion lineal 204d, respectivamente, para generar la imagen predictiva final a proporcionar.
La FIG. 20A es un diagrama de bloques funcionales que muestra otra estructura funcional para generar una imagen predictiva. Una imagen predictiva se genera a traves de la unidad de almacenamiento de coeficientes de prediccion lineal 206c, la unidad de almacenamiento de prediccion lineal 206d, la unidad de calculo de promedios 204f y la 45 unidad de operaciones de prediccion lineal 204g.
La unidad de calculo de promedios 204f obtiene, a partir de la unidad de almacenamiento de coeficientes de prediccion lineal 206c, los parametros de c_1 y d_1 de un conjunto de coeficientes de ponderacion (w1_1, w2_1, c_1, d_1) seleccionado por ref1 proporcionado por la unidad de analisis de flujos codificados 201 y, asimismo, 50 obtiene, a partir de la unidad de almacenamiento de coeficientes de prediccion lineal 206d, los parametros de c_2 y d_2 de un conjunto de coeficientes de ponderacion (w1_2, w2_2, c_2, d_2) seleccionado por ref2 proporcionado por la unidad de analisis de flujos codificados 201. La unidad de calculo de promedios 204f calcula el promedio de c_1 y c_2 y el promedio de d_1 y d_2 obtenidos a partir de la unidad de almacenamiento de coeficientes de prediccion lineal 206c y la unidad de almacenamiento de coeficientes de prediccion lineal 206d para obtener ‘c' y ‘d' y 55 proporcionarse a la unidad de operaciones de prediccion lineal 204g.
Ademas, la unidad de operaciones de prediccion lineal 204g obtiene el parametro de w1_1 del conjunto de coeficientes de ponderacion mencionado anteriormente (w1_1, w2_1, c_1, d_1) a partir de la unidad de almacenamiento de coeficientes de prediccion lineal 206c, obtiene el parametro de w2_2 del conjunto de
coeficientes de ponderacion mencionado anteriormente (w1_2, w2_2, c_2, d_2) a partir de la unidad de almacenamiento de coeficientes de prediccion lineal 206d, obtiene c y d que son los promedios calculados por la unidad de calculo de promedios 204f y despues calcula la imagen predictiva utilizando la ecuacion 1 para proporcionarse.
5
De manera mas espedfica, cuando se determina el conjunto de coeficientes de ponderacion (w1, w2, c, d), que se utiliza realmente para la prediccion lineal, de entre el conjunto de coeficientes de ponderacion (w1_1, w2_1, c_1, d_1) obtenido a partir de la unidad de almacenamiento de coeficientes de prediccion lineal 206c y el conjunto de coeficientes de ponderacion (w1_2, w2_2, c_2, d_2) obtenido a partir de la unidad de almacenamiento de 10 coeficientes de prediccion lineal 206d, la unidad de operaciones de prediccion lineal 204g utiliza la siguiente regla.
w1 = w1_1 w2 = w2_2
c = (promedio de c_1 y c_2)
15 d = (promedio de d_1 y d_2)
La FIG. 20B es un diagrama de bloques funcionales que muestra otra estructura funcional para generar una imagen predictiva. Una imagen predictiva se genera a traves de la unidad de almacenamiento de coeficientes de prediccion lineal 206e, la unidad de almacenamiento de coeficientes de prediccion lineal 206f y la unidad de operaciones de 20 prediccion lineal 204h.
La unidad de operaciones de prediccion lineal 204h obtiene, a partir de la unidad de almacenamiento de coeficientes de prediccion lineal 206e, los parametros de w1_1, c_1 y d_1 que forman parte de un conjunto de coeficientes de ponderacion (w1_1, w2_1, c_1, d_1) seleccionado por refl proporcionado por la unidad de analisis de flujos 25 codificados 201 y, asimismo, obtiene, a partir de la unidad de almacenamiento de coeficientes de prediccion lineal 206f, el parametro de w2_2 que forma parte de un conjunto de coeficientes de ponderacion (w1_2, w2_2, c_2, d_2) seleccionado por ref2 proporcionado por la unidad de analisis de flujos codificados 201. La unidad de operaciones de prediccion lineal 204h calcula la imagen predictiva utilizando la ecuacion 1 basandose en w1_1, c_1, d_1, w2_2 obtenidos a partir de la unidad de almacenamiento de coeficientes de prediccion lineal 206e y la unidad de 30 almacenamiento de coeficientes de prediccion lineal 206f para proporcionarse.
De manera mas espedfica, cuando se determina el conjunto de coeficientes de ponderacion (w1, w2, c, d), que se utiliza realmente para la prediccion lineal, de entre el conjunto de coeficientes de ponderacion (w1_1, w2_1, c_1, d_1) obtenido a partir de la unidad de almacenamiento de coeficientes de prediccion lineal 206e y el conjunto de 35 coeficientes de ponderacion (w1_2, w2_2, c_2, d_2) obtenido a partir de la unidad de almacenamiento de coeficientes de prediccion lineal 206f, la unidad de operaciones de prediccion lineal 204h utiliza la siguiente regla.
w1 = w1_1 w2 = w2_2 40 c = c_1 d = d_1
Ademas, es posible utilizar uno o mas parametros de entre w1, w2, c y d como valores fijos. La FIG. 21 es un diagrama de bloques funcionales en el caso en que solo se utiliza “d” como un valor fijo para la estructura funcional 45 de la FIG. 20A. Una imagen predictiva se genera a traves de la unidad de almacenamiento de coeficientes de prediccion lineal 206g, la unidad de almacenamiento de coeficientes de prediccion lineal 206h, la unidad de calculo de promedios 204i y la unidad de operaciones de prediccion lineal 204j.
Los coeficientes seleccionados por el primer mdice de referencia ref1 a partir de la unidad de almacenamiento de 50 coeficientes de prediccion lineal 206g son solamente (w1_1, c_1), y los coeficientes seleccionados por el segundo mdice de referencia ref2 a partir de la unidad de almacenamiento de coeficientes de prediccion lineal 206h son solamente (w2_2, c_2). La unidad de calculo de promedios 204i calcula el promedio de c_1 y de c_2 obtenidos a partir de la unidad de almacenamiento de coeficientes de prediccion lineal 206g y de la unidad de almacenamiento de coeficientes de prediccion lineal 206h para obtener “c”, y lo proporciona a la unidad de operaciones de prediccion 55 lineal 204j.
La unidad de operaciones de prediccion lineal 204j obtiene el parametro de w1_1 a partir de la unidad de almacenamiento de coeficientes de prediccion lineal 206g, obtiene el parametro de w2_2 a partir de la unidad de almacenamiento de coeficientes de prediccion lineal 206h, obtiene el parametro de c a partir de la unidad de calculo
de promedios 204i, y despues calcula la imagen predictiva utilizando un valor fijo predeterminado como un parametro de d y la ecuacion 1 para proporcionarse. En este caso, tambien es posible transformar la ecuacion 1 en la ecuacion 1b para su utilizacion segun se explico en la primera realizacion.
5 Es posible utilizar un valor fijo predeterminado como un valor de d en muchos casos, pero en caso de que el aparato de codificacion describa el valor fijo anterior en la cabecera de seccion, ese valor fijo puede conmutarse por cada seccion extrayendolo en la unidad de analisis de flujos codificados 201. Asimismo, el valor fijo puede conmutarse por cada imagen o por cada secuencia describiendose en el area de informacion comun de imagen o en el area de informacion comun de secuencia.
10
Debe observarse que los procedimientos de descodificacion mencionados anteriormente estan relacionados con una imagen B que tiene dos imagenes de referencia, pero tambien es posible ejecutar el mismo procesamiento en el modo de descodificacion de una imagen de referencia para una imagen P o una imagen B que tiene solamente una imagen de referencia. En este caso, utilizando solamente uno de entre el primer mdice de referencia y el segundo 15 mdice de referencia, pconjunto e idx_cmd para ref1 o ref2 solo se describen en el area de cabecera de seccion incluida en el flujo codificado de la FIG. 6, segun el mdice de referencia descrito en el area de datos de bloque. Ademas, como un procedimiento de prediccion lineal, se utiliza la siguiente ecuacion 3 o la ecuacion 4 en lugar de la ecuacion 1 explicada en el procedimiento convencional.
20 La utilizacion de la ecuacion 1 y de la ecuacion 3 requiere cuatro parametros w1, w2, c y d, pero la utilizacion de la ecuacion 4 permite una prediccion lineal utilizando solamente tres parametros w1, c y d. Dicho de otro modo, es posible reducir a tres el numero de elementos de datos del conjunto de coeficientes de ponderacion que va a describirse en cada area de cabecera de seccion, cuando el primer mdice de referencia o el segundo mdice de referencia se utiliza para una imagen completa como imagen P.
25
Si se utiliza la ecuacion 3, es posible realizar una prediccion lineal disponible para las imagenes B y las imagenes P de manera adaptativa sin cambios en la estructura. Si se utiliza la ecuacion 4, la cantidad de datos que va a describirse en el area de cabecera de una imagen P puede reducirse y, por tanto, es posible reducir la cantidad de procesamiento gracias a un calculo simplificado. Sin embargo, puesto que el procedimiento de asignacion de indices 30 de referencia sugerido por la presente invencion puede aplicarse directamente a cualquiera de los procedimientos anteriores, puede crearse una imagen predictiva con una mayor precision de prediccion, lo que es extremadamente eficaz en la descodificacion de imagenes.
Por otro lado, las imagenes a las que se hace referencia en una compensacion de movimiento se determinan 35 designando los indices de referencia asignados a imagenes respectivas. En ese caso, el numero maximo de imagenes que estan disponibles como referencia se ha descrito en el area de informacion comun de imagen del flujo codificado.
La FIG. 38 es un diagrama esquematico de un flujo codificado en el que esta descrito el numero maximo de 40 imagenes que estan disponibles como referencia. Tal y como muestra este diagrama, el numero maximo de imagenes para “Max_pic1” de ref1 y el numero maximo de imagenes para “Max_pic2” de ref2 estan descritos en la informacion comun de imagen en el flujo codificado.
La informacion requerida para la descodificacion no es el numero maximo de imagenes reales, sino el valor maximo 45 de mdice de referencia disponible para designar imagenes.
Puesto que en el procedimiento convencional se asigna un mdice de referencia a una imagen, la descripcion mencionada anteriormente del numero maximo de imagenes no genera ninguna contradiccion. Sin embargo, el diferente numero de indices de referencia y de imagenes influye significativamente en caso de que una pluralidad de 50 indices de referencia se asigne a un numero de imagen, como la presente invencion.
Tal y como se ha descrito anteriormente, las secuencias de comandos idx_cmd1 e idx_cmd2 se describen en un flujo codificado con el fin de asignar indices de referencia a numeros de imagen. Los numeros de imagen y los indices de referencia se hacen corresponder entre sf en funcion de cada comando de estas secuencias de 55 comandos idx_cmd1 e idx_cmd2. Para ese fin, conocer el valor maximo de mdice de referencia muestra que todos los indices de referencia y los numeros de imagen se han hecho corresponder entre sf, en concreto, el final de los comandos de las secuencias de comandos idx_cmd1 e idx_cmd2.
Por lo tanto, en la presente realizacion, el numero maximo de indices de referencia disponibles, en lugar del numero
maximo de imagenes en la tecnica anterior, se describe en el area de informacion comun de imagen, que es una cabecera de la imagen. Como alternativa, se describen tanto el numero maximo de imagenes como el numero maximo de indices de referencia.
5 La FIG. 23 muestra un area de informacion comun de imagen de un flujo codificado de una imagen en la que esta descrito el numero maximo de indices de referencia. En el area de informacion comun de imagen estan descritos el numero maximo de indices de referencia disponibles para “Max_idx1” de refl y el numero maximo de indices de referencia disponibles para “Max_idx2” de ref2.
10 En la FIG. 23, el numero maximo de indices de referencia esta descrito en la informacion comun de imagen, pero puede estar estructurado de manera que el numero maximo de indices de referencia se describa en el area de datos de seccion, asf como en la informacion de comun de imagen. Por ejemplo, el numero maximo de indices de referencia requerido para cada seccion puede describirse claramente, en caso de que el numero maximo de indices de referencia requeridos para cada seccion sea significativamente diferente al numero maximo de los mismos 15 descrito en el area de informacion comun de imagen, de seccion a seccion; por ejemplo, el numero maximo de indices de referencia en una imagen es 8, el numero maximo de indices de referencia requeridos para la seccion 1 en la imagen es 8, y el numero maximo de indices de referencia requeridos para la seccion 2 es 4.
Dicho de otro modo, puede estar estructurado de manera que el numero maximo de indices de referencia descrito 20 en la informacion comun de imagen se fije para que sea el valor por defecto comun a todas las secciones de la imagen, y el numero maximo de indices de referencia requerido para cada seccion, que es diferente del valor por defecto, se describa en la cabecera de seccion.
Aunque la FIG. 23 y la FIG. 38 muestran ejemplos en los que un flujo codificado esta formado por un area de 25 informacion comun de imagen y por areas de datos de seccion, el area de informacion comun de imagen y las areas de datos de seccion pueden tratarse como flujos codificados distintos exactamente de la misma manera que un flujo codificado.
(Septima realizacion)
30
A continuacion, se explicara el procedimiento de descodificacion de imagenes en movimiento de la septima realizacion de la presente invencion. Puesto que la estructura del aparato de descodificacion, el flujo de procesamiento de descodificacion y el procedimiento de asignacion de indices de referencia son exactamente identicos a los de la sexta realizacion, no se repetira la explicacion de los mismos.
35
En la sexta realizacion, la prediccion lineal se lleva a cabo en cada pixel utilizando la ecuacion 1, la ecuacion 3 o la ecuacion 4 para generar una imagen predictiva en una compensacion de movimiento. Sin embargo, todas estas ecuaciones incluyen multiplicaciones, que provocan un aumento significativo en la cantidad de procesamiento, considerando que estas multiplicaciones se llevan a cabo en todos los pfxeles.
40
Por lo tanto, es posible utilizar la ecuacion 5 en lugar de la ecuacion 1, la ecuacion 6 en lugar de la ecuacion 3 y la ecuacion 7 en lugar de la ecuacion 4. Estas ecuaciones solo permiten calculos mediante operaciones de desplazamiento de bits sin utilizar multiplicaciones y, por tanto, permiten reducir la cantidad de procesamiento.
45 Al igual que en el caso de la sexta realizacion, la ecuacion 5 se utiliza para generar una imagen predictiva con referencia a dos imagenes al mismo tiempo, y la ecuacion 6 o la ecuacion 7 se utiliza para generar una imagen predictiva con referencia a una imagen solamente. Puesto que estas ecuaciones requieren identificadores que indican signos mas y menos, los conjuntos de coeficientes de ponderacion requeridos para las operaciones de prediccion son (signo1, m, signo2, n, c) para las ecuaciones 5 y 6, y (signo1, m, c) para la ecuacion 7. "signo1" y 50 "signo2" son parametros que identifican el primer y el segundo signo mas y menos, respectivamente. Aunque el numero de parametros sea mayor que en la tercera realizacion, solo hay un ligero incremento en la cantidad de procesamiento ya que tanto signo1 como signo2 pueden representarse mediante 1 bit.
A continuacion, se explicara en detalle el flujo de procesamiento desde la determinacion de conjuntos de 55 coeficientes de ponderacion hasta la generacion de una imagen predictiva con referencia a dos imagenes al mismo tiempo utilizando la ecuacion 5.
En primer lugar, se explicara el caso en que la estructura funcional para la generacion de una imagen predictiva es como la mostrada en la FIG. 18. La unidad de calculo de promedios 204a obtiene el conjunto de coeficientes de
ponderacion (signol, m_1, signo2_1, n_1, c_1) a partir de la unidad de almacenamiento de coeficientes de prediccion lineal 206a. Ademas, la unidad de calculo de promedios 204a obtiene el conjunto de coeficientes de ponderacion (signo1_2, m_2, signo2_2, n_2, c_2) a partir de la unidad de almacenamiento de coeficientes de prediccion lineal 206b.
5
La unidad de calculo de promedios 204a calcula, para parametros respectivos, el promedio de los conjuntos de coeficientes de ponderacion obtenidos a partir de la unidad de almacenamiento de coeficientes de prediccion lineal 206a y de la unidad de almacenamiento de coeficientes de prediccion lineal 206b para considerar el promedio como el conjunto de coeficientes de ponderacion (signol, m, signo2, n, c). La unidad de operaciones de prediccion lineal 10 204b calcula la imagen predictiva utilizando la ecuacion 5 basandose en el conjunto de coeficientes de ponderacion (signol, m, signo2, n, c) proporcionado por la unidad de calculo de promedios 204a.
Debe observarse que la FIG. 18 muestra el conjunto de coeficientes de ponderacion (w1_1, w2_1, c_1, d_1) y similares obtenidos a partir de la unidad de almacenamiento de coeficientes de prediccion lineal 206a y similares, 15 que se calculan en caso de que se utilice la ecuacion 1 explicada en la sexta realizacion, y no muestra los parametros utilizados en caso de que la imagen predictiva se obtenga utilizando la ecuacion 5, ya que los parametros utilizados en el primer caso pueden sustituirse por los parametros del segundo caso. Lo mismo se aplica para los casos de la FIG. 19 y la FIG. 20, que se describen a continuacion.
20 A continuacion, se explicara el caso en que la estructura funcional para la generacion de una imagen predictiva es como la mostrada en la FIG. 19. La unidad de operaciones de prediccion lineal 204c calcula una imagen predictiva 1 basandose en el conjunto de coeficientes de ponderacion (signo1_1, m_1, signo2_1, n_1, c_1) obtenido a partir de la unidad de almacenamiento de coeficientes de prediccion lineal 206a. La unidad de operaciones de prediccion lineal 204d calcula una imagen predictiva 2 basandose en el conjunto de coeficientes de ponderacion (signo1_2, 25 m_2, signo2_2, n_2, c_2) obtenido a partir de la unidad de almacenamiento de coeficientes de prediccion lineal 206b. Ademas, la unidad de calculo de promedios 204e calcula, para pfxeles respectivos, el promedio de las imagenes predictivas calculadas por las unidades de operaciones de prediccion lineal 204c y 204d, respectivamente, para obtener una imagen predictiva.
30 En este caso, la unidad de operaciones de prediccion lineal 204c calcula en primer lugar la imagen predictiva utilizando la ecuacion 5 basandose en el conjunto de coeficientes de ponderacion (signo1_1, m_1, signo2_1, n_1, c_1), de manera que es posible calcular la imagen predictiva utilizando operaciones de desplazamiento de bits sin utilizar multiplicaciones. Lo mismo se aplica a la unidad de operaciones de prediccion lineal 204d. Por otro lado, en el caso de la FIG. 18, puesto que el promedio del conjunto de coeficientes de ponderacion (signo1_1, m_1, 35 signo2_1, n_1, c_1) y del conjunto de coeficientes de ponderacion (signo1_2, m_2, signo2_2, n_2, c_2) se calcula primero, el promedio de m_1 y m_2 o el promedio de n_1 y n_2, en concreto, los exponentes de 2, pueden no ser numeros enteros y, por tanto, existe la posibilidad de que aumente la cantidad de procesamiento. Ademas, si los exponentes de 2 se redondean a numeros enteros, existe la posibilidad de que aumenten los errores.
40 A continuacion, se explicara el caso en que una imagen predictiva se genera en la estructura funcional mostrada en la FIG. 20A. La unidad de operaciones de prediccion lineal 204g calcula una imagen predictiva utilizando la ecuacion 5, en funcion de los parametros signo1_1 y m_1 que se obtienen a partir de la unidad de almacenamiento de coeficientes de prediccion lineal 206c y utilizados para operaciones de desplazamiento de bits, los parametros signo2_2 y n_2 que se obtienen a partir de la unidad de almacenamiento de coeficientes de prediccion lineal 206d y 45 utilizados para operaciones de desplazamientos de bits, y el promedio c calculado por la unidad de calculo de promedios 204f de los parametros c_1 y c_2 que se obtienen a partir de las unidades de almacenamiento de coeficientes de prediccion lineal 206c y 206d.
En este caso, puesto que los coeficientes utilizados para las operaciones de desplazamiento de bits son los valores 50 obtenidos directamente a partir de la unidad de almacenamiento de coeficientes de prediccion lineal 206c o de la unidad de almacenamiento de coeficientes de prediccion lineal 206d, los exponentes de 2 de la ecuacion 5 son numeros enteros. Por lo tanto, los calculos pueden llevarse a cabo utilizando operaciones de desplazamiento de bits y, por tanto, puede reducirse la cantidad de procesamiento.
55 A continuacion, se explicara el caso en que se genera una imagen predictiva en la estructura funcional mostrada en la FIG. 20B. La unidad de operaciones de prediccion lineal 204h calcula una imagen predictiva utilizando la ecuacion 5 basandose en los parametros signo1_1, m_1 y c_1 que se obtienen a partir de la unidad de almacenamiento de coeficientes de prediccion lineal 206e y los parametros signo2_2 y n_2 que se obtienen a partir de la unidad de almacenamiento de coeficientes de prediccion lineal 206f.
En este caso, puesto que los coeficientes utilizados para las operaciones de desplazamiento de bits son valores que se obtuvieron directamente a partir de la unidad de almacenamiento de coeficientes de prediccion lineal 206e o de la unidad de almacenamiento de coeficientes de prediccion lineal 206f, los exponentes de 2 de la ecuacion 5 son 5 numeros enteros. Por lo tanto, la imagen predictiva puede calcularse utilizandose operaciones de desplazamiento de bits y, por tanto, puede reducirse la cantidad de procesamiento.
En los casos de las FIG. 20A y 20B, hay parametros que no necesitan anadirse al flujo codificado para su transmision, como es el caso de las FIG. 10A y 10B en la sexta realizacion, y la cantidad de datos del flujo codificado 10 puede reducirse.
Utilizando las ecuaciones de prediccion lineal explicadas en la septima realizacion, los calculos pueden llevarse a cabo utilizando operaciones de desplazamiento de bits sin utilizar multiplicaciones, de manera que la cantidad de procesamiento puede reducirse significativamente con respecto a la sexta realizacion.
15
En la presente realizacion, la prediccion lineal se lleva a cabo utilizando las ecuaciones 5, 6 y 7 en lugar de las ecuaciones 1, 3 y 4, y utilizando el conjunto de parametros que va a codificarse (signol, m, signo2, n, c) en lugar de (w1, w2, c, d), de manera que los calculos pueden realizarse utilizando solamente operaciones de desplazamiento de bits y, por tanto, se reduce la cantidad de procesamiento. Sin embargo, tambien es posible, como otro enfoque, 20 utilizar las ecuaciones 1, 3 y 4 y (w1, w2, c, d) tal cual, limitando los valores seleccionables de w1 y de w2 a solamente los valores disponibles para operaciones de desplazamiento de bits, de manera que los calculos pueden realizarse utilizando solamente operaciones de desplazamiento de bits y, por tanto, la reduccion de la cantidad de procesamiento se consigue exactamente en la misma estructura que la de la sexta realizacion.
25 Ademas, como un procedimiento para tal limitacion, es posible limitar los valores de w1 y de w2 de manera que siempre se seleccione 1 para tales valores y se introduzca un flujo codificado que tenga valores arbitrarios de solamente c1 y 2, que son componentes de cC. Tomando la estructura de la FIG. 21 como un ejemplo, (1, c_1) para ref1 y (1, c_2) para ref2 se codificaran como conjuntos de parametros. En este caso, el valor de pixel P(i) de la imagen predictiva se calcula mediante la siguiente ecuacion en la que w1_1 y w2_2 en la ecuacion 1a se sustituyen 30 por 1.
P(i) = (Q1(i) + (Q2(i)/pow(2, d) + (c_1 + c_2)/2
(donde pow(2, d) indica la “d”-esima potencia de 2)
35
Por consiguiente, es posible reducir significativamente la cantidad de procesamiento para la prediccion lineal incluso exactamente en la misma estructura que la de la sexta realizacion.
Ademas, tal y como se muestra en la FIG. 24, en caso de que un indicador sft_flg, que indica si es posible o no 40 realizar una prediccion lineal utilizando solamente operaciones de desplazamiento de bits, y un indicador cc_flg, que indica si es posible o no llevar a cabo una prediccion lineal utilizando solamente c, que es una componente de CC, esten descritos en la informacion comun de imagen de un flujo codificado de una imagen, el aparato de descodificacion puede llevar a cabo una descodificacion, haciendo referencia a estos indicadores, en la estructura adecuada para la prediccion lineal utilizando solamente operaciones de desplazamiento de bits o una 45 descodificacion en la estructura adecuada para la prediccion lineal utilizando solamente una componente de CC. Por consiguiente, la cantidad de procesamiento puede reducirse significativamente dependiendo de la estructura del aparato de descodificacion.
(Octava realizacion)
50
A continuacion, se explicara el procedimiento de descodificacion de imagenes en movimiento de la octava realizacion de la presente invencion. Puesto que la estructura del aparato de descodificacion, el flujo de procesamiento de descodificacion y el procedimiento de asignacion de indices de referencia son exactamente identicos a los de la sexta realizacion, no se repetira la explicacion de los mismos.
55
Tal y como se explico en la seccion de la tecnica anterior, existe un procedimiento para generar una imagen predictiva utilizando una ecuacion fija predeterminada, tal como la ecuacion 2a y la ecuacion 2b, a diferencia de la sexta y septima realizaciones en las que una imagen predictiva se genera utilizando una ecuacion de prediccion obtenida a partir de conjuntos de coeficientes de ponderacion de coeficientes de prediccion lineal. Este
procedimiento convencional tiene la ventaja de que puede reducirse la cantidad de datos de codificacion ya que no es necesario codificar ni transmitir el conjunto de coeficientes de ponderacion utilizado para generar la imagen predictiva. Ademas, la cantidad de procesamiento para la prediccion lineal puede reducirse significativamente ya que las ecuaciones de prediccion lineal son simples. Sin embargo, este procedimiento que utiliza las ecuaciones fijas 5 tiene el problema de que la precision de prediccion es menor debido a que solo pueden seleccionarse dos ecuaciones de prediccion lineal, la 2a y la 2b.
Por tanto, En la presente realizacion, se utilizan las ecuaciones 8a y 8b en lugar de las ecuaciones 2a y 2b. Las ecuaciones 8a y 8b se obtienen anadiendo C1 y C2 a las ecuaciones 2a y 2b. Puesto que solo aumenta el numero 10 de sumas para la operacion, la cantidad de procesamiento aumenta ligeramente en comparacion con las ecuaciones originales 2a y 2b.
Las ecuaciones 8a y 8b son ecuaciones de prediccion para generar una imagen predictiva con referencia a dos imagenes al mismo tiempo, pero cuando se genera una imagen predictiva con referencia a una imagen solamente, 15 la ecuacion 9 se utiliza en lugar de la ecuacion 3 o la ecuacion 4, explicadas en las realizaciones anteriores.
Los conjuntos de coeficientes de ponderacion para utilizar este procedimiento son solamente (C1) para refl y (C2) para ref2. Por lo tanto, un ejemplo de un flujo codificado de una imagen obtenida utilizando este procedimiento es como el mostrado en la FIG. 14. En el area de cabecera de seccion, los conjuntos de coeficientes de ponderacion 20 para la prediccion lineal (pconjuntoO, pconjuntol, pconjunto2...) se describen por separado para refl y ref2, y cada uno de los conjuntos de coeficientes de ponderacion incluye solamente a C. Asimismo, la FIG. l5 muestra un ejemplo de conjuntos de coeficientes de ponderacion incluidos en el area de cabecera de seccion. A diferencia de la FIG. 7, cada uno de los conjuntos de coeficientes de ponderacion de la FIG. 15 incluye solamente a C.
25 La FIG. 22 es un diagrama de bloques que muestra la estructura funcional para generar una imagen predictiva a traves de la unidad de almacenamiento de coeficientes de prediccion lineal 206 y de la unidad de descodificacion de compensacion de movimiento 204 de la FIG. 2.
Una imagen predictiva se genera a traves de la unidad de almacenamiento de coeficientes de prediccion lineal 206a, 30 la unidad de almacenamiento de coeficientes de prediccion lineal 206b y la unidad de operaciones de prediccion lineal 204a.
Los conjuntos de coeficientes de ponderacion (C1) y (C2), que tienen un elemento respectivamente, se obtienen a partir de las unidades de almacenamiento de coeficientes de prediccion lineal 206a y 206b mediante el primer mdice 35 de referencia refl y el segundo mdice de referencia ref2 proporcionados por la unidad de analisis de flujos codificados 201. Estos valores se introducen en la unidad de operaciones de prediccion lineal 204a, donde se lleva a cabo una prediccion lineal en los mismos utilizando las ecuaciones 8a y 8b, generandose despues la imagen predictiva.
40 Asimismo, cuando se lleva a cabo una prediccion lineal con referencia a una imagen solamente, se obtiene cualquiera de los conjuntos de coeficientes de ponderacion (C1) y (C2) utilizando solamente uno de entre ref1 y ref2 de la FIG. 22, se lleva a cabo una prediccion lineal utilizando la ecuacion 9 y despues se genera una imagen predictiva.
45 Puesto que la presente realizacion solamente requiere utilizar un parametro para cada uno de ref1 y ref2, puede reducirse la cantidad de datos que va a describirse en el flujo codificado. Ademas, puesto que las ecuaciones de prediccion lineal no requieren operaciones complejas tales como multiplicaciones, la cantidad de operaciones tambien puede minimizarse. Ademas, la utilizacion de los coeficientes C1 y C2 permite una mejora radical en la baja precision de prediccion, considerada como una desventaja del procedimiento convencional de utilizar ecuaciones 50 fijas.
Debe observarse que es posible utilizar el procedimiento de prediccion lineal explicado En la presente realizacion, independientemente de si una pluralidad de indices de referencia puede hacer referencia o no a la misma imagen.
55 (Novena realizacion)
A continuacion, se explicara el procedimiento de descodificacion de imagenes en movimiento de la novena realizacion de la presente invencion. Puesto que la estructura del aparato de descodificacion, el flujo de procesamiento de descodificacion y el procedimiento de asignacion de indices de referencia son exactamente
identicos a los de la sexta realizacion, no se repetira la explicacion de los mismos.
Informacion de orden de visualizacion que indica el tiempo de visualizacion, o una alternativa a la misma, as^ como un numero de imagen se asignan a cada imagen. La FIG. 39 es un diagrama que muestra un ejemplo de numeros 5 de imagen y la informacion de orden de visualizacion correspondiente. Determinados valores se asignan a la informacion de orden de visualizacion segun el orden de visualizacion. En este ejemplo se utiliza un valor que aumenta de uno en uno para cada imagen. En la novena realizacion se explicara un procedimiento para generar valores de coeficientes utilizados en una ecuacion de prediccion lineal utilizando esta informacion de orden de visualizacion.
10
En la sexta realizacion, la prediccion lineal se lleva a cabo para cada pixel utilizando la ecuacion 1, la ecuacion 3 o la ecuacion 4 durante la generacion de una imagen predictiva en una compensacion de movimiento. Sin embargo, puesto que la prediccion lineal requiere datos de coeficientes, tales datos de coeficientes se describen en areas de cabecera de seccion en un flujo codificado como conjuntos de coeficientes de ponderacion que se utilizan para la 15 creacion de la imagen predictiva. Aunque este procedimiento consigue una alta eficacia de codificacion, requiere un procesamiento adicional para crear datos de los conjuntos de coeficientes de ponderacion y provoca un incremento en la cantidad de bits ya que los conjuntos de coeficientes de ponderacion se describen en el flujo codificado.
Por lo tanto, tambien es posible llevar a cabo la prediccion lineal utilizando la ecuacion 10, la ecuacion 11a o la 20 ecuacion 12a en lugar de la ecuacion 1. Utilizando estas ecuaciones, los coeficientes de ponderacion pueden determinarse solamente en funcion de la informacion de orden de visualizacion de cada imagen de referencia, por lo que no hay necesidad de codificar los conjuntos de coeficientes de ponderacion por separado.
Cuando se supone, por ejemplo, que la imagen actual que va a descodificarse es la n° 16, que la imagen designada 25 por el primer mdice de referencia es la n° 11 y que la imagen designada por el segundo mdice de referencia es la n° 10, la informacion de orden de visualizacion de imagenes respectivas es 15, 13 y 10 y, por tanto, se determinan las siguientes educaciones de prediccion lineal.
V1 = (10 - 15)/(10 - 13) = 5/3 30 V2 = (15 - 13)/(10 - 13) = - 2/3 P(i) = 5/3 x Q1(i) - 2/3 x Q2(i)
En comparacion con el procedimiento para llevar a cabo la prediccion lineal utilizando los conjuntos de coeficientes de ponderacion de la ecuacion 1, las ecuaciones anteriores tienen una menor flexibilidad en lo que respecta a los 35 valores de coeficiente y, por tanto, puede decirse que es imposible crear la imagen predictiva optima. Sin embargo, en comparacion con el procedimiento de conmutar las dos ecuaciones fijas 2a y 2b dependiendo de la relacion posicional entre dos imagenes de referencia, las ecuaciones anteriores son ecuaciones de prediccion lineal mas eficaces.
40 Cuando el primer mdice de referencia y el segundo mdice de referencia hacen referencia a la misma imagen, la ecuacion 11a y la ecuacion 12a no se cumplen porque T1 es igual a T2. Por tanto, cuando las dos imagenes de referencia tienen la misma informacion de orden de visualizacion, puede llevarse a cabo una prediccion lineal utilizando 1/2 como el valor de V1 y V2. En ese caso, las ecuaciones de prediccion lineal son las siguientes.
45 V1 = 1/2 V2 = 1/2
P(i) = 1/2 x Q1(i) + 1/2 x Q2(i)
Ademas, las ecuaciones 11a y 12a no se cumplen porque T1 es igual a T2 cuando el primer mdice de referencia y el 50 segundo mdice de referencia hacen referencia a diferentes imagenes, pero estas imagenes tienen la misma informacion de orden de visualizacion. Cuando las dos imagenes de referencia tienen la misma informacion de orden de visualizacion que la mencionada anteriormente, la prediccion lineal se llevara a cabo utilizando 1/2 como el valor de V1 y V2.
55 Tal y como se ha descrito anteriormente, cuando dos imagenes de referencia tienen la misma informacion de orden de visualizacion, es posible utilizar un valor predeterminado como coeficiente. Tal coeficiente predeterminado puede ser uno que tenga el mismo peso que 1/2, como se muestra en el ejemplo anterior.
Por otro lado, la utilizacion de la ecuacion 10 en la presente realizacion, requiere multiplicaciones y divisiones para la
prediccion lineal. Puesto que la operacion de prediccion lineal que utiliza la ecuacion 10 es una operacion en todos los p^xeles de un bloque actual que va a descodificarse, la adicion de multiplicaciones provoca un aumento significativo de la cantidad de procesamiento.
5 Por lo tanto, la aproximacion de V1 y de V2 a las potencias de 2, como en el caso de la septima realizacion, hace posible llevar a cabo una operacion de prediccion lineal solamente mediante operaciones de desplazamiento y, por lo tanto, reducir la cantidad de procesamiento. Las ecuaciones 11b y 12b se utilizan como ecuaciones de prediccion lineal para ese caso en lugar de las ecuaciones 11a y 12a.
10 Debe observarse que tambien es posible utilizar las ecuaciones 11c y 12c en lugar de las ecuaciones 11a y 12a.
Debe observarse que tambien es posible utilizar las ecuaciones 11d y 12d en lugar de las ecuaciones 11a y 12a.
Debe observarse que el valor de V1 y de V2 aproximados a la potencia de 2 sera, tomando la ecuacion 11b como 15 ejemplo, el valor de +pow(2, v1) obtenido cuando los valores de +pow(2, v1) y (T2 - T0) / (T2 - T1) se aproximan mucho entre sf a medida que el valor de v1 cambia en valores de 1.
Por ejemplo, en la FIG. 39, cuando una imagen actual que va a descodificarse es la n° 16, la imagen designada por el primer mdice de referencia es la n° 11 y la imagen designada por el segundo mdice de referencia es la n° 10, la 20 informacion de orden de visualizacion de las respectivas imagenes es 15, 13 y 10, por lo que (T2 - T0) / (T2 - T1) y +pow(2, v1) se determinan de la siguiente manera.
(T2 - T0)/(T2 - T1) = (10 - 15)/(10 - 13) = 5/3 + pow(2, 0) = °
25 + pow(2, 1) = 2
Puesto que 5/3 tiene un valor mas aproximado a 2 que a 1, como resultado de la aproximacion se obtiene que V1 = 2.
30 Como otro procedimiento de aproximacion, tambien es posible conmutar entre una aproximacion de redondeo por exceso y una aproximacion de redondeo por defecto, dependiendo de la relacion entre dos valores de informacion de orden de visualizacion T1 y T2.
En ese caso, la aproximacion de redondeo por exceso se lleva a cabo en V1 y en V2 cuando T1 es posterior a T2, y 35 la aproximacion de redondeo por defecto se lleva a cabo en V1 y en V2 cuando T1 es anterior a T2. Tambien es posible, de manera inversa, llevar a cabo una aproximacion de aproximacion de redondeo por defecto en V1 y en V2 cuando T1 es posterior a T2 y una aproximacion de redondeo por exceso en V1 y en V2 cuando T1 es anterior a T2.
Como otro procedimiento de aproximacion que utiliza informacion de orden de visualizacion, una aproximacion de 40 redondeo por exceso se lleva a cabo en una ecuacion para V1 y una aproximacion de redondeo por defecto se lleva a cabo en una ecuacion para V2 cuando T1 es posterior a T2. Como resultado, la diferencia entre los valores de los dos coeficientes aumenta, por lo que es posible obtener valores adecuados para una extrapolacion. Por el contrario, cuando T1 es anterior a T2, se comparan el valor en la ecuacion para V1 y el valor en la ecuacion para V2 y, despues, se lleva a cabo una aproximacion de redondeo por exceso en el valor inferior y se lleva a cabo una 45 aproximacion de redondeo por defecto en el valor superior. Como resultado, la diferencia entre los valores de los dos coeficientes disminuye, por lo que es posible obtener valores adecuados para una interpolacion.
Por ejemplo, en la FIG. 39, cuando una imagen actual que va a descodificarse es la n° 16, la imagen designada por el primer mdice de referencia es la n° 11 y la imagen designada por el segundo mdice de referencia es la n° 10, la 50 informacion de orden de visualizacion de las respectivas imagenes es 15, 13 y 10. Puesto que T1 es posterior a T2, una aproximacion de redondeo por exceso se lleva a cabo en la ecuacion para V1 y una aproximacion de redondeo por defecto se lleva a cabo en la ecuacion para V2. Como resultado, las ecuaciones 11b y 12b se calculan de la siguiente manera.
55 (1) Ecuacion 11b
(T2 - T0)/(T2 - T1) = (10 - 15)/(10 - 13) = 5/3 + pow(2, 0) = 1 + pow(2, 1) = 2
Como resultado de la aproximacion de redondeo por exceso, se obtiene que V1 = 2.
(2) Ecuacion 12b
(T0 - T1)/(T2 - T1) = (15 - 13)/(10 - 13) = - 2/3 5 - pow(2, 0) = - 1 - pow(2, - 1) = - 1/2
Como resultado de la aproximacion de redondeo por defecto, se obtiene que V2 = -1.
10 Debe observarse que, aunque la ecuacion 10 es solamente una ecuacion para la prediccion lineal en las realizaciones anteriores, tambien es posible combinar este procedimiento con el procedimiento de prediccion lineal mediante la utilizacion de las dos ecuaciones fijas 2a y 2b explicadas en la seccion de la tecnica anterior. En ese caso, la ecuacion 10 se utiliza en lugar de la ecuacion 2a y la ecuacion 2b se utiliza tal cual. De manera mas espedfica, la ecuacion 10 se utiliza cuando la imagen designada por el primer mdice de referencia aparece detras 15 de la imagen designada por el segundo mdice de referencia en el orden de visualizacion, mientras que la ecuacion 2b se utiliza en otros casos.
Por el contrario, tambien es posible utilizar la ecuacion 10 en lugar de la ecuacion 2b y utilizar la ecuacion 2a tal cual. De manera mas espedfica, la ecuacion 2a se utiliza cuando la imagen designada por el primer mdice de 20 referencia aparece detras de la imagen designada por el segundo mdice de referencia, y la ecuacion 10 se utiliza en otros casos. Sin embargo, cuando las dos imagenes de referencia tienen la misma informacion de orden de visualizacion, la prediccion lineal se lleva a cabo utilizando 1/2 como el valor de V1 y V2.
Tambien es posible describir solamente el coeficiente C en las areas de cabecera de seccion que van a utilizarse 25 para la prediccion lineal, de la misma manera que el concepto de la octava realizacion. En ese caso, la ecuacion 13 se utiliza en lugar de la ecuacion 10. V1 y V2 se obtienen de la misma manera que las realizaciones anteriores.
El procesamiento para generar coeficientes es necesario y, ademas, los datos de coeficientes necesitan descodificarse en el area de cabecera de seccion, pero la utilizacion de C1 y de C2 permite una prediccion lineal 30 mas precisa incluso si la precision de V1 y de V2 es baja. Esto es particularmente eficaz en caso de que V1 y V2 se aproximen a las potencias de 2 para la prediccion lineal.
Debe observarse que utilizando la ecuacion 13, la prediccion lineal puede llevarse a cabo de la misma manera en caso de asignar un mdice de referencia a una imagen y en caso de asignar una pluralidad de indices de referencia a 35 una imagen.
En el calculo de los valores de cada una de las ecuaciones 11a, 12a, 11b, 12b, 11c, 12c, 11d y 12d, las combinaciones de los valores permitidos estan limitadas hasta cierto punto en cada seccion. Por lo tanto, una sola operacion es suficiente para descodificar una seccion, a diferencia de la ecuacion 10 o de la ecuacion 13 en las que 40 la operacion necesita llevarse a cabo para todos los pfxeles de un bloque actual que va a descodificarse y, por lo tanto, parece que influye poco en la cantidad de procesamiento global.
Debe observarse que la informacion de orden de visualizacion En la presente realizacion, no esta limitada al orden de visualizacion, sino que puede ser el tiempo de visualizacion real o el orden de las imagenes respectivas 45 empezando por una imagen predeterminada, cuyo valor aumenta a medida que transcurre el tiempo de visualizacion.
(Decima realizacion)
50 A continuacion, se explicara el procedimiento de descodificacion de imagenes en movimiento de la decima realizacion de la presente invencion. Puesto que la estructura del aparato de descodificacion, el flujo de procesamiento de descodificacion y el procedimiento de asignacion de indices de referencia son exactamente identicos a los de la sexta realizacion, no se repetira la explicacion de los mismos.
55 En el procedimiento convencional es posible conmutar, si es necesario, entre la generacion de una imagen predictiva mediante la utilizacion de ecuaciones fijas y la generacion de una imagen predictiva mediante la utilizacion de conjuntos de coeficientes de ponderacion de coeficientes de prediccion lineal, utilizando indicadores descritos en un area de informacion comun de imagen de un flujo codificado.
En la presente realizacion, se explicara otro procedimiento para conmutar los diversos procedimientos de prediccion lineal explicados de la sexta a la novena realizaciones anteriores utilizando indicadores.
La FIG. 17A muestra la estructura utilizada para el caso en que cinco indicadores (p_flag, c_flag, d_flag, t_flag, 5 s_flag) para controlar la conmutacion anterior estan descritos en el area de cabecera de seccion del flujo codificado.
Tal y como se muestra en la FIG. 17B, p_flag es un indicador que indica si los coeficientes de ponderacion se han codificado o no. c_flag es un indicador que indica si solo se han codificado o no los datos del parametro C (C1 y C2), de entre los parametros para refl y ref2. t_flag es un indicador que indica si los coeficientes de ponderacion para la 10 prediccion lineal van a generarse o no utilizando la informacion de orden de visualizacion de las imagenes de referencia. Por ultimo, s_flag es un indicador que indica si los coeficientes de ponderacion para la prediccion lineal van a aproximarse o no a las potencias de 2 para el calculo mediante la utilizacion de operaciones de desplazamiento.
15 Ademas, d_flag es un indicador que indica si conmutar o no dos ecuaciones fijas predeterminadas, como las ecuaciones 2a y 2b, dependiendo de la relacion posicional temporal entre la imagen designada por ref1 y la imagen designada por ref2, cuando se lleva a cabo una prediccion lineal utilizando tales dos ecuaciones fijas. De manera mas espedfica, cuando este indicador indica la conmutacion de las ecuaciones, la ecuacion 2a se utiliza en caso de que la imagen designada por refl sea posterior a la imagen designada por ref2 en el orden de visualizacion, y la 20 ecuacion 2b se utiliza en otros casos para llevar a cabo una prediccion lineal, como es el caso del procedimiento convencional. Por otro lado, cuando este indicador indica no conmutar las ecuaciones, la ecuacion 2b siempre se utiliza para la prediccion lineal, independientemente de la relacion posicional entre la imagen designada por refl y la imagen designada por ref2.
25 Debe observarse que incluso si se utiliza la ecuacion 2a en lugar de la ecuacion 2b como una ecuacion que va a utilizarse sin conmutacion, la ecuacion 2a puede tratarse de la misma manera que la ecuacion 2b.
En el aparato de descodificacion mostrado en la FIG. 2, la unidad de analisis de flujos codificados 201 analiza el valor del indicador p_flag y proporciona a la unidad de descodificacion de compensacion de movimiento 204 una 30 instruccion que indica si descodificar o no los datos relacionados con los conjuntos de coeficientes de ponderacion para generar una imagen predictiva en funcion del resultado del analisis y, despues, la unidad de descodificacion de compensacion de movimiento 204 lleva a cabo una compensacion de movimiento mediante una prediccion lineal. Como resultado, es posible utilizar los conjuntos de coeficientes de ponderacion en un aparato de mayor rendimiento para llevar a cabo la prediccion lineal y no utilizar los conjuntos de coeficientes de ponderacion en un aparato de 35 menor rendimiento para llevar a cabo la prediccion lineal.
Asimismo, en el aparato de descodificacion mostrado en la FIG. 2, la unidad de analisis de flujos codificados 201 analiza el valor del indicador c_flag y proporciona a la unidad de descodificacion de compensacion de movimiento 204 una instruccion que indica si descodificar o no solamente los datos relacionados con el parametro C (C1 y C2) 40 correspondiente a las componentes de CC de los datos de imagen para generar una imagen predictiva mediante la utilizacion de ecuaciones fijas, en funcion de los resultados del analisis, y despues la unidad de descodificacion de compensacion de movimiento 204 lleva a cabo una compensacion de movimiento mediante prediccion lineal. Como resultado, es posible utilizar los conjuntos de coeficientes de ponderacion en un aparato de mayor rendimiento para llevar a cabo una prediccion lineal y utilizar solamente las componentes de CC en un aparato de menor rendimiento 45 para llevar a cabo la prediccion lineal.
Asimismo, en el aparato de descodificacion mostrado en la FIG. 2, cuando la unidad de analisis de flujos codificados 201 analiza el valor del indicador d_flag y se lleva a cabo una prediccion lineal utilizando ecuaciones fijas en funcion del resultado del analisis, la unidad de analisis de flujos codificados 201 proporciona una instruccion, que indica si 50 conmutar o no dos ecuaciones de descodificacion, a la unidad de descodificacion de compensacion de movimiento 204, en la que se lleva a cabo una compensacion de movimiento. Como resultado, es posible conmutar el procedimiento de manera que cualquiera de las ecuaciones fijas se utiliza para la prediccion lineal en caso de que se produzca un ligero cambio temporal en el brillo de una imagen, y las dos ecuaciones fijas conmutan para la prediccion lineal en caso de que el brillo de la imagen cambie a medida que pasa el tiempo.
55
Asimismo, en el aparato de descodificacion mostrado en la FIG. 2, la unidad de analisis de flujos codificados 201 analiza el valor del indicador t_flag y, en funcion del resultado del analisis, proporciona a la unidad de descodificacion de compensacion de movimiento 204 una instruccion que indica si generar o no los coeficientes para una prediccion lineal utilizando la informacion de orden de visualizacion de las imagenes de referencia, y la unidad
de descodificacion de compensacion de movimiento 204 lleva a cabo una compensacion de movimiento. Como resultado, es posible que el aparato de codificacion codifique los conjuntos de coeficientes de ponderacion para la prediccion lineal en caso de que pueda llevarse a cabo una codificacion adicional y generar los coeficientes a partir de la informacion de orden de visualizacion para la prediccion lineal en caso de que no pueda llevarse a cabo una 5 codificacion adicional.
Asimismo, en el aparato de codificacion mostrado en la FIG. 2, la unidad de analisis de flujos codificados 201 analiza el valor del indicador s_flag y, en funcion del resultado del analisis, proporciona a la unidad de descodificacion de compensacion de movimiento 204 una instruccion que indica si aproximar o no los coeficientes de prediccion lineal a 10 las potencias de 2 para permitir el calculo de estos coeficientes mediante operaciones de desplazamiento, y la unidad de descodificacion de compensacion de movimiento 204 lleva a cabo una compensacion de movimiento. Como resultado, es posible utilizar los coeficientes de ponderacion sin aproximarse en un aparato de mayor rendimiento para llevar a cabo la prediccion lineal, y utilizar los coeficientes de ponderacion aproximandose a las potencias de 2 en un aparato de menor rendimiento para llevar a cabo la prediccion lineal que puede realizarse 15 mediante operaciones de desplazamiento.
Por ejemplo, el caso de (1) (p, c, d, t, s_flag) = (1, 0, 0, 0, 1) muestra que se descodifican todos los conjuntos de coeficientes de ponderacion y que se lleva a cabo una prediccion lineal solamente mediante operaciones de desplazamiento representandose los coeficientes como las potencias de 2 explicadas en la septima realizacion para 20 generar una imagen predictiva.
El caso de (2) (p, c, d, t, s_flag) = (1, 1, 1, 0, 0) muestra que solamente se descodifican los datos relacionados con el parametro C (C1 y C2), se utiliza el procedimiento para generar una imagen predictiva anadiendo el coeficiente C a las ecuaciones fijas como explicadas en la octava realizacion y, ademas, las dos ecuaciones fijas se conmutan para 25 su utilizacion.
En el caso de (3) (p, c, d, t, s_flag) = (0, 0, 0, 0, 0), ningun conjunto de coeficientes de ponderacion se descodifica. Dicho de otro modo, muestra que se utiliza el procedimiento para generar una imagen predictiva utilizando solamente la ecuacion 2b de entre las ecuaciones fijas del procedimiento convencional.
30
El caso de (4) (p, c, d, t, s_flag) = (0, 0, 1, 1, 1) muestra que no se descodifica ningun conjunto de coeficientes de ponderacion, sino que la prediccion lineal se lleva a cabo solamente mediante operaciones de desplazamiento generando los coeficientes de ponderacion a partir de informacion de orden de visualizacion de las imagenes de referencia y aproximando adicionalmente los coeficientes a las potencias de 2, como se explico en la novena 35 realizacion, y despues las dos ecuaciones fijas se conmutan para utilizarse y generar una imagen predictiva.
Debe observarse que, en la presente realizacion, las determinaciones se realizan utilizando cinco indicadores (p_flag, c_flag, d_flag, t_flag, s_flag), cada uno de los cuales es 1 bit, pero tambien es posible representar las determinaciones solamente con un indicador de 5 bits en lugar de estos cinco indicadores. En ese caso es posible 40 una descodificacion utilizando una descodificacion de longitud variable, no mediante la representacion con 5 bits.
Debe observarse que, En la presente realizacion, se utilizan los cinco indicadores (p_flag, c_flag, d_flag, t_flag, s_flag), cada uno de los cuales es 1 bit, pero esto tambien puede aplicarse al caso en que el procedimiento de prediccion lineal conmuta utilizando solamente algunos de estos indicadores. En ese caso, solo se codifican y 45 describen los indicadores necesarios para la prediccion lineal de entre los indicadores mostrados en la FIG. 17A.
En el procedimiento convencional se proporciona un indicador en un area de informacion comun de imagen de un flujo codificado para conmutar entre la generacion de una imagen predictiva mediante la utilizacion de ecuaciones fijas y la generacion de una imagen predictiva mediante la utilizacion de conjuntos de coeficientes de ponderacion de 50 coeficientes de prediccion lineal, para permitir la conmutacion entre las mismas en cada imagen. Sin embargo, en este procedimiento, el procedimiento de generacion de imagenes predictivas solo puede conmutarse por cada imagen.
Por el contrario, en la presente realizacion, como se ha mencionado anteriormente, es posible conmutar el 55 procedimiento de generacion de una imagen predictiva para cada seccion, que es una subdivision de una imagen, proporcionando el indicador de conmutacion en una cabecera de seccion de un flujo codificado. Por lo tanto, es posible, por ejemplo, generar la imagen predictiva utilizando los conjuntos de coeficientes de ponderacion en una seccion que contiene imagenes complejas y generar la imagen predictiva utilizando las ecuaciones fijas en una seccion que contiene imagenes simples. Como resultado, la calidad de la imagen puede mejorarse minimizandose al
mismo tiempo el aumento de la cantidad de procesamiento.
Debe observarse que, en la presente realizacion, cinco indicadores (p_flag, c_flag, d_flag, t_flag, s_flag) estan descritos en un area de cabecera de seccion para la determinacion del procedimiento en cada seccion, pero tambien 5 es posible conmutar la determinacion por cada imagen describiendo estos indicadores en el area de informacion comun de imagen. Ademas, tambien es posible generar una imagen predictiva utilizando el procedimiento optimo en cada bloque proporcionando el indicador de conmutacion en cada bloque, que es una subdivision de una seccion.
Debe observarse que la informacion de orden de visualizacion En la presente realizacion, no esta limitada al orden 10 de visualizacion, sino que puede ser el tiempo de visualizacion real o el orden de imagenes respectivas empezando por una imagen predeterminada, cuyo valor aumenta a medida que transcurre el tiempo de visualizacion.
(Decimoprimera realizacion)
15 A continuacion, se explicara el procedimiento de codificacion de imagenes en movimiento y el procedimiento de descodificacion de imagenes en movimiento de la decimoprimera realizacion de la presente invencion. Puesto que las estructuras del aparato de codificacion y del aparato de descodificacion, los flujos de procesamiento de codificacion y de procesamiento de descodificacion y el procedimiento de asignacion de indices de referencia son exactamente identicos a los de la primera y sexta realizaciones, no se repetira la explicacion de los mismos.
20
En la presente realizacion, se explicara una tecnologfa similar a la explicada en la quinta y decima realizaciones.
El indicador p_flag indica si se codifica o no un conjunto de parametros y el indicador c_flag indica si se codifican o no solamente los datos relacionados con el parametro C (C1 y C2), de entre los parametros para refl y ref2, 25 descritos en cada seccion.
En el aparato de codificacion mostrado en la FIG. 1, la unidad de codificacion de compensacion de movimiento 107 determina, por cada seccion o por cada bloque, si codificar o no los datos relacionados con el conjunto de parametros y proporciona, basandose en la determinacion, la informacion del indicador p_flag a la unidad de 30 generacion de flujos codificados 103, en la que la informacion se describe en el flujo codificado, como se muestra en la FIG. 40A.
Asimismo, en el aparato de codificacion mostrado en la FIG. 1, la unidad de codificacion de compensacion de movimiento 107 determina, por cada seccion o por cada bloque, si codificar o no solamente los datos relacionados 35 con el parametro C (C1 y C2) correspondiente a las componentes de CC de los datos de imagen y proporciona, basandose en la determinacion, la informacion del indicador c_flag a la unidad de generacion de flujos codificados 103, en la que la informacion se describe en el flujo codificado, como se muestra en la FIG. 40A.
Por otro lado, en el aparato de descodificacion mostrado en la FIG. 2, la unidad de analisis de flujos codificados 201 40 analiza los valores de los indicadores de conmutacion p_flag y c_flag y, en funcion del analisis, proporciona a la unidad de descodificacion de compensacion de movimiento 204 una instruccion que indica si generar una imagen predictiva mediante la utilizacion de los conjuntos de parametros descargados o si generar una imagen predictiva mediante la utilizacion de ecuaciones fijas, por ejemplo, y la unidad de descodificacion de compensacion de movimiento 204 lleva a cabo una compensacion de movimiento mediante una prediccion lineal.
45
Por ejemplo, tal y como se muestra en la FIG. 40B, (1) cuando el indicador p_flag es 1 y el indicador c_flag es 0, el aparato de codificacion codifica todos los conjuntos de parametros, (2) cuando el indicador p_flag es 1 y el indicador c_flag es 1, el aparato de codificacion codifica solamente los datos relacionados con el parametro C (C1 y C2) y, ademas, (3) cuando el indicador p_flag es 0 y el indicador c_flag es 0, el aparato de codificacion no codifica ningun 50 conjunto de parametros. Debe observarse que determinando los valores de indicador mostrados en la FIG. 40B puede determinarse si la componente de cC de los datos de imagen se ha codificado o no utilizando el valor del indicador p_flag.
El aparato de codificacion procesa los parametros como se explico de la FIG. 8 a la FIG. 10, por ejemplo, en el
55 anterior caso (1). Procesa los parametros como se explico en la FIG. 16, por ejemplo, en el anterior caso (2).
Procesa los parametros utilizando ecuaciones fijas, por ejemplo, en el anterior caso (3).
El aparato de descodificacion procesa los parametros como se explico de la FIG. 18 a la FIG. 20, por ejemplo, en el
anterior caso (1). Procesa los parametros como se explico en la FIG. 22, por ejemplo, en el anterior caso (2).
Procesa los parametros utilizando ecuaciones fijas, por ejemplo, en el anterior caso (3).
A continuacion, se explicara de manera espedfica otro ejemplo de una combinacion de los anteriores casos (1) a (3).
5
En el ejemplo anterior, la codificacion de parametros (tanto si aparato de descodificacion recibe los parametros como si no) conmuta de manera explfcita utilizando los indicadores p_flag y c_flag, pero tambien es posible utilizar una tabla de codificacion de longitud variable (tabla VLC) en lugar de los indicadores anteriores.
10 Tal y como se muestra en las FIG. 41A y 41B, tambien es posible seleccionar de manera explfcita si conmutar entre la ecuacion fija 2a y la ecuacion fija 2b.
En este caso, la no conmutacion de la ecuacion 2 significa lo siguiente. En la seccion de la tecnica anterior se explico que, por ejemplo, para generar una imagen predictiva, la ecuacion fija 2a que incluye los coeficientes fijos se 15 selecciona cuando la imagen designada por el primer mdice de referencia aparece detras, en el orden de visualizacion, de la imagen designada por el segundo mdice de referencia, y la ecuacion 2b que incluye coeficientes fijos se selecciona en otros casos. Por otro lado, cuando se ordena no conmutar la ecuacion, como se muestra en el ejemplo de la FIG. 41B, esto significa que la ecuacion fija 2b que incluye coeficientes fijos se selecciona incluso cuando la imagen designada por el primer mdice de referencia aparece detras, en el orden de codificacion, de la 20 imagen designada por el segundo mdice de referencia para generar una imagen predictiva.
La informacion del indicador v_flag para seleccionar de manera explfcita si conmutar entre la ecuacion fija 2a y la ecuacion fija 2b se proporciona por la unidad de generacion de flujos codificados 103 y se describe en el flujo codificado mostrado en la FIG. 41A.
25
La FIG. 41B muestra un ejemplo de procesamiento mediante la utilizacion del indicador v_flag. Tal y como se muestra en la FIG. 41B, cuando el indicador v_flag vale 1, los parametros no se codifican (los parametros no se descargan en el aparato de descodificacion. Esto tambien se aplica a lo descrito a continuacion) y la ecuacion fija 2 no conmuta. Cuando el indicador v_flag vale 01, los parametros no se codifican y la ecuacion fija 2 conmuta. Cuando
30 el indicador v_flag vale 0000, solo se codifica el parametro C y la ecuacion 2 no conmuta.
Ademas, cuando el indicador v_flag vale 0001, solo se codifica el parametro C y la ecuacion 2 conmuta. Cuando el indicador v_flag vale 0010, todos los parametros se codifican y la ecuacion 2 no conmuta. Cuando el indicador v_flag vale 0011, todos los parametros se codifican y la ecuacion fija 2 conmuta.
35
Debe observarse que puesto que todos los parametros se codifican cuando v_flag vale 0010 y 0011, es posible llevar a cabo una prediccion lineal utilizando parametros de ponderacion, sin utilizar ecuaciones fijas, y en ese caso, la determinacion de si conmutar o no la ecuacion fija se ignora.
40 Debe observarse que el indicador v_flag puede conmutarse por la unidad de codificacion de compensacion de
movimiento 107 del aparato de codificacion mostrado en la FIG. 1 y por la unidad de descodificacion de
compensacion de movimiento 204 del aparato de descodificacion mostrado en la FIG. 2. Tambien es posible utilizar el indicador d_flag que indica si conmutar o no la ecuacion fija, en lugar del indicador v_flag, ademas de los indicadores anteriores p_flag y c_flag.
45
Tal y como se ha descrito anteriormente, la utilizacion de indicadores permite la conmutacion de si el aparato de descodificacion recibe (descarga) o no parametros codificados despues de que el aparato de codificacion codifique los parametros. Como resultado, los parametros que van a codificarse (o recibirse) pueden conmutar de manera explfcita segun las caractensticas de la aplicacion y el rendimiento del aparato de descodificacion.
50
Ademas, puesto que la ecuacion fija puede conmutar de manera explfcita, la variedad de medios para mejorar la calidad de la imagen aumenta y, por tanto, la eficacia de codificacion tambien mejora. Ademas, incluso si el aparato de descodificacion no tiene ninguna ecuacion fija, puede conmutar a la ecuacion fija de manera explfcita y, por tanto, generar una imagen predictiva utilizando la ecuacion fija seleccionada explfcitamente.
55
Debe observarse que la ubicacion de los indicadores no esta limitada a lo mostrado en la FIG. 40. Ademas, los valores de los indicadores no estan limitados a los explicados anteriormente. Ademas, puesto que cuatro tipos de usos de parametros pueden mostrarse de manera explfcita utilizando dos tipos de indicadores, los parametros pueden asignarse de manera diferente a lo explicado anteriormente. Ademas, todos los parametros se transmiten en
el ejemplo anterior, pero todos los conjuntos de parametros necesarios pueden transmitirse, como se explico en la FIG. 10 y en la FIG. 20, por ejemplo.
(Decimosegunda realizacion)
5
Si un programa para realizar las estructuras del procedimiento de codificacion de imagenes o del procedimiento de descodificacion de imagenes mostrados en las realizaciones anteriores se graba en un medio de memoria tal como un disco flexible, entonces es posible llevar a cabo facilmente el procesamiento mostrado en cada una de las realizaciones en un sistema informatico independiente.
10
Las FIG. 25A, 25B y 25C son ilustraciones que muestran el caso en que el procesamiento se lleva a cabo en un sistema informatico que utiliza un disco flexible que almacena el procedimiento de codificacion de imagenes o el procedimiento de descodificacion de imagenes de la primera a la decimoprimera realizaciones anteriores.
15 La FIG. 25B muestra una vista delantera y una vista en seccion transversal de la apariencia de un disco flexible, y el propio disco flexible, y la FIG. 25A muestra un ejemplo de un formato ffsico de un disco flexible como un cuerpo de medio de grabacion. El disco flexible FD esta contenido en una funda F, y una pluralidad de pistas Tr estan formadas de manera concentrica en la superficie del disco en la direccion del radio desde la periferia y cada pista esta dividida en 16 sectores Se en la direccion angular. Por lo tanto, en lo que respecta al disco flexible que almacena el 20 programa mencionado anteriormente, el procedimiento de codificacion de imagenes como programa se graba en un area asignada para ello en el disco flexible FD.
La FIG. 25C muestra la estructura para grabar y reproducir el programa en y desde el disco flexible FD. Cuando el programa se graba en el disco flexible FD, el procedimiento de codificacion de imagenes o el procedimiento de 25 descodificacion de imagenes como programa se escribe en el disco flexible desde el sistema informatico Cs a traves de una unidad de disco flexible. Cuando el procedimiento de codificacion de imagenes esta generado en el sistema informatico mediante el programa en el disco flexible, el programa se lee del disco flexible utilizando la unidad de disco flexible y se transfiere al sistema informatico.
30 La explicacion anterior se realiza bajo la suposicion de que un medio de grabacion es un disco flexible, pero el mismo procesamiento tambien puede llevarse a cabo utilizando un disco optico. Ademas, el medio de grabacion no esta limitado a un disco flexible y a un disco optico, sino que puede utilizarse cualquier otro medio, tal como una tarjeta de CI y un casete ROM, que pueda grabar un programa.
35 (Decimotercera realizacion)
Las FIG. 26 a 29 son ilustraciones de dispositivos para llevar a cabo el procesamiento de codificacion o el procesamiento de descodificacion descritos en las realizaciones anteriores y un sistema que los utiliza.
40 La FIG. 26 es un diagrama de bloques que muestra la configuracion global de un sistema de suministro de contenido ex100 para llevar a cabo un servicio de distribucion de contenido. El area para proporcionar el servicio de comunicacion esta dividida en celulas de tamano deseado y estaciones base ex107 a ex110, que son estaciones inalambricas fijas, estan situadas en celulas respectivas.
45 En este sistema de suministro de contenido ex100, dispositivos tales como un ordenador ex111, un asistente digital personal (PDA) ex112, una camara ex113, un telefono movil ex114 y un telefono movil equipado con camara ex115 estan conectados a Internet ex101 a traves de un proveedor de servicios de Internet ex102, una red telefonica ex104 y estaciones base ex107 a ex110.
50 Sin embargo, el sistema de suministro de contenido ex100 no esta limitado a la configuracion mostrada en la FIG. 26, y una combinacion de cualquiera de los dispositivos puede conectarse. Ademas, cada dispositivo puede estar conectado directamente a la red telefonica ex104, no a traves de las estaciones base ex107 a ex110.
La camara ex113 es un dispositivo tal como una videocamara digital que puede capturar imagenes en movimiento. 55 El telefono movil puede ser un telefono movil de un sistema de comunicaciones digitales personales (PDC), de un sistema de acceso multiple por division de codigo (CDMA), de un sistema de acceso multiple por division de codigo de banda ancha (W-CDMA), de un sistema global para comunicaciones moviles (GSM), de un sistema de telefono portatil personal (PHS), o similar.
Un servidor de flujo continuo (streaming) ex103 esta conectado a la camara ex113 a traves de la estacion base ex109 y la red telefonica ex104, que permite una distribucion en directo o similar utilizando la camara ex113 en funcion de los datos codificados transmitidos desde un usuario. La camara ex113 o el servidor para transmitir los datos puede codificar los datos.
5
Ademas, los datos de imagenes en movimiento capturados por una camara ex116 pueden transmitirse al servidor de flujo continuo ex103 a traves del ordenador exlll. La camara ex116 es un dispositivo tal como una camara digital que puede capturar imagenes fijas y en movimiento. La camara ex116 o el ordenador ex111 pueden codificar los datos de imagenes en movimiento. Un LSI ex117 incluido en el ordenador ex111 o en la camara ex116 lleva a cabo 10 realmente el procesamiento de codificacion.
El software para codificar y descodificar imagenes en movimiento puede estar integrado en cualquier tipo de medio de almacenamiento (tal como un CD-ROM, un disco flexible y un disco duro) que sea un medio de grabacion que pueda leerse por el ordenador ex111 o similar. Ademas, un telefono movil equipado con camara ex115 puede 15 transmitir los datos de imagenes en movimiento. Estos datos de imagenes en movimiento son los datos codificados por el LSI incluido en el telefono movil ex115.
El sistema de suministro de contenido ex100 codifica contenidos (tales como video de actuaciones musicales en directo) capturados por usuarios utilizando la camara ex113, la camara ex116, o similares, de la misma manera que 20 las realizaciones anteriores y los transmite al servidor de flujo continuo ex103, mientras que el servidor de flujo continuo ex103 realiza una distribucion de flujo de los datos de contenido a los clientes bajo solicitud. Los clientes incluyen el ordenador ex111, el PDA ex112, la camara ex113, el telefono movil ex114, y similares, capaces de descodificar los datos codificados mencionados anteriormente. En el sistema de suministro de contenido ex100, los clientes pueden recibir y reproducir por tanto los datos codificados y, ademas, los clientes pueden recibir, 25 descodificar y reproducir los datos en tiempo real para realizar una radiodifusion personal.
Cuando cada dispositivo de este sistema lleva a cabo la codificacion o la descodificacion, puede utilizarse el aparato de codificacion de imagenes en movimiento o el aparato de descodificacion de imagenes en movimiento, mostrados en cada una de las realizaciones mencionadas anteriormente.
30
A continuacion, se explicara un telefono movil como un ejemplo del dispositivo.
La FIG. 27 es un diagrama que muestra el telefono movil ex115 que utiliza el procedimiento de codificacion de imagenes en movimiento y el procedimiento de descodificacion de imagenes en movimiento explicados en las 35 realizaciones anteriores. El telefono movil ex115 tiene una antena ex201 para enviar y recibir ondas de radio hacia y desde la estacion base ex110, una unidad de camara ex203, tal como una camara CCD que puede capturar imagenes estaticas y de video, una unidad de visualizacion ex202, tal como una pantalla de cristal lfquido para mostrar los datos obtenidos descodificando video, y similares, capturado por la unidad de camara ex203 y recibido a traves de la antena ex201, una unidad de cuerpo que incluye un conjunto de teclas de funcionamiento ex204, una 40 unidad de salida de voz ex208, tal como un altavoz para emitir voz, una unidad de entrada de voz 205, tal como un microfono para introducir voz, un medio de almacenamiento ex207 para almacenar datos codificados o descodificados, tales como datos de imagenes estaticas o en movimiento capturadas por la camara, datos de texto y datos de imagenes estaticas o en movimiento de correos electronicos recibidos, y una unidad de ranura ex206 para acoplar el medio de almacenamiento ex207 al telefono movil ex115. El medio de almacenamiento ex207 incluye un 45 elemento de memoria flash, un tipo de memoria de solo lectura electricamente programable y borrable (EEPROM), que es una memoria no volatil que puede reescribirse y borrarse electricamente, en un recubrimiento de plastico tal como una tarjeta SD.
El telefono movil ex115 se explicara ademas con referencia a la FIG. 28. En el telefono movil ex115, una unidad de 50 circuito de suministro de energfa ex310, una unidad de control de entrada de operaciones ex304, una unidad de codificacion de imagenes ex312, una unidad de interfaz de camara ex303, una unidad de control de pantalla de cristal lfquido (LCD) ex302, una unidad de descodificacion de imagenes ex309, una unidad de multiplexacion / desmultiplexacion ex308, una unidad de grabacion / reproduccion ex307, una unidad de circuito de modem ex306 y una unidad de procesamiento de voz ex305 estan conectadas a una unidad de control principal ex311 estructurada 55 para controlar de manera global la unidad de visualizacion ex202 y la unidad de cuerpo que incluye las teclas de funcionamiento ex204, y estan conectadas entre sf a traves de un bus smcrono ex313.
Cuando un usuario pulsa la tecla de fin de llamada o la tecla de encendido, la unidad de circuito de suministro de energfa ex310 suministra energfa a las unidades respectivas desde un paquete de batenas para activar el telefono
movil digital equipado con camara ex115 para hacer que pase a un estado preparado.
En el telefono movil ex115, la unidad de procesamiento de voz ex305 convierte las senales de voz recibidas por la unidad de entrada de voz ex205, en modo de conversacion, en datos de voz digitales bajo el control de la unidad de 5 control principal ex311 que incluye una CPU, ROM, RAM y otros dispositivos, la unidad de circuito de modem ex306 lleva a cabo un procesamiento de espectro ensanchado de los datos de voz digitales y la unidad de circuito de envfo / recepcion ex30l lleva a cabo una conversion de digital a analogico y una transformada de frecuencia de los datos para transmitirlos a traves de la antena ex201. Ademas, en el telefono movil ex115, despues de que los datos recibidos por la antena ex201 en el modo de conversacion se amplifiquen y se sometan a una transformada de 10 frecuencia y a una conversion de analogico a digital, la unidad de circuito de modem ex306 lleva a cabo un procesamiento de espectro ensanchado inverso de los datos, y la unidad de procesamiento de voz ex305 los convierte en datos de voz analogicos para proporcionarlos a traves de la unidad de salida de voz 208.
Ademas, cuando se transmiten correos electronicos en el modo de comunicacion de datos, los datos de texto del 15 correo electronico introducidos mediante el funcionamiento de las teclas de funcionamiento ex204 de la unidad de cuerpo se envfan a la unidad de control principal ex311 a traves de la unidad de control de entrada de operaciones ex304. En la unidad de control principal ex311, despues de que la unidad de circuito de modem ex306 lleve a cabo el procesamiento de espectro ensanchado de los datos de texto y la unidad de circuito de envfo / recepcion ex301 lleve a cabo una conversion de digital a analogico y una transformada de frecuencia en los mismos, los datos se 20 transmiten a la estacion base ex110 a traves de la antena ex201.
Cuando los datos de imagen se transmiten en el modo de comunicacion de datos, los datos de imagen capturados por la unidad de camara ex203 se suministran a la unidad de codificacion de imagenes ex312 a traves de la unidad de interfaz de camara ex303. Cuando no se transmiten datos de imagen, tambien es posible mostrar los datos de 25 imagen capturados por la unidad de camara ex203 directamente en la unidad de visualizacion 202 a traves de la unidad de interfaz de camara ex303 y la unidad de control LCD ex302.
La unidad de codificacion de imagenes ex312, que incluye el aparato de codificacion de imagenes explicado en la presente invencion, comprime y codifica los datos de imagen suministrados por la unidad de camara ex203 mediante 30 el procedimiento de codificacion utilizado para el aparato de codificacion de imagenes mostrado en las realizaciones anteriores para transformarlos en datos de imagen codificados y los envfa a la unidad de multiplexacion / desmultiplexacion ex308. En este momento, el telefono movil ex115 envfa las voces recibidas por la unidad de entrada de voz ex205 durante la captura por medio de la unidad de camara ex203 a la unidad de multiplexacion / desmultiplexacion ex308 como datos de voz digitales a traves de la unidad de procesamiento de voz ex305.
35
La unidad de multiplexacion / desmultiplexacion ex308 multiplexa los datos de imagen codificados suministrados por la unidad de codificacion de imagenes ex312 y los datos de voz suministrados por la unidad de procesamiento de voz ex305 mediante un procedimiento predeterminado, la unidad de circuito de modem ex306 lleva a cabo un procesamiento de espectro ensanchado en los datos multiplexados obtenidos como resultado de la multiplexacion, y 40 la unidad de circuito de envfo / recepcion ex301 lleva a cabo una conversion de digital a analogico y una transformada de frecuencia en los datos para su transmision a traves de la antena ex201.
En lo que respecta a la recepcion de datos de un archivo de imagenes en movimiento que esta enlazado a una pagina web o similar en el modo de comunicacion de datos, la unidad de circuito de modem ex306 lleva a cabo un 45 procesamiento de espectro ensanchado inverso de la senal recibida desde la estacion base ex110 a traves de la antena ex201 y envfa los datos multiplexados obtenidos como resultado del procesamiento a la unidad de multiplexacion / desmultiplexacion ex308.
Con el fin de descodificar los datos multiplexados recibidos a traves de la antena ex201, la unidad de multiplexacion 50 / desmultiplexacion ex308 separa los datos multiplexados en un flujo de bits codificado de datos de imagen y un flujo de bits codificado de datos de voz y suministra los datos de imagen codificados a la unidad de descodificacion de imagenes ex309 y los datos de voz a la unidad de procesamiento de voz ex305, respectivamente, a traves del bus smcrono ex313.
55 Despues, la unidad de descodificacion de imagenes ex309, que incluye el aparato de descodificacion de imagenes explicado en la presente invencion, descodifica el flujo de bits codificado de datos de imagen mediante el procedimiento de descodificacion correspondiente al procedimiento de codificacion mostrado en las realizaciones mencionadas anteriormente para generar datos de imagenes en movimiento reproducidos y suministra estos datos a la unidad de visualizacion ex202 a traves de la unidad de control LCD ex302 y, por tanto, se muestran los datos de
imagenes en movimiento incluidos en un archivo de imagenes en movimiento enlazado a una pagina web, por ejemplo. Al mismo tiempo, la unidad de procesamiento de voz ex305 convierte los datos de voz en datos de voz analogicos y despues suministra estos datos a la unidad de salida de voz ex208 y, por tanto, se reproducen los datos de voz incluidos en un archivo de imagenes en movimiento enlazado a una pagina web, por ejemplo.
5
La presente invencion no esta limitada al sistema mencionado anteriormente, y al menos cualquiera del aparato de codificacion de imagenes y el aparato de descodificacion de imagenes de las realizaciones mencionadas anteriormente pueden incorporarse en un sistema de radiodifusion digital mostrado en la FIG. 29. Esta radiodifusion digital por satelite o terrestre ha aparecido recientemente en los medios de comunicacion. De manera mas 10 espedfica, un flujo de bits codificado de informacion de video se transmite desde una estacion de radiodifusion ex409 hasta un satelite de comunicaciones o de radiodifusion ex410 a traves de ondas de radio. Tras la recepcion del mismo, el satelite de radiodifusion ex410 transmite ondas de radio para la radiodifusion, una antena de uso domestico ex406 con una funcion de recepcion de radiodifusion por satelite recibe las ondas de radio y una television (receptor) ex401 o una unidad de adaptacion multimedia (STB) ex407 descodifica el flujo de bits codificado 15 para su reproduccion.
El aparato de descodificacion de imagenes mostrado en las realizaciones mencionadas anteriormente puede implementarse en el aparato de reproduccion ex403 para leer y descodificar el flujo de bits codificado grabado en un medio de almacenamiento ex402, es decir, un medio de grabacion tal como un CD y un DVD. En este caso, las 20 senales de video reproducidas se muestran en un monitor ex404. Tambien se concibe implementar el aparato de descodificacion de imagenes en la unidad de adaptacion multimedia ex407 conectada a un cable ex405 para una television por cable o la antena ex406 para la radiodifusion por satelite y/o terrestre para su reproduccion en el monitor ex408 de la television ex401. El aparato de descodificacion de imagenes puede estar incorporado en la television, no en la unidad de adaptacion multimedia. Como alternativa, un coche ex412 que tiene una antena ex411 25 puede recibir senales desde el satelite ex410, la estacion base ex107 o similar para reproducir imagenes en movimiento en un dispositivo de visualizacion tal como un sistema de navegacion para coches ex413.
Ademas, el aparato de codificacion de imagenes mostrado en las realizaciones mencionadas anteriormente puede codificar senales de imagenes para su grabacion en un medio de grabacion. Como un ejemplo concreto, hay un 30 grabador ex420, tal como un grabador de DVD para grabar senales de imagenes en un disco DVD ex421 y un grabador de disco para la grabacion en un disco duro. Tambien pueden grabarse en una tarjeta SD ex422. Si el grabador ex420 incluye el aparato de descodificacion de imagenes mostrado en las realizaciones mencionadas anteriormente, las senales de imagenes grabadas en el disco DVD ex421 o la tarjeta SD ex422 pueden reproducirse para su visualizacion en el monitor ex408.
35
La estructura sin la unidad de camara ex203, la unidad de interfaz de camara ex303 y la unidad de codificacion de imagenes ex312, de entre las unidades mostradas en la FIG. 28, pueden concebirse como la estructura del sistema de navegacion para coches ex413. Lo mismo se aplica al ordenador ex111, a la television (receptor) ex401 y a otros dispositivos.
40
Ademas, tres tipos de implementaciones pueden concebirse para un terminal tal como el telefono movil ex114 mencionado anteriormente: un terminal de envfo / recepcion que incluye tanto un codificador como un descodificador, un terminal de envfo que incluye solamente un codificador y un terminal de recepcion que incluye solamente un descodificador.
45
Tal y como se ha descrito anteriormente, es posible utilizar el procedimiento de codificacion de imagenes en movimiento o el procedimiento de descodificacion de imagenes en movimiento en las realizaciones mencionadas anteriormente en cualquiera de los aparatos y sistemas mencionados anteriormente y, utilizando este procedimiento, pueden obtenerse los efectos descritos en las realizaciones anteriores.
50
Aplicabilidad industrial
La presente invencion es adecuada para que un aparato de codificacion de imagenes lleve a cabo una codificacion inter-imagen para generar una imagen predictiva generando comandos que indican una correspondencia entre 55 numeros de imagen e indices de referencia para designar imagenes de referencia y coeficientes utilizados para la generacion de imagenes predictivas, designando una imagen de referencia a la que se hace referencia utilizando un mdice de referencia, cuando se lleva a cabo una compensacion de movimiento en un bloque de una imagen actual que va a codificarse, y llevando a cabo una prediccion lineal utilizando un coeficiente correspondiente al mdice de referencia en un bloque obtenido mediante compensacion de movimiento en la imagen de referencia designada.
Ademas, la presente invencion es adecuada para que un aparato de descodificacion de imagenes descodifique una senal codificada obtenida como resultado de la codificacion realizada por el aparato de codificacion de imagenes.

Claims (3)

  1. REIVINDICACIONES
    1. Un procedimiento de descodificacion de imagenes para descodificar un bloque codificado haciendo
    referencia a dos imagenes de referencia, comprendiendo el procedimiento de descodificacion:
    descodificar la senal de imagen codificada para obtener: un primer mdice de referencia que identifica una primera imagen de referencia para un bloque actual que va a descodificarse; un segundo mdice de referencia que identifica una segunda imagen de referencia para el bloque actual que va a descodificarse; comandos que indican una correspondencia entre indices de referencia e imagenes de referencia; una pluralidad de conjuntos de coeficientes 10 de ponderacion utilizados para generar una imagen predictiva; y un error de prediccion;
    designar, basandose en los comandos y el primer y el segundo indices de referencia, la primera imagen de referencia y la segunda imagen de referencia a las que se hace referencia cuando el bloque actual se descodifica mediante compensacion de movimiento;
    15
    especificar un primer conjunto de coeficientes de ponderacion que corresponde al primer mdice de referencia y un segundo conjunto de coeficientes de ponderacion que corresponde al segundo mdice de referencia, de entre la pluralidad de conjuntos de coeficientes de ponderacion;
    20 generar una primera imagen predictiva cambiando la escala de valores de pixel de un primer bloque de referencia utilizando el primer conjunto de coeficientes de ponderacion especificado, y generar una segunda imagen predictiva cambiando la escala de valores de pixel de un segundo bloque de referencia utilizando el segundo conjunto de coeficientes de ponderacion especificado, obteniendose el primer bloque de referencia a partir de la primera imagen de referencia designada en dicha designacion y obteniendose el segundo bloque de referencia a partir de la 25 segunda imagen de referencia designada en dicha designacion;
    generar una imagen predictiva del bloque actual basandose en un valor medio de la primera imagen predictiva y la segunda imagen predictiva; y
    30 generar una imagen reconstruida anadiendo la imagen predictiva y el error de prediccion, en el que los comandos comprenden primeros comandos y segundos comandos, y
    los primeros comandos indican una correspondencia entre los primeros indices de referencia y las primeras 35 imagenes de referencia, siendo cada uno de los primeros indices de referencia un mdice para designar la primera imagen de referencia, y los segundos comandos indican una correspondencia entre los segundos indices de referencia y las segundas imagenes de referencia, siendo cada uno de los segundos indices de referencia un mdice para designar la segunda imagen de referencia, y
    40 en el que la pluralidad de conjuntos de coeficientes de ponderacion utilizados para generar la primera imagen predictiva y la segunda imagen predictiva estan ubicados en una cabecera de seccion de la senal de imagen codificada, y
    en el que el bloque actual es un bloque incluido en una imagen B y el bloque actual se descodifica designando la 45 primera imagen de referencia y la segunda imagen de referencia a las que se hace referencia, y
    en el que el primer conjunto de coeficientes de ponderacion comprende una primera parte w1 y una segunda parte c1, y el segundo conjunto de coeficientes de ponderacion comprende una primera parte w2 y una segunda parte c2, y la primera parte w1 se utiliza para cambiar la escala de los valores de pixel del primer bloque de referencia y la 50 primera parte w2 se utiliza para cambiar la escala de los valores de pixel del segundo bloque de referencia, y la segunda parte cl y la segunda parte c2 se utilizan para aumentar los valores de pixel de la imagen predictiva por un valor medio de c1 y c2, y
    caracterizado porque 55
    al menos dos primeros indices de referencia se asignan a la primera imagen de referencia a la que hace referencia el bloque actual y la primera imagen de referencia a la que hace referencia el bloque actual se designa por uno de los al menos dos primeros indices de referencia, y al menos dos segundos indices de referencia se asignan a la segunda imagen de referencia a la que hace referencia el bloque actual y la segunda imagen de referencia a la que
    hace referencia el bloque actual se designa por uno de los al menos dos segundos mdices de referencia.
  2. 2. Un aparato de descodificacion que descodifica un bloque codificado haciendo referencia a dos
    imagenes de referencia, comprendiendo el aparato de descodificacion:
    5
    una unidad de descodificacion de senal de imagen codificada que puede hacerse funcionar para descodificar una senal de imagen codificada para obtener: un primer mdice de referencia que identifica una primera imagen de referencia para un bloque actual que va a descodificarse; un segundo mdice de referencia que identifica una segunda imagen de referencia para el bloque actual que va a descodificarse; comandos que indican una 10 correspondencia entre indices de referencia e imagenes de referencia; una pluralidad de conjuntos de coeficientes de ponderacion utilizados para generar una imagen predictiva; y un error de prediccion;
    una unidad de designacion de imagenes de referencia que puede hacerse funcionar para designar, basandose en los comandos y el primer y el segundo indices de referencia, la primera imagen de referencia y la segunda imagen 15 de referencia a las que se hace referencia cuando se descodifica el bloque actual mediante compensacion de movimiento;
    una unidad de especificacion de conjuntos de coeficientes de ponderacion que puede hacerse funcionar para especificar un primer conjunto de coeficientes de ponderacion que corresponde al primer mdice de referencia y un 20 segundo conjunto de coeficientes de ponderacion que corresponde al segundo mdice de referencia, de entre la pluralidad de conjuntos de coeficientes de ponderacion;
    una unidad de generacion de primera y segunda imagenes predictivas que puede hacerse funcionar para (i) generar una primera imagen predictiva cambiando la escala de valores de pixel de un primer bloque de referencia, utilizando 25 el primer conjunto de coeficientes de ponderacion especificado, y (ii) generar una segunda imagen predictiva cambiando la escala de valores de pixel de un segundo bloque de referencia, utilizando el segundo conjunto de coeficientes de ponderacion especificado, obteniendose el primer bloque de referencia a partir de la primera imagen de referencia designada por dicha unidad de designacion de imagenes de referencia y obteniendose el segundo bloque de referencia a partir de la segunda imagen de referencia designada por dicha unidad de designacion de 30 imagenes de referencia;
    una unidad de generacion de imagenes predictivas que puede hacerse funcionar para generar una imagen predictiva del bloque actual basandose en un valor medio de la primera imagen predictiva y la segunda imagen predictiva; y
    35 una unidad de generacion de imagen reconstruida que puede hacerse funcionar para generar una imagen reconstruida anadiendo la imagen predictiva y el error de prediccion,
    en el que los comandos comprenden primeros comandos y segundos comandos, y
    40 los primeros comandos indican una correspondencia entre los primeros indices de referencia y las primeras imagenes de referencia, siendo cada uno de los primeros indices de referencia un mdice para designar la primera imagen de referencia, y los segundos comandos indican una correspondencia entre los segundos indices de referencia y las segundas imagenes de referencia, siendo cada uno de los segundos indices de referencia un mdice para designar la segunda imagen de referencia, y 45
    en el que la pluralidad de conjuntos de coeficientes de ponderacion utilizados para generar la primera imagen predictiva y la segunda imagen predictiva estan ubicados en una cabecera de seccion de la senal de imagen codificada, y
    50 en el que el bloque actual es un bloque incluido en una imagen B y el bloque actual se descodifica designando la primera imagen de referencia y la segunda imagen de referencia a las que se hace referencia, y
    en el que el primer conjunto de coeficientes de ponderacion comprende una primera parte w1 y una segunda parte c1, y el segundo conjunto de coeficientes de ponderacion comprende una primera parte w2 y una segunda parte c2, 55 y la primera parte w1 se utiliza para cambiar la escala de los valores de pixel del primer bloque de referencia y la primera parte w2 se utiliza para cambiar la escala de los valores de pixel del segundo bloque de referencia, y la segunda parte cl y la segunda parte c2 se utilizan para aumentar los valores de pixel de la imagen predictiva por un valor medio de c1 y c2, y
    caracterizado porque
    al menos dos primeros mdices de referencia se asignan a la primera imagen de referencia a la que hace referencia el bloque actual y la primera imagen de referencia a la que hace referencia el bloque actual se designa por uno de 5 los al menos dos primeros indices de referencia, y al menos dos segundos indices de referencia se asignan a la segunda imagen de referencia a la que hace referencia el bloque actual y la segunda imagen de referencia a la que hace referencia el bloque actual se designa por uno de los al menos dos segundos indices de referencia.
  3. 3. Un medio legible por ordenador no transitorio que tiene un programa almacenado en el mismo para
    10 hacer que un ordenador lleve a cabo un procedimiento de descodificacion para descodificar un bloque codificado haciendo referencia a dos imagenes de referencia, comprendiendo el procedimiento de descodificacion:
    descodificar una senal de imagen codificada para obtener: un primer mdice de referencia que identifica una primera imagen de referencia para un bloque actual que va a descodificarse; un segundo mdice de referencia que identifica 15 una segunda imagen de referencia para el bloque actual que va a descodificarse; comandos que indican una correspondencia entre indices de referencia e imagenes de referencia; una pluralidad de conjuntos de coeficientes de ponderacion utilizados para generar una imagen predictiva; y un error de prediccion;
    designar, basandose en los comandos y el primer y el segundo indices de referencia, la primera imagen de 20 referencia y la segunda imagen de referencia a las que se hace referencia cuando el bloque actual se descodifica mediante compensacion de movimiento;
    especificar un primer conjunto de coeficientes de ponderacion que corresponde al primer mdice de referencia y un segundo conjunto de coeficientes de ponderacion que corresponde al segundo mdice de referencia, de entre la 25 pluralidad de conjuntos de coeficientes de ponderacion;
    generar una primera imagen predictiva cambiando la escala de valores de pixel de un primer bloque de referencia utilizando el primer conjunto de coeficientes de ponderacion especificado, y generar una segunda imagen predictiva cambiando la escala de valores de pixel de un segundo bloque de referencia utilizando el segundo conjunto de 30 coeficientes de ponderacion especificado, obteniendose el primer bloque de referencia a partir de la primera imagen de referencia designada en dicha designacion y obteniendose el segundo bloque de referencia a partir de la segunda imagen de referencia designada en dicha designacion;
    generar una imagen predictiva del bloque actual basandose en un valor medio de la primera imagen predictiva y la 35 segunda imagen predictiva; y
    generar una imagen reconstruida anadiendo la imagen predictiva y el error de prediccion,
    en el que los comandos comprenden primeros comandos y segundos comandos, y 40
    los primeros comandos indican una correspondencia entre los primeros indices de referencia y las primeras imagenes de referencia, siendo cada uno de los primeros indices de referencia un mdice para designar la primera imagen de referencia, y los segundos comandos indican una correspondencia entre los segundos indices de referencia y las segundas imagenes de referencia, siendo cada uno de los segundos indices de referencia un mdice 45 para designar la segunda imagen de referencia, y
    en el que la pluralidad de conjuntos de coeficientes de ponderacion utilizados para generar la primera imagen predictiva y la segunda imagen predictiva estan ubicados en una cabecera de seccion de la senal de imagen codificada, y 50
    en el que el bloque actual es un bloque incluido en una imagen B y el bloque actual se descodifica designando la primera imagen de referencia y la segunda imagen de referencia a las que se hace referencia, y
    en el que el primer conjunto de coeficientes de ponderacion comprende una primera parte w1 y una segunda parte 55 c1, y el segundo conjunto de coeficientes de ponderacion comprende una primera parte w2 y una segunda parte c2, y la primera parte w1 se utiliza para cambiar la escala de los valores de pixel del primer bloque de referencia y la primera parte w2 se utiliza para cambiar la escala de los valores de pixel del segundo bloque de referencia, y la segunda parte cl y la segunda parte c2 se utilizan para aumentar los valores de pixel de la imagen predictiva por un valor medio de c1 y c2, y
    caracterizado porque
    al menos dos primeros mdices de referencia se asignan a la primera imagen de referencia a la que hace referencia 5 el bloque actual y la primera imagen de referencia a la que hace referencia el bloque actual se designa por uno de los al menos dos primeros indices de referencia, y al menos dos segundos indices de referencia se asignan a la segunda imagen de referencia a la que hace referencia el bloque actual y la segunda imagen de referencia a la que hace referencia el bloque actual se designa por uno de los al menos dos segundos indices de referencia.
ES14197727.2T 2002-08-08 2003-07-22 Procedimiento de descodificación de imágenes en movimiento Expired - Lifetime ES2636947T3 (es)

Applications Claiming Priority (12)

Application Number Priority Date Filing Date Title
JP2002232160 2002-08-08
JP2002232160 2002-08-08
JP2002273992 2002-09-19
JP2002273992 2002-09-19
JP2002289294 2002-10-01
JP2002289294 2002-10-01
JP2002296726 2002-10-09
JP2002296726 2002-10-09
JP2002370722 2002-12-20
JP2002370722 2002-12-20
JP2003008751 2003-01-16
JP2003008751 2003-01-16

Publications (1)

Publication Number Publication Date
ES2636947T3 true ES2636947T3 (es) 2017-10-10

Family

ID=31721895

Family Applications (10)

Application Number Title Priority Date Filing Date
ES17188120T Expired - Lifetime ES2767954T3 (es) 2002-08-08 2003-07-22 Procedimiento de descodificación de imágenes en movimiento
ES10178507.9T Expired - Lifetime ES2524117T3 (es) 2002-08-08 2003-07-22 Procedimiento de codificación y procedimiento de descodificación de imágenes en movimiento
ES14197723.1T Expired - Lifetime ES2650068T3 (es) 2002-08-08 2003-07-22 Procedimiento de codificación y procedimiento de descodificación de imágenes en movimiento
ES14177707.8T Expired - Lifetime ES2653437T3 (es) 2002-08-08 2003-07-22 Procedimiento de descodificación de imágenes en movimiento
ES14197725.6T Expired - Lifetime ES2638189T3 (es) 2002-08-08 2003-07-22 Procedimiento de descodificación de imágenes en movimiento
ES14197727.2T Expired - Lifetime ES2636947T3 (es) 2002-08-08 2003-07-22 Procedimiento de descodificación de imágenes en movimiento
ES14197718.1T Expired - Lifetime ES2673393T3 (es) 2002-08-08 2003-07-22 Procedimiento de codificación de imágenes en movimiento y procedimiento de descodificación de imágenes en movimiento
ES03741520T Expired - Lifetime ES2401774T3 (es) 2002-08-08 2003-07-22 Procedimiento de codificación y procedimiento de descodificación de imágenes en movimiento
ES17188103T Expired - Lifetime ES2767066T3 (es) 2002-08-08 2003-07-22 Procedimiento de descodificación de imágenes en movimiento
ES14177815.9T Expired - Lifetime ES2656106T3 (es) 2002-08-08 2003-07-22 Procedimiento de decodificación de imágenes en movimiento

Family Applications Before (5)

Application Number Title Priority Date Filing Date
ES17188120T Expired - Lifetime ES2767954T3 (es) 2002-08-08 2003-07-22 Procedimiento de descodificación de imágenes en movimiento
ES10178507.9T Expired - Lifetime ES2524117T3 (es) 2002-08-08 2003-07-22 Procedimiento de codificación y procedimiento de descodificación de imágenes en movimiento
ES14197723.1T Expired - Lifetime ES2650068T3 (es) 2002-08-08 2003-07-22 Procedimiento de codificación y procedimiento de descodificación de imágenes en movimiento
ES14177707.8T Expired - Lifetime ES2653437T3 (es) 2002-08-08 2003-07-22 Procedimiento de descodificación de imágenes en movimiento
ES14197725.6T Expired - Lifetime ES2638189T3 (es) 2002-08-08 2003-07-22 Procedimiento de descodificación de imágenes en movimiento

Family Applications After (4)

Application Number Title Priority Date Filing Date
ES14197718.1T Expired - Lifetime ES2673393T3 (es) 2002-08-08 2003-07-22 Procedimiento de codificación de imágenes en movimiento y procedimiento de descodificación de imágenes en movimiento
ES03741520T Expired - Lifetime ES2401774T3 (es) 2002-08-08 2003-07-22 Procedimiento de codificación y procedimiento de descodificación de imágenes en movimiento
ES17188103T Expired - Lifetime ES2767066T3 (es) 2002-08-08 2003-07-22 Procedimiento de descodificación de imágenes en movimiento
ES14177815.9T Expired - Lifetime ES2656106T3 (es) 2002-08-08 2003-07-22 Procedimiento de decodificación de imágenes en movimiento

Country Status (9)

Country Link
US (15) US7308145B2 (es)
EP (13) EP2824927B1 (es)
KR (5) KR100969057B1 (es)
CN (7) CN101873501B (es)
DK (2) DK1530374T3 (es)
ES (10) ES2767954T3 (es)
HU (2) HUE047568T2 (es)
PT (4) PT2903278T (es)
WO (1) WO2004015999A1 (es)

Families Citing this family (71)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7308145B2 (en) 2002-08-08 2007-12-11 Matsushita Electric Industrial Co., Ltd. Moving picture coding method and moving picture decoding method
US7003035B2 (en) 2002-01-25 2006-02-21 Microsoft Corporation Video coding methods and apparatuses
US20040001546A1 (en) 2002-06-03 2004-01-01 Alexandros Tourapis Spatiotemporal prediction for bidirectionally predictive (B) pictures and motion vector prediction for multi-picture reference motion compensation
US8406301B2 (en) 2002-07-15 2013-03-26 Thomson Licensing Adaptive weighting of reference pictures in video encoding
US7903742B2 (en) * 2002-07-15 2011-03-08 Thomson Licensing Adaptive weighting of reference pictures in video decoding
US7154952B2 (en) 2002-07-19 2006-12-26 Microsoft Corporation Timestamp-independent motion vector prediction for predictive (P) and bidirectionally predictive (B) pictures
WO2004032506A1 (en) * 2002-10-01 2004-04-15 Thomson Licensing S.A. Implicit weighting of reference pictures in a video encoder
CN101304536B (zh) 2002-11-20 2011-11-02 松下电器产业株式会社 动态图像编码方法及动态图像编码装置
JP2004179687A (ja) * 2002-11-22 2004-06-24 Toshiba Corp 動画像符号化/復号化方法及び装置
CN101686364B (zh) * 2004-04-28 2013-03-13 松下电器产业株式会社 流产生装置,流产生方法,编码装置,编码方法,记录介质及其程序
US8731054B2 (en) * 2004-05-04 2014-05-20 Qualcomm Incorporated Method and apparatus for weighted prediction in predictive frames
US20060083298A1 (en) * 2004-10-14 2006-04-20 Nokia Corporation Reference picture management in video coding
US8621543B2 (en) * 2004-12-08 2013-12-31 Imagine Communications Ltd. Distributed statistical multiplexing of multi-media
KR100703749B1 (ko) * 2005-01-27 2007-04-05 삼성전자주식회사 잔차 재 추정을 이용한 다 계층 비디오 코딩 및 디코딩방법, 이를 위한 장치
TWI280803B (en) * 2005-07-20 2007-05-01 Novatek Microelectronics Corp Method and apparatus for motion estimation
US8233535B2 (en) * 2005-11-18 2012-07-31 Apple Inc. Region-based processing of predicted pixels
CN101998120B (zh) * 2006-05-24 2014-07-30 松下电器产业株式会社 图像编码装置、图像编码方法及图像编码集成电路
BRPI0622046B1 (pt) * 2006-09-30 2020-01-21 Interdigital Vc Holdings Inc método e dispositivo para codificar e decodificar camada de aprimoramento de cor para vídeo
US8256005B2 (en) * 2007-01-08 2012-08-28 Apple Inc. Protection of audio or video data in a playback device
JP2008177907A (ja) * 2007-01-19 2008-07-31 Fujitsu Ltd 動画データ復号装置、情報機器、動画データ復号方法および動画データ復号プログラム
US8494049B2 (en) * 2007-04-09 2013-07-23 Cisco Technology, Inc. Long term reference frame management with error video feedback for compressed video communication
US8254455B2 (en) * 2007-06-30 2012-08-28 Microsoft Corporation Computing collocated macroblock information for direct mode macroblocks
AU2007237313A1 (en) * 2007-12-03 2009-06-18 Canon Kabushiki Kaisha Improvement for error correction in distributed vdeo coding
US8270483B1 (en) * 2008-01-18 2012-09-18 Maxim Integrated Products, Inc. Method and apparatus for applying accurate parameter estimation and efficient fade detection in weighted prediction for video compression
WO2009095962A1 (ja) 2008-01-29 2009-08-06 Panasonic Corporation 画像符号化装置、画像符号化方法、画像符号化集積回路および画像符号化プログラム
KR101353304B1 (ko) * 2008-10-24 2014-01-21 에스케이 텔레콤주식회사 적응적 보간 필터 계수를 이용한 영상 부호화/복호화 방법 및 장치
US8189666B2 (en) * 2009-02-02 2012-05-29 Microsoft Corporation Local picture identifier and computation of co-located information
US20110023548A1 (en) 2009-07-29 2011-02-03 Garner Sean M Glass substrate comprising an edge web portion
WO2011037420A2 (ko) * 2009-09-25 2011-03-31 에스케이텔레콤 주식회사 인접 화소를 이용한 인터 예측 방법 및 장치와 그를 이용한 영상 부호화/복호화 방법 및 장치
CN103826131B (zh) * 2010-04-08 2017-03-01 株式会社东芝 图像解码方法以及图像解码装置
JP5368631B2 (ja) 2010-04-08 2013-12-18 株式会社東芝 画像符号化方法、装置、及びプログラム
CN102972027B (zh) * 2010-05-13 2016-12-21 夏普株式会社 预测图像生成装置、动图像解码装置、动图像编码装置以及预测图像生成方法
KR101341993B1 (ko) 2010-10-06 2013-12-16 에스케이텔레콤 주식회사 고정밀 필터를 이용한 영상 부호화/복호화 방법 및 장치
WO2012047047A2 (ko) * 2010-10-06 2012-04-12 에스케이텔레콤 주식회사 고정밀 필터를 이용한 영상 부호화/복호화 방법 및 장치
CN107087195B (zh) 2010-12-13 2020-03-13 韩国电子通信研究院 基于帧间预测对视频信号进行解码的方法
JP2014501091A (ja) 2010-12-17 2014-01-16 エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュート インター予測方法及びその装置
ES2685945T3 (es) 2011-04-12 2018-10-15 Sun Patent Trust Procedimiento de codificación de video de movimiento, y aparato de codificación de video de movimiento
US9485518B2 (en) 2011-05-27 2016-11-01 Sun Patent Trust Decoding method and apparatus with candidate motion vectors
PL4007276T3 (pl) 2011-05-27 2023-12-11 Sun Patent Trust Sposób kodowania obrazów, urządzenie do kodowania obrazów, sposób dekodowania obrazów, urządzenie do dekodowania obrazów, i urządzenie do kodowania i dekodowania obrazów
US8989271B2 (en) 2011-05-31 2015-03-24 Panasonic Intellectual Property Corporation Of America Decoding method and apparatus with candidate motion vectors
EP4228264A1 (en) 2011-06-23 2023-08-16 Sun Patent Trust Image decoding device, image encoding device
RU2603552C2 (ru) 2011-06-24 2016-11-27 Сан Пэтент Траст Способ декодирования изображения, способ кодирования изображения, устройство декодирования изображения, устройство кодирования изображения и устройство кодирования и декодирования изображения
US9106919B2 (en) 2011-06-24 2015-08-11 Panasonic Intellectual Property Corporation Of America Image decoding method, image coding method, image decoding apparatus, image coding apparatus, and image coding and decoding apparatus
MY169636A (en) 2011-06-27 2019-04-24 Sun Patent Trust Image decoding method, image coding method, image decoding apparatus, image coding apparatus, and image coding and decoding apparatus
CN107105254B (zh) 2011-06-28 2020-03-20 太阳专利托管公司 编码方法及编码装置
MX2013010892A (es) 2011-06-29 2013-12-06 Panasonic Corp Metodo de decodificacion de imagenes, metodo de codificacion de imagenes, aparato de decodificacion de imagenes, aparato de codificacion de imagenes y aparato de codificacion y decodificacion de imagenes.
KR102060619B1 (ko) 2011-06-30 2019-12-30 선 페이턴트 트러스트 화상 복호 방법, 화상 부호화 방법, 화상 복호 장치, 화상 부호화 장치 및 화상 부호화 복호 장치
MX339141B (es) 2011-06-30 2016-05-13 Panasonic Ip Corp America Metodo de decodificacion de imagenes, metodo de codificacion de imagenes, aparato de decodificacion de imagenes, aparato de codificacion de imagenes y aparato de codificacion y decodificacion de imagenes.
HUE049138T2 (hu) 2011-07-11 2020-09-28 Sun Patent Trust Kép dekódolási eljárás, kép dekódoló berendezés
EP3487178A1 (en) 2011-08-03 2019-05-22 Sun Patent Trust Video encoding method, video encoding apparatus, video decoding method, video decoding apparatus, and video encoding/decoding apparatus
RU2014107469A (ru) 2011-10-17 2015-11-27 Кабусики Кайся Тосиба Устройство кодирования, устройство декодирования, способ кодирования и способ декодирования
JP5698644B2 (ja) * 2011-10-18 2015-04-08 株式会社Nttドコモ 動画像予測符号化方法、動画像予測符号化装置、動画像予測符号化プログラム、動画像予測復号方法、動画像予測復号装置及び動画像予測復号プログラム
WO2013057877A1 (ja) 2011-10-19 2013-04-25 パナソニック株式会社 画像符号化方法、画像符号化装置、画像復号方法、および、画像復号装置
EP2806635A4 (en) * 2012-01-18 2015-12-02 Korea Electronics Telecomm METHOD AND DEVICE FOR ENCODING AND DECODING AN IMAGE
JP6182718B2 (ja) * 2012-06-29 2017-08-23 ヴェロス メディア インターナショナル リミテッドVelos Media International Limited 復号装置および復号方法
KR20150060730A (ko) * 2012-09-26 2015-06-03 톰슨 라이센싱 인터-이미지 예측 방법과 디바이스 및 대응하는 인코딩 방법과 디바이스
US9628790B1 (en) 2013-01-03 2017-04-18 Google Inc. Adaptive composite intra prediction for image and video compression
JP6365924B2 (ja) * 2013-05-09 2018-08-01 サン パテント トラスト 画像復号方法及び画像復号装置
US9609343B1 (en) 2013-12-20 2017-03-28 Google Inc. Video coding using compound prediction
US10148965B2 (en) * 2015-03-04 2018-12-04 Panasonic Intellectual Property Management Co., Ltd. Moving image coding apparatus and moving image coding method
CN110169059B (zh) 2017-01-13 2023-08-22 谷歌有限责任公司 视频代码化的复合预测
CN116437104A (zh) * 2017-05-19 2023-07-14 松下电器(美国)知识产权公司 解码方法和编码方法
US10284869B2 (en) 2017-09-28 2019-05-07 Google Llc Constrained motion field estimation for hardware efficiency
US10880573B2 (en) 2017-08-15 2020-12-29 Google Llc Dynamic motion vector referencing for video coding
US11789874B2 (en) 2018-01-09 2023-10-17 Qualcomm Incorporated Method, apparatus, and system for storing memory encryption realm key IDs
EP3599693A1 (de) * 2018-07-27 2020-01-29 Fronius International GmbH Lichtbogenerkennung
JP7304153B2 (ja) * 2018-12-27 2023-07-06 Kddi株式会社 動画像復号装置、動画像復号方法及びプログラム
CN110147330B (zh) * 2019-05-23 2023-09-01 深圳市创维软件有限公司 一种字模数据的缓存方法、装置、设备和存储介质
CN112584142B (zh) * 2019-09-30 2022-09-30 杭州海康威视数字技术股份有限公司 一种编解码方法、装置及其设备
JP2021061501A (ja) * 2019-10-04 2021-04-15 シャープ株式会社 動画像変換装置及び方法
CN111343462B (zh) * 2020-03-08 2021-10-22 苏州浪潮智能科技有限公司 一种图像数据压缩传输方法、装置及存储介质

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59200592A (ja) * 1983-04-27 1984-11-13 Fuji Photo Film Co Ltd カラ−画像の適応形圧縮方式
JP2853553B2 (ja) * 1994-02-22 1999-02-03 日本電気株式会社 動画像符号化方式
JP3089941B2 (ja) 1994-02-28 2000-09-18 日本ビクター株式会社 画像間予測符号化装置
US5708473A (en) 1994-08-30 1998-01-13 Hughes Aircraft Company Two stage video film compression method and system
TW257924B (en) * 1995-03-18 1995-09-21 Daewoo Electronics Co Ltd Method and apparatus for encoding a video signal using feature point based motion estimation
EP0935395A2 (en) * 1998-02-06 1999-08-11 Sony Corporation Video encoding methods and apparatus
EP1086591A1 (en) * 1999-04-06 2001-03-28 Koninklijke Philips Electronics N.V. Motion estimation
WO2001086960A2 (en) * 2000-05-10 2001-11-15 Picturetel Corporation Video coding using multiple buffers
JP2001333389A (ja) * 2000-05-17 2001-11-30 Mitsubishi Electric Research Laboratories Inc ビデオ再生システムおよびビデオ信号処理方法
KR100557911B1 (ko) * 2001-09-18 2006-03-10 마쯔시다덴기산교 가부시키가이샤 화상 부호화 방법 및 화상 복호화 방법
US7308145B2 (en) * 2002-08-08 2007-12-11 Matsushita Electric Industrial Co., Ltd. Moving picture coding method and moving picture decoding method
CN1897703A (zh) * 2002-01-18 2007-01-17 株式会社东芝 视频编码方法和装置以及视频解码方法和装置
JP2004007379A (ja) * 2002-04-10 2004-01-08 Toshiba Corp 動画像符号化方法及び動画像復号化方法
JP4015934B2 (ja) 2002-04-18 2007-11-28 株式会社東芝 動画像符号化方法及び装置
KR100508798B1 (ko) * 2002-04-09 2005-08-19 엘지전자 주식회사 쌍방향 예측 블록 예측 방법
HUE054106T2 (hu) * 2002-04-19 2021-08-30 Panasonic Ip Corp America Kép dekódoló eljárás és berendezés
JP2004023458A (ja) * 2002-06-17 2004-01-22 Toshiba Corp 動画像符号化/復号化方法及び装置
US20040234143A1 (en) * 2002-07-02 2004-11-25 Makoto Hagai Image encoding method and picture decoding method
US7903742B2 (en) * 2002-07-15 2011-03-08 Thomson Licensing Adaptive weighting of reference pictures in video decoding
EP1422946A4 (en) * 2002-07-26 2008-04-02 Matsushita Electric Ind Co Ltd MOVING IMAGE PROCEDURE, MOVABLE IMAGE DECODING METHOD AND RECORD MEDIUM
JP2004179687A (ja) * 2002-11-22 2004-06-24 Toshiba Corp 動画像符号化/復号化方法及び装置
BR0307119A (pt) * 2002-11-25 2004-12-28 Matsushita Electric Ind Co Ltd Método de codificação de imagens móveis e método de decodificação de imagens móveis
MXPA06000555A (es) * 2003-07-15 2006-07-10 Thomson Licensing Calculo de movimiento con coincidencia del bloque de busqueda rapida.
WO2009041215A1 (ja) * 2007-09-25 2009-04-02 Sharp Kabushiki Kaisha 動画像符号化装置及び動画像復号装置
US9819965B2 (en) * 2012-11-13 2017-11-14 Intel Corporation Content adaptive transform coding for next generation video
CN104737542B (zh) * 2013-01-30 2018-09-25 英特尔公司 用于下一代视频的内容自适应熵编码

Also Published As

Publication number Publication date
EP2903278B1 (en) 2017-06-28
EP1530374B1 (en) 2012-12-26
EP2903272A1 (en) 2015-08-05
EP1906671A3 (en) 2010-03-10
US20140056359A1 (en) 2014-02-27
US8606027B2 (en) 2013-12-10
EP2302931A3 (en) 2011-12-07
EP1906671A2 (en) 2008-04-02
CN101873491A (zh) 2010-10-27
EP1530374A4 (en) 2007-10-10
EP2928185A1 (en) 2015-10-07
ES2767066T3 (es) 2020-06-16
CN101867823A (zh) 2010-10-20
EP3349447B1 (en) 2019-11-06
US10321129B2 (en) 2019-06-11
CN101883279A (zh) 2010-11-10
EP2824928B1 (en) 2017-11-01
KR20080073368A (ko) 2008-08-08
US9456218B2 (en) 2016-09-27
US20080063288A1 (en) 2008-03-13
US20100329350A1 (en) 2010-12-30
EP2824927A2 (en) 2015-01-14
EP2320659A2 (en) 2011-05-11
KR100976017B1 (ko) 2010-08-17
US20140056351A1 (en) 2014-02-27
EP3285486B1 (en) 2019-11-06
ES2650068T3 (es) 2018-01-16
US20120195514A1 (en) 2012-08-02
PT2903277T (pt) 2017-10-06
US20080063291A1 (en) 2008-03-13
KR20100082017A (ko) 2010-07-15
CN101083770A (zh) 2007-12-05
WO2004015999A1 (ja) 2004-02-19
CN101867823B (zh) 2012-05-02
US20080069462A1 (en) 2008-03-20
PT2903278T (pt) 2017-09-22
US20130101045A1 (en) 2013-04-25
KR20050031451A (ko) 2005-04-06
US7308145B2 (en) 2007-12-11
CN101873501B (zh) 2012-10-31
EP2824928A3 (en) 2015-10-21
EP2903278A1 (en) 2015-08-05
HUE047568T2 (hu) 2020-04-28
KR20100082016A (ko) 2010-07-15
PT2320659E (pt) 2014-11-13
KR101011561B1 (ko) 2011-01-27
US8355588B2 (en) 2013-01-15
KR101000635B1 (ko) 2010-12-10
US7817867B2 (en) 2010-10-19
US20080069461A1 (en) 2008-03-20
EP3285486A1 (en) 2018-02-21
US9113149B2 (en) 2015-08-18
ES2401774T3 (es) 2013-04-24
EP2824927A3 (en) 2015-10-07
EP2824927B1 (en) 2017-10-04
EP3288261A1 (en) 2018-02-28
EP2928185B1 (en) 2017-09-06
US20050105809A1 (en) 2005-05-19
EP2824928A2 (en) 2015-01-14
ES2638189T3 (es) 2017-10-19
US8150180B2 (en) 2012-04-03
ES2524117T3 (es) 2014-12-04
ES2767954T3 (es) 2020-06-19
US7492952B2 (en) 2009-02-17
CN101873501A (zh) 2010-10-27
US20110293007A1 (en) 2011-12-01
EP2302931A2 (en) 2011-03-30
KR20100082015A (ko) 2010-07-15
HUE035701T2 (en) 2018-05-28
ES2673393T3 (es) 2018-06-21
DK2903277T3 (en) 2017-09-04
US8023753B2 (en) 2011-09-20
US9888239B2 (en) 2018-02-06
US9002124B2 (en) 2015-04-07
US20180192048A1 (en) 2018-07-05
KR100969057B1 (ko) 2010-07-09
CN101883279B (zh) 2012-12-19
US20160360197A1 (en) 2016-12-08
EP3288261B1 (en) 2019-11-06
EP1530374A1 (en) 2005-05-11
EP2320659A3 (en) 2011-12-28
CN101873491B (zh) 2011-11-23
CN101873492B (zh) 2012-05-30
US9942547B2 (en) 2018-04-10
US20130094583A1 (en) 2013-04-18
EP3349447A1 (en) 2018-07-18
EP2903277B1 (en) 2017-07-12
CN101873492A (zh) 2010-10-27
CN101083770B (zh) 2010-06-16
PT1530374E (pt) 2013-02-06
US7817868B2 (en) 2010-10-19
US20160360233A1 (en) 2016-12-08
EP2903277A1 (en) 2015-08-05
ES2653437T3 (es) 2018-02-07
KR101000609B1 (ko) 2010-12-10
ES2656106T3 (es) 2018-02-23
CN1568622B (zh) 2010-05-26
US7813568B2 (en) 2010-10-12
CN1568622A (zh) 2005-01-19
EP2320659B1 (en) 2014-10-01
EP2903272B1 (en) 2018-03-28
DK1530374T3 (da) 2013-01-21

Similar Documents

Publication Publication Date Title
ES2636947T3 (es) Procedimiento de descodificación de imágenes en movimiento
ES2644048T3 (es) Procedimiento de codificación de imágenes en movimiento y procedimiento de decodificación de imágenes en movimiento
ES2306380T3 (es) Procedimiento de codificacion de imagenes en movimiento y procedimiento de decodificacion de imagenes en movimiento.
ES2600520T3 (es) Procedimiento de codificación de vectores de movimiento
ES2535957T3 (es) Dispositivo de codificación de imágenes, dispositivo de descodificación de imágenes y sus métodos
ES2368908T3 (es) Procedimiento de codificación y decodificación de imágenes en movimiento.
JP4485157B2 (ja) 画像復号化方法および画像復号化装置
JP4485494B2 (ja) 画像復号化方法および画像復号化装置