ES2685945T3

ES2685945T3 - Procedimiento de codificación de video de movimiento, y aparato de codificación de video de movimiento

Info

Publication number: ES2685945T3
Application number: ES16193061.5T
Authority: ES
Inventors: Toshiyasu Sugio; Takahiro Nishi; Youji Shibahara; Hisao Sasai
Original assignee: Sun Patent Trust Inc
Current assignee: Sun Patent Trust Inc
Priority date: 2011-04-12
Filing date: 2012-02-28
Publication date: 2018-10-15
Anticipated expiration: 2032-02-28
Also published as: US20160337660A1; US20190132608A1; BR112013023478A8; MX2013010231A; JP6112320B2; US20200195954A1; JP2016015787A; PL2698999T3; RU2013141795A; EP3136727A1; RU2016137964A; US20190075314A1; CA2830036A1; EP2698999B1; US20190132607A1; US11012705B2; ES2621231T3; SA112330447B1; RU2719308C2; US9872036B2

Abstract

Un procedimiento de codificación de imágenes en movimiento para codificar un bloque actual, comprendiendo: determinar un primer candidato de bloque de fusión en una lista de candidatos de bloques de fusión y un segundo candidato de bloque de fusión en la lista de candidatos de bloques de fusión, teniendo el primer candidato de bloque de fusión al menos (i) un primer vector de movimiento que ha sido usado para codificar un primer bloque vecino al bloque actual, (ii) una primera dirección de predicción correspondiente al primer vector de movimiento, y (iii) un primer valor del índice de imagen de referencia para identificar una primera imagen de referencia correspondiente con el primer vector de movimiento, y teniendo el segundo candidato de bloque de fusión al menos (i) un segundo vector de movimiento que ha sido usado para codificar un segundo bloque vecino al bloque actual y diferente del primer bloque, (ii) una segunda dirección de predicción correspondiente al segundo vector de movimiento, y (iii) un segundo valor del índice de imagen de referencia para identificar una segunda imagen de referencia correspondiente con el segundo vector de movimiento, en el que la segunda dirección de predicción es diferente de la primera dirección de predicción y la lista de candidatos de bloques de fusión incluye una pluralidad de candidatos de bloques de fusión uno de los cuales es seleccionado para ser usado para codificar el bloque actual; y generar un candidato de bloque de fusión combinado de predicción bidireccional mediante la asignación del primer vector de movimiento y el primer índice de imagen de referencia para la primera dirección de predicción del candidato de bloque de fusión combinado y mediante la asignación del segundo vector de movimiento y el segundo índice de imagen de referencia para la segunda dirección de predicción del candidato de bloque de fusión combinado; y codificar el bloque actual mediante el uso de un candidato de bloque de fusión seleccionado entre la pluralidad de candidatos de bloques de fusión incluyendo el primer candidato de bloque de fusión, el segundo candidato de bloque de fusión, y el candidato de bloque de fusión combinado.

Description

5

10

15

20

25

30

35

40

45

50

55

DESCRIPCION

Procedimiento de codificación de video de movimiento, y aparato de codificación de video de movimiento rCampo técnico]

La presente invención se relaciona con métodos de codificación de imágenes en movimiento de codificar de imágenes de entrada en un modo bloque a bloque utilizando predicción entre imágenes con referencia a una imagen o imágenes codificadas, y métodos de decodificación de imágenes en movimiento de decodificar un flujo de bits en un modo bloque a bloque utilizando predicción entre imágenes.

Antecedentes de la técnica]

En la codificación de imágenes en movimiento, generalmente, una cantidad de información es comprimida mediante el uso de una redundancia de una dirección espacial y una dirección temporal de imágenes en movimiento. Aquí, en general, uno de los métodos que usa una redundancia en una dirección espacial es la transformación a un dominio de la frecuencia, y uno de los métodos que usa una redundancia en una dirección temporal es la codificación de predicción entre imágenes (en adelante, referida como “predicción entre”). En la codificación de predicción entre, cuando una imagen actual va a ser codificada, una imagen codificada anterior o posterior a la imagen actual en orden de visualización es usada como imagen de referencia. Entonces, la estimación del movimiento es realizada en la imagen actual correspondiente a la imagen de referencia para estimar un vector de movimiento. Entonces, se obtiene una diferencia entre los datos de la imagen de predicción generada mediante una compensación de movimiento basada en el vector de movimiento estimado y los datos de la imagen de la imagen actual para eliminar una redundancia en la dirección temporal. Aquí, en la estimación de movimiento, se calcula un valor de diferencia entre el bloque actual en una imagen actual y un bloque en la imagen de referencia, y se determina un bloque que tiene el menor valor de diferencia en la imagen de referencia como bloque de referencia. Entonces, mediante el uso del bloque actual como el bloque de referencia, se estima un vector de movimiento.

En el esquema de codificación de imágenes en movimiento conocido como H.264 que ya ha sido estandarizado, para comprimir una cantidad de información, se usan tres tipos de imágenes, imagen I, imagen P, e imagen B. La imagen I es una imagen en la cual no se realiza la codificación de predicción entre, en otras palabras, en la cual se realiza la codificación intra imagen (en adelante, referida como “predicción intra”). La imagen P es una imagen en la cual se realiza la codificación de predicción entre con referencia a una imagen codificada ubicada antes o después de la imagen actual en orden de visualización. La imagen B es una imagen en la cual se realiza la codificación de predicción entre con referencia a dos imágenes codificadas ubicadas antes o después de la imagen actual en orden de visualización.

En la codificación de predicción entre, se genera una lista de imágenes de referencia para especificar una imagen de referencia. La lista de imágenes de referencia es una lista en la cual una imagen de referencia codificada a la que se referirá en la predicción entre es asignada con un o unos valores correspondientes de un índice de imágenes de referencia. Por ejemplo, dado que una imagen B puede ser codificada con referencia a dos imágenes, una imagen B tiene dos listas (L0, L1) de imágenes de referencia.

La FIG. 1A es un diagrama para explicar la asignación de índices de imágenes de referencia para cada una de las imágenes de referencia. Las FIGS. 1B y 1C muestran un ejemplo de un par de listas de imágenes de referencia para una imagen B. En la FIG. 1A, por ejemplo, se asume que una imagen 2 de referencia, una imagen 1 de referencia, una imagen 0 de referencia, y una imagen actual a ser codificada son dispuestas en orden de visualización. Bajo esa suposición, la lista 0 (L0) de imágenes de referencia es un ejemplo de una lista de imágenes de referencia en una dirección 0 (la primera dirección de predicción) de predicción para predicción bidireccional. Como se muestra en la FIG. 1B, se asigna un valor “0” de un índice 0 de imagen de referencia a la imagen 0 de referencia dispuesta en el orden 2 de visualización, se asigna un valor “1” del índice 0 de imagen de referencia a la imagen 1 de referencia dispuesta en el orden 1 de visualización, y se asigna un valor “2” del índice 0 de imagen de referencia a la imagen 2 de referencia dispuesta en el orden 0 de visualización. En pocas palabras, se asigna un mayor valor del índice de imagen de referencia a una imagen más cercana temporalmente a la imagen actual en el orden de visualización. Por otro lado, la lista 1 (L1) de imágenes de referencia es un ejemplo de una lista de imágenes de referencia en una dirección 1 de predicción (la segunda dirección de predicción) para una predicción bidireccional. En la lista 1 (L1) de imágenes de referencia, se asigna un valor “0” de un índice 1 de imagen de referencia a la imagen 1 de referencia dispuesta en el orden 1 de visualización, se asigna un valor “1” del índice 1 de imagen de referencia a la imagen 0 de referencia dispuesta en el orden 2 de visualización, y se asigna un valor “2” del índice 1 de imagen de referencia a la imagen 2 de referencia dispuesta en el orden 0 de visualización. Como se describió anteriormente, para cada una de las imágenes de referencia, es posible asignar diferentes índices de imágenes de referencia a las direcciones de predicción respectivas (las imágenes 0 y 1 de referencia en la FIG. 1A), o asignar el mismo índice de imagen de referencia a ambas direcciones de predicción (imagen 2 de referencia en la FIG. 1A).

Además, en el esquema del método de codificación de imágenes en movimiento conocido como H.264 (véase Literatura 1 de documentos que no son patentes), como un modo de codificación de predicción entre para cada bloque actual en una imagen B, hay un modo de estimación del vector de movimiento para codificar (a) un valor

diferente entre los datos de la imagen de predicción y los datos de la imagen de un bloque actual y (b) un vector de movimiento usado en la generación de los datos de la imagen de predicción. En el modo de estimación del vector de movimiento, se selecciona bien la predicción bidireccional o bien la predicción unidireccional. En la predicción bidireccional, se genera una imagen de predicción con referencia a dos imágenes codificadas ubicadas antes o 5 después de la imagen actual. Por otro lado, en la predicción unidireccional, se genera una imagen de predicción con referencia a una imagen codificada ubicada antes o después de la imagen actual.

Además, en el esquema de codificación de imágenes en movimiento conocido como H.264, en la codificación de la imagen B, cuando se han de derivar los vectores de movimiento, es posible seleccionar un modo de codificación llamado un modo de vector de movimiento de predicción temporal. El método de codificación de predicción entre en 10 el modo de vector de movimiento de predicción temporal se describe con referencia a la FIG. 2. La FIG. 2 es un diagrama explicativo que muestra vectores de movimiento en el modo de vector de movimiento de predicción temporal, y muestra la situación donde un bloque “a” en una imagen B2 es codificada en el modo de vector de movimiento de predicción temporal. En esta situación, se usa un vector vb de movimiento. El vector vb de movimiento ha sido usado para codificar un bloque “b” en una imagen P3 que es una imagen de referencia ubicada 15 antes de la imagen B2. El bloque “b” (en adelante, referido como “bloque co-ubicado”) es ubicado, en la imagen P3, en una posición correspondiente a la posición del bloque “a”. El vector vb de movimiento es un vector de movimiento que ha sido usado para codificar el bloque “b”, y se refiere a una imagen P1. Mediante el uso de un vector de movimiento en paralelo con el vector vb de movimiento, el bloque “a” obtiene bloques de referencia de la imagen P1 que es una imagen de referencia hacia delante y de la imagen P3 que es una imagen de referencia hacia atrás. De 20 este modo, la predicción bidireccional se realiza para codificar el bloque “a”. Más específicamente, los vectores de movimiento usados para codificar el bloque “a” son un vector va1 de movimiento sobre la imagen PI y un vector va2 de movimiento sobre la imagen P3.

[Lista de referencias]

[Documentos que son Patentes]

25 NPL-1: ITU-T Recomendación H. 264, “Advanced video coding for generic audiovisual services”.

Artículo por S. Kamp et al. “Multihypothesis prediction using decoder side-motion vector derivation in inter-frame video coding”, Conf. On Visual Communications and Image Processing, 20-22 Enero 2009, San Jose muestra la derivación de los vectores de movimiento en el lado del decodificador sin señalarlos explícitamente. Esto es realizado por correspondencias de plantillas dentro de las porciones de imágenes adyacentes ya reconstruidas.

30 El documento WO 2010/148919 muestra la selección de vectores de movimiento de un conjunto de candidatos con los vectores de movimiento de los bloques vecinos.

La contribución JVT-C121 por Jeon “New Syntax for Bi-dir pred. Mode in MH pictures”, 60th MPEG meeting, mayo 10, 2002 muestra la predicción bidireccional usando no solo un par de tramas hacia delante y hacia atrás como referencia sino también dos tramas hacia delante y dos hacia atrás. En consecuencia, se introduce un nuevo 35 elemento de sintaxis para señalar la información de dirección.

La invención se establece en el conjunto de reivindicaciones adjuntas.

[Compendio de la invención]

[Problema técnico]

Sin embargo, convencionalmente, hay una situación donde, en la codificación de un bloque actual, la selección de 40 bien la predicción bidireccional o bien la predicción unidireccional causa una disminución de la eficiencia de codificación.

Una realización ejemplar no limitante de la presente descripción proporciona un método de codificación de imágenes en movimiento y un método de decodificación de imágenes en movimiento que son capaces de mejorar la eficiencia de codificación.

45 [Solución al problema]

En un aspecto general, las técnicas descritas aquí presentan; un método de codificación de imágenes en movimiento de codificar un bloque actual mediante el copiado de al menos un valor del índice de imagen de referencia y al menos un vector de movimiento, el al menos un valor del índice de imagen de referencia que es para identificar una imagen de referencia que ha sido usada en la codificación de un bloque diferente al bloque actual, el 50 método de codificación de imágenes en movimiento incluye: determinar una pluralidad de primeros bloques candidatos de los cuales el al menos un valor del índice de imagen de referencia y el al menos un vector de movimiento han de ser copiados; generar un segundo bloque candidato que use la predicción bidireccional, el segundo bloque candidato que es generado mediante la combinación de los valores de los índices de imágenes de referencia y vectores de movimiento que han sido usados para al menos parte de los primeros bloques candidatos;

5

10

15

20

25

30

35

40

45

50

55

seleccionar, de los primeros bloques candidatos y el segundo bloque candidato, un bloque del cual el al menos un valor del índice de imagen de referencia y el al menos un vector de movimiento han de ser copiados para codificar el bloque actual; y copiar el al menos un valor del índice de imagen de referencia y el al menos un vector de movimiento del bloque seleccionado, y codificar el bloque actual usando el al menos un valor del índice de imagen de referencia copiado y el al menos un vector de movimiento copiado.

De este modo, es posible codificar la imagen actual usando vector o vectores de movimiento e imagen o imágenes de referencia que sean las más apropiadas para el bloque actual. Como resultado, la eficiencia de codificación puede ser mejorada.

Es también posible que la generación del segundo bloque candidato incluya: determinar si cada uno de los primeros bloques candidatos tiene uno o más valores de índice de imagen de referencia y uno o más vectores de movimiento o no; y generar el segundo bloque candidato, cuando al menos uno de los primeros bloques candidatos no tiene ningún valor del índice de imagen de referencia y ningún vector de movimiento.

Es además posible que el método de codificación de imágenes en movimiento incluya: determinar si el bloque actual ha de ser codificado mediante el uso de el al menos un valor del índice de imagen de referencia y el al menos un vector de movimiento o no, que son copiados de uno de los primeros bloques de candidatos o del segundo bloque candidato; establecer una bandera que indique un resultado de la determinación; y añadir la bandera a un flujo de bits que incluya el bloque actual.

Es además también posible que el método de codificación de imágenes en movimiento incluya además: determinar un valor del índice de bloque correspondiente al bloque seleccionado del cual el al menos un valor del índice de imagen de referencia y el al menos un vector de movimiento han de ser copiados para codificar el bloque actual, de una lista de candidatos en la cual los primeros bloques candidatos y el segundo bloque candidato son asignados con valores de los índices de bloques respectivos; y añadir el valor del índice de bloque determinado a un flujo de bits que incluya el bloque actual.

Es además también posible que la generación del segundo bloque candidato incluya: determinar si dos de los primeros bloques candidatos tienen valores de índice de imagen de referencia que indiquen diferentes direcciones de predicción y han sido codificadas mediante predicción bidireccional o no; y generar el segundo bloque candidato, cuando los dos de los primeros bloques candidatos tienen diferentes direcciones de predicción o han sido codificados mediante predicción bidireccional.

Es además también posible que la generación del segundo bloque candidato incluya además: determinar si uno de los dos primeros bloques candidatos han sido predichos en una primera dirección de predicción o codificados mediante predicción bidireccional o no, y el otro de los dos primeros bloques candidatos ha sido predicho en una segunda dirección de predicción o codificado mediante predicción bidireccional; y cuando se ha determinado que el uno de los dos primeros bloques candidatos ha sido predicho en la primera dirección de predicción o codificado mediante predicción bidireccional, y el otro de los dos primeros bloques candidatos ha sido predicho en la segunda dirección de predicción o codificado mediante predicción bidireccional, generar el segundo bloque candidato mediante (i) la selección de un valor del índice de imagen de referencia y un vector de movimiento que han sido usados en la primera dirección de predicción para el uno de los dos primeros bloques candidatos, como un valor del índice de imagen de referencia y un vector de movimiento que son usados en la primera dirección de predicción para el segundo bloque candidato, y (ii) la selección de un valor del índice de imagen de referencia y un vector de movimiento que han sido usados en la segunda dirección de predicción para el otro de los dos primeros bloques candidatos, como un valor del índice de imagen de referencia y un vector de movimiento que son usados en la segunda dirección de predicción para el segundo bloque candidato.

Es además también posible que la generación del segundo bloque candidato incluya además: determinar si uno de los dos primeros bloques candidatos ha sido predicho en una primera dirección de predicción o codificado mediante predicción bidireccional o no, y el otro de los dos primeros bloques candidatos ha sido predicho en una segunda dirección de predicción o codificado mediante predicción bidireccional; y cuando no se ha determinado que el uno de los dos primeros bloques candidatos ha sido predicho en la primera dirección de predicción o codificado mediante predicción bidireccional, y el otro de los dos primeros bloques candidatos ha sido predicho en la segunda dirección de predicción o codificado mediante predicción bidireccional, generar el segundo bloque candidato mediante (i) la selección de un valor del índice de imagen de referencia y un vector de movimiento que han sido usados en la primera dirección de predicción para el otro de los dos primeros bloques candidatos, como un valor del índice de imagen de referencia y un vector de movimiento que son usados en la primera dirección de predicción para el segundo bloque candidato, y (ii) la selección de un valor del índice de imagen de referencia y un vector de movimiento que han sido usados en la segunda dirección de predicción para el uno de los dos primeros bloques candidatos, como un valor del índice de imagen de referencia y un vector de movimiento que son usados en la segunda dirección de predicción para el segundo bloque candidato.

En otro aspecto, las técnicas descritas en esta memoria presentan; un método de decodificación de imágenes en movimiento de decodificar un bloque actual mediante el copiado de al menos un valor del índice de imagen de referencia y al menos un vector de movimiento, el al menos un valor del índice de imagen de referencia para

5

10

15

20

25

30

35

40

45

50

55

60

identificar una imagen de referencia que ha sido usada en la decodificación de un bloque diferente al bloque actual, el método de decodificación de imágenes en movimiento incluye: determinar una pluralidad de primeros bloques candidatos de los cuales el al menos un valor del índice de imagen de referencia y el al menos un vector de movimiento han de ser copiados; generar un segundo bloque candidato que use la predicción bidireccional, el segundo bloque candidato que es generado mediante la combinación de los valores de los índices de imágenes de referencia y vectores de movimiento que han sido usados para al menos parte de los primeros bloques candidatos; seleccionar, de los primeros bloques candidatos y el segundo bloque candidato, un bloque del cual el al menos un valor del índice de imagen de referencia y el al menos un vector de movimiento han de ser copiados para decodificar el bloque actual; y copiar el al menos un valor del índice de imagen de referencia y el al menos un vector de movimiento del bloque seleccionado, y decodificar el bloque actual usando el al menos un valor del índice de imagen de referencia copiado y el al menos un vector de movimiento copiado.

De este modo, es posible decodificar un flujo de bits usando el o los vectores de movimientos más apropiados y la o las imágenes de referencia más apropiadas.

Es también posible que la generación del segundo bloque candidato incluya: determinar si cada uno de los primeros bloques candidatos tiene un valor del índice de imagen de referencia y uno o más vectores de movimiento o no; y generar el segundo bloque candidato, cuando al menos uno de los primeros bloques candidatos no tiene ningún valor del índice de imagen de referencia y ningún vector de movimiento.

Es además posible que el método de decodificación de imágenes en movimiento incluya: obtener, de un flujo de bits que incluye el bloque actual, una bandera que indica si el bloque actual ha de ser decodificado o no usando el al menos un valor del índice de imagen de referencia y el al menos un vector de movimiento que son copiados de uno de los primeros bloques de candidatos o del segundo bloque candidato; y decodificar el bloque actual según la bandera.

Es además también posible que el método de decodificación de imágenes en movimiento incluya además: obtener un valor del índice de bloque de un flujo de bits que incluye el bloque actual; y seleccionar, mediante el uso del valor del índice de bloque obtenido, un bloque del cual el al menos un valor del índice de imagen de referencia y el al menos un vector de movimiento han de ser copiados para decodificar el bloque actual, de una lista de candidatos en la cual los primeros bloques candidatos y el segundo bloque candidato son asignados con valores de los índices de bloques respectivos.

Es además también posible que la generación del segundo bloque candidato incluya además: determinar si uno de los dos primeros bloques candidatos ha sido predicho en una primera dirección de predicción o codificado mediante predicción bidireccional o no, y el otro de los dos primeros bloques candidatos ha sido predicho en una segunda dirección de predicción o codificado mediante predicción bidireccional; y cuando no se ha determinado que el uno de los dos primeros bloques candidatos ha sido predicho en la primera dirección de predicción o codificado mediante predicción bidireccional, y el otro de los dos primeros bloques candidatos ha sido predicho en la segunda dirección de predicción o codificado mediante predicción bidireccional, generar el segundo bloque candidato mediante (i) la selección de un valor del índice de imagen de referencia y un vector de movimiento que han sido usados en la primera dirección de predicción para el otro de los dos primeros bloques candidatos, como un valor del índice de imagen de referencia y un vector de movimiento que son usados en la primera dirección de predicción para el segundo bloque candidato, y (ii) la selección de un valor del índice de imagen de referencia y un vector de movimiento que han sido usados en la segunda dirección de predicción para el uno de los dos primeros bloques candidatos, como un valor del índice de imagen de referencia y un vector de movimiento que son usados en la

5

10

15

20

25

30

35

40

45

50

55

segunda dirección de predicción para el segundo bloque candidato.

Debería notarse que la presente descripción puede ser implementada no solo como el método de codificación de imágenes en movimiento y el método de decodificación de imágenes en movimiento anteriores, sino también como: un aparato de codificación de imágenes en movimiento, un aparato de decodificación de imágenes en movimiento, y un aparato de codificación y decodificación de imágenes en movimiento cada uno de los cuales incluye unidades de procesamiento que realizan los pasos caracterizados incluidos en el método de codificación de imágenes en movimiento y el método de decodificación de imágenes en movimiento; un programa que causa que un ordenador ejecute los pasos; y similares. La presente descripción puede ser implementada también como: un medio de grabación legible por un ordenador, tal como un Disco Compacto de Memoria de Solo Lectura (CD-ROM), en el cual el programa anterior es grabado; información, datos, señales que indican el programa, y similares. El programa, información, datos, o señales pueden ser distribuidos a través de un medio de transmisión tal como Internet.

En resumen, un aparato de codificación de una imagen en movimiento que codifica un bloque actual copiando al menos un valor de índice de imagen de referencia y al menos un vector de movimiento. El al menos un valor de índice de imagen de referencia siendo para identificar una imagen de referencia que se ha usado en la codificación de un bloque diferente del bloque actual, dicho aparato de codificación de imagen en movimiento comprendiendo una unidad de determinación configurada para determinar una pluralidad de primeros bloques candidatos de los cuales el al menos un valor de índice de imagen de referencia y el al menos un vector de movimiento se copian. Una unidad de generación configurada para generar al menos un segundo bloque candidato que usa predicción bidireccional, generándose el segundo bloque candidato combinando valores de índice de imagen de referencia y vectores de movimiento que se han usado para al menos parte de los primeros bloques candidatos; una unidad de selección configurada para seleccionar, desde los primeros bloques candidatos y el segundo bloque candidato, un bloque, desde el cual, el al menos un valor de índice de imagen de referencia y el al menos un vector de movimiento se copian para codificar el bloque actual y, una unidad de codificación configurada para (i) copiar el al menos un valor de índice de imagen de referencia y el al menos un vector de movimiento desde el bloque seleccionado por dicha unidad de selección y, (ii) codificar el bloque actual usando el al menos un valor de índice de imagen de referencia copiado y el al menos un vector de movimiento copiado.

Un aparato de decodificación de imagen en movimiento que decodifica un bloque actual copiando, al menos un valor de índice de imagen de referencia y al menos un vector de movimiento, siendo el al menos un valor de índice de referencia para identificar una imagen de referencia que se ha usado en la decodificación de un bloque diferente del bloque del bloque actual, comprendiendo dicho aparato de decodificación de imagen en movimiento una unidad de determinación configurada para determinar una pluralidad de primeros bloques candidatos desde los cuales el al menos un valor de índice de imagen de referencia y el al menos un vector de movimiento se copian. Una unidad de generación configurada para generar un segundo bloque candidato que usa predicción bidireccional, generándose el segundo bloque candidato combinando los valores de índice de imagen de referencia y los vectores de movimiento que se han usado para al menos parte de los primeros bloques candidatos.

Una unidad de selección configurada para seleccionar, de los primeros bloques candidatos y el segundo bloque candidato, un bloque desde el cual el al menos un valor de índice de imagen de referencia y el al menos un vector de movimiento se copian para decodificar el bloque actual y, una unidad de decodificación configurada para (i) copiar el al menos un valor de índice de imagen de referencia y el al menos un vector de movimiento desde el bloque seleccionado mediante dicha unidad de selección y, (ii) decodificar el bloque actual usando el al menos un valor de índice de imagen de referencia copiado y el al menos un vector de movimiento copiado.

Un aparato de codificación y decodificación de imagen en movimiento que comprende el aparato de codificación de imagen en movimiento y el aparato de decodificación de imagen en movimiento.

rEfectos ventajosos de la invención]

Según la presente descripción, un nuevo candidato de bloque de fusión de predicciones bidireccionales se calcula desde candidatos de bloques de fusión, para mejorar la eficiencia de codificación.

[Breve descripción de los dibujos]

[FIG. 1A] La FIG. 1A es un diagrama para explicar la asignación de índices de imágenes de referencia para cada imagen de referencia.

[FIG. 1B] La FIG. 1B es una tabla que muestra un ejemplo de una de las listas de imágenes de referencia para una imagen B.

[FIG. 1C] La FIG. 1C es una tabla que muestra un ejemplo de la otra lista de imágenes de referencia para una imagen B.

[FIG. 2] La FIG. 2 es un diagrama ejemplar que muestra vectores de movimiento en el modo de vector de movimiento de predicción temporal.

[FIG. 3A] La FIG. 3A es un diagrama que muestra una relación entre: un bloque actual a ser codificado; bloques vecinos; y vectores de movimiento de los bloques vecinos.

[FIG. 3B] La FIG. 3B es una tabla que muestra un ejemplo de una lista de candidatos de bloques de fusión en la cual cada valor de un índice de fusión es asignado a un vector de movimiento y un índice de imagen de

5

10

15

20

25

30

35

40

45

50

55

60

referencia que han de ser usados en el modo de fusión.

[FIG. 4] La FIG. 4 es un diagrama de bloques que muestra una estructura de un aparato de codificación de imágenes en movimiento que usa un método de codificación de imágenes en movimiento según una realización de la presente descripción.

[FIG. 5] La FIG. 5 es un diagrama de flujo de un compendio de un flujo de procesamiento del método de codificación de imágenes en movimiento según la realización de la presente descripción.

[FIG. 6] La FIG. 6 es una tabla que muestra un ejemplo de una lista de candidatos de bloques de fusión en la cual cada valor de un índice de fusión se asigna a un vector de movimiento y a un índice de imagen de referencia los cuales han de usarse en el modo de fusión según la Realización 1.

[FIG. 7] La FIG. 7 es un ejemplo de una tabla de codificación que es usada para realizar codificación de longitud variable en el índice de bloque de fusión.

[FIG. 8] La FIG. 8 es un diagrama de flujo de un flujo de procesamiento detallado para calcular un bloque de fusión combinado.

[FIG. 9] La FIG. 9 es un diagrama de flujo de un flujo de procesamiento detallado para comparar errores de predicción.

[FIG. 10] La FIG. 10 es un diagrama de bloques que muestra una estructura de un aparato de decodificación de imágenes en movimiento que usa un método de decodificación de imágenes en movimiento según una realización de la presente descripción.

[FIG. 11] La FIG. 11 es un diagrama de flujo de un compendio de un flujo de procesamiento de un método de decodificación de imágenes en movimiento según una realización de la presente descripción.

[FIG. 12] La FIG. 12 muestra una configuración general de un sistema que proporciona contendido para implementar servicios de distribución de contenidos;

[FIG. 13] La FIG. 13 muestra una configuración general de un sistema de difusión digital;

[FIG. 14] La FIG. 14 muestra un diagrama de bloques que ilustra un ejemplo de una configuración de un televisor.;

[FIG. 15] La FIG. 15 muestra un diagrama de bloques que ilustra un ejemplo de una configuración de una unidad de reproducción/grabación de información que lee y escribe información de y en un medio de grabación que es un disco óptico;

[FIG. 16] La FIG. 16 muestra un ejemplo de una configuración de un medio de grabación que es un disco óptico; [FIG. 17A] La FIG. 17A muestra un ejemplo de un teléfono móvil;

[FIG. 17B] La FIG. 17B es un diagrama de bloques que muestra un ejemplo de una configuración de un teléfono móvil;

[FIG. 18] La FIG. 18 ilustra una estructura de datos multiplexados;

[FIG. 19] La FIG. 19 muestra esquemáticamente cómo cada flujo es multiplexado en datos multiplexados;

[FIG. 20] La FIG. 20 muestra cómo un flujo de video es almacenado en un flujo de paquetes PES en más detalle;

[FIG. 21] La FIG. 21 muestra una estructura de paquetes TS y paquetes origen en los datos multiplexados;

[FIG. 22] La FIG. 22 muestra una estructura de datos de una PMT;

[FIG. 23] La FIG. 23 muestra una estructura interna de información de datos multiplexados;

[FIG. 24] La FIG. 24 muestra una estructura interna de información de atributos de flujo;

[FIG. 25] La FIG. 25 muestra pasos para identificar datos de video;

[FIG. 26] La FIG. 26 muestra un ejemplo de una configuración de un circuito integrado para implementar el método de codificación de imágenes en movimiento y el método de decodificación de imágenes en movimiento según cada uno de las Realizaciones;

[FIG. 27] La FIG. 27 muestra una configuración para conmutar entre frecuencias portadoras;

[FIG. 28] La FIG. 28 muestra los pasos para identificar datos de video y conmutar entre frecuencias portadoras;

[FIG. 29] La FIG. 29 muestra un ejemplo de una tabla de búsqueda en la cual los estándares de datos de video

están asociados con frecuencias portadoras;

[FIG. 30A] La FIG. 30A es un diagrama que muestra un ejemplo de una configuración para compartir un módulo de una unidad de procesamiento de señal; y

[FIG. 30B] La FIG. 30B es un diagrama que muestra otro ejemplo de una configuración para compartir un módulo de la unidad de procesamiento de señal.

rDescripción de las realizaciones!

En el esquema de codificación de imágenes en movimiento, un modo de codificación llamado un modo de fusión ha sido examinado como un modo de predicción entre para cada bloque a ser codificado en una imagen B o una imagen P. En este modo de fusión, un vector de movimiento y un valor de un índice de imagen de referencia (en adelante, referido también como “valores de los índices de imágenes de referencia”) son copiados de un bloque vecino de un bloque actual a ser codificado, para codificar el bloque actual. Aquí, añadiendo el valor del índice y el mismo del bloque vecino desde el cual son copiados son añadidos a un flujo de bits. Como resultado, un vector de movimiento o un valor de un índice de imagen de referencia que han sido usados en la codificación pueden ser seleccionados en la decodificación. Se describe un ejemplo detallado con referencias a las figuras correspondientes.

La Fig. 3A es un diagrama de bloques que muestra una relación entre: un bloque actual a ser codificado; bloques vecinos; y vectores de movimiento de los bloques vecinos. La FIG. 3B es una tabla que muestra un ejemplo de una lista de candidatos de bloques de fusión en la cual cada valor de un índice de fusión es asignado a un vector de

5

10

15

20

25

30

35

40

45

50

55

movimiento y un índice de imagen de referencia que han de ser usados en el modo de fusión.

En la FIG. 3A, un bloque codificado inmediatamente a la izquierda del bloque actual es referido como un bloque A vecino, un bloque codificado inmediatamente encima del bloque actual es referido como un bloque B vecino, un bloque codificado inmediatamente arriba a la derecha del bloque actual es referido como un bloque C vecino, y un bloque codificado inmediatamente abajo a la izquierda del bloque actual es referido como bloque D vecino. Además, en la FIG. 3A, el bloque A vecino ha sido codificado mediante predicción unidireccional usando una dirección 0 de predicción (la primera dirección de predicción). El bloque A vecino tiene un vector MvL0_A de movimiento de la dirección 0 de predicción para una imagen de referencia indicada por un valor RefL0_A de índice en un índice de imagen de referencia de la dirección 0 de predicción. Aquí, el vector MvL0 de movimiento es un vector de movimiento que se refiere a una imagen de referencia especificada por la lista 0 (L0) de imágenes de referencia, y MvL1 es un vector de movimiento que se refiere a una imagen de referencia especificada por la lista 1 (L1) de imágenes de referencia. El bloque B vecino ha sido codificado mediante predicción unidireccional usando una dirección 1 de predicción (la segunda dirección de predicción). El bloque B vecino tiene un vector MvL1_B de movimiento de la dirección 1 de predicción para una imagen de referencia indicada por un valor RefL1_B de índice en un índice de imagen de referencia de la dirección 1 de predicción. El bloque C vecino ha sido codificado mediante predicción intra. El bloque D vecino ha sido codificado mediante predicción unidireccional usando una dirección 0 de predicción. El bloque D vecino tiene un vector MvL0_D de movimiento de la dirección 0 de predicción para una imagen de referencia indicada por un valor RefL0_D de índice en un índice de imagen de referencia de la dirección 0 de predicción.

En la situación como se muestra en la FIG. 3A, como un vector de movimiento y un valor del índice de imagen de referencia para el bloque actual, son seleccionados un vector de movimiento y un valor del índice de imagen de referencia que ofrecen la más alta eficiencia de codificación, por ejemplo, desde (a) los vectores de movimiento y los valores de los índices de imágenes de referencia de los bloques A, B, C y D vecinos, y (b) un vector de movimiento y un valor del índice de imagen de referencia del bloque co-ubicado que son obtenidos en el modo de vector de movimiento de predicción temporal. Entonces, un índice de bloque de fusión que indica el bloque vecino seleccionado o bloque co-ubicado es añadido al flujo de bits. Por ejemplo, si el bloque A vecino es seleccionado, el bloque actual es codificado usando el vector MvL0_A de movimiento y el valor ReL0_A de índice de imagen de referencia de la dirección 0 de predicción, y solo un valor “0” del índice del bloque de fusión que indica que el bloque A vecino es usado como se muestra en la FIG. 3B es añadido en el flujo de bits, de forma que una cantidad de información de vectores de movimiento y valores de los índices de imágenes de referencia pueden ser reducidas.

Sin embargo, en el modo de fusión descrito anteriormente, si un bloque a ser candidato a bloque de fusión no tiene ningún vector de movimiento ni valor del índice de imagen de referencia porque el bloque ha sido codificado mediante predicción intra (como el bloque C vecino), el bloque no puede ser usado como un candidato a bloque de fusión. En la situación anterior, se considera también que el número de candidatos de bloques de fusión disponibles disminuye, el intervalo de selección para un vector de movimiento y un valor del índice de imagen de referencia que ofrece la más alta eficiencia de codificación es reducido, y finalmente la eficiencia de codificación disminuye.

Para dirigir el problema anterior, una realización ejemplar no limitante proporciona un método de codificación de imágenes y un método de decodificación de imágenes que son capaces de mejorar la eficiencia de codificación sin disminuir el número de candidatos de bloques de fusión disponibles en el modo de fusión.

A continuación, se describen realizaciones según la presente descripción con referencias a los dibujos. Se debería anotar que todas las realizaciones descritas a continuación son ejemplos específicos de la presente descripción. Los valores numéricos, formas, materiales, elementos constituyentes, posiciones de disposiciones y la configuración de conexión de los elementos constituyentes, pasos, el orden de los pasos, y similares descritos en las siguientes realizaciones son meros ejemplos, y no pretenden limitar la presente descripción. La presente descripción se caracteriza solo por las reivindicaciones anexas. Por tanto, entre los elementos constituyentes en las siguientes realizaciones, los elementos constituyentes que no son descritos en reivindicaciones independientes que muestran el concepto más genérico de la presente descripción son descritos como elementos que constituyen las configuraciones más deseables, aunque tales elementos constituyentes no son requeridos necesariamente para alcanzar el objeto de la presente descripción.

(Realización 1)

La FIG. 4 es un diagrama de bloques que muestra una estructura de un aparato de codificación de imágenes en movimiento usando un método de codificación de imágenes en movimiento según la Realización 1.

Como se muestra en la FIG. 4, el aparato 100 de codificación de imágenes en movimiento incluye una unidad 101 de transformación ortogonal, una unidad 102 de cuantificación, una unidad 103 de cuantificación inversa, una unidad 104 de transformación ortogonal inversa, una memoria 105 de bloque, una memoria 106 de trama, una unidad 107 de predicción intra, una unidad 108 de predicción entre, una unidad 109 de control de predicción entre, una unidad 110 de determinación de tipo de imagen, una unidad 111 de cálculo de candidatos de bloque de fusión, una memoria 112 CoIPic, una unidad 113 de codificación de longitud variable, un sustractor 114, un sumador 115, y una unidad 116 conmutadora.

5

10

15

20

25

30

35

40

45

50

55

60

La unidad 101 de transformación ortogonal transforma los datos de errores de predicción que es una diferencia entre los datos de predicción generados como se describió anteriormente y una secuencia de imágenes de entrada, de un dominio de la imagen a un dominio de la frecuencia. La unidad 102 de cuantificación cuantifica los datos de errores de predicción que han sido transformados al dominio de la frecuencia. La unidad 103 de cuantificación inversa cuantifica a la inversa los datos de errores de predicción que han sido cuantificados por la unidad 102 de cuantificación. La unidad 104 de transformación ortogonal transforma los datos de errores de predicción cuantificados inversamente desde un dominio de la frecuencia a un dominio de la imagen. El sumador 115 suma los datos de predicción a los datos de error de predicción cuantificados inversamente para generar unos datos decodificados. La memoria 105 de bloque mantiene la imagen decodificada en una forma bloque a bloque. La memoria 106 de trama mantiene la imagen decodificada en una forma imagen a imagen. La unidad 110 de determinación de tipo de imagen determina mediante qué tipo de imagen entre una imagen I, una imagen B, o una imagen P, cada imagen en la secuencia de imágenes de entrada ha de ser codificada, y genera información de tipo de imagen. La unidad 107 de predicción intra codifica un bloque actual a ser codificado mediante predicción intra, mediante el uso de la imagen decodificada almacenada en un modo bloque a bloque en la memoria 105 de bloque, para generar la imagen de predicción. La unidad 108 de predicción entre codifica el bloque actual mediante predicción entre mediante el uso de la imagen decodificada almacenada en un modo imagen a imagen en la memoria 106 de tramas y un vector de movimiento derivado en la estimación de movimiento, para generar la imagen de predicción. El sustractor 114 sustrae los datos de predicción generados mediante la unidad 206 de predicción intra o la unidad 207 de predicción entre de la secuencia de imágenes de entrada, para calcular los datos de errores de predicción.

La unidad 111 de cálculo de candidatos de bloque de fusión especifica los candidatos de bloques de fusión (los primeros bloques candidatos) del modo de fusión, mediante el uso (a) de vectores de movimiento y valores de los índices de imágenes de referencia que han sido usados para codificar los bloques vecinos e (b) información de CoIPic tal como un vector de movimiento y similares del bloque co-ubicado que es almacenado en la memoria 112 de CoIPic respecto al bloque actual. Aquí, los candidatos de bloques de fusión son candidatos de un bloque del cual al menos un vector de movimiento y al menos un valor del índice de imagen de referencia son usados directamente (copiados) para el bloque actual. Además, la unidad 111 de cálculo de candidatos de bloque de fusión genera un bloque de fusión combinado (el segundo bloque candidato) mediante el método descrito anteriormente. Se debería anotar que el bloque de fusión combinado no es un bloque que realmente tenga valores de píxeles, sino un bloque virtual que tiene vectores de movimiento y valores de los índices de imágenes de referencia. Además, la unidad 111 de cálculo de candidatos de bloque de fusión asigna cada uno de los bloques de fusión especificados con un valor correspondiente del índice de bloque de fusión (índice de bloque). Entonces, la unidad 111 de cálculo de candidatos de bloque de fusión proporciona los candidatos de bloques de fusión y los valores de los índices de bloques de fusión (en adelante, referidos también como “valores de los índices de bloques de fusión”) a la unidad 109 de control de predicción entre. Se debería anotar en la presente realización 1 que los vectores de movimiento y los valores de los índices de imágenes de referencia usados para los bloques vecinos de la imagen actual se asumen que son almacenados en la unidad 111 de cálculo de candidatos de bloque de fusión.

La unidad 109 de control de predicción entre realiza codificación de predicción entre en un modo de predicción que tiene el menor error de predicción entre (a) un modo de predicción para una imagen de predicción entre generada mediante el uso de un vector de movimiento derivado por el modo de estimación de movimiento y (b) un modo de predicción para una imagen de predicción entre generada mediante el uso de un vector de movimiento derivado en el modo de fusión. Además, la unidad 109 de control de predicción entre provee a la unidad 113 de codificación de longitud variable de (a) una bandera de fusión que indica si el modo de predicción es el modo de fusión o no, (b) un valor del índice de bloque de fusión correspondiente al bloque de fusión determinado en el modo de fusión es seleccionado como el modo de predicción, e (c) información de error de predicción. Además, la unidad 109 de control de predicción entre transfiere información de ColPic que incluye el vector de movimiento y similares para el bloque actual, a la memoria 112 de ColPic.

La unidad 113 de codificación de longitud variable realiza codificación de longitud variable en los datos de errores de predicción cuantificados, bandera de fusión, valor del índice de bloque de fusión, e información de tipo de imagen, para generar un flujo de bits.

La FIG. 5 es un diagrama de flujo de un compendio de un flujo de procesamiento del método de codificación de imágenes en movimiento según la presente realización.

La unidad 111 de cálculo de candidatos de bloque de fusión especifica los candidatos de bloques de fusión de bloques de vecinos y un bloque co-ubicado de un bloque actual a ser codificado (Paso S11). Por ejemplo, en la situación mostrada en la FIG. 3A, la unidad 111 de cálculo de candidatos de bloque de fusión especifica los bloques A, B, C, D vecinos y un bloque de fusión co-ubicado, como candidatos de bloques de fusión. Aquí, el bloque de fusión co-ubicado incluye al menos un vector de movimiento y similares que son calculados en el modo de predicción temporal de al menos un vector de movimiento del bloque co-ubicado. Entonces, la unidad 111 de cálculo de candidatos de bloque de fusión asigna a cada uno de los candidatos de bloques de fusión un valor correspondiente del índice de bloque de fusión como se muestra en la FIG. 3B. En general, cuando un valor del índice de bloque de fusión es más pequeño, la cantidad de información necesaria disminuye. Por otro lado, cuando un valor del índice de bloque de fusión es más grande, la cantidad de información necesaria aumenta. Por lo tanto,

5

10

15

20

25

30

35

40

45

50

55

60

si un valor del índice de bloque de fusión correspondiente a un candidato de bloque de fusión que tiene una alta posibilidad de tener un vector de movimiento más preciso y un valor del índice de imagen de referencia más precisa disminuye, la eficiencia de codificación aumenta. Por ejemplo, se puede considerar contar cuántas veces cada candidato de bloque de fusión ha sido seleccionado como un bloque de fusión, y se asigna un valor más pequeño del índice de bloque de fusión a un bloque que tiene la mayor cuenta. Aquí, si un candidato de bloque de fusión objetivo no mantiene información tal como un vector de movimiento, por ejemplo, si el candidato de bloque de fusión es un bloque codificado mediante predicción intra, o si el candidato de bloque de fusión está ubicado fuera de un borde de imagen o un borde de porción, se asume que tal bloque no puede ser usado como un candidato de bloque de fusión. En la presente realización, si un bloque no puede ser usado como un candidato de bloque de fusión, el bloque es referido como un bloque no disponible, y si un bloque puede ser usado como un candidato de bloque de fusión, el bloque es referido como un bloque disponible. En la situación mostrada en la FIG. 3A, dado que el bloque C vecino es un bloque codificado mediante predicción intra, el bloque C vecino es considerado como no disponible como un bloque no disponible como un candidato de bloque de fusión.

Mediante el uso de candidatos de bloques de fusión especificados en el S11, la unidad 111 de cálculo de candidatos de bloque de fusión genera un bloque de fusión combinado mediante el método que se describirá más adelante, para actualizar la lista de candidatos de bloques de fusión (Paso S12). Por ejemplo, la lista de candidatos de bloques de fusión mostrada en la FIG. 6 es generada de la lista de candidatos de bloques de fusión mostrada en la FIG. 3B. En la lista de candidatos de bloques de fusión en la FIG. 3B, el bloque de fusión combinado generado mediante el método que se describirá más adelante es usado en vez de un candidato no disponible que tiene un valor “3” de índice de bloque de fusión. Mediante el uso de tal bloque de fusión combinado recién generado en vez del candidato no disponible, es posible mejorar la eficiencia de codificación sin cambiar un valor máximo del número de candidatos de bloques de fusión.

A continuación, la unidad 109 de control de predicción entre compara (a) el error de predicción de la imagen de predicción entre generada mediante el uso del vector de movimiento derivado por la estimación de movimiento con (b) el error de predicción de la imagen de predicción generada por el candidato de bloque de fusión mediante el método que se describirá más adelante, para determinar un modo de predicción para codificar el bloque actual. Aquí, si se determina que el modo de predicción es el modo de fusión, entonces la unidad 109 de control de predicción entre determina un valor del índice de bloque de fusión que indica qué candidato de bloque de fusión usar. Entonces, si el modo de predicción es el modo de fusión, la unidad 109 de control de predicción entre establece la bandera de fusión a 1, sino, establece la bandera de fusión a 0 (Paso S13). La unidad 109 de control de predicción entre determina si la bandera es 1 o no, en otras palabras, si el modo de predicción es el modo de fusión o no (Paso S14). Como resultado, si el modo de predicción es el modo de fusión (Sí en el Paso S14), entonces la unidad 109 de control de predicción entre provee a la unidad 113 de codificación de longitud variable de la bandera de fusión y el valor del índice de bloque de fusión a ser usado para la fusión, para añadir la bandera de fusión y el valor del índice en el flujo de bits (Paso S15). Por otro lado, si el modo de predicción no es el modo de fusión (No en el Paso S14), entonces la unidad 109 de control de predicción entre provee a la unidad 113 de codificación de longitud variable de la bandera de fusión e información del modo de vector de estimación de movimiento, para añadir la bandera de fusión y la información al flujo de bits (Paso S16).

Se debería anotar en la presente realización que, como se muestra en la FIG. 3B, respecto a los valores de los índices de bloques de fusión, un valor correspondiente con el bloque A vecino es “0”, un valor correspondiente con el bloque B vecino es “1”, y un valor correspondiente con el bloque de fusión co-ubicado es “2”, un valor correspondiente con el bloque C vecino es “3”, y un valor correspondiente con el bloque D vecino es “4”. Sin embargo, la forma de asignar valores de índice de bloque de fusión no está limitada solo a este ejemplo. Por ejemplo, también es posible que el valor más grande se asigne a un candidato no disponible como un candidato de bloque de fusión. También debería anotarse que los candidatos de bloques de fusión no están limitados a los bloques A, B, C y D vecinos. Por ejemplo, un bloque vecino o similar que está ubicado encima del bloque D inmediatamente abajo a la izquierda puede ser seleccionado como un candidato de bloque de fusión. Debería también anotarse que no es necesario usar todos los bloques vecinos, sino que solo los bloques A y B vecinos pueden ser usados como candidatos de bloques de fusión. También debería anotarse que no es necesario usar siempre el bloque de fusión co-ubicado.

También debería anotarse que se ha descrito en la presente realización en el S15 en la FIG. 5 que la unidad 109 de control de predicción entre proporciona un valor del índice de bloque de fusión a la unidad 113 de codificación de longitud variable para añadir el valor del índice de bloque de fusión en el flujo de bits, pero también es posible no añadir el valor del índice del bloque de fusión si el número de candidatos de bloques de fusión es 1. De este modo, es posible reducir una cantidad de información del índice de bloque de fusión.

También debería anotarse que se ha descrito en la presente realización en el S12 en la FIG. 5 que un bloque de fusión combinado es usado en vez de un candidato no disponible que tiene un valor “3” del índice de bloque de fusión. Sin embargo, la presente descripción no está limitada a lo anterior y el bloque de fusión combinado puede ser además añadido en la lista de candidatos de bloques de fusión. De este modo, es posible aumentar el intervalo de selección de los candidatos de bloques de fusión. Aquí, también es posible que el candidato no disponible sea tratado como un candidato que tiene el vector 0 de movimiento y el índice 0 de imagen de referencia.

5

10

15

20

25

30

35

40

45

50

55

60

La FIG. 7 muestra un ejemplo de una tabla de codificación que es usada para realizar codificación de longitud variable en valores de los índices de bloques de fusión.

En el ejemplo mostrado en la FIG. 7, un código que tiene una longitud de código más corta es asignado a un valor más pequeño del índice de bloque de fusión. Por lo tanto, si un valor del índice de bloque de fusión correspondiente a un candidato de bloque de fusión que tiene la posibilidad de una precisión de predicción alta es disminuido, es posible mejorar la eficiencia de codificación.

Se debería anotar que se ha descrito en la presente realización que la codificación de longitud variable es realizada en valores de los índices de bloques de fusión como se muestra en la FIG. 7, pero los valores de los índices de bloques de fusión pueden ser codificados con una longitud de código fija. De este modo, es posible reducir una carga en el proceso de codificación o decodificación.

La FIG. 8 es un diagrama de flujo de un flujo detallado del S12 en la FIG. 5. Lo siguiente describe el método para generar un bloque de fusión combinado desde los candidatos de bloques de fusión especificados en el S11 con referencia a la FIG. 8.

La unidad 111 de cálculo de candidatos de bloques de fusión inicializa un valor 1 (idx1) del índice a “0” (Paso S21). Entonces, la unidad 111 de cálculo de candidatos de bloques de fusión inicializa un valor 2 (idx2) del índice a “0” (Paso S22). La unidad 111 de cálculo de candidatos de bloques de fusión determina si el idx1 y el idx2 tienen diferentes valores o no y la lista de candidatos de bloques de fusión incluye cualquier candidato no disponible (Paso S23). Como resultado, si hay un candidato no disponible (Sí en el Paso S23), entonces la unidad 111 de cálculo de candidatos de bloques de fusión determina si el candidato [idx1] asignado con el valor idx1 del índice de bloque de fusión está disponible y el candidato [idx2] asignado con el valor idx2 del índice de bloque de fusión está disponible o no (Paso S24). Como resultado, si el candidato [idx1] de bloque de fusión está disponible y el candidato [idx2] de bloque de fusión también está disponible (Sí en el Paso S24), entonces la unidad 111 de cálculo de candidatos de bloques de fusión determina si el candidato [idx1] de bloque de fusión y el candidato [idx2] de bloque de fusión han sido predichos en diferentes direcciones de predicción, o si tanto el candidato [idx1] de bloque de fusión como el candidato [idx2] de bloque de fusión han sido codificados mediante predicción bidireccional (Paso S25). Como resultado, si el candidato [idx1] de bloque de fusión y el candidato [idx2] de bloque de fusión han sido predichos en diferentes direcciones de predicción, o tanto el candidato [idx1] de bloque de fusión como el candidato [idx2] de bloque de fusión han sido codificados mediante predicción bidireccional (Sí en el Paso S25), entonces la unidad 111 de cálculo de candidatos de bloques de fusión determina si el candidato [idx1] de bloque de fusión ha sido predicho en la dirección 0 de predicción (la primera dirección de predicción) o codificado mediante predicción bidireccional, y el candidato [idx2] de bloque de fusión ha sido predicho en la dirección 1 de predicción (la segunda dirección de predicción) o codificado mediante predicción bidireccional (Paso S26). Como resultado, si el candidato [idx1] de bloque de fusión ha sido predicho en la dirección 0 de predicción o codificado mediante predicción bidireccional, y el candidato [idx2] de bloque de fusión ha sido predicho en la dirección 1 de predicción o codificado mediante predicción bidireccional (Sí en el Paso S26), en otras palabras, si el candidato [idx1] de bloque de fusión tiene al menos un vector de movimiento de la dirección 0 de predicción y el candidato [idx2] de bloque de fusión tiene el menos un vector de movimiento de la dirección 1 de predicción, entonces la unidad 111 de cálculo de candidatos de bloques de fusión selecciona el vector de movimiento y el valor del índice de imagen de referencia de la dirección 0 de predicción del candidato [idx1] de bloque de fusión para la dirección 0 de predicción del bloque de fusión combinado (Paso S27). Además, la unidad 111 de cálculo de candidatos de bloques de fusión selecciona el vector de movimiento y el valor del índice de imagen de referencia de la dirección 1 de predicción del candidato [idx2] de bloque de fusión para la dirección 1 de predicción del bloque de fusión combinado, para generar el bloque de fusión combinado de predicción bidireccional (Paso S28). Por otro lado, si no se determina que el candidato [idx1] de bloque de fusión ha sido predicho en la dirección 0 de predicción o codificado mediante la predicción bidireccional, y el candidato [idx2] de bloque de fusión ha sido predicho en la dirección 1 de predicción o codificado mediante la predicción bidireccional (No en el Paso S26), entonces la unidad 111 de cálculo de candidatos de bloques de fusión selecciona el vector de movimiento y el valor del índice de imagen de referencia de la dirección 0 de predicción del candidato [idx2] de bloque de fusión para la dirección 0 de predicción del bloque de fusión combinado (Paso S29). Además, si la unidad 111 de cálculo de candidatos de bloques de fusión selecciona el vector de movimiento y el valor del índice de imagen de referencia de la dirección 1 de predicción del candidato [idx1] de bloque de fusión para la dirección 1 de predicción del bloque de fusión combinado, para generar el bloque de fusión combinado de predicción bidireccional (Paso S30). La unidad 111 de cálculo de candidatos de bloques de fusión añade el bloque de fusión combinado generado en la lista de bloques de fusión como un candidato disponible, en vez del candidato no disponible (Paso S31). A continuación, la unidad 111 de cálculo de candidatos de bloques de fusión añade un valor “1” al valor idx2 (Paso S32), y determina si el valor idx2 es igual o mayor que el valor máximo del número de candidatos de bloques de fusión (Paso S33). Como resultado, si el valor idx2 no es igual o mayor que el valor máximo del número de candidatos de bloques de fusión (No en el Paso S33), el procesamiento vuelve al Paso S23, entonces la unidad 111 de cálculo de candidatos de bloques de fusión determina otra vez si queda algún candidato o no, y genera un próximo bloque de fusión combinado (Pasos S23 a S32). Por otro lado, si el valor idx2 es igual o mayor que un valor máximo del número de candidatos de bloques de fusión (Sí en el Paso S33), entonces la unidad 111 de cálculo de candidatos de bloques de fusión añade un valor “1” al idx1 (Paso S34) y determina si el idx1 es igual o mayor que el valor máximo del número de candidatos de bloques de fusión (Paso S35). Como resultado, si el idx1 es igual o mayor que el valor máximo del número de candidatos de bloques de fusión (Sí en el Paso S35), en

5

10

15

20

25

30

35

40

45

50

55

otras palabras, si todas las combinaciones de candidatos de bloques de fusión han sido examinadas, el procesamiento se completa.

Debería anotarse que se ha descrito en la presente realización que el procesamiento se completa cuando todas las combinaciones de candidatos de bloques de fusión han sido examinadas, pero la presente descripción no está limitada por lo anterior. Por ejemplo, es posible completar el procesamiento cuando no hay más candidatos disponibles en la lista de candidatos de bloques de fusión. Como resultado, una cantidad de procesamiento puede ser reducida.

También debería anotarse que se ha descrito en la presente realización que los pasos en el método para generar un bloque de fusión combinado desde candidatos de bloques de fusión son realizados en el orden mostrado en el diagrama de flujo de la FIG. 8, pero la presente descripción no está limitada por lo anterior y el orden de los pasos puede cambiarse.

También debería anotarse que se ha descrito en la presente realización que, por ejemplo, cuando un vector de movimiento y un valor del índice de imagen de referencia de la dirección de predicción respecto a un bloque vecino es seleccionada para la dirección 0 de predicción del bloque de fusión combinado, si hay una pluralidad de candidatos de bloque de fusión que tienen un vector de movimiento y un valor del índice de imagen de referencia de la dirección 0 de predicción, se selección el vector de movimiento y el valor del índice de imagen de referencia de la dirección 0 de predicción con respecto al candidato de bloque de fusión que tiene el valor del índice de bloque de fusión más cercano a “0”. Sin embargo, la presente descripción no está limitada por lo anterior. Por ejemplo, también es posible seleccionar un vector de movimiento y un valor del índice de imagen de referencia de la dirección 0 de predicción con referencia a un candidato de bloque de fusión que tenga un valor del índice de bloque de fusión más cercano a un valor máximo.

También debería anotarse que se ha descrito en la presente realización en el S31 en al FIG. 8 que el bloque de fusión combinado generado es añadido a la lista de candidatos de bloques de fusión como un candidato disponible en vez de un candidato no disponible, peo la presente descripción no está limitada por lo anterior. Por ejemplo, es también posible que se determine si cualquier otro candidato de bloque de fusión que mantiene el mismo vector de movimiento y el mismo valor del índice de imagen de referencia que los bloques de fusión combinados ha sido ya incluido en la lista de candidatos de bloques de fusión, y si no hay tal candidato en la lista, el bloque de fusión combinado es añadido a la lista de candidatos de bloques de fusión como un candidato disponible en vez de un candidato no disponible. De este modo, evitando que el mismo candidato de bloque de fusión sea añadido otra vez, es posible añadir candidatos de bloques de fusión efectivos. Como resultado, la eficiencia de codificación puede ser mejorada.

También debería anotarse que se ha descrito en la presente realización que el bloque de fusión combinado generado es añadido a la lista de candidatos de bloques de fusión cuando hay un candidato no disponible en la lista de candidatos de bloques de fusión, pero la presente descripción no está limitada por lo anterior. Por ejemplo, es también posible en el S23 en la FIG. 8 que la determinación de si hay o no un candidato no disponible en la lista de candidatos de bloques de fusión no se tome, pero el bloque de fusión combinado se calcule y se añada a la lista de candidatos de bloques de fusión. De este modo, es posible aumentar el intervalo de selección de los candidatos de bloques de fusión. Como resultado, la eficiencia de codificación puede ser mejorada.

La FIG. 9 es un diagrama de flujo de un flujo detallado del S13 en la FIG. 5. Lo que sigue se describe con referencia a la FIG.9.

La unidad 109 de control de predicción entre establece un valor del índice de candidato de bloque de fusión a “0”, el error de predicción mínimo a un error de predicción (coste) del modo de estimación de vector de movimiento, y la bandera de fusión a “0” (Paso S41). Aquí, el coste se calcula mediante, por ejemplo, la siguiente Ecuación 1 del modelo de optimización R-D.

[Mat. 1]

Coste = D + A x R (Ecuación 1)

En la Ecuación 1, D representa una distorsión de codificación que es, por ejemplo, una suma de valores absolutos de diferencia de (a) un valor de pixel obtenido mediante la codificación y decodificación de un bloque actual mediante el uso de una imagen de predicción generada por un cierto vector de movimiento y (b) un valor de pixel original del bloque actual. Además, R representa una cantidad de codificación que es, por ejemplo, una cantidad de codificación requerida para codificar el vector de movimiento usado en la generación de la imagen de predicción. A representa un método de Lagrange de multiplicadores indeterminados.

Entonces, la unidad 109 de control de predicción entre determina si un valor del índice del candidato de fusión es menor o no que el número de candidatos de bloques de fusión del bloque actual, en otras palabras, si hay o no cualquier bloque que tenga la posibilidad de ser un candidato de bloque de fusión (Paso S42). Como resultado, si se determina que el valor del índice del candidato de bloque de fusión es menor que el número de candidatos de bloques de fusión (Sí en el Paso S42), entonces la unidad 109 de control de predicción entre calcula un coste del candidato de bloque de fusión asignado con el valor del índice del candidato de bloque de fusión (Paso S43). A

5

10

15

20

25

30

35

40

45

50

55

continuación, la unidad 109 de control de predicción entre determina si el coste calculado del candidato de bloque de fusión es menor que el error de predicción mínimo (Paso S44). Como resultado, si el coste calculado del candidato de bloque de fusión es menor que el error de predicción mínimo (Sí en el Paso S44), entonces la unidad 109 de control de predicción entre actualiza el error de predicción mínimo, el valor del índice del bloque de fusión, y el valor de la bandera de fusión (Paso S45). A continuación, la unidad 109 de control de predicción entre añade un valor “1” al valor del índice del candidato de bloque de fusión (Paso S46), y el procesamiento se repite desde el S42 al S46. Si el coste calculado del candidato de bloque de fusión no es menor que el error de predicción mínimo (No en el Paso S44), entonces el proceso de actualización en el S45 no se realiza, sino que el Paso 46 se realiza, y el procesamiento se repite desde el S42 al S46. Aquí, en el Paso S42, si el valor del índice del candidato de bloque de fusión no es menor que el número de candidatos de bloques de fusión (No en el Paso S42), en otras palabras, si no hay un candidato de bloque de fusión, entonces la unidad 109 de control de predicción entre finalmente determina la bandera de fusión dejada finalmente y el valor del índice de bloque de fusión (Paso S47).

Según la presente realización de la presente descripción, un nuevo candidato de bloque de fusión de predicción bidireccional se calcula desde los candidatos de bloques de fusión, para mejorar la eficiencia de codificación. Más específicamente, basado en los candidatos de bloques de fusión calculados desde bloques vecinos y el bloque coubicado, (a) un vector de movimiento y un valor del índice de imagen de referencia de la dirección 0 de predicción y (b) un vector de movimiento y un valor del índice de imagen de referencia de la dirección 1 de predicción son combinados para generar un bloque de fusión combinado de predicción bidireccional, y entonces añadido a la lista de candidatos de bloques de fusión. Como resultado, la eficiencia de codificación puede ser mejorada. Además, si hay un candidato no disponible en la lista de candidatos de bloques de fusión, un bloque de fusión combinado es generado y el candidato no disponible es reemplazado por el bloque de fusión combinado. De este modo, la eficiencia de codificación puede ser mejorada sin incrementar un valor máximo del número de candidatos de bloques de fusión.

Se debería anotar que ha sido descrito en la presente realización que la bandera de fusión es siempre añadida al flujo de bits en el modo de fusión, pero la presente descripción no está limitada por lo anterior. Por ejemplo, también es posible que sea forzada a seleccionar el modo de fusión según a una forma o similar del bloque actual. En este caso, es posible que una cantidad de información sea reducida mediante la no adición de la bandera de fusión al flujo de bits.

Se debería anotar que ha sido descrito en la presente realización que, en el modo de fusión, al menos un vector de movimiento y al menos un valor del índice de imagen de referencia son copiados desde un bloque vecino del bloque actual y entonces usados para codificar el bloque actual, pero la presente descripción no está limitada por lo anterior. Por ejemplo, lo siguiente es también posible. En la misma forma que el modo de fusión, mediante el uso de candidatos de bloques de fusión generados como se muestra en la FIG. 6, al menos un vector de movimiento y al menos un valor del índice de imagen de referencia son copiados desde un bloque vecino del bloque actual y entonces usados para codificar el bloque actual. Como resultado, si cada dato de error de predicción del bloque actual es 0, una bandera de omisión es establecida a 1 y añadida al flujo de bits. Por otro lado, si cada dato de error de predicción no es 0, la bandera de omisión es establecida a 0 y la bandera de omisión y el dato de error de predicción son añadidos al flujo de bits (modo de omisión de fusión).

También debería anotarse que ha sido descrito en la presente realización que, en el modo de fusión, al menos un vector de movimiento y al menos un valor del índice de imagen de referencia son copiados desde un bloque vecino del bloque actual y entonces usados para codificar el bloque actual, pero la presente descripción no está limitada por lo anterior. Por ejemplo, también es posible que un vector de movimiento en el modo de estimación de vector de movimiento sea codificado mediante el uso de la lista de candidatos de bloques de fusión como se muestra en la FIG. 6. Más específicamente, es posible que un vector de movimiento de un candidato de bloque de fusión designado por el valor del índice de bloque de fusión sea sustraído del vector de movimiento del modo de estimación de vector de movimiento, para obtener una diferencia, y que la diferencia y el valor del índice de candidato de bloque de fusión sean añadidos al flujo de bits. Además, lo siguiente también es posible. Mediante el uso del valor RefIdx_ME de índice de imagen de referencia del modo de estimación de movimiento y un valor RefIdx_Fusión de índice de imagen de referencia del modo de fusión, se realiza un escalado en un vector MV_Fusión de movimiento del candidato de bloque de fusión. Entonces, un vector escaladoMV_Fusión de movimiento del candidato de bloque de fusión escalado es sustraído de los vectores de movimiento en el modo de estimación de movimiento para obtener una diferencia. La diferencia y el valor del índice del candidato de bloque de fusión son añadidos al flujo de bits. Este escalado puede ser realizado mediante el uso de la Ecuación 2 siguiente:

escaladoMV_Fusión = MV_Fusiónx(POC(RefIdx_ME) - curPOC )/(POC(RefIdx_Fusión) - curPOC) (Ecuación 2)

Aquí, POC(RefIdx_ME) representa una ubicación en un orden de visualización de una imagen de referencia indicada por un valor RefIdx_ME de índice de imagen de referencia, POC(RefIdx_Fusión) representa una ubicación en el orden de visualización de una imagen de referencia indicada por el valor RefIdx_Fusión, y curPOC representa una ubicación en el orden de visualización de una imagen a ser codificada.

5

10

15

20

25

30

35

40

45

50

55

(Realización 2)

La FIG. 10 es un diagrama de bloques que muestra una estructura de un aparato de decodificación de imágenes en movimiento que usa un método de decodificación de imágenes en movimiento según la Realización 2 de la presente descripción.

Como se muestra en la FIG. 10, el aparato 200 de decodificación de imágenes en movimiento incluye una unidad 201 de decodificación de longitud variable, una unidad 202 de cuantificación inversa, una unidad 203 de transformación ortogonal inversa, una memoria 204 de bloques, una memoria 205 de tramas, una unidad 206 de predicción intra, una unidad 207 de predicción entre, una unidad 208 de control de predicción entre, una unidad 209 de cálculo de candidatos de bloques de fusión, una memoria 210 de colPic, un sumador 211, y un conmutador 212.

La unidad 201 de decodificación de longitud variable realiza decodificación de longitud variable en un flujo de bits de entrada para obtener la información del tipo de imagen, la bandera de fusión, y el índice del bloque de fusión, y un flujo de bits decodificado de longitud variable. La unidad 202 de cuantificación inversa cuantifica inversamente el flujo de bits decodificado de longitud variable. La unidad 203 de transformación ortogonal inversa transforma el flujo de bits cuantificado inversamente desde un dominio de la frecuencia a un dominio de la imagen, para generar datos de imagen de error de predicción. La memoria 204 de bloques mantiene una secuencia de imágenes generada mediante la adicción de los datos de imagen de error de predicción a la imagen de predicción en una forma bloque a bloque. La memoria 205 de tramas mantiene una secuencia de imágenes en una forma imagen a imagen. La unidad 206 de predicción intra realiza predicción intra en la secuencia de imágenes almacenada en la memoria 204 de bloques en una forma bloque a bloque, para generar datos de imagen de predicción de un bloque actual a ser decodificado. La unidad 207 de predicción entre realiza predicción entre en la secuencia de imágenes almacenada en la memoria de tramas en una forma imagen a imagen, para generar datos de imagen de predicción del bloque actual a ser decodificado.

La unidad 209 de cálculo de candidatos de bloques de fusión deriva candidatos de bloques de fusión del modo de fusión, mediante el uso de información de colPic tal como vectores de movimiento de bloques vecinos y un bloque co-ubicado almacenado en la memoria 210 de colPic respecto al bloque actual. Además, la unidad 209 de cálculo de candidatos de bloques de fusión asigna cada bloque de fusión derivado con un valor correspondiente del índice de bloque de fusión. Entonces, la unidad 209 de cálculo de candidatos de bloques de fusión proporciona los candidatos de bloques de fusión y los valores del índice de bloque de fusión a la unidad 208 de control de predicción entre.

Si la bandera de fusión decodificada mediante la unidad 210 de decodificación de longitud variable es “0”, en otras palabras, si el modo de predicción no es el modo de fusión, la unidad 208 de control de predicción entre genera imagen de predicción entre usando la información decodificada del modo de estimación de movimiento. Además, si la bandera de fusión es “1”, en otras palabras, si el modo de predicción es el modo de fusión, entonces la unidad 208 de control de predicción entre determina un vector de movimiento y un valor del índice de imagen de referencia a ser usados en la predicción entre desde la pluralidad de candidatos de bloques de fusión, basado en el valor del índice del bloque de fusión decodificado, para generar imagen de predicción entre. Además, la unidad 208 de control de predicción entre provee a la memoria 210 de colPic de información de colPic que incluye el vector de movimiento y similares del bloque actual.

El sumador 211 añade los datos de predicción generados por la unidad 206 de predicción intra o la unidad 207 de predicción entre a los datos de error de predicción desde la unidad 203 de transformación ortogonal inversa, para generar una secuencia de imágenes decodificadas.

La FIG. 11 es un diagrama de flujo de un compendio de un flujo de procesamiento de un método de decodificación de imágenes en movimiento según la presente realización.

La unidad 201 de decodificación de longitud variable decodifica una bandera de fusión desde un flujo de bits (Paso S51). La unidad 208 de control de predicción entre determina si la bandera de fusión es “1” o no (Paso S52). Como resultado, si la bandera de fusión es “1” (Sí en el Paso S52), entonces la unidad 209 de cálculo de candidatos de bloques de fusión especifica candidatos de bloques de fusión desde los bloques vecinos y un bloque co-ubicado de un bloque actual a ser decodificado (Paso S53). En el mismo método al mostrado en la FIG. 8, la unidad 209 de cálculo de candidatos de bloques de fusión genera un bloque de fusión combinado, y actualiza la lista de candidatos de bloques de fusión (Paso S54). De este modo, como en el procesamiento de codificación, por ejemplo, la lista de candidatos de bloques de fusión mostrada en la FIG. 6 es generada desde la lista de candidatos de bloques de fusión mostrada en la FIG. 3B. La unidad 208 de control de predicción entre determina un bloque de fusión desde el cual al menos un vector de movimiento y al menos un valor del índice de imagen de referencia son copiados, según el valor del índice de bloque de fusión decodificado por la unidad 201 de decodificación de longitud variable, y genera imagen de predicción entre usando el bloque de fusión determinado (Paso S55). Por otro lado, en el Paso S52, si la bandera de fusión es “0”, entonces la unidad 208 de control de predicción entre genera imagen de predicción entre usando la información del modo de estimación de vector de movimiento que es decodificado por la unidad 201 de decodificación de longitud variable (Paso S56). Se debería anotar que, si el número de candidatos de bloques de fusión especificado o generado en el S53 y S54 es uno, es posible no decodificar un valor del índice de bloque de fusión sino estimar el valor del índice de bloque de fusión como 0.

5

10

15

20

25

30

35

40

45

50

55

Según la realización presente de la presente descripción, un nuevo bloque de fusión de predicción bidireccional es calculado desde los candidatos de bloques de fusión, para decodificar apropiadamente un flujo de bits con eficiencia de codificación mejorada.

Más específicamente, basado en los candidatos de bloques de fusión calculados por los bloques vecinos y el bloque co-ubicado, (a) un vector de movimiento y un valor del índice de imagen de referencia de la dirección 0 de predicción y (b) un vector de movimiento y un valor del índice de imagen de referencia de la dirección 1 de predicción son combinados para generar un bloque de fusión combinado de predicción bidireccional, y añadido a la lista de candidatos de bloques de fusión. Como resultado, es posible decodificar apropiadamente el flujo de bits con eficiencia de codificación mejorada. Además, si hay un candidato no disponible en la lista de candidatos de bloques de fusión, un bloque de fusión combinado es calculado y el candidato no disponible es reemplazado por el bloque de fusión combinado. De este modo, es posible decodificar apropiadamente el flujo de bits con eficiencia de codificación mejorada, sin aumentar un valor máximo del número de candidatos de bloques de fusión.

(Realización 3)

El procesamiento descrito en cada una de las Realizaciones puede ser implementado simplemente en un sistema informático independiente, mediante la grabación, en un medio de grabación, de un programa para implementar las configuraciones del método de codificación de imágenes en movimiento (método de codificación de imágenes) y el método de decodificación de imágenes en movimiento (método de decodificación de imágenes) descritos en cada una de las Realizaciones. El medio de grabación puede ser cualquier medio de grabación siempre y cuando el programa pueda ser grabado, tal como un disco magnético, un disco óptico, un disco óptico magnético, una tarjeta IC, y una memoria de semiconductores.

En adelante, se describirán las aplicaciones al método de codificación de imágenes en movimiento (método de codificación de imágenes) y el método de decodificación de imágenes en movimiento (método de decodificación de imágenes) descritos en cada una de las Realizaciones y sistemas que usan los mismos. El sistema tiene una característica de tener un aparato de codificación y decodificación de imágenes que incluye un aparato de codificación de imágenes que usa el método de codificación de imágenes y un aparato de decodificación de imágenes que usa el método de decodificación de imágenes. Se pueden cambiar otras configuraciones en el sistema según sea apropiado dependiendo del caso.

La FIG. 12 ilustra una configuración general de un sistema ex100 que proporciona contendido para implementar servicios de distribución de contenidos. El área para proporcionar servicios de comunicación está dividida en celdas del tamaño deseado, y las estaciones base ex106, ex107, ex108, ex109, y ex110 que son estaciones inalámbricas fijas son emplazadas en cada celda.

El sistema ex100 que proporciona contenido está conectado a dispositivos, tales como un ordenador ex111, un asistente digital personal (PDA) ex112, una cámara ex113, un teléfono móvil ex114 y una consola de videojuegos ex115, a través de Internet ex101, un proveedor ex102 de servicios de Internet, una red ex104 telefónica, así como las estaciones base ex106 a ex110 respectivamente.

Sin embargo, la configuración del sistema ex100 que proporciona contenido no está limitada a la configuración mostrada en la FIG. 12, y una combinación en la cual cualquiera de los elementos esté conectados es aceptable. Además, cada dispositivo puede estar directamente conectado con la red ex104 telefónica, más que a través de las estaciones base ex106 a ex110, que son las estaciones inalámbricas fijas. Además, los dispositivos pueden estar interconectados entre ellos a través de una comunicación inalámbrica de corta distancia y otros.

La cámara ex113, tal como una video cámara digital, es capaz de capturar video. Una cámara ex116, tal como una video cámara digital, es capaz de capturar tanto imágenes fijas como video. Además, el teléfono móvil ex114 puede ser el que cumpla cualquiera de los estándares como Sistema Global para comunicaciones Móviles (GSM), Acceso Múltiple por División de Código (CDMA), Acceso Múltiple por División de Código de Banda Ancha (W-CDMA), Evolución a Largo Plazo (LTE) y Acceso de Paquetes de Alta Velocidad (HSPA). Alternativamente, el teléfono móvil ex114 puede ser un Sistema de Teléfono Útil Personal (PHS).

En el sistema ex100 que proporciona contenido, un servidor ex103 de flujo de transmisión está conectado a la cámara ex113 y otros a través de la red ex104 telefónica y la estación base ex109, que permiten la distribución de imágenes en un espectáculo en vivo y otros. En tal distribución, un contenido (por ejemplo, video de un espectáculo de música en vivo) capturado por el usuario usando la cámara ex113 es codificado como se describió anteriormente en cada una de las Realizaciones (esto es, las funciones de la cámara como el aparato de codificación de imágenes de la presente invención), y el contenido codificado es transmitido al servidor ex103 de flujo de transmisión. Por otro lado, el servidor ex103 de flujo de transmisión lleva a cabo distribución de flujos de los datos contenidos transmitidos a los clientes a su solicitud. Los clientes incluyen el ordenador ex111, el pDa ex112, la cámara ex113, el teléfono móvil ex114, y la consola de videojuegos ex115 que son capaces de decodificar los datos codificados mencionados anteriormente. Cada uno de los dispositivos que ha recibido los datos distribuidos decodifica y reproduce los datos codificados (esto es, los dispositivos funcionan como el aparato de decodificación de imágenes de la presente invención).

5

10

15

20

25

30

35

40

45

50

55

60

Los datos capturados pueden ser codificados por la cámara ex113 o el servidor ex103 de flujo de transmisión que transmite los datos, o los procesos de codificación pueden compartirse entre la cámara ex113 y el servidor ex103 de flujo de transmisión. Similarmente, los datos distribuidos pueden ser decodificados por los clientes o el servidor ex103 de flujo de transmisión, o los procesos de decodificación pueden compartirse entre los clientes y el servidor ex103 de flujo de transmisión. Además, los datos de las imágenes fijas y el video capturado por no solo la cámara ex113 sino también por la cámara ex116 pueden ser transmitidos al servidor ex103 de flujo de transmisión a través del ordenador ex111. Los procesos de codificación pueden realizarse mediante la cámara ex116, el ordenador ex111, o el servidor ex103 de flujo de transmisión, o compartidos entre ellos.

Además, los procesos de codificación y decodificación pueden ser realizados por un LSI ex500 generalmente incluido en cada ordenador ex111 y los dispositivos. El lSi ex500 puede estar configurado de un único chip o una pluralidad de chips. El software para codificar y decodificar el video puede estar integrado en algún tipo de medio de grabación (tal como un CD-ROM, un disco flexible, y un disco duro) que es legible por el ordenador ex111 y otros, y los procesos de codificación y decodificación pueden ser realizados usando el software. Además, cuando el teléfono móvil ex114 está equipado con una cámara, los datos de imágenes obtenidas por la cámara pueden ser transmitidos. Los datos de video son datos codificados por el LSI ex500 incluido en el teléfono móvil ex114.

Además, el servidor ex103 de flujo de transmisión puede estar compuesto de servidores y ordenadores, y puede descentralizar datos y procesar los datos descentralizados, grabar, o distribuir datos.

Como se describió anteriormente, los clientes pueden recibir y reproducir los datos codificados en el sistema ex100 que proporciona contenido. En otras palabras, los clientes pueden recibir y decodificar información transmitida por el usuario, y reproducir y decodificar datos en tiempo real en el sistema ex100 que proporciona contenido, de forma que el usuario que no tienen ningún derecho y un equipo particular puede implementar difusión personal.

Aparte del ejemplo del sistema ex100 que proporciona contenido, el menos un aparato de codificación de imágenes en movimiento (aparato de codificación de imágenes) y el aparato de decodificación de imágenes en movimiento (aparato de decodificación de imágenes) descritos en cada una de las Realizaciones puede ser implementado en un sistema ex200 de difusión digital ilustrado en la FIG. 13. Más específicamente, una estación ex201 de difusión se comunica o transmite, a través de ondas de radio a un satélite ex202 de difusión, datos multiplexados obtenidos mediante la multiplexación de datos de audio y otros en datos de video. Los datos de video son datos codificados por el método de codificación de imágenes en movimiento descrito en cada una de las Realizaciones (esto es, datos codificados por el aparato de codificación de imágenes de la presente invención). Tras recibir los datos multiplexados, el satélite ex202 de difusión transmite ondas de radio para difusión. Entonces, una antena ex204 de uso doméstico con una función de recepción de difusión de satélite recibe las ondas de radio. A continuación, un dispositivo como un televisor (receptor) ex300 y un decodificador de televisión (STB) ex217 decodifican los datos multiplexados recibidos, y reproducen los datos decodificados (esto es, el dispositivo funciona como el aparato de codificación de imágenes de la presente invención).

Además, un lector/grabador ex218 (i) lee y decodifica los datos multiplexados grabados en un medio ex215 de grabación, tal como un DVD y un BD, o (i) codifica señales de video en el medio ex215 de grabación, y en algunos casos, escribe datos obtenidos mediante la multiplexación de una señal de audio en los datos codificados. El lector/grabador ex218 puede incluir el aparato de decodificación de imágenes en movimiento o el aparato de codificación de imágenes en movimiento como se muestra en cada una de las Realizaciones. En este caso, las señales de video reproducidas son visualizadas en el monitor ex219, y pueden ser reproducidas por cualquier dispositivo o sistema que use el medio ex215 de grabación en el cual los datos multiplexados están grabados. Es también posible implementar el aparato de decodificación de imágenes en movimiento en el decodificador de televisión ex217 conectado al cable ex203 para televisión por cable o a la antena ex204 para difusión satelital y/o terrestre, para visualizar las señales de video en el monitor ex219 del televisor ex300. El aparato de decodificación de imágenes en movimiento puede implementarse no solo en el decodificador de televisión sino en el televisor ex300.

La FIG. 14 ilustra el televisor (receptor) ex300 que usa el método de codificación de imágenes en movimiento y el método de decodificación de imágenes en movimiento descrito en cada una de las Realizaciones. El televisor ex300 incluye: un sintonizador ex301 que obtiene o proporciona datos multiplexados obtenidos mediante la multiplexación de datos de audio sobre datos de video, a través de la antena ex204 o el cable ex203, etc. que recibe una difusión; una unidad ex302 de modulación/demodulación que demodula los datos multiplexados recibidos o modula datos en datos multiplexados a ser suministrados fuera; y una unidad ex303 de multiplexación/demultiplexación que demultiplexa los datos multiplexados modulados en datos de video y datos de audio, o multiplexa datos de video y datos de audio codificados por una unidad ex306 de procesamiento de señal en datos.

El televisor ex300 además incluye: una unidad ex306 de procesamiento de señal que incluye una unidad ex304 de procesamiento de señal de audio y una unidad ex305 de procesamiento de señal de video que decodifica datos de audio y datos de video y codifica datos de audio y datos de video, (que funciona como el aparato de codificación de imágenes y el aparato de decodificación de imágenes), respectivamente; y una unidad ex309 de salida que incluye un altavoz ex307 que proporciona la señal de audio decodificada, y una unidad ex308 de visualización que muestra la señal de video decodificada, tal como un monitor. Además, el televisor ex300 incluye una unidad ex317 de interfaz

5

10

15

20

25

30

35

40

45

50

55

60

que incluye una unidad ex312 de entrada de operación que recibe una entrada de una operación de usuario. Además, el televisor ex300 incluye una unidad ex310 de control que controla en general cada elemento constituyente del televisor ex300, y una unidad ex311 de circuito de alimentación que suministra alimentación a cada uno de los elementos. Además de la unidad ex312 de entrada de operación, la unidad ex317 de interfaz puede incluir: un puente ex313 que está conectado a un dispositivo externo, tal como el lector/grabador ex218; una unidad ex314 de ranura para habilitar el acoplamiento del medio ex216 de grabación tal como una tarjeta SD; un controlador ex315 a ser conectado a un medio de grabación externo, tal como un disco duro; y un módem ex316 a ser conectado a la red telefónica. Aquí, el medio ex216 de grabación puede grabar eléctricamente información usando un elemento de memoria semiconductor no volátil/volátil de almacenamiento. Los elementos constituyentes del televisor ex300 están conectados entre ellos a través de un bus síncrono.

Primero, se describirá la configuración en la cual el televisor ex300 decodifica datos multiplexados obtenidos desde fuera a través de la antena ex204 y otros y reproduce los datos decodificados. En el televisor ex300, tras una operación de usuario a través de un mando ex220 a distancia y otros, la unidad ex303 de multiplexación/demultiplexación demultiplexa los datos multiplexados demodulados por la unidad ex302 de modulación/demodulación, bajo el control de la unidad ex310 de control que incluye una CPU. Además, la unidad ex304 de procesamiento de señal de audio decodifica los datos de audio demultiplexados, y la unidad ex305 de procesamiento de señal de video decodifica los datos de video demultiplexados, usando el método de decodificación descrito en cada una de las Realizaciones, en el televisor ex300. La unidad ex309 de salida proporciona la señal de video y la señal de audio decodificadas de salida, respectivamente. Cuando la unidad ex309 de salida proporciona la señal de video y la señal de audio, las señales pueden ser almacenadas temporalmente en las memorias intermedias (buffers) ex318 y ex319, y otras para que las señales se reproduzcan en sincronía entre ellas. Además, el televisor ex300 puede leer datos multiplexados no a través de una difusión y otros sino desde el medio ex215 y ex216 de grabación, tal como un disco magnético, un disco óptico, y una tarjeta SD. A continuación, se describirá una configuración en la cual el televisor ex300 codifica una señal de audio y una señal de video, y transmite los datos afuera o escribe los datos en un medio de grabación. En el televisor ex300, tras una operación de usuario a través de un mando ex220 a distancia y otros, la unidad ex304 de procesamiento de señal de audio codifica una señal de audio, y la unidad ex305 de procesamiento de señal de video codifica una señal de video, bajo el control de la unidad ex310 de control usando el método de codificación descrito en cada una de las Realizaciones. La unidad ex303 multiplexa la señal de video y la señal de audio codificadas, y proporciona la señal resultante afuera. Cuando la unidad ex303 de multiplexación/demultiplexación multiplexa la señal de video y la señal de audio, las señales pueden ser almacenadas temporalmente en las memorias intermedias (buffers) ex320 y ex321, y otras para que las señales se reproduzcan en sincronía entre ellas. Aquí, las memorias intermedias ex318, ex319, ex320 y ex321 pueden ser varias como se ilustra, o al menos una memoria intermedia puede ser compartida en el televisor ex300. Además, los datos pueden ser almacenados en una memoria intermedia para que se pueda evitar el exceso de flujo o la falta de flujo entre la unidad ex302 de modulación/demodulación y la unidad ex303 de multiplexación/demultiplexación, por ejemplo.

Además, el televisor ex300 puede incluir una configuración para recibir una entrada AV desde un micrófono o una cámara además de la configuración para obtener datos de audio y video desde una difusión o un medio de grabación, y puede codificar los datos obtenidos. Aunque el televisor ex300 puede codificar, multiplexar, y proporcionar datos de salida en la descripción, puede ser solo capaz de recibir, decodificar, y proporcionar datos de salida, pero no de codificar, multiplexar y proporcionar datos de salida.

Además, cuando el lector/grabador ex218 lee o escribe datos multiplexados desde o en un medio de grabación, uno entre el televisor ex300 y el lector/grabador ex218 puede decodificar y codificar los datos multiplexados, y el televisor ex300 y el lector/grabador ex218 pueden compartir la decodificación o codificación.

Como un ejemplo, la FIG. 15 ilustra una configuración de una unidad ex400 de reproducción/grabación de información cuando los datos se leen o escriben desde o en un disco óptico. La unidad ex400 de reproducción/grabación de información incluye elementos constituyentes ex401, ex402, ex403, ex404, ex405, ex406, y ex407 que serán descritos en adelante. El cabezal ex401 óptico irradia un punto laser en una superficie de grabación del medio ex215 de grabación que es un disco óptico para escribir información, y detecta luz reflejada desde la superficie de grabación en el medio ex215 de grabación para leer la información. La unidad ex402 de grabación de modulación dirige eléctricamente un láser semiconductor incluido en el cabezal ex401 óptico, y modula la luz láser según los datos grabados. La unidad ex403 de demodulación de reproducción amplifica una señal de reproducción obtenida mediante la detección eléctrica de la luz reflejada desde la superficie de grabación usando un foto detector incluido en el cabezal ex401 óptico, y demodula la señal de reproducción separando una componente de señal grabada en el medio ex215 de grabación para reproducir la información necesaria. La memoria intermedia ex404 mantiene temporalmente la información a ser grabada en el medio ex215 de grabación y la información reproducida desde el medio ex215 de grabación. El motor ex405 de disco rota el medio ex215 de grabación La unidad ex406 de control servo mueve el cabezal ex401 óptico a una pista de información predeterminada mientras controla el controlador de rotación del motor ex405 del disco para seguir el punto láser. La unidad ex407 de control del sistema controla en general la unidad ex400 de reproducción/grabación de información. Los procesos de lectura y escritura pueden ser implementados por la unidad ex407 de control del sistema usando varia información almacenada en la memoria intermedia ex404 y generando y añadiendo nueva información según sea necesario, y a través de la unidad ex402 de grabación de modulación, la unidad ex403 de demodulación de reproducción, y la

5

10

15

20

25

30

35

40

45

50

55

unidad ex406 de control servo que graba y reproduce información a través del cabeza ex401 óptico mientras son operados de manera coordinada. La unidad ex407 de control del sistema incluye, por ejemplo, un microprocesador, y ejecuta procesamiento causando que un ordenador ejecute un programa para leer y escribir.

Aunque el cabezal ex401 óptico irradia un punto láser en la descripción, puede realizar grabación de alta densidad usando luz de campo cercano.

La FIG. 16 ilustra el medio ex215 de grabación que es un disco óptico. En la superficie de grabación del medio ex215 de grabación, guías formadas por surcos en espiral, y una pista ex230 de información graba, por adelantado, información de dirección que indica una posición absoluta en el disco según los cambios y en la forma de los surcos de guía. La información de dirección incluye información para determinar posiciones de bloques ex231 de grabación que son una unidad para grabar datos. Reproducir la pista ex230 de información y leer la información de dirección en un aparato que graba y reproduce datos puede llevar a determinar las posiciones de los bloques de grabación. Además, el medio ex215 de grabación incluye un área ex233 de grabación de datos, un área ex232 de circunferencia interior, y un área ex234 de circunferencia exterior. El área ex233 de grabación de datos es un área para usar en la grabación de datos de usuario. El área ex232 de circunferencia interior y el área ex234 de circunferencia exterior que están dentro y fuera del área ex233 de grabación de datos, respectivamente son para uso específico excepto para grabar los datos de usuario. La unidad 400 de reproducción/grabación de información lee y escribe audio codificado, datos de video codificado, o datos multiplexados obtenidos mediante la multiplexación de audio y datos de video codificados, desde y en el área ex233 de grabación de datos del medio ex215 de grabación.

Aunque un disco óptico que tiene una capa, tal como un DVD y un BD se describen como un ejemplo en la descripción, el disco óptico no está limitado a tal, y puede ser un disco óptimo que tenga una estructura multicapa y que sea capaz de ser grabado en otra parte aparte de la superficie. Además, el disco óptico puede tener una estructura para grabación/reproducción multidimensional, tal como grabación de información usando luces de colores con diferentes longitudes de onda en la misma porción del disco óptico y para grabar información que tenga diferentes capas desde varios ángulos.

Además, un coche ex210 que tenga una antena ex205 puede recibir datos desde el satélite ex202 y otros, y reproducir video en un dispositivo de visualización tal como un sistema ex211 de navegación del coche instalado en el coche ex210, en el sistema ex200 de difusión digital. Aquí, una configuración del sistema ex211 de navegación del coche será una configuración, por ejemplo, que incluya una unidad de recepción de GPS desde la configuración ilustrada en la FIG. 14. Lo mismo será verdad para la configuración del ordenador ex111, el teléfono móvil ex114, y otros.

La FIG. 17A ilustra el teléfono móvil ex114 que usa el método de codificación de imágenes en movimiento y el método de decodificación de imágenes en movimiento descritos en las Realizaciones. El teléfono móvil ex114 incluye: una antena ex350 para transmitir y recibir ondas de radio a través de la estación base ex110; una unidad ex365 de cámara capaz de capturar imágenes fijas y en movimiento; y una unidad ex358 de visualización tal como una pantalla de cristal líquido para visualizar los datos tales como video decodificado capturado por la unidad ex365 de cámara o recibidos por la antena ex350. El teléfono móvil ex114 además incluye: una unidad de cuerpo principal que incluye una unidad ex366 de teclas de operación; una unidad ex357 de salida de audio tal como un altavoz para salida de audio; una unidad ex356 de entrada de audio tal como un micrófono para entrada de audio; una unidad ex367 de memoria para almacenar video o imágenes fijas, audio grabado, datos codificados o decodificados del video recibido, las imágenes fijas, e-mails, u otros; y una unidad ex364 de ranura que es una unidad de interfaz para medios de grabación que almacena datos en el mismo modo que la unidad ex367 de memoria.

A continuación, se describirá un ejemplo de una configuración del teléfono móvil ex114 con referencia a la FIG. 17B. En el teléfono móvil ex114, una unidad ex360 de control principal diseñada para controlar en general cada unidad del cuerpo principal incluyendo la unidad ex358 de visualización además de la unidad ex366 de teclas de operación está conectada mutuamente, a través de un bus ex370 síncrono, a una unidad ex361 de circuito de alimentación, una unidad ex362 de control de entrada de operación, una unidad ex355 de procesamiento de señal de video, una unidad ex363 de interfaz de cámara, una unidad ex359 de control de pantalla de cristal líquido (LCD), una unidad ex352 de modulación/demodulación, una unidad ex353 de multiplexación/demultiplexación, una unidad ex354 de procesamiento de señal de audio, la unidad ex364 de ranura y la unidad ex367 de memoria.

Cuando una tecla de fin de llamada o una tecla de encendido es activada por una operación de usuario, la unidad ex361 de circuito de alimentación suministra a las unidades respectivas alimentación desde un paquete de baterías para activar el teléfono móvil ex114.

En el teléfono móvil ex114, la unidad ex354 de procesamiento de señal de audio convierte la señal de audio recogida por la unidad ex356 de entrada de audio en modo de conversación de voz en señales de audio digitales bajo el control de la unidad ex360 de control principal incluyendo una CPU, ROM, y RAM. Entonces, la unidad ex352 de modulación/demodulación realiza procesamiento de espectro ensanchado en las señales de audio digitales, y la unidad ex351 de transmisión y recepción realiza la conversión digital a analógico y conversión de frecuencia sobre los datos, para transmitir los datos resultantes a través de la antena ex350. También, en el teléfono móvil ex114, la

5

10

15

20

25

30

35

40

45

50

55

unidad ex351 de transmisión y recepción amplifica los datos recibidos por la antena ex350 en modo de conversación de voz y realiza conversión de frecuencia y la conversión analógica a digital sobre los datos. Entonces, la unidad ex352 de modulación/demodulación realiza el procesamiento de espectro ensanchado inverso sobre los datos, y la unidad ex354 de procesamiento de señal de audio la convierte en señales de audio analógicas, para sacarlas a través de la unidad ex357 de salida de audio.

Además, cuando se transmite un e-mail en el modo de comunicación de datos, los datos de texto del e-mail introducidos mediante la operación de la unidad ex366 de teclas de operación y otros del cuerpo principal son enviados a la unidad ex360 de control principal a través de la unidad ex362 de control de entrada de operación. La unidad ex360 de control principal causa que la unidad ex352 de modulación/demodulación realice procesamiento de espectro ensanchado en los datos de texto, y la unidad ex351 de transmisión y recepción realiza la conversión digital a analógico y la conversión de frecuencia en los datos resultantes para transmitir los datos a la estación base ex110 a través de la antena ex350. Cuando se recibe un e-mail, se realiza un procesamiento en los datos recibidos que es aproximadamente inverso al procesamiento de transmitir un e-mail, y los datos resultantes son proporcionados a la unidad ex358 de visualización.

Cuando se transmiten video, imágenes fijas, o video y audio en el modo de comunicación de datos, la unidad ex355 de procesamiento de señal de video comprime y codifica señales de video suministradas desde la unidad ex365 de cámara usando el método de codificación de imágenes en movimiento mostrado en cada una de las Realizaciones (esto eso, funciona como el aparato de codificación de imágenes de la presente invención), y transmite los datos de video codificado a la unidad ex353 de multiplexación/demultiplexación. En contraste, durante la captura de video, imágenes fijas, y otros, de la unidad ex365 de cámara, la unidad ex354 de procesamiento de señal de audio codifica señales de audio recogidas por la unidad ex356 de entrada de audio, y transmite los datos de audio codificados a la unidad ex353 de multiplexación/demultiplexación.

La unidad ex353 de multiplexación/demultiplexación multiplexa los datos de video codificado suministrado desde la unidad ex355 de procesamiento de señal de video y los datos de audio codificado suministrados desde la unidad ex354 de procesamiento de señal de audio, usando un método predeterminado. Entonces, la unidad ex352 de modulación/demodulación (unidad de circuito de modulación/demodulación) realiza procesamiento de espectro ensanchado en los datos multiplexados, y la unidad ex351 de transmisión y recepción realiza conversión digital a analógico y conversión de frecuencia en los datos para transmitir los datos resultantes a través de la antena ex350.

Cuando los datos recibidos de un archivo de video que está enlazado a una página Web y otros en el modo de comunicación de datos cuando se recibe un email con video y/o audio adjunto, para decodificar los datos multiplexados recibidos a través de la antena ex350, la unidad ex353 de multiplexación/demultiplexación demultiplexa los datos multiplexados en un flujo de bits de datos de video y un flujo de bits de datos de audio, y suministra a la unidad ex355 de procesamiento de señal de video los datos de video codificados y a la unidad ex354 de procesamiento de señal de audio los datos de audio codificados, a través del bus ex370 síncrono. La unidad ex355 de procesamiento de señal de video decodifica la señal de video usando un método de decodificación de imágenes en movimiento correspondiente con el método de codificación de imágenes en movimiento en cada una de las Realizaciones (esto es, funciona como el aparato de decodificación de imágenes de la presente invención), y entonces la unidad ex358 de visualización muestra, por ejemplo, el video e imágenes fijas incluidas en el archivo de video enlazado a la página Web a través de la unidad ex359 de control del LCD. Además, la unidad ex354 de procesamiento de señal de audio decodifica la señal de audio, y la unidad ex357 de salida de audio proporciona el audio.

Además, similarmente al televisor ex300, un terminal tal como el teléfono móvil ex114 probablemente tenga 3 tipos de configuraciones de implementación incluyendo no solo (i) un terminal de transmisión y recepción que incluye tanto un aparato de codificación como un aparato de decodificación, sino también (ii) un terminal de transmisión que incluye solo un aparato de codificación y (iii) un terminal de recepción que incluye solo un aparato de decodificación. Aunque el sistema ex200 de difusión digital recibe y transmite los datos multiplexados obtenidos mediante la multiplexación de datos de audio sobre datos de video en la descripción, los datos multiplexados pueden ser datos obtenidos mediante la multiplexación de datos que no son de audio sino datos de caracteres relacionados con el video sobre datos de video, y pueden no ser datos multiplexados sino datos de video en sí.

Como tal, el método de codificación de imágenes en movimiento y el método de decodificación de imágenes en movimiento en cada una de las Realizaciones pueden ser usados en cualquiera de los dispositivos y sistemas descritos. Así, se pueden obtener las ventajas descritas en cada una de las Realizaciones.

Además, la presente invención no está limitada a las Realizaciones, y son posibles varias modificaciones y revisiones sin salirse del alcance de la presente invención.

(Realización 4)

Los datos de video pueden ser generados mediante la conmutación, según sea necesario, entre (i) el método de codificación de imágenes en movimiento y el aparato de codificación de imágenes en movimiento mostrado en cada una de las Realizaciones y (ii) un método de codificación de imágenes en movimiento o un aparato de codificación

5

10

15

20

25

30

35

40

45

50

55

de imágenes en movimiento en conformidad con un estándar diferente, tal como MPEG-2, MPEG4-AVC, y VC-1.

Aquí, cuando se genera una pluralidad de datos de video conforme a los diferentes estándares y se decodifica a continuación, los métodos de decodificación necesitan ser seleccionados para ajustarse a los diferentes estándares. Sin embargo, dado que no se puede detectar con qué estándar de la pluralidad de los datos de video a ser decodificados, hay un problema de que no se pueda seleccionar un método de decodificación apropiado.

Para resolver el problema, los datos multiplexados obtenidos mediante la multiplexación de datos de audio y otros sobre datos de video tiene una estructura que incluye información de identificación que indica a qué estándar se ajustan los datos de video. En adelante se describirá la estructura específica de los datos multiplexados que incluyen los datos de video generados en el método de codificación de imágenes en movimiento y por el aparato de codificación de imágenes en movimiento mostrado en cada una de las Realizaciones. Los datos multiplexados es un flujo digital en el formato de Flujo de Transporte MPEG2.

La FIG. 18 ilustra una estructura de los datos multiplexados. Como se ilustra en la FIG. 18, los datos multiplexados se pueden obtener mediante la multiplexación de al menos uno entre un flujo de video, un flujo de audio, un flujo de gráficos de presentación (PG), y un flujo de gráficos interactivos. El flujo de video representa video primario y video secundario de una película, el flujo de audio (IG) representa una parte de audio primaria y una parte de audio secundaria a ser mezcladas con la parte de audio primaria, y el flujo de gráficos de representación representan subtítulos de la película. Aquí, el video primario es video normal a ser visualizado en una pantalla, y el video secundario es video a ser visualizado en una ventana más pequeña en el video primario. Además, el flujo de gráficos interactivo representa una pantalla interactiva a ser generada mediante la disposición de los componentes del GUI en una pantalla. El flujo de video es codificado en el método de codificación de imágenes en movimiento o mediante el aparato de codificación de imágenes en movimiento en cada una de las Realizaciones, o en un método de codificación de imágenes en movimiento o mediante un aparato de codificación de imágenes en movimiento en conformidad con un estándar convencional, tal como MPEG-2, MPEG4-AVC, y VC-1. El flujo de audio está codificado según un estándar, tal como Dolby-AC-3, Dolby Digital Plus, MLP, DTS, DtS-HD, y PCM lineal.

Cada flujo incluido en los datos multiplexados es identificado por PID. Por ejemplo, 0x1011 está asignado en el flujo de video a ser usado por el video de una película, 0x1100 a 0x111F están asignados a los flujos de audio, 0x1200 a 0x121F están asignados a los flujos de gráficos de presentación, 0x1400 a 0x141F están asignados a los flujos de gráficos interactivos, 0x1B00 a 0x1B1F están asignados a los flujos de video a ser usados por el video secundario de la película, y 0x1A00 a 0x1A1F están asignados a los flujos de audio a ser usados por el video secundario a ser mezclado con el audio primario.

La FIG. 19 ilustra esquemáticamente cómo cada flujo es multiplexado. Primero, un flujo ex235 de video compuesto de tramas de video y un flujo ex238 de audio compuesto de tramas de audio son transformados en un flujo de paquetes ex236 PES y un flujo de paquetes ex239 PES, y además en paquetes ex237 TS y paquetes ex240 TS, respectivamente. Similarmente, los datos del flujo ex241 de gráficos de presentación y datos de un flujo ex244 de gráficos interactivos son transformados en un flujo de paquetes ex242 PES y un flujo de paquetes ex245 PES, y además en paquetes ex243 TS y paquetes ex246 TS, respectivamente. Estos paquetes TS son multiplexados en un flujo para obtener datos ex247 multiplexados.

La FIG. 20 ilustra cómo un flujo de video es almacenado en un flujo de paquetes PES en más detalle. La primera barra en la FIG. 20 muestra un flujo de tramas de video en un flujo de video. La segunda barra muestra el flujo de paquetes PES. Como se indica por las flechas denotadas como yy1, yy2, yy3 y yy4 en la FIG. 20, el flujo de video es dividido en imágenes como imágenes I, imágenes B, e imágenes P cada una de las cuales es una unidad de presentación de video, y las imágenes son almacenadas en una carga de cada uno de los paquetes PES. Cada uno de los paquetes PES tiene una cabecera PES, y la cabecera PES almacena una Marca de Tiempo de Presentación (PTS) que indica un tiempo de visualización de la imagen, y una Marca de Tiempo de Decodificación (DTS) que indica un momento de decodificación de la imagen.

La FIG. 21 ilustra un formato de paquetes TS a ser finalmente escritos en los datos multiplexados. Cada uno de los paquetes TS es un paquete de longitud fija de 188 bytes que incluye una cabecera TS de 4 bytes que tiene información, tal como un PID para identificar un flujo y una carga de Ts de 184 bytes para almacenar datos. Los paquetes PES son divididos, y almacenados en las cargas TS, respectivamente. Cuando se usa una ROM BD, a cada uno de los paquetes TS se le da una Cabecera Extra TP de 4 bytes, resultando así en paquetes origen de 192 bytes. Los paquetes origen son escritos en los datos multiplexados. Las Cabeceras Extra TP almacenan información tal como una Marca de Tiempo de Llegada (ATS). La ATS muestra un momento de inicio de la transferencia en el cual cada uno de los paquetes TS ha de ser transferido a un filtro PID. Los paquetes origen son dispuestos en los datos multiplexados como se muestra en la parte inferior de la FIG. 21. Los números que aumentan desde la cabecera de los datos multiplexados son llamados números de paquetes origen (SPN).

Cada uno de los paquetes TS incluidos en los datos multiplexados incluye no solo flujos de audio, video, subtítulos y otros, sino también una Tabla Asociada del Programa (pAt), una Tabla de Correspondencia del Programa (PMT), y una Referencia de Reloj del Programa (PCR). La PAT muestra lo que un PID en una PMT usada en los datos multiplexados indica, y un PID de la PAT en sí es registrada a cero. La PMT almacena PIDs de los flujos de video,

5

10

15

20

25

30

35

40

45

50

55

60

audio, subtítulos y otros incluidos en los datos multiplexados, e información de atributos de los flujos correspondientes a los PIDs. La PMT también tiene varios descriptores relativos a los datos multiplexados. Los descriptores tienen información tal como información de control de copia que muestra si la copia de los datos multiplexados está permitida o no. La PCR almacena información de tiempo STC correspondiente a una ATS que muestra cuando el paquete PCR es transferido a un decodificador, para lograr la sincronización entre el Reloj de Tiempo de Llegada (ATC) que es un eje de tiempo de ATS, y un Reloj de Hora del Sistema (STC) que es un eje de tiempo de PTS y DTS.

La FIG. 22 ilustra la estructura de datos de una PMT en detalle. Una cabecera PMT es dispuesta en la parte superior de la PMT. La cabecera PMT describe la longitud de los datos incluidos en la PMT y otros. Una pluralidad de descriptores relativos a los datos multiplexados es dispuesta tras la cabecera PMT. Información tal como la información de control de copia es descrita en los descriptores. Tras los descriptores, se dispone una pluralidad de piezas de información de flujo relativos a los flujos incluidos en los datos multiplexados. Cada pieza de información de flujo incluye descriptores de flujo cada uno describiendo información, tal como un tipo de flujo para identificar un códec de compresión de un flujo, un PID del flujo, e información de atributos del flujo (tal como una tasa de trama o una relación de aspecto). Los descriptores de flujo son iguales en número al número de flujos en los datos multiplexados.

Cuando los datos multiplexados son grabados en un medio de grabación y otros, son grabados junto con archivos de información de datos multiplexados.

Cada uno de los archivos de información de datos multiplexados es información de gestión de los datos multiplexados como se muestra en la FIG. 23. Los archivos de información de datos multiplexados se corresponden uno a uno con los datos multiplexados, y cada uno de los archivos incluye información de datos multiplexados, información de atributos de flujo, y una correspondencia de entrada.

Como se ilustra en la FIG. 23, los datos multiplexados incluyen una tasa de sistema, un momento de inicio de reproducción, y un momento de fin de reproducción. La tasa de sistema indica la tasa de transferencia máxima en la cual un decodificador objetivo del sistema que será descrito más tarde transfiere los datos multiplexados a un filtro PID. Los intervalos de las ATS incluidas en los datos multiplexados son establecidas a no más altas que una tasa de sistema. El momento de inicio de reproducción indica un PTS en una trama de video en la cabecera de los datos multiplexados. Un intervalo de una trama es añadido a un PTS en una trama de video en el final de los datos multiplexados, y el PTS se establece al momento final de reproducción.

Como se muestra en la FIG. 24, una pieza de información de atributo es registrada en la información de atributo de flujo, para cada PID de cada flujo incluido en los datos multiplexados. Cada pieza de información de atributo tiene información diferente según si el flujo correspondiente es un flujo de video, un flujo de audio, un flujo de gráficos de representación, o un flujo de gráficos interactivos. Cada pieza de información de atributo de flujo de video porta información que incluye qué tipo de códec de compresión es usado para comprimir el flujo de video, y la resolución, relación de aspecto y tasa de trama de las piezas de datos de imágenes que son incluidas en el flujo de video. Cada pieza de información de atributo de flujo de audio porta información que incluye qué tipo de códec de compresión es usado para comprimir el flujo de audio, cuántos canales son incluidos en el flujo de audio, qué idioma soporta el flujo de audio, y cómo de alta es la frecuencia de muestreo. La información de atributo de flujo de video y la información de atributo de flujo de audio son usadas para inicializar un decodificador antes de que el reproductor reproduzca la información.

En la presente realización, los datos multiplexados a ser usados son de un tipo de flujo incluido en la PMT. Además, cuando los datos multiplexados son grabados en un medio de grabación, se usa la información de atributo del flujo de video incluida en la información de los datos multiplexados. Más específicamente, el método de codificación de imágenes en movimiento o el aparato de codificación de imágenes en movimiento descritos en cada una de las Realizaciones incluyen un paso o una unidad para asignar información única que indique los datos de video generados por el método de codificación de imágenes en movimiento o el aparato de codificación de imágenes en movimiento en cada una de las Realizaciones, al tipo de flujo incluido en la PMT o la información de atributo de flujo de video. Con la configuración, los datos de video generados por el método de codificación de imágenes en movimiento o el aparato de codificación de imágenes en movimiento descritos en cada una de las Realizaciones se pueden distinguir de datos de video que se ajustan a otro estándar.

Además, la FIG. 25 muestra pasos del método de decodificación de imágenes en movimiento según la presente realización. En el Paso exS100, el tipo de flujo incluido en la PMT o la información de atributo de flujo de video se obtiene desde los datos multiplexados. A continuación, en el Paso exS101, se determina si el tipo de flujo o la información de atributo de flujo de video indican o no que los datos multiplexados son generados por el método de codificación de imágenes en movimiento o el aparato de codificación de imágenes en movimiento en cada una de las Realizaciones. Cuando se determina que el tipo de flujo o la información de atributo de flujo de video indican que los datos multiplexados son generados por el método de codificación de imágenes en movimiento o el aparato de codificación de imágenes en movimiento en cada una de las Realizaciones, en el Paso exS102, se realiza la decodificación mediante el método de decodificación de imágenes en movimiento en cada una de las Realizaciones. Además, cuando el tipo de flujo o la información de atributo de flujo de video indican conformidad con los estándares

5

10

15

20

25

30

35

40

45

50

55

convencionales, tales como MPEG-2, MPEG4-AVC, y VC-1, en el Paso exS103, se realiza la decodificación mediante un método de decodificación de imágenes en movimiento en conformidad con los estándares convencionales.

Como tal, asignar un nuevo valor único al tipo de flujo o la información de atributo de flujo de video permite determinar si el método de decodificación de imágenes en movimiento o el aparato de decodificación de imágenes en movimiento que son descritos en cada una de las Realizaciones pueden realizar decodificación o no. Aun cuando los datos multiplexados se ajustan a un estándar diferente, se puede seleccionar un método o aparato de decodificación apropiado. Así, se vuelve posible decodificar información sin errores. Además, el método o aparato de codificación de imágenes en movimiento, o el método o aparato de decodificación de imágenes en movimiento en la presente realización se pueden usar en los dispositivos y sistemas descritos anteriormente.

(Realización 5)

Cada uno del método de codificación de imágenes en movimiento, el aparato de codificación de imágenes en movimiento, el método de decodificación de imágenes en movimiento, y el aparato de decodificación de imágenes en movimiento en cada una de las Realizaciones se consigue típicamente en la forma de un circuito integrado o un circuito Integrado a Gran Escala (LSI). Como un ejemplo del LSI, la FIG. 26 ilustra una configuración del LSI ex500 que está hecho en un chip. El LSI ex500 incluye los elementos ex501, ex502, ex503, ex504, ex505, ex506, ex507, ex508, y ex509 que serán descritos a continuación, y los elementos están conectados entre sí a través de un bus ex510. La unidad ex505 de circuito de alimentación es activada por el suministro a cada uno de los elementos cuando la unidad ex505 de circuito de alimentación se enciende.

Por ejemplo, cuando se realiza la codificación, el LSI ex500 recibe una señal AV desde un micrófono ex117, una cámara ex113, y otros a través de un AV IO ex509 bajo el control de una unidad ex501 de control que incluye una CPU ex502, un controlador ex503 de memoria, un controlador ex504 de flujo, y una unidad ex512 de control de frecuencia portadora. La señal AV recibida es almacenada temporalmente en una memoria ex511 externa tal como una SDRAM. Bajo el control de la unidad ex501 de control, los datos almacenados son segmentados en porciones de datos según la cantidad y velocidad de procesamiento a ser transmitidos a una unidad ex507 de procesamiento de señal. Entonces, la unidad ex507 de procesamiento de señal codifica una señal de audio y/o una señal de video. Aquí, la codificación de la señal de video es la codificación descrita en cada una de las Realizaciones. Además, la unidad ex507 de procesamiento de señal a veces multiplexa los datos de audio codificados y los datos de video codificados, y un flujo IO ex506 proporciona los datos multiplexados hacia afuera. Los datos multiplexados proporcionados son transmitidos a la estación base ex107, o escritos en el medio ex215 de grabación. Cuando los conjuntos de datos son multiplexados, los datos deberían ser almacenados temporalmente en la memoria intermedia ex508 para que los conjuntos de datos se sincronicen entre sí.

Aunque la memoria ex511 es un elemento fuera del LSI ex500, se puede incluir en el LSI ex500. La memoria intermedia ex508 no está limitada a una memoria intermedia, sino que puede estar compuesta de memorias intermedias. Además, el LSI ex500 puede estar hecho en un chip o una pluralidad de chips.

Además, aunque la unidad ex501 de control incluye la CPU ex502, el controlador ex503 de memoria, el controlador ex504 de flujo, la unidad ex512 de control de frecuencia portadora, la configuración de la unidad ex501 de control no está limitada a tales. Por ejemplo, la unidad ex507 de procesamiento de señal puede además incluir una CPU. La inclusión de otra CPU en la unidad ex507 de procesamiento de señal puede mejorar la velocidad de procesamiento. Además, como otro ejemplo, la CPU ex502 puede servir como o ser una parte de la unidad ex507 de procesamiento de señal, y, por ejemplo, puede incluir una unidad de procesamiento de señal de audio. En tal caso, la unidad ex501 de control incluye la unidad ex507 de procesamiento de señal o la CPU ex502 incluyendo una parte de la unidad ex507 de procesamiento de señal.

El nombre usado aquí es LSI, pero también puede llamarse IC, sistema LSI, super LSI, o ultra LSI dependiendo del grado de integración.

Además, los modos de conseguir la integración no están limitados al LSI, y un circuito especial o un procesador de propósito general etcétera pueden también conseguir la integración. La Matriz de Puertas Programables en Campo (FPGA) puede ser programada para permitir la reconfiguración de la conexión o se puede usar la configuración de un LSI para el mismo propósito.

En el futuro, con los adelantos en tecnología de semiconductores, una nueva tecnología puede reemplazar al LSI. Los bloques funcionales se pueden integrar usando tal tecnología. La posibilidad es que la presente invención sea aplicada en biotecnología.

(Realización 6)

Cuando los datos de video generados en el método de codificación de imágenes en movimiento o mediante el aparato de codificación de imágenes en movimiento descrito en cada una de las Realizaciones son decodificados, comparado con cuando los datos de video se ajustan a un estándar convencional, tal como MPEG-2, MPEG4-AVC y VC-1 son decodificados, la cantidad de procesamiento probablemente aumenta. Así, el LSI ex500 necesita ser

5

10

15

20

25

30

35

40

45

50

55

60

configurado a una frecuencia portadora más alta que la de la CPU ex502 para usarse cuando los datos de video son decodificados ajustándose a un estándar convencional. Sin embargo, cuando la frecuencia portadora se configura más alta, hay un problema de que el consumo de potencia aumenta.

Para solucionar el problema, el aparato de decodificación de imágenes en movimiento, tal como el televisor ex300 y el LSI ex500 son configurados para determinar a qué estándar se ajustan los datos de video, y conmutar entre las frecuencias portadoras según el estándar determinado. La FIG. 27 ilustra una configuración ex800 en la presente realización. Una unidad ex803 de conmutación de frecuencia portadora establece una frecuencia portadora a una frecuencia portadora más alta cuando los datos de video son generados por el método de codificación de imágenes en movimiento o el aparato de codificación de imágenes en movimiento descritos en cada una de las Realizaciones. Entonces, la unidad ex803 de conmutación de frecuencia portadora da instrucciones a una unidad ex801 de procesamiento de decodificación que ejecuta el método de decodificación de imágenes en movimiento descrito en cada una de las Realizaciones para decodificar los datos de video. Cuando los datos de video se ajustan al estándar convencional, la unidad ex803 de conmutación de frecuencia portadora establece una frecuencia portadora a una frecuencia portadora más baja que aquella de los datos de video generados por el método de codificación de imágenes en movimiento o el aparato de codificación de imágenes en movimiento descritos en cada una de las Realizaciones. Entonces, la unidad ex803 de conmutación de frecuencia portadora da instrucciones a la unidad ex802 de procesamiento de decodificación que se ajusta al estándar convencional para decodificar los datos de video.

Más específicamente, la unidad ex803 de conmutación de frecuencia portadora incluye la CPU ex502 y la unidad ex512 de control de frecuencia portadora en la FIG. 26. Aquí, cada una de la unidad ex801 de procesamiento de decodificación que ejecuta el método de decodificación de imágenes en movimiento descrito en cada una de las Realizaciones y la unidad ex802 de procesamiento de decodificación que se ajusta al estándar convencional se corresponden con la unidad ex507 de procesamiento de señal en la FIG. 26. La CPU ex502 determina a qué estándar se ajustan los datos de video. Entonces, la unidad ex512 de control de frecuencia portadora determina una frecuencia portadora basado en una señal de la CPU ex502. Además, la unidad ex507 de procesamiento de señal decodifica los datos de video basado en la señal de la CPU ex502. Por ejemplo, la información de identificación descrita en la Realización 4 es usada probablemente para identificar los datos de video. La información de identificación no está limitada a la descrita en la Realización 4 sino que puede ser cualquier información mientras que la información indique a qué estándar se ajustan los datos de video. Por ejemplo, cuando se puede determinar a qué estándar se ajustan los datos de video basándose en una señal externa para determinar que los datos de video son usados para un televisor o un disco, etc., la determinación puede hacerse basándose en tal señal externa. Además, la CPU ex502 selecciona una frecuencia portadora basándose en, por ejemplo, una tabla de búsqueda en la cual se asocian los estándares de los datos de video con las frecuencias portadoras como se muestra en la FIG. 29. La frecuencia portadora se puede seleccionar mediante el almacenamiento de la tabla de búsqueda en la memoria intermedia ex508 y en una memoria interna de un LSI, y con referencia a la tabla de búsqueda por la CPU ex502.

La FIG. 28 ilustra los pasos para ejecutar un método en la presente realización. Primero, en el Paso exS200, la unidad ex507 de procesamiento de señal obtiene información de identificación desde los datos multiplexados. A continuación, en el Paso exS201, la CPU ex502 determina si los datos de video son generados o no por el método de codificación y el aparato de codificación descritos en cada una de las Realizaciones, basándose en la información de identificación. Cuando se generan los datos de video mediante el método de codificación de imágenes en movimiento y el aparato de codificación de imágenes en movimiento descritos en cada una de las Realizaciones, en el Paso exS202, la CPU ex502 transmite una señal para establecer la frecuencia portadora a una frecuencia portadora más alta a la unidad ex512 de control de frecuencia portadora. Entonces, la unidad ex512 de control de frecuencia portadora establece la frecuencia portadora a la frecuencia portadora más alta. Por otro lado, cuando la información de identificación indica que los datos de video se ajustan al estándar convencional, tal como MPEG-2, MPEG4-AVC, y VC-1, en el Paso exS203, la CPU ex502 transmite una señal para establecer la frecuencia portadora a una frecuencia portadora más baja a la unidad ex512 de control de frecuencia portadora. Entonces, la unidad ex512 de control de frecuencia portadora establece la frecuencia portadora a la frecuencia portadora más baja que en el caso donde los datos de video son generados por el método de codificación de imágenes en movimiento y el aparato de codificación de imágenes en movimiento descritos en cada una de las Realizaciones.

Además, junto con la conmutación de las frecuencias portadoras, el efecto de conservación de potencia se puede mejorar cambiando el voltaje a aplicar al LSI ex500 o a un aparato que incluye el LSI ex500. Por ejemplo, cuando la frecuencia portadora se establece más baja, el voltaje a aplicar al LSI ex500 o al aparato que incluye el LSI ex500 es probablemente establecido a un voltaje más bajo que en el caso donde la frecuencia portadora es establecida más alta.

Además, cuando la cantidad de procesamiento para decodificar es mayor, la frecuencia portadora puede establecerse más alta, y cuando la cantidad de procesamiento para decodificar es menor, la frecuencia portadora puede establecerse más baja como el método para establecer la frecuencia portadora. Así, el método de establecimiento no está limitado a los descritos anteriormente. Por ejemplo, cuando la cantidad de procesamiento para decodificar datos de video en conformidad con MPEG4-AVC es mayor que la cantidad de procesamiento para decodificar datos de video generados por el método de codificación de imágenes en movimiento y el aparato de

5

10

15

20

25

30

35

40

45

50

55

60

codificación de imágenes en movimiento descritos en cada una de las Realizaciones, la frecuencia portadora se establece probablemente en orden inverso a los establecimientos descritos anteriormente.

Además, el método para establecer la frecuencia portadora no está limitado al método para establecer la frecuencia portadora más baja. Por ejemplo, cuando la información de identificación indica que los datos de video son generados por el método de codificación de imágenes en movimiento y el aparato de codificación de imágenes en movimiento descritos en cada una de las Realizaciones, el voltaje a aplicar al LSI ex500 o el aparato que incluye el LSI ex500 es probablemente establecido más alto. Cuando la información de identificación indica que los datos de video se ajustan al estándar convencional, tal como MPEG-2, MPEG4-AVC, y VC-1, el voltaje a ser aplicado al LSI ex500 o al aparato que incluye el LSI ex500 es establecido probablemente más bajo. Como otro ejemplo, cuando la información de identificación indica que los datos de video son generados por el método de codificación de imágenes en movimiento y el aparato de codificación de imágenes en movimiento descritos en cada una de las Realizaciones, la conducción de la CPU ex502 no es probable que tenga que ser suspendida. Cuando la información de identificación indica que los datos de video se ajustan al estándar convencional, tal como MPEG-2, MPEG4-AVC, y VC-1, la conducción de la CPU ex502 es probablemente suspendida en un momento dado porque la CPU ex502 tiene capacidad de procesamiento extra. Aun cuando la información de identificación indica que los datos de video son generados por el método de codificación de imágenes en movimiento y el aparato de codificación de imágenes en movimiento descritos en cada una de las Realizaciones, en el caso donde la CPU ex502 tiene capacidad de procesamiento extra, la conducción de la CPU ex502 es probablemente suspendida en un momento dado. En tal caso, el tiempo de suspensión es probablemente establecido más corto que aquel en el caso en que la información de identificación indica que los datos de video se ajustan al estándar convencional, tal como MPEG-2, MPEG4-AVC, y VC-1.

En consecuencia, el efecto de conservación de potencia puede mejorarse mediante la conmutación entre las frecuencias portadoras según el estándar al cual se ajusten los datos de video. Además, cuando el LSI ex500 o el aparato que incluye el LSI ex500 son conducidos usando una batería, la vida de la batería puede extenderse con el efecto de conservación de potencia.

(Realización 7)

Hay casos donde una pluralidad de datos de video que se ajustan a diferentes estándares, son proporcionados a los dispositivos y sistemas, tal como un televisor y un teléfono móvil. Para permitir la decodificación de la pluralidad de datos de video que se ajustan a diferentes estándares, la unidad ex507 de procesamiento de señal del LSI ex500 necesita ajustarse a los diferentes estándares. Sin embargo, los problemas de aumentar la escala del circuito del LSI ex500 y aumentar el coste surgen con el uso individual de las unidades ex507 de procesamiento de señal que se ajustan a los estándares respectivos.

Para resolver el problema, lo que se concibe es una configuración en la cual la unidad de procesamiento de decodificación para implementar el método de decodificación de imágenes en movimiento descrito en cada una de las Realizaciones y la unidad de procesamiento de decodificación que se ajusta al estándar convencional, tal como MPEG-2, MPEG4-AVC, y VC-1 son compartidas parcialmente. Ex900 en la FIG. 30A muestra un ejemplo de la configuración. Por ejemplo, el método de decodificación de imágenes en movimiento descrito en cada una de las Realizaciones y el método de decodificación de imágenes en movimiento que se ajusta a MPEG4-AVC tienen, parcialmente en común, los detalles del procesamiento, tal como codificación de entropía, cuantificación inversa, filtrado de desbloqueo, y predicción de compensación de movimiento. Los detalles del procesamiento a ser compartidos probablemente incluyen el uso de una unidad ex902 de procesamiento de decodificación que se ajusta a MPEG4-AVC. En contraste, una unidad ex901 de procesamiento de decodificación dedicada es usada probablemente para otros procesamientos únicos a la presente invención. Dado que la presente invención está caracterizada por procesamiento de predicción intra en particular, por ejemplo, la unidad ex901 de procesamiento de decodificación dedicada se usa para el procesamiento de predicción intra. De otra manera, la unidad de procesamiento de decodificación es compartida probablemente por uno entre codificación de entropía, cuantificación inversa, filtrado de desbloqueo, y compensación de movimiento, u otros los procesamientos. La unidad de procesamiento de decodificación para implementar el método de decodificación de imágenes en movimiento descrito en cada una de las Realizaciones puede compartirse para compartir el procesamiento, y una unidad de procesamiento de decodificación dedicada puede usarse para procesar únicamente la del MPEG4-AVC.

Además, ex1000 en la FIG. 30B muestra otro ejemplo en el que el procesamiento es parcialmente compartido. Este ejemplo usa una configuración que incluye una unidad ex1001 de procesamiento de decodificación dedicada que soporta el procesamiento único a la presente invención, una unidad ex1002 de procesamiento de decodificación dedicada que soporta el procesamiento único a otra estándar convencional, y una unidad ex1003 de procesamiento de decodificación que soporta el procesamiento compartido entre el método de decodificación de imágenes en movimiento en la presente invención y el método de decodificación de imágenes en movimiento convencional. Aquí, las unidades ex1001 y ex1002 de procesamiento de decodificación no están necesariamente especializadas para el procesamiento de la presente invención y el procesamiento de los estándares convencionales, respectivamente, y pueden ser las capaces de implementar procesamiento general. Además, la configuración de la presente realización puede implementarse mediante el LSI ex500.

5

10

15

20

25

30

35

40

Como tal, reducir la escala del circuito del LSI y reducir el coste es posible compartiendo la unidad de procesamiento de decodificación para el procesamiento a ser compartido entre el método de decodificación de imágenes en movimiento en la presente invención y el método de decodificación de imágenes en movimiento en conformidad con el estándar convencional.

rAplicabilidad Industrial]

El método de codificación de imágenes en movimiento y el método de decodificación de imágenes en movimiento según la presente descripción son capaces de ser aplicados a cualquier dato multimedia y mejorar una tasa de compresión. Por ejemplo, son adecuados como el método de codificación de imágenes en movimiento y el método de decodificación de imágenes en movimiento para acumulación, transmisión, comunicaciones, y similares usando teléfonos móviles, aparatos de DVD, ordenadores personales, y similares.

[Lista de Signos de Referencia]

100 aparato de codificación de imágenes en movimiento

101 unidad de transformación ortogonal

102 unidad de cuantificación

103 unida de cuantificación inversa

104 unidad de transformación ortogonal inversa

105 memoria de bloques

106 memoria de tramas

107 unidad de predicción intra

108 unidad de predicción entre

109 unidad de control de predicción entre

110 unidad de determinación de tipo de imagen

111 unidad de cálculo de candidatos de bloques de fusión

112 memoria de coIPic

113 unidad de decodificación de longitud variable

114 sustractor

115 sumador

116 unidad de conmutación

200 aparato de decodificación de imagen en movimiento

201 unidad de decodificación de longitud variable

202 unidad de cuantificación inversa

203 unidad de transformación ortogonal inversa

204 memoria de bloques

205 memoria de tramas

206 unidad de predicción intra

207 unidad de predicción entre

208 unidad de control de predicción entre

209 unidad de cálculo de candidatos de bloque de fusión

210 memoria de colPic

211 sumador

212 conmutador

Claims

5

10

15

20

25

30

35

40

45

50

55

REIVINDICACIONES

1. Un procedimiento de codificación de imágenes en movimiento para codificar un bloque actual, comprendiendo:

determinar un primer candidato de bloque de fusión en una lista de candidatos de bloques de fusión y un segundo candidato de bloque de fusión en la lista de candidatos de bloques de fusión, teniendo el primer candidato de bloque de fusión al menos (i) un primer vector de movimiento que ha sido usado para codificar un primer bloque vecino al bloque actual, (ii) una primera dirección de predicción correspondiente al primer vector de movimiento, y (iii) un primer valor del índice de imagen de referencia para identificar una primera imagen de referencia correspondiente con el primer vector de movimiento, y teniendo el segundo candidato de bloque de fusión al menos (i) un segundo vector de movimiento que ha sido usado para codificar un segundo bloque vecino al bloque actual y diferente del primer bloque, (ii) una segunda dirección de predicción correspondiente al segundo vector de movimiento, y (iii) un segundo valor del índice de imagen de referencia para identificar una segunda imagen de referencia correspondiente con el segundo vector de movimiento, en el que la segunda dirección de predicción es diferente de la primera dirección de predicción y la lista de candidatos de bloques de fusión incluye una pluralidad de candidatos de bloques de fusión uno de los cuales es seleccionado para ser usado para codificar el bloque actual; y

generar un candidato de bloque de fusión combinado de predicción bidireccional mediante la asignación del primer vector de movimiento y el primer índice de imagen de referencia para la primera dirección de predicción del candidato de bloque de fusión combinado y mediante la asignación del segundo vector de movimiento y el segundo índice de imagen de referencia para la segunda dirección de predicción del candidato de bloque de fusión combinado; y

codificar el bloque actual mediante el uso de un candidato de bloque de fusión seleccionado entre la pluralidad de candidatos de bloques de fusión incluyendo el primer candidato de bloque de fusión, el segundo candidato de bloque de fusión, y el candidato de bloque de fusión combinado.
2. El procedimiento de codificación de imágenes en movimiento según la Reivindicación 1,

en el que, cuando el candidato de bloque de fusión que es seleccionado para ser usado para codificar el bloque actual es el candidato de bloque de fusión combinado, el candidato de bloque de fusión combinado es usado para la primera dirección de predicción y la segunda dirección de predicción.
3. El procedimiento de codificación de imágenes en movimiento según la Reivindicación 1, en el que, cuando el candidato de bloque de fusión que es seleccionado para ser usado para codificar el bloque actual es el candidato de bloque de fusión combinado, el primer vector de movimiento y el segundo vector de movimiento del candidato de bloque de fusión combinado son usados para una dirección correspondiente con la primera dirección de predicción y una dirección correspondiente con la segunda dirección de predicción.
4. Un aparato de codificación de imágenes en movimiento que codifica un bloque actual, comprendiendo:

una unidad de determinación configurada para determinar un primer candidato de bloque de fusión en una lista de candidatos de bloques de fusión y un segundo candidato de bloque de fusión en la lista de candidatos de bloques de fusión, teniendo el primer candidato de bloque de fusión al menos (i) un primer vector de movimiento que ha sido usado para codificar un primer bloque vecino al bloque actual, (ii) una primera dirección de predicción correspondiente al primer vector de movimiento, y (iii) un primer valor del índice de imagen de referencia para identificar una primera imagen de referencia correspondiente con el primer vector de movimiento, y teniendo el segundo candidato de bloque de fusión al menos (i) un segundo vector de movimiento que ha sido usado para codificar un segundo bloque vecino al bloque actual y diferente del primer bloque, (ii) una segunda dirección de predicción correspondiente al segundo vector de movimiento, y (iii) un segundo valor del índice de imagen de referencia para identificar una segunda imagen de referencia correspondiente con el segundo vector de movimiento, en donde la segunda dirección de predicción es diferente de la primera dirección de predicción y la lista de candidatos de bloques de fusión incluye una pluralidad de candidatos de bloques de fusión uno de los cuales es seleccionado para ser usado para codificar el bloque actual;

una unidad de generación configurada para generar un candidato de bloque de fusión combinado de predicción bidireccional mediante la asignación del primer vector de movimiento y el primer índice de imagen de referencia para la primera dirección de predicción del nuevo candidato de bloque de fusión y mediante la asignación del segundo vector de movimiento y el segundo índice de imagen de referencia para la segunda dirección de predicción del nuevo candidato de bloque de fusión; y

una unidad de decodificación configurada para codificar el bloque actual mediante el uso de un candidato de bloque de fusión seleccionado entre la pluralidad de candidatos de bloques de fusión incluyendo el primer candidato de bloque de fusión, el segundo candidato de bloque de fusión, y el candidato de bloque de fusión combinado.