ES2923648T3

ES2923648T3 - Procedimiento de codificación de imágenes de vídeo, procedimiento de decodificación de imágenes de vídeo

Info

Publication number: ES2923648T3
Application number: ES13800607T
Authority: ES
Inventors: Kengo Terada; Youji Shibahara; Kyoko Tanikawa; Hisao Sasai; Toshiyasu Sugio; Toru Matsunobu
Original assignee: Sun Patent Trust Inc
Current assignee: Sun Patent Trust Inc
Priority date: 2012-06-04
Filing date: 2013-05-17
Publication date: 2022-09-29
Anticipated expiration: 2033-05-17
Also published as: BR112013032418B1; CN103650498A; CN103650498B; CA2840064A1; CN107820092A; MX340432B; AR091182A1; EP2858357B1; US10652557B2; US20130322520A1; AU2013273044A1; CN107820092B; US20160277752A1; RU2013157568A; TW201412122A; CA2840064C; WO2013183232A1; TWI554947B; AU2013273044B2; MX2013014753A

Abstract

El método de codificación de imagen móvil para codificar una imagen de entrada incluye: convertir un valor de un primer parámetro en una primera señal binaria, el primer parámetro que identifica un tipo de proceso de compensación de muestra que se aplicará a una imagen reconstruida correspondiente a la imagen de entrada (S301); y codificación al menos una parte de la primera señal binaria a través de la codificación aritmética de derivación utilizando una probabilidad fija (S302). (Traducción automática con Google Translate, sin valor legal)

Description

DESCRIPCIÓN

Procedimiento de codificación de imágenes de vídeo, procedimiento de decodificación de imágenes de vídeo

La presente invención se refiere a un procedimiento de codificación y decodificación de una instantánea en movimiento y en particular a codificación aritmética o decodificación aritmética en un parámetro de compensación adaptativa de muestra (SAO).

Los últimos años han visto el desarrollo técnico significativo en aparatos de vídeo digital y el aumento de las probabilidades para la codificación por compresión de una señal de vídeo (imagen en movimiento) (una pluralidad de instantáneas dispuestas en una serie de tiempo) y la grabación de la señal de vídeo en medios de grabación, tales como DVD y discos duros, o la distribución de la señal de vídeo en la Internet. H.264/AVC (MPEG-4 AVC) es una de las normas de codificación de imágenes y la norma de Codificación de Vídeo de Alta Eficiencia (HEVC) se está considerando en la actualidad como una norma de próxima generación.

La norma HEVC descrita en NPL 1 propone un procedimiento de desplazamiento de muestra llamado SAO. El procedimiento de SAO es un procedimiento de adición de un valor de desplazamiento a un valor de muestra (valor de píxel) en una imagen (imagen reconstruida) decodificada de un flujo de bits. Por consiguiente, la imagen reconstruida en la que se ha realizado el procedimiento de SAO habilita una reproducción fiel de una imagen original (imagen de entrada) antes de la codificación y reducción en la degradación de imagen por la codificación. En NPL 2 se desvela un procedimiento de codificación de tipos de SAO. Además, NPL 3 desvela un procedimiento de codificación de parámetros de SAO y NPL 4 a NPL 6 desvelan aspectos de combinar codificación adaptativa por contexto y de derivación.

[Bibliografía no de patente]

[NPL 1] Equipo de Colaboración Mixto sobre Codificación de Vídeo (JCT-VC) de ITU-T SG16 WP3 e ISO/IEC J^tC1/SC29/W^g11, 9a Reunión: Ginebra, Suiza, 27 de abril - 7 de mayo de 2012, JCTVC-I0602_CDTexts_r3.doc, BoG report on integrated text of SAO adoptions on top of JCTVC-I0030, http://phenix.it-sudparis.eu/jct/doc end user/documents/9 Genev a/wg11/JCTVC-I0602-v4.zip.

[NPL 2] MAANI (SONY) E Y COL.: "SAO Type Coding Simplification", 100. REUNIÓN DE MPEG; 30-4-2012 - 4-5 2012; Ginebra; (GRUPO DE EXPERTOS DE IMÁGENES EN MOVIMIENTO o ISO/IEC JTC1/SC29/WG11), n.° m24492, 28 de abril de 2012.

[NPL 3] C-M FU Y COL.: "Non-CEl: bug-fix of offset coding in SAO interleaving mode", Equipo de Colaboración Mixto sobre Codificación de Vídeo (JCT-VC), Documento JCTVC-I0168, Ginebra, abril de 2012.

[NPL 4] SEREGIN V Y COL.: "Utilisation of CABAC equal probability mode for intra mode coding", 6. REUNIÓN DE JCT-VC; 97. REUNIÓN DE MPEG; 14-7-2011 -22-7-2011; TURÍN.

[NPL 5] MISRA K Y COL.: "Using CABAC bypass mode for coding intra prediction mode", 7. REUNIÓN DE JCT-VC; 98. REUNIÓN DE MPEG; 21-11-2011 -30-11-2011; GINEBRA.

[NPL 6] SEREGIN V Y COL.: "bypass bins for reference index coding", 100. REUNIÓN DE MPEG; 30-4-2012 - 4 5-2012; GINEBRA.

Los procedimientos de codificación/decodificación de imágenes en movimiento usando el procedimiento de desplazamiento de muestra convencional requieren la supresión de disminución en la eficiencia de codificación y aceleración del procesamiento o reducción en la carga de procesamiento.

Los procedimientos de codificación y decodificación de imágenes en movimiento de acuerdo con un aspecto de la presente invención pueden acelerar el procesamiento o reducir la carga de procesamiento mientras suprime la disminución en la eficiencia de codificación, en los procedimientos de codificación/decodificación de imágenes en movimiento que usan el procedimiento de desplazamiento de muestra.

[Figura 1]

La Figura 1 es un diagrama de bloques que ilustra una configuración de un aparato de codificación de instantáneas en movimiento de acuerdo con la realización 1.

[Figura 2]

La Figura 2 es un diagrama de flujo que indica procedimientos realizados por el aparato de codificación de instantáneas en movimiento de acuerdo con la realización 1.

[Figura 3]

La Figura 3 es un diagrama de bloques que ilustra una configuración interna de una unidad de codificación de longitud variable de parámetro de SAO de acuerdo con la realización 1.

[Figura 4]

La Figura 4 es un diagrama de flujo que indica procedimientos realizados por la unidad de codificación de longitud variable de parámetro de SAO de acuerdo con la realización 1.

[Figura 5]

La Figura 5 es un diagrama de bloques que ilustra una configuración interna de una unidad de codificación de sao_type_idx de acuerdo con la realización 1.

[Figura 6]

La Figura 6 es un diagrama de flujo que indica procedimientos realizados por la unidad de codificación de sao_type_idx de acuerdo con la realización 1.

[Figura 7]

La Figura 7 es una tabla que indica una correspondencia entre señales no binarias y señales binarias de acuerdo con la realización 1.

[Figura 8]

La Figura 8 es una tabla que indica una correspondencia entre binIdxs y contextos de acuerdo con la realización 1 y las variaciones 1 y 2.

[Figura 9]

La Figura 9 es una tabla que muestra un resultado de experimento en el que se comparan las eficiencias de codificación entre la técnica convencional y la realización 1 y las variaciones 1 y 2.

[Figura 10]

La Figura 10 es una tabla que indica una correspondencia entre señales no binarias y señales binarias de acuerdo con la variación 3.

[Figura 11]

La Figura 11 es una tabla que indica una correspondencia entre binIdxs y un contexto de acuerdo con la variación 3.

[Figura 12]

La Figura 12 es un diagrama de bloques que ilustra una configuración de un aparato de decodificación de instantáneas en movimiento de acuerdo con la realización 2.

[Figura 13]

La Figura 13 es un diagrama de flujo que indica procedimientos realizados por el aparato de decodificación de instantáneas en movimiento de acuerdo con la realización 2.

[Figura 14]

La Figura 14 es un diagrama de bloques que ilustra una configuración interna de una unidad de decodificación de longitud variable de parámetro de SAO de acuerdo con la realización 2.

[Figura 15]

La Figura 15 es un diagrama de flujo que indica procedimientos realizados por la unidad de decodificación de longitud variable de parámetro de SAO de acuerdo con la realización 2.

[Figura 16]

La Figura 16 es un diagrama de bloques que ilustra una configuración interna de una unidad de decodificación de sao_type_idx de acuerdo con la realización 2.

[Figura 17]

La Figura 17 es un diagrama de flujo que indica procedimientos realizados por la unidad de decodificación de sao_type_idx de acuerdo con la realización 2.

[Figura 18A]

La Figura 18A es un diagrama de bloques que ilustra una configuración de un aparato de codificación de instantáneas en movimiento de acuerdo con otra realización.

[Figura 18B]

La Figura 18B es un diagrama de flujo que indica procedimientos realizados por el aparato de codificación de instantáneas en movimiento de acuerdo con la otra realización.

[Figura 19A]

La Figura 19A es un diagrama de bloques que ilustra una configuración de un aparato de decodificación de instantáneas en movimiento de acuerdo con la otra realización.

[Figura 19B]

La Figura 19B es un diagrama de flujo que indica procedimientos realizados por el aparato de decodificación de instantáneas en movimiento de acuerdo con la otra realización.

[Figura 20]

La Figura 20 ilustra una configuración global de un sistema de suministro de contenido para implementar servicios de distribución de contenido.

[Figura 21]

La Figura 21 ilustra una configuración global de un sistema de difusión digital.

[Figura 22]

La Figura 22 ilustra un diagrama de bloques de un ejemplo de una configuración de una televisión.

[Figura 23]

La Figura 23 ilustra un diagrama de bloques que ilustra un ejemplo de una configuración de una unidad de reproducción/grabación de información que lee y escribe información de o en un medio de grabación que es un disco óptico.

[Figura 24]

La Figura 24 ilustra un ejemplo de una configuración de un medio de grabación que es un disco óptico.

[Figura 25A]

La Figura 25^ailustra un ejemplo de un teléfono celular.

[Figura 25B]

La Figura 25^bilustra un diagrama de bloques de un ejemplo de una configuración del teléfono celular.

[Figura 26]

La Figura 26 ilustra una estructura de datos multiplexados.

[Figura 27]

La Figura 27 ilustra esquemáticamente cómo se multiplexa cada flujo en datos multiplexados.

[Figura 28]

La Figura 28 ilustra cómo se almacena un flujo de vídeo en el flujo de paquetes de PES en más detalle.

[Figura 29]

La Figura 29 ilustra una estructura de paquetes de TS y paquetes de origen en los datos multiplexados.

[Figura 30]

La Figura 30 ilustra una estructura de datos de una PMT.

[Figura 31]

La Figura 31 ilustra una estructura interna de información de datos multiplexados.

[Figura 32]

La Figura 32 ilustra una estructura interna de información de atributo de flujo.

[Figura 33]

La Figura 33 ilustra etapas para identificar datos de vídeo.

[Figura 34]

La Figura 34 ilustra un diagrama de bloques que ilustra un ejemplo de una configuración de un circuito integrado para implementar un procedimiento de codificación de instantáneas en movimiento y un procedimiento de decodificación de instantáneas en movimiento de acuerdo con cada una de las realizaciones.

[Figura 35]

La Figura 35 ilustra una configuración para conmutar entre frecuencias de accionamiento.

[Figura 36]

La Figura 36 ilustra etapas para identificar datos de vídeo y conmutar entre frecuencias de accionamiento.

[Figura 37]

La Figura 37 ilustra un ejemplo de una tabla de consulta en la que las normas de datos de vídeo se asocian con las frecuencias de accionamiento.

[Figura 38A]

La Figura 38^ailustra un ejemplo de una configuración para compartir un módulo de una unidad de procesamiento de señales.

[Figura 38B]

La Figura 38b ilustra un ejemplo de una configuración para compartir un módulo de una unidad de procesamiento de señales.

(Conocimiento en el que se basa la presente invención)

En el procedimiento de SAO, los píxeles incluidos en una imagen reconstruida se clasifican en categorías. Para cada una de las categorías, un valor de desplazamiento que corresponde a la categoría se añade a un valor de píxel que pertenece a la categoría. Existen procedimientos plurales para clasificar píxeles. Específicamente, se realiza una codificación aritmética en un parámetro que indica un procedimiento de clasificación usado en la codificación real (es decir, parámetro (sao_type_idx) para identificar un tipo de un procedimiento de desplazamiento de muestra), y el parámetro se añade a un flujo de bits.

Adicionalmente, de acuerdo con la norma HEVC, se convierte (binariza) una señal a decodificar desde una señal no binaria a una señal binaria (señal que representa 0 y 1) y, a continuación, se realiza la codificación aritmética en la señal binaria.

La señal binaria es una señal que incluye al menos uno de bits que representan uno de dos símbolos (0 y 1). Cada uno de los bits también se denomina como "bin" en la descripción. En este punto, la señal binaria también se denomina como "cadena de bins".

De acuerdo con la norma HEVC, se definen dos tipos de codificación aritmética, en concreto, codificación aritmética adaptativa según contexto y codificación aritmética de derivación. En la codificación aritmética adaptativa según contexto, se realiza codificación aritmética en una señal binaria usando una probabilidad de ocurrencia de símbolo seleccionada adaptativamente a base de un contexto. Adicionalmente, en la codificación aritmética de derivación, se realiza codificación aritmética en una señal binaria usando una probabilidad de ocurrencia de símbolo fija (por ejemplo, 50 %).

Más específicamente, en la codificación aritmética adaptativa según contexto, se selecciona un contexto, por ejemplo, por bin incluido en una señal binaria a codificar. A continuación, se carga la información de probabilidad del contexto seleccionado, y se realiza codificación aritmética en el bin usando una probabilidad de ocurrencia de símbolo identificada por la información de probabilidad. Adicionalmente, la información de probabilidad (probabilidad de ocurrencia de símbolo) del contexto seleccionado se actualiza de acuerdo con un valor (símbolo) del bin en el que se ha realizado la codificación aritmética.

En contraste, en la codificación aritmética de derivación, se realiza codificación aritmética en un bin fijando la probabilidad de ocurrencia de símbolo al 50 % sin usar ningún contexto. Por lo tanto, en la codificación aritmética de derivación no se carga o actualiza ninguna información de probabilidad en el contexto.

Convencionalmente, dado que parece que cada bin incluido en una señal binaria que corresponde a sao_type_idx tiene un sesgo en la probabilidad de ocurrencia de símbolo, se realiza la codificación aritmética adaptativa según contexto en el bin. Por lo tanto, la carga de procesamiento para cargar o actualizar información de probabilidad en un contexto aumenta en la codificación convencional de sao_type_idx. Adicionalmente, cuando se realiza codificación aritmética en dos bits usando el mismo contexto, la codificación aritmética en el segundo bit no puede iniciarse hasta que se completa el procedimiento de actualización de contexto en el primer bit. Por lo tanto, la codificación aritmética en sao_type_idx se vuelve secuencial y se reduce el caudal.

De acuerdo con la presente invención, la porción de la primera señal binaria que corresponde al valor del primer parámetro para identificar un tipo del procedimiento de desplazamiento de muestra se codifica a través de la codificación aritmética de derivación. El número de carga y actualización de información de probabilidad que corresponde a un contexto puede reducirse más que el de codificación de todas las señales binarias por la codificación aritmética adaptativa según contexto. Adicionalmente, dado que la codificación aritmética de derivación no requiere actualizar la información de probabilidad, puede realizarse codificación aritmética, en paralelo, en bits incluidos en una señal binaria.

Adicionalmente, dado que la señal binaria que corresponde al valor del primer parámetro tiene convencionalmente un sesgo en la probabilidad de ocurrencia de símbolo, parece que la eficiencia de codificación disminuye significativamente cuando la señal binaria se codifica a través de la codificación aritmética de derivación. Sin embargo, la presente invención revela que la eficiencia de codificación no disminuye significativamente incluso cuando al menos una porción de la señal binaria que corresponde al valor del primer parámetro se codifica a través de la codificación aritmética de derivación.

En otras palabras, codificando al menos la porción de la señal binaria que corresponde al valor del primer parámetro para identificar un tipo del procedimiento de desplazamiento de muestra a través de la codificación aritmética de derivación, puede acelerarse el procesamiento o puede reducirse la carga de procesamiento mientras puede suprimirse la disminución en la eficiencia de codificación.

Una primera porción de la primera señal binaria se codifica a través de codificación aritmética adaptativa según contexto, y una segunda porción de la primera señal binaria se codifica a través de la codificación aritmética de derivación cuando la primera señal binaria incluye la segunda porción posterior a la primera porción.

Por consiguiente, la primera porción de la señal binaria se codifica a través de la codificación aritmética adaptativa según contexto, y la segunda porción de la señal binaria se codifica a través de la codificación aritmética de derivación. Por lo tanto, es posible conmutar la codificación aritmética entre la primera porción que tiene un mayor sesgo en la probabilidad de ocurrencia de símbolo y la segunda porción que tiene un menor sesgo en la probabilidad de ocurrencia de símbolo, y puede suprimirse adicionalmente la disminución en la eficiencia de codificación.

Por ejemplo, el procedimiento de desplazamiento de muestra puede no aplicarse a la imagen reconstruida cuando el valor del primer parámetro es igual a un valor predeterminado, y la primera porción de la primera señal binaria puede indicar si el valor del primer parámetro es igual o no al valor predeterminado.

Por consiguiente, la primera porción que indica si el valor del primer parámetro es igual o no al valor predeterminado puede codificarse a través de la codificación aritmética adaptativa según contexto. En otras palabras, la primera porción que indica si el procedimiento de desplazamiento de muestra se aplica o no a la imagen reconstruida puede codificarse a través de la codificación aritmética adaptativa según contexto. Dado que la porción que indica si el procedimiento de desplazamiento de muestra se aplica o no a la imagen reconstruida tiene un sesgo mayor en la probabilidad de ocurrencia de símbolo, puede suprimirse adicionalmente la disminución en la eficiencia de codificación.

La primera porción de la primera señal binaria se compone de un primer bit de la primera señal binaria y la segunda porción de la primera señal binaria se compone de los bits restantes de la primera señal binaria.

Por consiguiente, el primer bit de la señal binaria se codifica a través de la codificación aritmética adaptativa según contexto, y los bits restantes de la señal binaria se codifican a través de la codificación aritmética de derivación.

El procedimiento de codificación de instantáneas en movimiento incluye adicionalmente: convertir al menos uno de un valor de un segundo parámetro y un valor de un tercer parámetro en una segunda señal binaria, identificando el segundo parámetro un modo de intra predicción, identificando el tercer parámetro un candidato que hay que usar para inter predicción de entre una lista de candidatos, cada uno de los cuales incluye al menos un vector de movimiento; codificar una primera porción de la segunda señal binaria a través de la codificación aritmética adaptativa según contexto; y codificar una segunda porción de la segunda señal binaria a través de la codificación aritmética de derivación cuando la segunda señal binaria incluye la segunda porción posterior a la primera porción, en el que una longitud de bit de la primera porción de la primera señal binaria puede ser idéntica a una longitud de bit de la primera porción de la segunda señal binaria.

Por consiguiente, dado que puede estandarizarse la conmutación de la codificación aritmética entre el primer parámetro para identificar un tipo de un procedimiento de desplazamiento de muestra y otro parámetro (segundo parámetro o tercer parámetro), puede simplificarse la configuración del aparato de codificación.

De acuerdo con la presente invención, al menos la porción de la señal binaria que corresponde al valor del primer parámetro para identificar un tipo del procedimiento de desplazamiento de muestra se codifica a través de la decodificación aritmética de derivación. Por lo tanto, el número de carga y actualización de información de probabilidad que corresponde a un contexto puede reducirse más que el de la codificación de todas las señales binarias por la decodificación aritmética adaptativa según contexto. Adicionalmente, dado que la decodificación aritmética de derivación no requiere la actualización de la información de probabilidad, puede realizarse decodificación aritmética, en paralelo, en bits incluidos en una señal binaria.

En otras palabras, decodificando al menos la porción codificada de la señal binaria que corresponde al valor del primer parámetro para identificar un tipo del procedimiento de desplazamiento de muestra a través de la codificación aritmética de derivación, puede acelerarse el procesamiento o la carga de procesamiento puede reducirse mientras puede suprimirse la disminución en la eficiencia de codificación.

Una primera porción codificada de la primera señal binaria se codifica a través de decodificación aritmética adaptativa según contexto, y una segunda porción codificada de la primera señal binaria se codifica a través de la decodificación aritmética de derivación cuando la primera señal binaria incluye la segunda porción posterior a la primera porción.

Por consiguiente, la primera porción codificada de la señal binaria se codifica a través de la decodificación aritmética adaptativa según contexto y la segunda porción codificada de la señal binaria se codifica a través de la decodificación aritmética de derivación. Por lo tanto, la señal binaria codificada puede decodificarse conmutando entre la primera porción que tiene un sesgo mayor en la probabilidad de ocurrencia de símbolo y la segunda porción que tiene un sesgo menor en la probabilidad de ocurrencia de símbolo, y puede suprimirse adicionalmente la disminución en la eficiencia de codificación.

Por consiguiente, la primera porción que indica si el valor del primer parámetro es igual o no al valor predeterminado puede decodificarse a través de la decodificación aritmética adaptativa según contexto. En otras palabras, la primera porción codificada que indica si el procedimiento de desplazamiento de muestra se aplica o no a la imagen reconstruida puede decodificarse a través de la decodificación aritmética adaptativa según contexto. Dado que la porción que indica si el procedimiento de desplazamiento de muestra se aplica o no a la imagen reconstruida tiene un sesgo mayor en la probabilidad de ocurrencia de símbolo, puede suprimirse adicionalmente la disminución en la eficiencia de codificación.

Por consiguiente, el primer bit codificado de la señal binaria puede decodificarse a través de la decodificación aritmética adaptativa según contexto, y los bits restantes de la señal binaria se decodifican a través de la decodificación aritmética de derivación.

El procedimiento de decodificación de instantáneas en movimiento incluye adicionalmente: decodificar una primera porción codificada de una segunda señal binaria que corresponde a al menos uno de un valor de un segundo parámetro y un valor de un tercer parámetro, a través de la decodificación aritmética adaptativa según contexto, identificando el segundo parámetro un modo de intra predicción, identificando el tercer parámetro un candidato que hay que usar para inter predicción de entre una lista de candidatos, cada uno de los cuales incluye al menos un vector de movimiento; y decodificar una segunda porción codificada de la segunda señal binaria a través de la decodificación aritmética de derivación cuando la segunda señal binaria incluye la segunda porción posterior a la primera porción, en el que una longitud de bit de la primera porción de la primera señal binaria puede ser idéntica a una longitud de bit de la primera porción de la segunda señal binaria.

Por consiguiente, dado que la conmutación de la decodificación aritmética entre el primer parámetro para identificar un tipo de un procedimiento de desplazamiento de muestra y otro parámetro (segundo parámetro o tercer parámetro) puede estandarizarse a base de la posición de bit de la señal binaria, puede simplificarse la configuración del aparato de decodificación.

Estos aspectos generales o específicos pueden implementarse mediante un sistema, un aparato, un circuito integrado, un programa informático o un medio de grabación legible por ordenador, o mediante una combinación arbitraria del sistema, el aparato, el circuito integrado, el programa informático y el medio de grabación.

Se describirán realizaciones con referencia a los dibujos.

La presente invención, que se define mediante las reivindicaciones adjuntas, corresponde a la variación 3 de las realizaciones 1 y 2. Las porciones adicionales de la descripción anterior pertenecen a ejemplos e información de antecedentes útiles para el entendimiento de la presente invención.

(Realización 1)

<Configuración global>

La Figura 1 ilustra una configuración de un aparato 100 de codificación de instantáneas en movimiento de acuerdo con la realización 1. El aparato 100 de codificación de instantáneas en movimiento codifica una instantánea de entrada por bloque.

Como se ilustra en la Figura 1, el aparato 100 de codificación de instantáneas en movimiento incluye una unidad 101 de particionamiento de bloque, una unidad 102 de predicción, una unidad 103 de resta, una unidad 104 de transformación, una unidad 105 de transformación inversa, una unidad 106 de adición, una unidad 107 de procesamiento de SAO, una unidad 108 de codificación de longitud variable de parámetro de SAO, una unidad 109 de codificación de longitud variable de coeficiente y una memoria 110 de fotograma.

A continuación, se describirán las operaciones del aparato 100 de codificación de instantáneas en movimiento con la configuración. La Figura 2 muestra procedimientos realizados por el aparato 100 de codificación de instantáneas en movimiento de acuerdo con la realización 1.

(Etapa 101)

La unidad 101 de particionamiento de bloque particiona una instantánea de entrada en bloques (por ejemplo, unidades de codificación). La unidad 101 de particionamiento de bloque emite secuencialmente los bloques a la unidad 103 de resta y la unidad 102 de predicción como bloques a codificar (imágenes de entrada). Los bloques son variables en tamaño. La unidad 101 de particionamiento de bloque particiona la instantánea de entrada en los bloques, usando las características de una imagen. Por ejemplo, el tamaño mínimo de los bloques es 4 píxeles horizontales x 4 píxeles verticales, y el tamaño máximo de los bloques es 32 píxeles horizontales x 32 píxeles verticales.

(Etapa 102)

La unidad 102 de predicción genera un bloque de predicción, a base de los bloques a codificar, y una instantánea reconstruida almacenada en la memoria 110 de fotograma y que corresponde a una instantánea que ya se ha codificado.

(Etapa 103)

La unidad 103 de resta genera un bloque residual de cada uno de los bloques a codificar y el bloque de predicción. (Etapa 104)

La unidad de transformación 104 transforma el bloque residual en coeficientes de frecuencia. A continuación, la unidad de transformación 104 cuantifica los coeficientes de frecuencia.

(Etapa 105)

La unidad 105 de transformación inversa cuantifica inversamente los coeficientes de frecuencia cuantificados. A continuación, la unidad 105 de transformación inversa transforma inversamente los coeficientes de frecuencia cuantificados inversamente para reconstruir el bloque residual.

(Etapa 106)

La unidad 106 de adición añade el bloque residual objetivo al bloque de predicción para generar un bloque reconstruido (imagen reconstruida). El bloque reconstruido se denomina en ocasiones "bloque decodificado local (imagen decodificada local)".

(Etapa 107)

La unidad 107 de procesamiento de SAO determina un parámetro de SAO. Adicionalmente, la unidad 107 de procesamiento de SAO añade un valor de desplazamiento a al menos un valor de píxel (valor de muestra) incluido en el bloque reconstruido, y almacena un resultado de la adición en la memoria 110 de fotograma. En otras palabras, la unidad 107 de procesamiento de SAO almacena, en la memoria 110 de fotograma, el bloque reconstruido en el que se ha realizado el procedimiento de SAO.

Más específicamente, la unidad 107 de procesamiento de SAO clasifica píxeles incluidos en el bloque reconstruido en categorías. A continuación, la unidad 107 de procesamiento de SAO añade, para cada una de las categorías, un valor de desplazamiento que corresponde a la categoría a un valor de píxel que pertenece a la categoría. Existen procedimientos plurales para clasificar píxeles. En otras palabras, se aplica adaptativamente uno de los procedimientos de SAO de diferentes tipos usando los procedimientos para clasificar píxeles. Por lo tanto, el parámetro de SAO incluye un parámetro (sao_type_idx) para identificar un tipo de un procedimiento de SAO. Adicionalmente, el parámetro de SAO también incluye un parámetro (sao_offset) que indica un valor de desplazamiento.

El procedimiento de SAO no tiene que realizarse siempre.

(Etapa 108)

La unidad 108 de codificación de longitud variable de parámetro de SAO realiza codificación de longitud variable (codificación por entropía) en el parámetro de SAO para emitir un flujo de bits.

(Etapa 109)

La unidad 109 de codificación de longitud variable de coeficiente realiza codificación de longitud variable en los coeficientes de frecuencia para emitir un flujo de bits.

(Etapa 110)

Los procedimientos desde la etapa 102 a la etapa 109 se repiten hasta que se completa la codificación de todos los bloques en la instantánea de entrada.

Los detalles de la unidad 108 de codificación de longitud variable de parámetro de SAO y la operación (etapa 108) se describirán a continuación en el presente documento.

<Configuración de la unidad de codificación de longitud variable de parámetro de SAO>

La Figura 3 ilustra una configuración interna de la unidad 108 de codificación de longitud variable de parámetro de SAO de acuerdo con la realización 1. Como se ilustra en la Figura 3, la unidad 108 de codificación de longitud variable de parámetro de SAO incluye una unidad 121 de codificación de sao_type_idx y una unidad 122 de codificación de sao_offset.

A continuación, se describirán las operaciones de la unidad 108 de codificación de longitud variable de parámetro de SAO con la configuración. La Figura 4 muestra procedimientos realizados por la unidad 108 de codificación de longitud variable de parámetro de SAO de acuerdo con la realización 1.

(Etapa 121)

La unidad 121 de codificación de sao_type_idx codifica sao_type_idx para identificar un tipo de un procedimiento de SAO.

(Etapa 122)

La unidad 122 de codificación de sao_offset codifica sao_offset que indica un valor de desplazamiento en el procedimiento de SAO.

Los detalles de la unidad 121 de codificación de sao_type_idx y la operación (etapa S121) se describirán a continuación en el presente documento.

<Configuración de la unidad de codificación de sao_type_idx>

La Figura 5 ilustra una configuración interna de la unidad 121 de codificación de sao_type_idx de acuerdo con la realización 1. Como se ilustra en la Figura 5, la unidad 121 de codificación de sao_type_idx incluye una unidad 140 de binarización de sao_type_idx y una unidad 150 de codificación aritmética de sao_type_idx.

La unidad 140 de binarización de sao_type_idx convierte un valor de sao_type_idx en una señal binaria. Como se ilustra en la Figura 5, la unidad 140 de binarización de sao_type_idx incluye una unidad 141 de establecimiento de bin y una unidad 142 de determinación de último bin.

La unidad 150 de codificación aritmética de sao_type_idx codifica al menos una porción de la señal binaria a través de codificación aritmética de derivación usando una probabilidad fija. Como se ilustra en la Figura 5, la unidad 150 de codificación aritmética de sao_type_idx incluye una unidad 151 de conmutación de codificación aritmética, una primera unidad 152 de codificación aritmética adaptativa según contexto, una segunda unidad 153 de codificación aritmética adaptativa según contexto y una unidad 154 de codificación aritmética de derivación.

A continuación, se describirán detalles de las operaciones realizadas por la unidad 121 de codificación de sao_type_idx con la configuración. La Figura 6 muestra procedimientos realizados por la unidad 121 de codificación de sao_type_idx de acuerdo con la realización 1.

(Etapas S141 a S144)

La unidad 141 de establecimiento de bin convierte un valor de sao_type_idx en una señal binaria (cadena de bins). Más específicamente, la unidad 141 de establecimiento de bin establece 0 o 1 a cada bin incluido en la señal binaria, usando un índice (binIdx) para identificar una posición del bin en la señal binaria y el valor de sao_type_idx. En este punto, el valor de sao_type_idx varía entre 0 y 5 inclusive.

La Figura 7 es una tabla que indica una correspondencia entre las señales no binarias (valores de sao_type_idx) y las señales binarias. Como se observa de la Figura 7, el número de "1" consecutivos desde el comienzo de cada señal binaria es igual al valor indicado por la señal no binaria.

En otras palabras, cuando el valor de sao_type_idx es mayor que 0, la señal binaria incluye uno o más primeros bits que tienen el primer símbolo "1", en el que el número del primer bits es igual al valor de sao_type_idx. Adicionalmente, la señal binaria (a) incluye un segundo bit que tiene el segundo símbolo "0" cuando el valor de sao_type_idx es menor que el valor máximo de 5, y (b) no incluye el segundo bit que tiene el segundo símbolo "0" cuando el valor de sao_type_idx es igual al valor máximo.

Adicionalmente, el primer valor de un binIdx es 0, y los valores posteriores se incrementan en 1. El bin y el binIdx se emiten a la unidad 150 de codificación aritmética de sao_type_idx.

(Etapas S145 a S149)

La unidad 151 de conmutación de codificación aritmética conmuta una unidad de procesamiento (elemento constituyente) que realiza codificación aritmética en un bin, a base del valor del binIdx.

La Figura 8 es una tabla que indica una correspondencia entre los binIdx y los contextos. De acuerdo con la realización 1, se realiza codificación aritmética en una señal binaria usando dos tipos de contextos (contexto 0 y contexto 1) como se muestra en la columna de "Realización 1" en la tabla de la Figura 8.

Más específicamente, la unidad 151 de conmutación de codificación aritmética conmuta a la primera unidad 152 de codificación aritmética adaptativa según contexto cuando el valor del binIdx es igual a 0. Adicionalmente, la unidad 151 de conmutación de codificación aritmética conmuta a la segunda unidad 153 de codificación aritmética adaptativa según contexto cuando el valor del binIdx es igual a 1. Adicionalmente, la unidad 151 de conmutación de codificación aritmética conmuta a la unidad 154 de codificación aritmética de derivación cuando el valor del binIdx no es igual ni a 0 ni a 1.

En otras palabras, la primera unidad 152 de codificación aritmética adaptativa según contexto realiza codificación aritmética en un bin de un binIdx que tiene 0, usando el contexto 0. Adicionalmente, la segunda unidad 153 de codificación aritmética adaptativa según contexto realiza codificación aritmética en un bin de un binIdx que tiene 1, usando el contexto 1. Adicionalmente, la unidad 154 de codificación aritmética de derivación realiza codificación aritmética en un bin de un binIdx que tiene un valor de 2 o mayor, usando una probabilidad fija del 50 % sin usar ningún contexto.

En este punto, un conjunto de bins (bins identificados por los binIdx que tienen 0 y 1 de acuerdo con la realización 1) codificados a través de la codificación aritmética adaptativa según contexto se denomina como una primera porción de una señal binaria. Adicionalmente, un conjunto de bins (bins identificados por los binIdx que tienen un valor de 2 o mayor de acuerdo con la realización 1) codificados a través de la codificación aritmética de derivación se denomina como una segunda porción de la señal binaria.

En otras palabras, la primera porción de la señal binaria se codifica a través de la codificación aritmética adaptativa según contexto de acuerdo con la realización 1. Adicionalmente, cuando la señal binaria incluye la segunda porción posterior a la primera porción, la segunda porción de la señal binaria se codifica a través de la codificación aritmética de derivación.

(Etapas S150 y S151)

La unidad 142 de determinación de último bin determina si un bin tiene o no 0 (primera condición) y el binIdx tiene 4 (segunda condición). En este punto, cuando se satisface al menos una de la primera condición y la segunda condición, se completa la codificación de sao_type_idx.

Cuando no se satisface ninguna de la primera condición y la segunda condición, la unidad 142 de determinación de último bin actualiza el binIdx a un valor obtenido añadiendo el valor del binIdx a 1. A continuación, los procedimientos vuelven a la etapa S142 para codificar el siguiente bin.

De acuerdo con la realización 1, cuando sao_type_idx tiene el valor máximo de 5 como se muestra en la Figura 7, las etapas S150 y S151 pueden evitar que se añada 0 a la última de la señal binaria.

Cuando sao_type_idx tiene el valor máximo, la cantidad de código puede reducirse evitando que se añada 0 a la última de la señal binaria de acuerdo con la realización 1. De acuerdo con la norma HEVC en NPL 1, 5 de sao_type_idx se convierte en una señal binaria representada por "111110". Dado que sao_type_idx toma únicamente valores de 0 a 5, cuando el número de "1" consecutivos en una señal binaria es cinco ("11111"), el aparato de decodificación reconoce sao_type_idx como 5. Por lo tanto, cuando sao_type_idx es igual al valor máximo de 5, la cantidad de código puede reducirse evitando que se añada 0 a la última de la señal binaria de acuerdo con la realización 1.

Adicionalmente, determinar el número máximo de bins incluidos en la señal binaria de sao_type_idx como 5 aumenta la tolerancia a errores del aparato de decodificación. Más específicamente, cuando se codifica un flujo de bits anormal (señal binaria en la que los "1" consecutivos son infinitos), convencionalmente, el procesamiento de decodificación no finaliza debido a que no aparece ningún 0. Sin embargo, determinar el número máximo de bins a 5 habilita la finalización del procesamiento de decodificación incluso cuando 0 no aparece en la señal binaria.

Adicionalmente, realizar la codificación aritmética de derivación en bins que están en la mitad posterior de la señal binaria y se obtienen de los valores de sao_type_idx habilita la aceleración de la codificación aritmética o la reducción en la carga para la codificación aritmética. De acuerdo con la realización 1, bins de un binIdx que tiene un valor de 2 o mayor se codifican no a través de la codificación aritmética adaptativa según contexto, sino a través de la codificación aritmética de derivación. Como se describe anteriormente, la codificación aritmética de derivación no requiere la carga 0 actualización de un contexto, y el procesamiento puede iniciarse sin esperar a la finalización de la actualización del contexto en las etapas anteriores. Por lo tanto, puede acelerarse el procesamiento o puede reducirse la carga de procesamiento más que la codificación aritmética adaptativa según contexto.

Adicionalmente, de acuerdo con la norma HEVC en NPL 1, la codificación aritmética adaptativa según contexto se realiza en un bin de un binIdx que tiene un valor de 1 o mayor, usando el mismo contexto. Esto es porque las probabilidades de ocurrencia de símbolos (probabilidades de ocurrencia de 1) del bin del binIdx que tiene un valor de 1 mayor son casi las mismas, pero no son iguales al 50 % y tienen un sesgo. En otras palabras, cuando una señal binaria incluye un bin cuyo binIdx es 1 o mayor (valor de sao_type_idx es 1 o mayor), existen muchos casos en los que (a) el bin cuyo binIdx es 1 tiene 0 y la señal binaria no incluye un bin cuyo binIdx es 2 o mayor (valor de sao_type_idx es 1) y (b) no aparece ningún bin que tiene 0 hasta el bin del binIdx que tiene un valor mayor (valor de sao_type_idx es 4 o 5, etc.).

Sin embargo, el experimento en el que se realiza codificación aritmética en un bin cuyo binIdx es 2 o mayor con una probabilidad de ocurrencia de símbolo fija del 50 % reveló que la eficiencia de codificación apenas se degrada. Específicamente, reveló que el valor de sao_type_idx a menudo indica un valor medio (2 o 3, etc.) y la probabilidad de ocurrencia de símbolo del bin cuyo binIdx es 2 o mayor está cerca del 50 %. Por lo tanto, codificar un bin cuyo binIdx es 2 o mayor no a través de la codificación aritmética adaptativa según contexto sino a través de la codificación aritmética de derivación habilita procesamiento acelerado o reducción en la carga de procesamiento mientras se suprime la disminución en la eficiencia de codificación.

Aunque la codificación aritmética de derivación se realiza en un bin cuyo binIdx es 2 o mayor de acuerdo con la realización 1, el procesamiento no se limita a tal. Por ejemplo, un bin cuyo binIdx es 1 o mayor puede codificarse a través de la codificación aritmética de derivación (Variación 1). Por ejemplo, todos los bins incluidos en una señal binaria pueden codificarse a través de la codificación aritmética de derivación (Variación 2).

Como se muestra en la Figura 8, un bin cuyo binIdx es 1 o mayor puede codificarse a través de la codificación aritmética de derivación de acuerdo con la variación 1. En otras palabras, la primera porción de una señal binaria codificada a través de la codificación aritmética adaptativa según contexto se compone del primer bin de la señal binaria. Adicionalmente, la segunda porción de una señal binaria codificada a través de la codificación aritmética de derivación se compone de los restantes bins de la señal binaria. Adicionalmente, todos los bins se codifican a través de la codificación aritmética de derivación de acuerdo con la variación 2.

A continuación en el presente documento, se describirá el resultado del experimento de acuerdo con la realización 1 y las variaciones 1 y 2. En el experimento se usó el software de prueba de acuerdo con la norma HEVC en el que se adaptaron un procedimiento de realización de codificación aritmética de derivación en un bin cuyo binIdx es 2 o mayor (Realización 1), un procedimiento de realización de codificación aritmética de derivación en un bin cuyo binIdx es 1 o mayor (Variación 1) y un procedimiento de realización de codificación aritmética de derivación en todos los bins (Variación 2).

La Figura 9 es una tabla que muestra un resultado del experimento en el que se comparan las eficiencias de codificación entre la técnica convencional y la realización 1 y las variaciones 1 y 2. Las condiciones de experimento siguen las condiciones de experimento comunes de la organización de norma HEVC. Los valores de la Figura 9 son resultados en los primeros 49 fotogramas en una imagen de prueba. Cuanto mayor sea el valor, menor será la eficiencia de codificación. El valor negativo indica una mejora en la eficiencia de codificación en comparación con la técnica convencional (NPL1).

Como se ilustra en la Figura 9, los valores varían entre -0,1 y 0,1 % en todas las condiciones, de acuerdo con la realización 1 y la variación 1. En otras palabras, la eficiencia de codificación apenas cambia independientemente del procesamiento acelerado por la codificación aritmética de derivación de acuerdo con la realización 1 y la variación 1.

Adicionalmente, aunque la eficiencia de codificación de la variación 2 es menor que las de la realización 1 y la variación 1, los valores están dentro del 1 %. Adicionalmente, la eficiencia de codificación apenas disminuye bajo la condición AI en la que todos los fotogramas se intra codifican.

Por lo tanto, el procedimiento de codificación de acuerdo con la variación 2 puede usarse cuando se prioriza el procesamiento acelerado incluso con una ligera reducción en la eficiencia de codificación y con frecuencia se aplica intra codificación. De lo contrario, las imágenes en movimiento pueden codificarse en los procedimientos de codificación de acuerdo con la realización 1 y la variación 1.

En este punto, un bin cuyo binIdx es 2 o menor puede codificarse a través de la codificación aritmética adaptativa según contexto, y un bin cuyo binIdx es 3 o mayor puede codificarse a través de la codificación aritmética de derivación.

Aunque la realización 1 usa sao_type_idx para identificar un tipo de un procedimiento de SAO y sao_offset que indica un valor de un valor de desplazamiento de SAO como parámetros de SAO, los parámetros de SAO no se limitan a tales. Los parámetros de SAO pueden incluir, por ejemplo, un parámetro que indica información auxiliar para clasificar píxeles. Adicionalmente, los parámetros de SAO pueden incluir sao_offset_sign que representa un bit de signo (positivo y negativo) de sao_offset.

Adicionalmente, sao_type_idx puede incluir información que indica la no ejecución de ningún procedimiento de SAO. Por ejemplo, cuando el valor de sao_type_idx es igual a 0, el procedimiento de SAO no tiene que realizarse siempre en un bloque reconstruido.

Adicionalmente, aunque el parámetro de SAO se codifica por bloque de acuerdo con la realización 1, la codificación no se limita a tal. El parámetro de SAO puede codificarse en una por unidad menor que el bloque. A la inversa, el parámetro de SAO puede codificarse en una por unidad obtenida concatenando bloques. Adicionalmente, el parámetro de SAO no se codifica en un bloque actual, sino que en su lugar, puede copiarse y usarse un valor de un parámetro de SAO de otro bloque.

Adicionalmente, aunque sao_type_idx toma valores de 0 a 5 de acuerdo con la realización 1, los valores no se limitan a tales. El valor máximo de sao_type_idx puede ser 6 o mayor o 4 o menor.

Por ejemplo, lo siguiente describirá un caso en el que el valor máximo de sao_type_idx es 2. En otras palabras, el caso en el que el número de tipos de procedimientos de SAO es tres.

La Figura 10 es una tabla que indica una correspondencia entre señales no binarias (sao_type_idx) y señales binarias de acuerdo con la variación 3. Adicionalmente, la Figura 11 es una tabla que indica una correspondencia entre los binIdx y un contexto de acuerdo con la variación 3.

Por ejemplo, cuando el valor de sao_type_idx es igual a 0, el procedimiento de SAO no se aplica a un bloque reconstruido de acuerdo con la variación 3. Adicionalmente, cuando el valor de sao_type_idx es igual a 1, se aplica un primer procedimiento de SAO al bloque reconstruido. Adicionalmente, cuando el valor de sao_type_idx es igual a 2, se aplica un segundo procedimiento de SAO al bloque reconstruido.

El primer procedimiento de SAO es, por ejemplo, un procedimiento de desplazamiento de banda. Adicionalmente, el segundo procedimiento de SAO es, por ejemplo, un procedimiento de desplazamiento de borde. En el procedimiento de desplazamiento de borde, se determina una categoría a la que pertenece cada uno de los píxeles, a base de una diferencia entre un valor de píxel del píxel y un valor de píxel de un píxel adyacente al píxel. Adicionalmente, en el procedimiento de desplazamiento de banda, un intervalo de posibles valores de píxel se divide en bandas, y una categoría a la que pertenece cada uno de los píxeles se determina a base de la banda a la que pertenece el valor de píxel del píxel. Dado que NPL1 y otros desvelan los detalles del procedimiento de desplazamiento de borde y el procedimiento de desplazamiento de banda, se omiten los detalles en el presente documento.

Como se muestra en las Figuras 10 y 11, el primer bin (binIdx = 0, la primera porción) de una señal binaria se codifica a través de la codificación aritmética adaptativa según contexto de acuerdo con la variación 3. Adicionalmente, los restantes bins (binIdx = 1, la segunda porción) de la señal binaria se codifican a través de la codificación aritmética de derivación.

En este punto, únicamente cuando el valor de sao_type_idx es igual a 0, el primer bin tiene 0. De lo contrario, el primer bin tiene 1. En otras palabras, la primera porción de una señal binaria indica si el valor de sao_type_idx es o no igual a un valor predeterminado de 0. En otras palabras, la primera porción de la señal binaria indica si el procedimiento de SAO se aplica o no a un bloque reconstruido. Como tal, una porción que indica si el procedimiento de SAO se aplica o no a un bloque reconstruido se codifica a través de la codificación aritmética adaptativa según contexto, y (ii) las otras porciones se codifican a través de la codificación aritmética de derivación. Estos procedimientos habilitan un procesamiento acelerado o reducción en la carga de procesamiento mientras se suprime la disminución en la eficiencia de codificación.

Los procedimientos de codificación de acuerdo con la realización 1 y las variaciones 1 a 3 pueden aplicarse no únicamente a sao_type_idx, sino a las otras sintaxis que se añaden a un flujo de bits. Por consiguiente, puede estandarizarse el procesamiento realizado por una unidad de codificación de longitud variable.

La codificación aritmética de derivación puede realizarse en una segunda porción de una señal binaria que corresponde a, por ejemplo, sao_offset que indica un valor de desplazamiento de SAO, ref_idx que indica un índice de una imagen de referencia, merge_idx para identificar un candidato que hay que usar en inter predicción de entre una lista de candidatos, cada uno de los cuales incluye al menos un vector de movimiento, o mpm_idx o intra_chroma_pred_mode para identificar un modo de intra predicción. Dado que NPL1 desvela sao_offset, ref_idx, merge_idx, mpm_idx e intra_chroma_pred_mode, se omiten los detalles en el presente documento. De acuerdo con la presente invención, se realiza codificación aritmética de derivación en una segunda porción de al menos una de una señal binaria que corresponde a un parámetro que identifica un modo de intra predicción y una señal binaria que corresponde a un parámetro que identifica un candidato que hay que usar en inter predicción de entre una lista de candidatos, cada uno de los cuales incluye al menos un vector de movimiento.

En otras palabras, la longitud de bits de la primera porción de la primera señal binaria es idéntica a la longitud de bits de la primera porción de la segunda señal binaria. En este punto, la primera señal binaria es una señal binaria obtenida binarizando un valor de un parámetro (sao_type_idx) para identificar un tipo de un procedimiento de desplazamiento de muestra. Adicionalmente, la segunda señal binaria es una señal binaria obtenida binarizando al menos uno de (i) un parámetro (por ejemplo, intra_chroma_pred_mode) para identificar un modo de intra predicción y (ii) un parámetro (por ejemplo, merge_idx) para identificar un candidato que hay que usar en inter predicción de entre una lista de candidatos, cada uno de los cuales incluye al menos un vector de movimiento.

Como tal, estandarizar, para sao_type_idx y las otras sintaxis, una porción en la que se realiza la codificación aritmética de derivación habilita no únicamente el procesamiento acelerado, sino también la simplificación de la configuración de un aparato con el uso común de una unidad de codificación de longitud variable.

Adicionalmente, aunque el tamaño mínimo de los bloques es 4 x 4 píxeles y el tamaño máximo de los bloques es 32 x 32 píxeles, los tamaños no se limitan a tales. Adicionalmente, el tamaño de los bloques no tiene que ser variable y puede ser fijo.

Adicionalmente, el procedimiento de desplazamiento de muestra no se limita al procedimiento de SAO descrito en NPL1. En otras palabras, el procedimiento de desplazamiento de muestra puede ser cualquier procedimiento siempre que se desplaza un valor de muestra (valor de píxel) de una imagen reconstruida.

(Realización 2)

A continuación, se describirá la realización 2. La realización 2 describirá la decodificación de una imagen codificada en el procedimiento de codificación de instantáneas en movimiento de acuerdo con la realización 1. En particular, la realización 2 describirá la realización de decodificación aritmética en un parámetro que se codifica de acuerdo con la realización 1 y es para identificar un tipo de un procedimiento de desplazamiento de muestra.

<Configuración global>

La Figura 12 ilustra una configuración de un aparato 200 de decodificación de instantáneas en movimiento de acuerdo con la realización 2. El aparato 200 de decodificación de instantáneas en movimiento decodifica una instantánea codificada por bloque.

Como se ilustra en la Figura 12, el aparato 200 de decodificación de instantáneas en movimiento incluye una unidad 201 de decodificación de longitud variable de parámetro de SAO, una unidad 202 de decodificación de longitud variable de coeficiente, una unidad 203 de transformación inversa, una unidad 204 de predicción, una unidad 205 de adición, una unidad 206 de procesamiento de SAO, una unidad 207 de combinación de bloques y una memoria 208 de fotograma.

A continuación, se describirán las operaciones del aparato 200 de decodificación de instantáneas en movimiento con la configuración. La Figura 13 muestra procedimientos realizados por el aparato 200 de decodificación de instantáneas en movimiento de acuerdo con la realización 2.

(Etapa 201)

La unidad 201 de decodificación de longitud variable de parámetro de SAO realiza decodificación de longitud variable (decodificación por entropía) en un parámetro de SAO codificado incluido en un flujo de bits.

(Etapa 202)

La unidad 202 de decodificación de longitud variable de coeficiente realiza decodificación de longitud variable en coeficientes de frecuencia codificados incluidos en el flujo de bits para emitir los coeficientes de frecuencia a la unidad 203 de transformación inversa.

(Etapa 203)

La unidad 203 de transformación inversa transforma inversamente los coeficientes de frecuencia en datos de píxel para generar un bloque residual.

(Etapa 204)

La unidad 204 de predicción genera un bloque de predicción, a base de una instantánea que se almacena en la memoria 208 de fotograma y ya ha sido decodificada.

(Etapa 205)

La unidad 205 de adición añade el bloque residual al bloque de predicción para generar un bloque reconstruido. (Etapa 206)

La unidad 206 de procesamiento de SAO clasifica píxeles incluidos en el bloque reconstruido en categorías, de acuerdo con el parámetro de SAO. A continuación, la unidad 206 de procesamiento de SAO añade un correspondiente valor de desplazamiento para cada una de las categorías. En otras palabras, la unidad 206 de procesamiento de SAO aplica el procedimiento de SAO al bloque reconstruido usando el parámetro de SAO. En este punto, los parámetros de SAO incluyen un parámetro (sao_type_idx) para identificar un tipo de un procedimiento de SAO y un parámetro (sao_offset) que indica un valor de desplazamiento.

El procedimiento de SAO no tiene que realizarse siempre. Por ejemplo, cuando el valor de sao_type_idx es igual a un valor predeterminado, el procedimiento de SAO no tiene que realizarse.

(Etapa 207)

Los procedimientos de las etapas S201 a S206 se repiten hasta que se completa el procesamiento en todos los bloques incluidos en la instantánea a codificar.

(Etapa 208)

La unidad 207 de combinación de bloques combina los bloques para generar una instantánea decodificada. Adicionalmente, la unidad 207 de combinación de bloques almacena la instantánea decodificada en la memoria 208 de fotograma.

Los detalles de la unidad 201 de decodificación de longitud variable de parámetro de SAO y el procedimiento (etapa 201) se describirán a continuación en el presente documento.

<Configuración de la unidad de decodificación de longitud variable de parámetro de SAO>

La Figura 14 ilustra una configuración interna de la unidad 201 de decodificación de longitud variable de parámetro de SAO de acuerdo con la realización 2. Como se ilustra en la Figura 14, la unidad 201 de decodificación de parámetros de SAO incluye una unidad 221 de decodificación de sao_type_idx y una unidad 222 de decodificación de sao_offset. <Operaciones (parámetro de SAO decodificación de longitud variable)>

A continuación, se describirán las operaciones de la unidad 201 de decodificación de longitud variable de parámetro de SAO con la configuración. La Figura 15 muestra procedimientos realizados por la unidad 201 de decodificación de longitud variable de parámetro de SAO de acuerdo con la realización 2.

(Etapa 221)

La unidad 221 de decodificación de sao_type_idx decodifica sao_type_idx codificado.

(Etapa 222)

La unidad 222 de decodificación de sao_offset decodifica sao_offset codificado.

Los detalles de la unidad 221 de decodificación de sao_type_idx y la operación (etapa S221) se describirán a continuación en el presente documento.

<Configuración de la unidad de decodificación de sao_type_idx>

La Figura 16 ilustra una configuración interna de la unidad 221 de decodificación de sao_type_idx de acuerdo con la realización 2. Como se ilustra en la Figura 16, la unidad 221 de decodificación de sao_type_idx incluye una unidad 240 de decodificación aritmética de sao_type_idx y una unidad 250 de binarización inversa de sao_type_idx.

La unidad 240 de decodificación aritmética de sao_type_idx decodifica al menos una porción codificada de una señal binaria que corresponde un sao_type_idx para identificar un tipo de un procedimiento de SAO que hay que aplicar a un bloque reconstruido, a través de decodificación aritmética de derivación. Como se ilustra en la Figura 16, la unidad 240 de decodificación aritmética de sao_type_idx incluye una unidad 241 de conmutación de decodificación aritmética, una primera unidad 242 de decodificación aritmética adaptativa según contexto, una segunda unidad 243 de decodificación aritmética adaptativa según contexto y una unidad 244 de decodificación aritmética de derivación.

La unidad 250 de binarización inversa de sao_type_idx convierte la señal binaria decodificada en el valor de sao_type_idx. Como se ilustra en la Figura 16, la unidad 250 de binarización inversa de sao_type_idx incluye una unidad 251 de determinación de último bin y una unidad 252 de establecimiento de sao_type_idx.

A continuación, se describirán detalles de las operaciones realizadas por la unidad 221 de decodificación de sao_type_idx con la configuración. La Figura 17 muestra procedimientos realizados por la unidad 221 de decodificación de sao_type_idx de acuerdo con la realización 2.

(Etapas S241 a S246)

La unidad 241 de conmutación de decodificación aritmética determina un valor de un binIdx de un bin a procesar. A continuación, la unidad 241 de conmutación de decodificación aritmética conmuta una unidad de procesamiento (elemento constituyente) que realiza una decodificación aritmética en un bin codificado, a base del valor determinado del binIdx. Más específicamente, la unidad 241 de conmutación de decodificación aritmética conmuta a la primera unidad 242 de decodificación aritmética adaptativa según contexto cuando el valor del binIdx es igual a 0. Más específicamente, la unidad 241 de conmutación de decodificación aritmética conmuta a la segunda unidad 243 de decodificación aritmética adaptativa según contexto cuando el valor del binIdx es igual a 1. Adicionalmente, la unidad 241 de conmutación de decodificación aritmética conmuta a la unidad 244 de decodificación aritmética de derivación cuando el valor del binIdx no es igual ni a 0 ni a 1.

En otras palabras, la primera unidad 242 de decodificación aritmética adaptativa según contexto realiza decodificación aritmética en un bin codificado del binIdx que tiene 0, usando el contexto 0. Adicionalmente, la segunda unidad 243 de decodificación aritmética adaptativa según contexto realiza decodificación aritmética en un bin codificado del binIdx que tiene 1, usando el contexto 1. Adicionalmente, la unidad de codificación aritmética de derivación 244 realiza decodificación aritmética en un bin del binIdx que tiene un valor de 2 o mayor, usando una probabilidad fija del 50 % sin usar ningún contexto.

En este punto, un conjunto de bins (bins identificados por los binIdx que tienen 0 y 1 de acuerdo con la realización 2) codificados a través de la codificación aritmética adaptativa según contexto se denomina como una primera porción de una señal binaria. Adicionalmente, un conjunto de bins (bins identificados por los binIdx, teniendo cada uno un valor de 2 o mayor de acuerdo con la realización 2) codificados a través de la codificación aritmética de derivación se denomina como una segunda porción de la señal binaria.

En otras palabras, la primera porción codificada de la señal binaria se codifica a través de la decodificación aritmética adaptativa según contexto de acuerdo con la realización 2. Adicionalmente, cuando la señal binaria incluye la segunda porción posterior a la primera porción, la segunda porción codificada de la señal binaria se codifica a través de la decodificación aritmética de derivación.

(Etapas S247 y S248)

Cuando el bin que resulta de la decodificación aritmética es 0 o el valor del binIdx es igual a 4, la unidad 251 de determinación de último bin completa la decodificación aritmética en el bin codificado, y los procedimientos continúan a la etapa S249. Cuando el valor del bin es igual a 1 y el valor del binIdx es 3 o menor, la unidad 251 de determinación de último bin añade 1 al valor del binIdx, y los procedimientos continúan a la etapa S242.

(Etapas S249 a S251)

La unidad 252 de establecimiento de sao_type_idx establece el valor del binIdx a sao_type_idx. Adicionalmente, cuando el valor del binIdx es igual a 4 y el valor del bin es 1, la unidad 252 de establecimiento de sao_type_idx establece 5 a sao_type_idx. Con las etapas S249 a S251, una señal binaria puede convertirse a 5 que es el valor de sao_type_idx incluso cuando no hay ningún 0 al final de la señal binaria. La correspondencia entre las señales no binarias y las señales binarias es la misma que se muestra en la Figura 7 de acuerdo con la realización 1.

De acuerdo con la realización 2, puede decodificarse el sao_type_idx codificado en la realización 1. En otras palabras, puede decodificarse al menos una porción codificada de una señal binaria que corresponde a un valor de sao_type_idx a través de la decodificación aritmética de derivación. Por lo tanto, pueden producirse las mismas ventajas que las de acuerdo con la realización 1. Por ejemplo, puede acelerarse el procesamiento o puede reducirse la carga de procesamiento mientras puede suprimirse la disminución en la eficiencia de codificación.

Por lo tanto, pueden aplicarse las mismas variaciones que las de acuerdo con la realización 1 a la realización 2. En otras palabras, el sao_type_idx codificado puede decodificarse como se muestra en las Figuras 8, 10 y 11 de acuerdo con las variaciones 1 a 3.

Adicionalmente, la decodificación aritmética de derivación puede realizarse en la segunda porción codificada de una señal binaria que corresponde a, por ejemplo, sao_offset que indica un valor de desplazamiento de SAO, ref_idx que indica un índice de una imagen de referencia, merge_idx para identificar un candidato que hay que usar en inter predicción de entre una lista de candidatos, cada uno de los cuales incluye al menos un vector de movimiento, o mpm_idx o intra_chroma_pred_mode para identificar un modo de intra predicción, también en la realización 2. De acuerdo con la presente invención, se realiza una decodificación aritmética de derivación en la segunda porción codificada de al menos una de una señal binaria que corresponde a un parámetro que identifica un modo de intra predicción y una señal binaria que corresponde a un parámetro que identifica un candidato que hay que usar para inter predicción de entre una lista de candidatos, cada uno de los cuales incluye al menos un vector de movimiento. En otras palabras, la longitud de bits de la primera porción de la primera señal binaria puede ser idéntica a la longitud de bits de la primera porción de la segunda señal binaria.

El aparato de codificación de instantáneas en movimiento ni tiene que incluir una parte de los elementos constituyentes en la Figura 1 ni realizar una parte de las etapas en la Figura 2. Adicionalmente, el aparato de decodificación de instantáneas en movimiento ni tiene que incluir una parte de los elementos constituyentes en la Figura 12 ni realizar una parte de las etapas en la Figura 13. A continuación en el presente documento, se describirá uno de los ejemplos de tal aparato de codificación de instantáneas en movimiento y aparato de decodificación de instantáneas en movimiento.

La Figura 18A ilustra una configuración de un aparato 300 de codificación de instantáneas en movimiento de acuerdo con otra realización. Adicionalmente, la Figura 18B muestra procedimientos realizados por el aparato 300 de codificación de instantáneas en movimiento de acuerdo con la otra realización.

El aparato 300 de codificación de instantáneas en movimiento incluye una unidad 301 de binarización (binarizador) y una unidad 302 de codificación aritmética (codificador aritmético).

La unidad 301 de binarización corresponde a la unidad 140 de binarización de sao_type_idx de acuerdo con la realización 1. La unidad 301 de binarización convierte un valor de un parámetro para identificar un tipo de un procedimiento de desplazamiento de muestra en una señal binaria (S301).

La unidad 302 de codificación aritmética corresponde a la unidad 150 de codificación aritmética de sao_type_idx de acuerdo con la realización 1. La unidad 302 de codificación aritmética codifica al menos una porción de una señal binaria a través de codificación aritmética de derivación usando una probabilidad fija (S302).

Dado que el aparato 300 de codificación de instantáneas en movimiento puede codificar al menos una porción de una señal binaria que corresponde a un parámetro para identificar un tipo de un procedimiento de desplazamiento de muestra, a través de codificación aritmética de derivación, puede acelerarse el procesamiento o puede reducirse la carga de procesamiento mientras puede suprimirse la disminución en la eficiencia de codificación.

La Figura 19A ilustra una configuración de un aparato 400 de decodificación de instantáneas en movimiento de acuerdo con la otra realización. Adicionalmente, la Figura 19B muestra procedimientos realizados por el aparato 400 de decodificación de instantáneas en movimiento de acuerdo con la otra realización.

El aparato 400 de decodificación de instantáneas en movimiento incluye una unidad 401 de decodificación aritmética (decodificador aritmético) y una unidad 402 de binarización inversa (binarizador inverso).

La unidad 401 de decodificación aritmética corresponde a la unidad 240 de decodificación aritmética de sao_type_idx de acuerdo con la realización 2. La unidad 401 de decodificación aritmética decodifica al menos una porción codificada de una señal binaria que corresponde a un parámetro para identificar un tipo de un procedimiento de desplazamiento de muestra que hay que aplicar a un bloque reconstruido obtenido a partir de una imagen codificada, a través de decodificación aritmética de derivación (S401).

La unidad 402 de binarización inversa corresponde a la unidad 250 de binarización inversa de sao_type_idx de acuerdo con la realización 2. La unidad 402 de binarización inversa convierte la señal binaria decodificada en un valor del parámetro para identificar el tipo del procedimiento de desplazamiento de muestra (S402).

Dado que el aparato 400 de decodificación de instantáneas en movimiento puede decodificar al menos una porción codificada de una señal binaria que corresponde a un parámetro para identificar un tipo de un procedimiento de desplazamiento de muestra, a través de decodificación aritmética de derivación, puede acelerarse el procesamiento o puede reducirse la carga de procesamiento mientras puede suprimirse la disminución en la eficiencia de codificación.

En general, en cada una de las realizaciones, cada uno de los bloques funcionales puede implementarse mediante, por ejemplo, una MPU y una memoria. Adicionalmente, en general, el procesamiento por cada uno de los bloques funcionales puede implementarse mediante software (un programa), y tal software se graba en un medio de grabación tal como una ROM. Además, tal software puede distribuirse, por ejemplo, descargando y grabando el mismo en medios de grabación, tales como CD-ROM. Cada uno de los bloques funcionales puede implementarse mediante hardware (un circuito especializado).

El procesamiento descrito en cada una de las realizaciones puede realizarse como un procesamiento centralizado por un único aparato (sistema) o puede realizarse como un procesamiento descentralizado mediante una pluralidad de aparatos. En este punto, el programa puede ejecutarse mediante uno o más componentes. En otras palabras, puede realizarse uno cualquiera del procesamiento centralizado y el procesamiento descentralizado.

Adicionalmente, cada uno de los elementos constituyentes de acuerdo con cada una de las realizaciones 1 y 2 puede implementarse mediante hardware especializado o ejecutando un programa de software apropiado para el elemento constituyente. Cada uno de los elementos constituyentes puede implementarse por una unidad de ejecución de programa, tal como una unidad central de procesamiento (CPU) y un procesador, leyendo y ejecutando el programa de software grabado en un medio de grabación, tal como un disco duro o una memoria de semiconductores.

Específicamente, cada uno del aparato de codificación de instantáneas en movimiento y del aparato de decodificación de instantáneas en movimiento incluye circuitería de control y almacenamiento eléctricamente conectado a (con capacidad de acceso desde) la circuitería de control. La circuitería de control puede incluir al menos uno del hardware especializado y la unidad de ejecución de programa. Adicionalmente, cuando la circuitería de control incluye la unidad de ejecución de programa, el almacenamiento puede almacenar el programa de software ejecutado por la unidad de ejecución de programa.

En este punto, el software que implementa el aparato de codificación de instantáneas en movimiento y el aparato de decodificación de instantáneas en movimiento de acuerdo con cada una de las realizaciones 1 y 2 es el siguiente programa.

Específicamente, el programa provoca que un ordenador ejecute un procedimiento de codificación de instantáneas en movimiento de codificación de una imagen de entrada, incluyendo el procedimiento: convertir un valor de un primer parámetro en una primera señal binaria, identificando el primer parámetro un tipo de un procedimiento de desplazamiento de muestra que hay que aplicar a una imagen reconstruida que corresponde a la imagen de entrada; y codificar al menos una porción de la primera señal binaria a través de codificación aritmética de derivación usando una probabilidad fija.

Adicionalmente, el programa provoca que un ordenador ejecute un procedimiento de decodificación de instantáneas en movimiento de decodificación de una imagen codificada, incluyendo el procedimiento: decodificar al menos una porción codificada de una primera señal binaria a través de decodificación aritmética de derivación usando una probabilidad fija, la primera señal binaria que corresponde a un valor de un primer parámetro que identifica un tipo de un procedimiento de desplazamiento de muestra que hay que aplicar a una imagen reconstruida obtenida de la imagen codificada; y convertir la primera señal binaria decodificada en el valor del primer parámetro.

(Realización 3)

Un sistema informático independiente puede realizar fácilmente el procesamiento descrito en cada una de las realizaciones grabando, en un medio de grabación, un programa para implementar la estructura del procedimiento de codificación de instantáneas en movimiento (procedimiento de codificación de imágenes) o el procedimiento de decodificación de instantáneas en movimiento (procedimiento de decodificación de imágenes) de acuerdo con la realización. El medio de grabación puede ser cualquiera siempre que el programa pueda grabarse en el mismo, tal como un disco magnético, un disco óptico, un disco óptico magnético, una tarjeta de CI y una memoria de semiconductores.

A continuación en el presente documento, se describirán aplicaciones del procedimiento de codificación de instantáneas en movimiento (procedimiento de codificación de imágenes) y el procedimiento de decodificación de instantáneas en movimiento (procedimiento de decodificación de imágenes) de acuerdo con cada una de las realizaciones y un sistema que usa tales aplicaciones. Incluyendo las características de sistema un aparato de codificación de imágenes que usa el procedimiento de codificación de imágenes, e incluyendo un aparato de codificación y decodificación de imágenes un aparato de decodificación de imágenes que usa el procedimiento de decodificación de imágenes. Las otras configuraciones del sistema pueden cambiarse de forma apropiada dependiendo del caso.

La Figura 20 ilustra una configuración global de un sistema ex100 de suministro de contenido para implementar servicios de distribución de contenido. El área para proporcionar servicios de comunicación se divide en células del tamaño deseado, y las estaciones ex106 a ex110 base que son estaciones inalámbricas fijas se sitúan en cada una de las células.

El sistema ex100 de suministro de contenido se conecta a dispositivos, tales como un ordenador ex111, un asistente ex112 digital personal (PDA), una cámara ex113, un teléfono ex114 celular y una máquina ex115 de juegos, mediante Internet ex101, un proveedor ex102 de servicios de Internet, una red ex104 de telefonía, así como a las estaciones ex106 a ex110 base.

Sin embargo, la configuración del sistema ex100 de suministro de contenido no se limita a la configuración mostrada en la Figura 20, y es aceptable una combinación en la que se conecta cualquiera de los elementos. Además, cada uno de los dispositivos puede conectarse directamente a la red ex104 de telefonía, en lugar de mediante las estaciones ex106 a ex110 base que son las estaciones inalámbricas fijas. Adicionalmente, los dispositivos pueden interconectarse entre sí a través de una comunicación inalámbrica de corta distancia y otras.

La cámara ex113, tal como una cámara digital de vídeo, es capaz de capturar imágenes en movimiento. Una cámara ex116, tal como una cámara digital de vídeo, es capaz de capturar tanto imágenes fijas como imágenes en movimiento. Adicionalmente, el teléfono ex114 celular puede ser el que cumple cualquiera de las normas tales como el Sistema Global para Comunicación Móvil (GSM), Acceso Múltiple por División de Código (CDMA), Acceso Múltiple por División de Código de Banda Ancha (W-CD-CDMA), Evolución a Largo Plazo (LTE) y Acceso por Paquetes a Alta Velocidad (HSPA). Como alternativa, el teléfono ex114 celular puede ser un Sistema Móvil Personal (PHS).

En el sistema ex100 de suministro de contenido, un servidor ex103 de envío por difusión en continuo se conecta a la cámara ex113 y a otros a través de la red ex104 de telefonía y la estación ex109 base, que posibilita la distribución de un espectáculo en directo y otros. Para una distribución de este tipo, un contenido (por ejemplo, vídeo de un espectáculo en directo de música) capturado por el usuario que usa la cámara ex113 se codifica como se ha descrito anteriormente en cada una de las realizaciones, y el contenido codificado se transmite al servidor ex103 de flujo continuo. Por otra parte, el servidor ex103 de difusión en continuo efectúa distribución de flujo de los datos de contenido recibidos a los clientes tras sus solicitudes. Los clientes incluyen el ordenador ex111, el p Da ex112, la cámara ex113, el teléfono ex114 celular y la máquina ex115 de juegos que son capaces de decodificar los datos codificados anteriormente mencionados. Cada uno de los dispositivos que han recibido los datos distribuidos decodifica y reproduce los datos codificados (es decir, funciona como el aparato de decodificación de imágenes de acuerdo con un aspecto de la presente invención).

Los datos capturados pueden codificarse por la cámara ex113 o el servidor ex103 de difusión en continuo que transmite los datos, o los procedimientos de codificación pueden compartirse entre la cámara ex113 y el servidor ex103 de difusión en continuo. De manera similar, los datos distribuidos pueden decodificarse por los clientes o el servidor ex103 de difusión en continuo, o los procedimientos de decodificación pueden compartirse entre los clientes y el servidor ex103 de difusión en continuo. Adicionalmente, los datos de las imágenes fijas y las imágenes en movimiento capturadas no solo por la cámara ex113 sino también por la cámara ex116 pueden transmitirse al servidor de flujo continuo ex103 a través del ordenador ex111. Los procedimientos de codificación pueden realizarse por la cámara ex116, el ordenador ex111 o el servidor ex103 de difusión en continuo, o compartirse entre ellos.

Adicionalmente, en general, el ordenador ex111 y un LSI ex500 incluido en cada uno de los dispositivos realizan dichos procedimientos de codificación y decodificación. El LSI ex500 puede estar configurado de un único chip o una pluralidad de chips. El software de codificación y decodificación de instantáneas en movimiento puede integrarse en algún tipo de un medio de grabación (tal como un CD-ROM, un disco flexible, un disco duro) que es legible por el ordenador ex111 y otros, y los procedimientos de codificación y decodificación pueden realizarse usando el software. Adicionalmente, cuando el teléfono ex114 celular está equipado con una cámara, pueden transmitirse los datos de vídeo obtenidos por la cámara. Los datos de vídeo son datos codificados por el LSI ex500 incluido en el teléfono ex114 celular.

Adicionalmente, el servidor ex103 de difusión en continuo puede componerse de servidores y ordenadores, y puede descentralizar los datos y procesar los datos descentralizados, grabar o distribuir los datos.

Como se ha descrito anteriormente, los clientes pueden recibir y reproducir los datos codificados en el sistema ex100 de suministro de contenido. En otras palabras, los clientes pueden recibir y decodificar información transmitida por el usuario, y reproducir los datos decodificados en tiempo real en el sistema ex100 de suministro de contenido, de modo que el usuario que no tiene ningún derecho ni equipo particulares puede implementar difusión personal.

La presente invención no se limita al contenido mencionado anteriormente que proporciona el sistema ex100, y al menos o bien el aparato de codificación de imagen en movimiento (aparato de codificación de imágenes) o el aparato de decodificación de imágenes en movimiento (aparato de decodificación de imágenes) descrito en cada una de las Realizaciones se pueden incorporar en un sistema ex200 de difusión digital como se muestra en la Figura 21. Más específicamente, una estación ex201 de difusión comunica o transmite a través de ondas de radio a un satélite ex202 de difusión datos multiplexados obtenidos multiplexando los datos de audio en los datos de vídeo. Los datos de vídeo son datos de acuerdo con el procedimiento de codificación de instantáneas en movimiento descrito en cada una de las realizaciones (es decir, datos codificados por el aparato de codificación de imágenes de acuerdo con el aspecto de la presente invención). Tras la recepción de los datos de vídeo, el satélite ex202 de difusión transmite ondas de radio para difusión. A continuación, una antena ex204 de uso doméstico capaz de recibir una difusión por satélite recibe las ondas de radio. Un dispositivo, tal como una televisión ex300 (receptor) y un decodificador ex217 de salón (STB), decodifica los datos multiplexados recibidos, y reproduce los datos (es decir, funciona como el aparato de decodificación de imágenes de acuerdo con el aspecto de la presente invención).

Adicionalmente, un lector/grabador ex218 que (i) lee y decodifica los datos multiplexados grabados en un medio ex215 de grabación, tal como un DVD y un BD, o (ii) codifica señales de vídeo en el medio ex215 de grabación y, en algunos casos, escribe datos obtenidos multiplexando una señal de audio en los datos codificados puede incluir el aparato de decodificación de instantáneas en movimiento o el aparato de codificación de instantáneas en movimiento como se muestra en cada una de las realizaciones. En este caso, las señales de vídeo reproducidas se visualizan en el monitor ex219, y otro aparato o sistema puede reproducir las señales de vídeo, usando el medio ex215 de grabación en el que se graban los datos multiplexados. Adicionalmente, también es posible implementar el aparato de decodificación de instantáneas en movimiento en el decodificador ex217 de salón conectado al cable ex203 para una televisión por cable o la antena ex204 para difusión por satélite y/o terrestre, para visualizar las señales de vídeo en el monitor ex219 de la televisión ex300. El aparato de decodificación de instantáneas en movimiento puede incluirse no en el decodificador de salón, sino en la televisión ex300.

La Figura 22 ilustra la televisión ex300 (receptor) que usa el procedimiento de codificación de instantáneas en movimiento y el procedimiento de decodificación de instantáneas en movimiento descritos en cada una de las realizaciones. La televisión ex300 incluye: un sintonizador ex301 que obtiene o proporciona datos multiplexados obtenidos multiplexando los datos de audio y los datos de vídeo, a través de la antena ex204 o el cable ex203, etc. que recibe una difusión; una unidad ex302 de modulación/demodulación que demodula los datos multiplexados recibidos o modula datos en datos multiplexados a suministrar al exterior; y una unidad de multiplexación/demultiplexación ex303 que demultiplica los datos multiplexados modulados en datos de vídeo y datos de audio, o multiplexa datos de vídeo y datos de audio codificados por una unidad ex306 de procesamiento de señal en datos.

Adicionalmente, la televisión ex300 incluye adicionalmente: una unidad ex306 de procesamiento de señales que incluye una unidad ex304 de procesamiento de señales de audio y una unidad ex305 de procesamiento de señales de vídeo que decodifican datos de audio y datos de vídeo y codifican datos de audio y datos de vídeo, respectivamente (que funcionan como el aparato de codificación de imágenes o el aparato de decodificación de imágenes de acuerdo con el aspecto de la presente invención); un altavoz ex307 que proporciona la señal de audio decodificada; y una unidad de salida ex309 que incluye una unidad de visualización ex308 que muestra la señal de vídeo decodificada, tal como un visualizador. Adicionalmente, la televisión ex300 incluye una unidad ex317 de interfaz que incluye una unidad ex312 de entrada de operación que recibe una entrada de una operación de usuario. Adicionalmente, la televisión ex300 incluye una unidad ex310 de control que controla en general cada elemento constituyente de la televisión ex300 y una unidad ex311 de circuito de fuente de alimentación que suministra potencia a cada uno de los elementos. Además de la unidad ex312 de entrada de operación, la unidad ex317 de interfaz puede incluir: un puente ex313 que se conecta a un dispositivo externo, tal como el lector/grabador ex218; una unidad ex314 de ranura para posibilitar la conexión del medio ex216 de grabación, tal como una tarjeta de SD; un controlador ex315 para conectarse a un medio de grabación externo, tal como un disco duro; y un módem ex316 para conectarse a una red de telefonía. En este punto, el medio ex216 de grabación puede grabar eléctricamente información usando un elemento de memoria de semiconductores no volátil/volátil para almacenamiento. Los elementos constituyentes de la televisión ex300 están conectados entre sí a través de un bus síncrono.

En primer lugar, se describirá la configuración en la que la televisión ex300 decodifica datos multiplexados obtenidos desde el exterior a través de la antena ex204 y otros y reproduce los datos decodificados. En la televisión ex300, después de la recepción de una operación de un usuario desde un controlador ex220 remoto y otros, la unidad ex303 de multiplexación/demultiplexación demultiplexa los datos multiplexados demodulados por la unidad ex302 de modulación/demodulación, bajo el control de la unidad ex310 de control que incluye una CPU. Adicionalmente, la unidad ex304 de procesamiento de señal de audio decodifica los datos de audio demultiplexados, y la unidad ex305 de procesamiento de señales de vídeo decodifica los datos de vídeo demultiplexados, usando el procedimiento de decodificación descrito en cada una de las realizaciones, en la televisión ex300. La unidad de salida ex309 proporciona la señal de vídeo decodificada y la señal de audio al exterior. Cuando la unidad ex309 de salida proporciona la señal de vídeo y la señal de audio, las señales pueden almacenarse temporalmente en las memorias ex318 y ex319 intermedias y otras de modo que las señales se reproducen en sincronización entre sí. Adicionalmente, la televisión ex300 puede leer datos multiplexados no a través de una difusión y otros sino desde los medios ex215 y ex216 de grabación, tales como un disco magnético, un disco óptico y una tarjeta de SD. A continuación, se describirá una configuración en la que la televisión ex300 codifica una señal de audio y una señal de vídeo y transmite los datos al exterior o escribe los datos en un medio de grabación. En la televisión ex300, tras la recepción de una operación de usuario desde el controlador ex220 remoto y otros, la unidad ex304 de procesamiento de señales de audio codifica una señal de audio, y la unidad ex305 de procesamiento de señales de vídeo codifica una señal de vídeo, bajo el control de la unidad ex310 de control usando el procedimiento de codificación según se describe en cada una de las realizaciones. La unidad ex303 de multiplexación/demultiplexación multiplexa la señal de vídeo y la señal de audio codificadas, y proporciona la señal resultante al exterior. Cuando la unidad ex303 de multiplexación/demultiplexación multiplexa la señal de vídeo y la señal de audio, las señales pueden almacenarse temporalmente en las memorias ex320 y ex321 intermedias y otras de modo que las señales se reproducen en sincronización entre sí. En este punto, las memorias ex318 a ex321 intermedias pueden ser varias como se ilustra, o al menos una memoria intermedia puede compartirse en la televisión ex300. Adicionalmente, los datos pueden almacenarse en una memoria intermedia distinta de las memorias ex318 a ex321 intermedias de modo que puede evitarse el desbordamiento e infrautilización del sistema entre la unidad ex302 de modulación/demodulación y la unidad ex303 de multiplexación/demultiplexación, por ejemplo.

Adicionalmente, la televisión ex300 puede incluir una configuración para recibir una entrada de AV desde un micrófono o una cámara distinta de la configuración para obtener datos de audio y de vídeo desde una difusión o de un medio de grabación, y puede codificar los datos obtenidos. Aunque la televisión ex300 puede codificar, multiplexar y proporcionar datos al exterior en la descripción, puede no ser capaz de realizar todos los procedimientos, sino ser capaz de únicamente uno de recepción, decodificación y proporcionar datos al exterior.

Adicionalmente, cuando el lector/grabador ex218 lee o escribe datos multiplexados de o en un medio de grabación, uno de la televisión ex300 y el lector/grabador ex218 puede decodificar o codificar los datos multiplexados, y la televisión ex300 y el lector/grabador ex218 pueden compartir la decodificación o codificación.

Como un ejemplo, la Figura 23 ilustra una configuración de una unidad ex400 de reproducción/grabación de información cuando los datos se leen o escriben desde o en un disco óptico. La unidad ex400 de reproducción/grabación de información incluye elementos ex401 a ex407 constituyentes que se describirán más adelante. El cabezal ex401 óptico irradia un punto láser en una superficie de grabación del medio ex215 de grabación que es un disco óptico para escribir información, y detecta luz reflejada desde la superficie de grabación del medio ex215 de grabación para leer la información. La unidad ex402 de grabación de modulación acciona eléctricamente un láser de semiconductores incluido en el cabezal ex401 óptico, y modula la luz de láser de acuerdo con datos grabados. La unidad ex403 de demodulación de reproducción amplifica una señal de reproducción obtenida detectando eléctricamente la luz reflejada desde la superficie de grabación usando un fotodetector incluido en el cabezal ex401 óptico, y demodula la señal de reproducción separando un componente de señal grabado en el medio ex215 de grabación para reproducir la información necesaria. La memoria ex404 intermedia mantiene temporalmente la información a grabarse en el medio ex215 de grabación y la información reproducida desde el medio ex215 de grabación. Un motor ex405 de disco rota el medio ex215 de grabación. Una unidad ex406 de servo control mueve el cabezal ex401 óptico a una pista de información predeterminada mientras controla el accionamiento de rotación del motor ex405 de disco para seguir el punto láser. La unidad ex407 de control de sistema controla en general la unidad ex400 de reproducción/grabación de información. Los procedimientos de lectura y escritura pueden implementarse por la unidad de control de sistema ex407 usando diversa información almacenada en la memoria intermedia ex404 y generando y añadiendo nueva información según sea necesaria, y por la unidad ex402 de grabación de modulación, la unidad de demodulación de reproducción ex403, y la unidad ex406 de servo control que graban y reproducen información a través del cabezal ex401 óptico mientras se operan de una manera coordinada. La unidad ex407 de control de sistema incluye, por ejemplo, un microprocesador y ejecuta procesamiento provocando que un ordenador ejecute un programa para lectura y escritura.

Aunque el cabezal ex401 óptico irradia un punto láser en la descripción, puede realizar grabación de alta densidad usando luz de campo cercano.

La Figura 24 ilustra esquemáticamente el medio ex215 de grabación que es el disco óptico. En la superficie de grabación del medio ex215 de grabación, se forman surcos de guía en espiral, y una pista ex230 de información graba, con antelación, información de dirección que indica una posición absoluta en el disco de acuerdo con el cambio en una forma de los surcos de guía. La información de dirección incluye información para determinar posiciones de bloques ex231 de grabación que son una unidad para grabar datos. Un aparato que graba y reproduce datos reproduce la pista ex230 de información y lee la información de dirección para determinar las posiciones de los bloques de grabación. Adicionalmente, el medio ex215 de grabación incluye un área ex233 de grabación de datos, un área ex232 de circunferencia interior y un área ex234 de circunferencia exterior. El área ex233 de grabación de datos es un área para su uso en la grabación de los datos de usuario. El área ex232 de circunferencia interna y el área ex234 de circunferencia exterior que están dentro y fuera del área ex233 de grabación de datos, respectivamente, son para uso específico excepto para la grabación de los datos de usuario. La unidad 400 de reproducción/grabación de información lee y escribe datos de audio codificados, datos de vídeo codificados o datos multiplexados obtenidos multiplexando los datos de audio codificados y los datos de vídeo codificados, desde y en el área ex233 de grabación de datos del medio ex215 de grabación.

Aunque se describe un disco óptico que tiene una capa, tal como un DVD y un BD como un ejemplo en la descripción, el disco óptico no se limita a esto, y puede ser un disco óptico que tiene una estructura de múltiples capas y capaz de grabarse en una parte distinta de la superficie. Adicionalmente, el disco óptico puede tener una estructura para grabación/reproducción multidimensional, tal como grabación de información usando luz de colores con diferentes longitudes de onda en la misma porción del disco óptico y para grabar información que tiene diferentes capas desde diferentes ángulos.

Adicionalmente, el automóvil ex210 que tiene la antena ex205 puede recibir datos desde el satélite ex202 y otros, y reproducir vídeo en el dispositivo de visualización, tal como el sistema ex211 de navegación de automóvil establecido en el automóvil ex210, en un sistema ex200 de difusión digital. En este punto, una configuración del sistema ex211 de navegación de automóvil será una, por ejemplo, que incluye una unidad de recepción de GPS en la configuración ilustrada en la Figura 22. Lo mismo se cumplirá para la configuración del ordenador ex111, el teléfono ex114 celular y otros.

La Figura 25A ilustra el teléfono ex114 celular que usa el procedimiento de codificación de instantáneas en movimiento y el procedimiento de decodificación de instantáneas en movimiento descrito en cada una de las realizaciones. El teléfono ex114 celular incluye: una antena ex350 para la transmisión y recepción de ondas de radio a través de la estación ex110 base; una unidad ex365 de cámara capaz de capturar imágenes en movimiento y fijas; y una unidad ex358 de visualización, tal como una pantalla de cristal líquido, para visualizar datos, tales como vídeo decodificado capturado por la unidad ex365 de cámara o recibido por la antena ex350. El teléfono ex114 celular incluye adicionalmente: una unidad de cuerpo principal que incluye un conjunto de teclas ex366 de operación; una unidad ex357 de salida de audio tal como un altavoz para la salida de audio; una unidad ex356 de entrada de audio tal como un micrófono para la entrada de audio; una unidad ex367 de memoria para el almacenamiento de vídeo o instantáneas fijas capturadas, audio grabado, datos codificados o decodificados del vídeo recibido, las imágenes fijas, correos electrónicos u otros; y una unidad ex364 de ranura que es una unidad de interfaz para un medio de grabación que almacena datos de la misma manera que la unidad ex367 de memoria.

A continuación, se describirá un ejemplo de una configuración del teléfono ex114 celular con referencia a la Figura 25B. En el teléfono ex114 celular, una unidad ex360 de control principal diseñada para controlar en general cada unidad del cuerpo principal que incluye la unidad ex358 de visualización así como las teclas ex366 de operación se conecta mutuamente, a través de un bus ex370 síncrono, a una unidad ex361 de circuito de fuente de alimentación, una unidad ex362 de control de entrada de operación, una unidad ex355 de procesamiento de señales de vídeo, una unidad de interfaz de cámara ex363, una unidad ex359 de control de pantalla de cristal líquido (LCD), una unidad ex352 de modulación/demodulación, una unidad ex353 de multiplexación/demultiplexación, una unidad ex354 de procesamiento de señales de audio, la unidad ex364 de ranura y la unidad ex367 de memoria.

Cuando se activa una tecla de fin de llamada o una tecla de alimentación mediante una operación de un usuario, la unidad ex361 de circuito de fuente de alimentación suministra a las respectivas unidades con alimentación procedente de un paquete de batería para activar el teléfono ex114 celular.

En el teléfono ex114 celular, la unidad ex354 de procesamiento de señales de audio convierte las señales de audio recogidas por la unidad ex356 de entrada de audio en modo de conversación por voz en señales de audio digital bajo el control de la unidad ex360 de control principal que incluye una CPU, ROM y RAM. A continuación, la unidad ex352 de modulación/demodulación realiza un procesamiento de espectro ensanchado sobre las señales de audio digital, y la unidad ex351 de transmisión y recepción realiza una conversión de digital a analógico y una conversión en frecuencia en los datos, para transmitir los datos resultantes a través de la antena ex350. A continuación, la unidad ex352 de modulación/demodulación realiza un procesamiento de espectro ensanchado inverso en los datos, y la unidad ex354 de procesamiento de señales de audio los convierte en señales de audio analógico, para emitir las mismas a través de la unidad ex357 de salida de audio.

Además, cuando se transmite un correo electrónico en modo de comunicación de datos, datos de texto del correo electrónico introducido al operar las teclas ex366 de operación y otros del cuerpo principal se envían fuera a la unidad ex360 de control principal a través de la unidad ex362 de control de entrada de operación. La unidad ex360 de control principal provoca que la unidad ex352 de modulación/demodulación realice un procesamiento de espectro ensanchado en los datos de texto, y la unidad ex351 de transmisión y recepción realiza la conversión de digital a analógico y la conversión de frecuencia en los datos resultantes para transmitir los datos a la estación ex110 base a través de la antena ex350. Cuando se recibe un correo electrónico, un procesamiento que es aproximadamente inverso al procesamiento de transmisión de un correo electrónico se realiza en los datos recibidos, y los datos resultantes se proporcionan a la unidad ex358 de visualización.

Cuando vídeo, imágenes fijas o vídeo y audio en modo de comunicación de datos se transmite o transmiten, la unidad ex355 de procesamiento de señales de vídeo (es decir, que funciona como el aparato de codificación de imágenes de acuerdo con el aspecto de la presente invención) comprime y codifica señales de vídeo suministradas desde la unidad ex365 de cámara usando el procedimiento de codificación de instantáneas en movimiento mostrado en cada una de las realizaciones, y transmite los datos de vídeo codificados a la unidad ex353 de multiplexación/demultiplexación. En contraposición, durante cuando la unidad ex365 de cámara captura vídeo, imágenes fijas, y otros, la unidad ex354 de procesamiento de señales de audio codifica las señales de audio recogidas por la unidad ex356 de entrada de audio, y transmite los datos de audio codificados a la unidad ex353 de multiplexación/demultiplexación.

La unidad ex353 de multiplexación/demultiplexación multiplexa los datos de vídeo codificados suministrados desde la unidad ex355 de procesamiento de señales de vídeo y los datos de audio codificados suministrados desde la unidad ex354 de procesamiento de señales de audio, usando un procedimiento predeterminado. A continuación, la unidad ex352 de modulación/demodulación realiza un procesamiento de espectro ensanchado sobre los datos multiplexados, y la unidad ex351 de transmisión y recepción realiza una conversión de digital a analógico y una conversión en frecuencia en los datos, para transmitir los datos resultantes a través de la antena ex350.

Cuando se reciben datos de un archivo de vídeo que está vinculado a una página web y otros en modo de comunicación de datos o cuando se recibe un correo electrónico con vídeo y/o audio adjunto, para decodificar los datos multiplexados recibidos a través de la antena ex350, la unidad ex353 de multiplexación/demultiplexación demultiplexa los datos multiplexados en un flujo de bits de datos de vídeo y un flujo de bits de datos de audio, y suministra a la unidad ex355 de procesamiento de señales de vídeo los datos de vídeo codificados y la unidad ex354 de procesamiento de señales de audio con los datos de audio codificados, a través del bus ex370 síncrono. La unidad ex355 de procesamiento de señales de vídeo (es decir, que funciona como el aparato de decodificación de imágenes de acuerdo con el aspecto de la presente invención) decodifica la señal de vídeo usando un procedimiento de decodificación de instantáneas en movimiento que corresponden al procedimiento de codificación de instantáneas en movimiento mostrado en cada una de las realizaciones y, a continuación, la unidad de visualización ex358 visualiza, por ejemplo, el vídeo y las imágenes fijas incluidas en el archivo de vídeo enlazado a la página web a través de la unidad ex359 de control de LCD. Adicionalmente, la unidad ex354 de procesamiento de señales de audio decodifica la señal de audio y la unidad ex357 de salida de audio proporciona el audio.

Adicionalmente, de forma similar a la televisión ex300, un terminal tal como el teléfono ex114 celular probablemente tiene 3 tipos de configuraciones de implementación que incluyen no únicamente (i) un terminal de transmisión y recepción que incluye tanto un aparato de codificación como un aparato de decodificación, sino que también (ii) un terminal de transmisión que incluye únicamente un aparato de codificación y (iii) un terminal de recepción que incluye únicamente un aparato de decodificación. Aunque el sistema ex200 de difusión digital recibe y transmite los datos multiplexados obtenidos multiplexando datos de audio a datos de vídeo en la descripción, los datos multiplexados pueden ser datos obtenidos multiplexando no datos de audio sino datos de caracteres relacionados con vídeo en datos de vídeo, y pueden no ser datos multiplexados sino los propios datos de vídeo.

Como tal, el procedimiento de codificación de instantáneas en movimiento o el procedimiento de decodificación de instantáneas en movimiento en cada una de las realizaciones puede usarse en cualquiera de los dispositivos y sistemas descritos. Por lo tanto, pueden obtenerse las ventajas descritas en cada una de las realizaciones.

Adicionalmente, la presente invención no se limita a las realizaciones y son posibles diversas modificaciones y revisiones sin alejarse del ámbito de la presente invención.

(Realización 4)

Pueden generarse datos de vídeo conmutando, según sea necesario, entre (i) el procedimiento de codificación de instantáneas en movimiento o el aparato de codificación de instantáneas en movimiento mostrados en cada una de las realizaciones y (ii) un procedimiento de codificación de instantáneas en movimiento o un aparato de codificación de instantáneas en movimiento que se ajustan a una norma diferente, tal como MPEG-2, MPEG4-AVC y VC-1.

En este punto, cuando se genera una pluralidad de datos de vídeo que se ajustan a las diferentes normas y se decodifican a continuación, necesitan seleccionarse los procedimientos de decodificación para ajustarse a las diferentes normas. Sin embargo, puesto que no puede detectarse con qué norma cumple cada uno de la pluralidad de los datos de vídeo que se va a decodificar, existe un problema de que no puede seleccionarse un procedimiento de decodificación apropiado.

Para resolver el problema, los datos multiplexados obtenidos multiplexando datos de audio y otros en datos de vídeo tienen una estructura que incluye información de identificación que indica con qué norma cumplen los datos de vídeo. En lo sucesivo se describirá la estructura específica de los datos multiplexados que incluyen los datos de vídeo generados en el procedimiento de codificación de instantáneas en movimiento o por el aparato de codificación de instantáneas en movimiento mostrados en cada una de las realizaciones. Los datos multiplexados son un flujo digital en el formato de Flujo de Transporte de MPEG-2.

La Figura 26 ilustra una estructura de datos multiplexados. Como se ilustra en la Figura 26, los datos multiplexados pueden obtenerse multiplexando al menos uno de un flujo de vídeo, un flujo de audio, un flujo de gráficos de presentación (PG) y un flujo de gráficos interactivo. El flujo de vídeo representa vídeo primario y vídeo secundario de una película, el flujo de audio (IG) representa una parte de audio primario y una parte de audio secundario a mezclarse con la parte de audio primario, y el flujo de gráficos de presentación representa subtítulos de una película. En este punto, el vídeo primario es vídeo normal a visualizarse en una pantalla, y el vídeo secundario es vídeo a visualizarse en una ventana más pequeña en el vídeo principal. Adicionalmente, el flujo de gráficos interactivo representa una pantalla interactiva a generarse disponiendo los componentes de la GUI en una pantalla. El flujo de vídeo se codifica en el procedimiento de codificación de instantáneas en movimiento o por el aparato de codificación de instantáneas en movimiento mostrados en cada una de las realizaciones, o en un procedimiento de codificación de instantáneas en movimiento o por un aparato de codificación de instantáneas en movimiento que se ajustan a una norma convencional, tal como MPEG-2, MPEG4-AVC y VC-1. El flujo de audio se codifica de acuerdo con una norma, tal como Dolby-AC-3, Dolby Digital Plus, MLP, DTS, DTS-HD y PCM lineal.

Cada flujo incluido en los datos multiplexados se identifica por PID. Por ejemplo, se asigna 0x1011 al flujo de vídeo a usarse para vídeo de una película, se asigna 0x1100 a 0x111F a los flujos de audio, se asigna 0x1200 a 0x121F al flujo de gráficos de presentación, se asigna 0x1400 a 0x141F a los flujos de gráficos interactivos, se asigna 0x1B00 a 0x1B1F a los flujos de vídeo a usarse para vídeo secundario de la película y se asigna 0x1A00 a 0x1A1F a los flujos de audio a usarse para el vídeo secundario a mezclarse con el audio principal.

La Figura 27 ilustra esquemáticamente cómo se multiplexan datos. En primer lugar, un flujo ex235 de vídeo compuesto por fotogramas de vídeo y un flujo ex238 de audio compuesto por tramas de audio se transforman en un flujo ex236 de paquetes de PES y un flujo ex239 de paquetes de PES, y adicionalmente en paquetes ex237 de TS y paquetes ex240 de TS, respectivamente. De manera similar, los datos de un flujo ex241 de gráficos de presentación y los datos de un flujo ex244 de gráficos interactivo se transforman en un flujo ex242 de paquetes de PES y un flujo ex245 de paquetes de PES, y adicionalmente en paquetes ex243 de TS y paquetes ex246 de TS, respectivamente. Estos paquetes de TS se multiplexan en un flujo para obtener datos multiplexados ex247.

La Figura 28 ilustra cómo se almacena un flujo de vídeo en el flujo de paquetes de PES en más detalle. La primera barra en la Figura 28 muestra un flujo de fotogramas de vídeo en un flujo de vídeo. La segunda barra muestra el flujo de paquetes de PES. Como se indica por las flechas yy1, yy2, yy3 y yy4 en la Figura 28, el flujo de vídeo se divide en instantáneas como instantáneas de tipo I, instantáneas de tipo B e instantáneas de tipo P cada una de las cuales es una unidad de presentación de vídeo, las instantáneas se almacenan en una carga útil de cada uno de los paquetes de PES. Cada uno de los paquetes de PES tiene un encabezamiento de PES, y el encabezamiento de PES almacena una Indicación de Tiempo de Presentación (PTS) que indica un tiempo de visualización de la instantánea, y una Indicación de Tiempo de Decodificación (DTS) que indica un tiempo de decodificación de la instantánea.

La Figura 29 ilustra un formato de paquetes de TS a escribir finalmente en los datos multiplexados. Cada uno de los paquetes de TS es un paquete de longitud fija de 188 bytes que incluye un encabezamiento de TS de 4 bytes que tiene información, tal como una PID para identificar un flujo y una carga útil de TS de 184 bytes para almacenar datos. Los paquetes de PES se dividen y se almacenan en las cabidas útiles de TS. Cuando se usa un BD ROM, a cada uno de los paquetes de TS se le proporciona un TP_Extra_Header de 4 bytes, resultando por lo tanto en paquetes de origen de 192 bytes. Los paquetes de origen se escriben en los datos multiplexados. El TP_Extra_Header almacena información tal como una Arrival_Time_Stamp (ATS). La ATS muestra un tiempo de inicio de transferencia en el que se ha de transferir cada uno de los paquetes de TS a un filtro de PID. Los números que se incrementan desde la cabecera de los datos multiplexados se denominan números de paquete de origen (SPN) como se muestra en la parte inferior de la Figura 29.

Cada uno de los paquetes de TS incluidos en los datos multiplexados incluye no únicamente flujos de audio, vídeo, subtítulos y otros, sino también una Tabla de Asociación de Programa (PAT), una Tabla de Mapa de Programa (PMT) y una Referencia de Reloj de Programa (PCR). La PAT muestra lo que indica una PID en una PMT usada en los datos multiplexados, y una PID de la propia PAT se registra como cero. La PMT almacena las PID de los flujos de vídeo, audio, subtítulos y otros incluidos en los datos multiplexados e información de atributos de los flujos que corresponden a las PID. La ^pM^ttambién tiene diversos descriptores relacionados con los datos multiplexados. Los descriptores tienen información, tal como información de control de copia, que muestra si se permite o no el copiado de los datos multiplexados. La PCR almacena información de tiempo de STC que se corresponde con una ATS que muestra cuándo se transfiere el paquete de PCR a un decodificador, para conseguir sincronización entre un Reloj de Tiempo de Llegada (ATC) que es el eje de tiempo de las ATS, y un Reloj de Tiempo de Sistema (STC) que es un eje de tiempo de las PTS y DTS.

La Figura 30 ilustra la estructura de datos de la PMT en detalle. Un encabezamiento de PMT se dispone en la parte superior de la PMT. El encabezamiento de la PMT describe la longitud de datos incluidos en la PMT y otros. Una pluralidad de descriptores relacionados con los datos multiplexados se disponen después del encabezamiento de PMT. La información, tal como la información de control de copia, se describe en los descriptores. Después de los descriptores, se dispone una pluralidad de piezas de la información de flujo relacionada con los flujos incluidos en los datos multiplexados. Cada pieza de la información de flujo incluye descriptores de flujo, cada uno de los cuales describe información, tal como un tipo de flujo para identificar un códec de compresión de un flujo, una PID de flujo e información de atributo de flujo (tal como una tasa de tramas o una relación de aspecto). Los descriptores de flujo son iguales en número al número de flujos en los datos multiplexados.

Cuando los datos multiplexados se graban en un medio de grabación y otros, se graban juntos con ficheros de información de datos multiplexados.

Cada uno de los ficheros de información de datos multiplexados es información de gestión de los datos multiplexados como se muestra en la Figura 31. Los ficheros de información de datos multiplexados están en una correspondencia uno a uno con los datos multiplexados, y cada uno de los ficheros incluye información de datos multiplexados, información de atributo de flujo y un mapa de entrada.

Como se ilustra en la Figura 31, la información de datos multiplexados incluye una tasa de sistema, un tiempo de inicio de reproducción y un tiempo de fin de reproducción. La tasa de sistema indica la tasa de trasferencia máxima a la que un decodificador objetivo de sistema que se va a describir más adelante transfiere los datos multiplexados a un filtro de PID. Los intervalos de las ATS incluidas en los datos multiplexados se establecen para que no sean superiores a una tasa de sistema. El tiempo de inicio de reproducción indica una PTS en una trama de vídeo en la cabecera de los datos multiplexados. Se añade un intervalo de una trama a una PTS en una trama de vídeo al final de los datos multiplexados, y la PTS se establece al tiempo de fin de reproducción.

Como se muestra en la Figura 32, se registra una pieza de información de atributo en la información de atributo de flujo, para cada PID de cada flujo incluido en los datos multiplexados. Cada pieza de información de atributo tiene diferente información dependiendo de si el correspondiente flujo es un flujo de vídeo, un flujo de audio, un flujo de gráficos de presentación o un flujo de gráficos interactivo. Cada pieza de información de atributo de flujo de vídeo lleva información que incluye qué tipo de códec de compresión se usa para comprimir el flujo de vídeo, y la resolución, relación de aspecto y tasa de tramas de las piezas de datos de instantánea que se incluyen en el flujo de vídeo. Cada pieza de información de atributo de flujo de audio lleva información que incluye qué clase de códec de compresión se usa para comprimir el flujo de audio, cuántos canales se incluyen en el flujo de audio, qué idioma soporta el flujo de audio, y cómo de alta es la frecuencia de muestreo. La información de atributo de flujo de vídeo y la información de atributo de flujo de audio se usan para inicialización de un decodificador antes de que el reproductor reproduzca la información.

En la realización 4, los datos multiplexados a usarse son de un tipo de flujo incluido en la PMT. Adicionalmente, cuando los datos multiplexados se graban en un medio de grabación, se usa la información de atributo de flujo de vídeo incluida en la información de datos multiplexados. Más específicamente, el procedimiento de codificación de instantáneas en movimiento o el aparato de codificación de instantáneas en movimiento descritos en cada una de las realizaciones incluyen una etapa o una unidad de asignación de información única que indica datos de vídeo generados por el procedimiento de codificación de instantáneas en movimiento o el aparato de codificación de instantáneas en movimiento en cada una de las realizaciones, al tipo de flujo incluido en la PMT o la información de atributo de flujo de vídeo. Con la estructura, los datos de vídeo generados por el procedimiento de codificación de instantáneas en movimiento o el aparato de codificación de instantáneas en movimiento descritos en cada una de las realizaciones pueden distinguirse de datos de vídeo que se ajustan a otra norma.

Adicionalmente, la Figura 33 ilustra etapas del procedimiento de decodificación de instantáneas en movimiento de acuerdo con la realización 4. En la etapa exS100, el tipo de flujo incluido en el PMT o la información del atributo de transmisión de vídeo se obtiene de los datos multiplexados. A continuación, en la etapa exS101, se determina si el tipo de flujo o la información de atributo de flujo de vídeo indica o no que los datos multiplexados se generan por el procedimiento de codificación de instantáneas en movimiento o el aparato de codificación de instantáneas en movimiento en cada una de las realizaciones. Cuando se determina que el tipo de flujo o la información de atributo de flujo de vídeo indica que los datos multiplexados se generan por el procedimiento de codificación de instantáneas en movimiento o el aparato de codificación de instantáneas en movimiento en cada una de las realizaciones, en la etapa exS102, el tipo de flujo o la información de atributo de flujo de vídeo se decodifica por el procedimiento de decodificación de instantáneas en movimiento en cada una de las realizaciones. Adicionalmente, cuando el tipo de flujo o la información de atributo de flujo de vídeo indica que se ajustan a las normas convencionales, tales como m Pe G-2, MPEG4-AVC y VC-1, en la etapa exS103, el tipo de flujo o la información de atributo de flujo de vídeo se decodifica mediante un procedimiento de decodificación de instantáneas en movimiento que se ajustan a las normas convencionales.

Como tal, asignar un nuevo valor único al tipo de flujo o la información de atributo de flujo de vídeo habilita la determinación de si el procedimiento de decodificación de instantáneas en movimiento o el aparato de decodificación de instantáneas en movimiento que se describen en cada una de las realizaciones pueden realizar o no decodificación. Incluso tras una entrada de datos multiplexados que se ajustan a una norma diferente, puede seleccionarse un procedimiento o aparato de decodificación apropiado. Por lo tanto, se hace posible decodificar información sin error alguno. Adicionalmente, el procedimiento o aparato de codificación de instantáneas en movimiento o el procedimiento o aparato de decodificación de instantáneas en movimiento en la realización 4 puede usarse en los dispositivos y sistemas descritos anteriormente.

(Realización 5)

Cada uno del procedimiento de codificación de instantáneas en movimiento, el aparato de codificación de instantáneas en movimiento, el procedimiento de decodificación de instantáneas en movimiento y el aparato de decodificación de instantáneas en movimiento en cada una de las realizaciones se consigue habitualmente en forma de un circuito integrado o un Circuito Integrado a Gran Escala (LSI). Como un ejemplo del LSI, la Figura 34 ilustra una configuración del LSI ex500 que se fabrica en un chip. El LSI ex500 incluye los elementos ex501, ex502, ex503, ex504, ex505, ex506, ex507, ex508 y ex509 que se van a describir a continuación, y los elementos se conectan entre sí a través de un bus ex510. La unidad ex505 de circuito de fuente de alimentación se activa suministrando a cada uno de los elementos potencia cuando se activa la unidad ex505 de circuito de fuente de alimentación.

Por ejemplo, cuando se realiza codificación, el LSI ex500 recibe una señal de AV desde un micrófono ex117, una cámara ex113 y otros a través de una ES ex509 de AV bajo el control de una unidad ex501 de control que incluye una CPU ex502, un controlador ex503 de memoria, un controlador ex504 de flujo y una unidad ex512 de control de frecuencia de accionamiento. La señal de AV recibida se almacena temporalmente en una memoria externa ex511, tal como una SDRAM. Bajo el control de la unidad ex501 de control, los datos almacenados se segmentan en porciones de datos de acuerdo con la cantidad de procesamiento y velocidad a transmitir a una unidad ex507 de procesamiento de señales. A continuación, la unidad ex507 de procesamiento de señales codifica una señal de audio y/o una señal de vídeo. En este punto, la codificación de la señal de vídeo es la codificación descrita en cada una de las realizaciones. Adicionalmente, la unidad ex507 de procesamiento de señales multiplexa en ocasiones los datos de audio codificados y los datos de vídeo codificados, y un flujo 10 ex506 proporciona los datos multiplexados al exterior. Los datos multiplexados proporcionados se transmiten a la estación ex107 base, o escriben en el medio ex215 de grabación.

Cuando se multiplexan conjuntos de datos, los conjuntos de datos deberían almacenarse temporalmente en la memoria ex508 intermedia de modo que los conjuntos de datos se sincronizan entre sí.

Aunque la memoria ex511 es un elemento fuera del LSI ex500, puede incluirse en el LSI ex500. La memoria ex508 intermedia no se limita a una memoria intermedia, sino que puede estar compuesta por memorias intermedias. Adicionalmente, el LSI ex500 puede fabricarse en un chip o una pluralidad de chips.

Adicionalmente, aunque la unidad ex501 de control incluye la CPU ex502, el controlador ex503 de memoria, el controlador ex504 de flujo, la unidad ex512 de control de frecuencia de accionamiento, la configuración de la unidad ex501 de control no se limita a esto. Por ejemplo, la unidad ex507 de procesamiento de señales puede incluir adicionalmente una CPU. La inclusión de otra CPU en la unidad ex507 de procesamiento de señales puede mejorar la velocidad de procesamiento. Adicionalmente, como otro ejemplo, la CPU ex502 puede incluir la unidad ex507 de procesamiento de señales, o una unidad de procesamiento de señales de audio que es una parte de la unidad ex507 de procesamiento de señales. En un caso de este tipo, la unidad ex501 de control incluye la unidad ex507 de procesamiento de señales o la CPU ex502 que incluye una parte de la unidad ex507 de procesamiento de señales.

El nombre usado en el presente documento es LSI, pero también puede denominarse CI, sistema LSI, súper LSI o ultra LSI dependiendo del grado de integración.

Además, las maneras para conseguir la integración no se limitan al LSI, y un circuito especial o un procesador de fin general y así sucesivamente también pueden conseguir la integración. La Matriz de Puertas Programables en Campo (FPGA) que puede programarse después de la fabricación de LSI o un procesador reconfigurable que permite la reconfiguración de la conexión o configuración de un LSI puede usarse para el mismo fin. El dispositivo lógico programable puede ejecutar habitualmente el procedimiento de codificación de instantáneas en movimiento y el procedimiento de decodificación de instantáneas en movimiento de acuerdo con las realizaciones y variaciones, cargando o leyendo, de una memoria, el programa incluido en software o firmware.

En el futuro, con el avance de la tecnología de semiconductores, una tecnología nueva puede sustituir al LSI. Los bloques funcionales pueden integrarse usando una tecnología de este tipo. La posibilidad es que la presente invención se aplique a biotecnología.

(Realización 6)

Cuando se decodifican datos de vídeo generados por el procedimiento de codificación de instantáneas en movimiento o por el aparato de codificación de instantáneas en movimiento descritos en cada una de las realizaciones, en comparación con el caso de decodificación de datos de vídeo que se ajusta a una norma convencional, tal como MPEG-2, MPEG4-AVC y VC-1, la cantidad de cálculo probablemente aumenta. Por lo tanto, el LSI ex500 necesita establecerse a una frecuencia de accionamiento más alta que la de la CPU ex502 a usarse cuando se decodifican datos de vídeo que se ajustan a la norma convencional. Sin embargo, cuando la frecuencia de accionamiento se establece más alta, existe un problema de que el consumo de potencia aumenta.

Para resolver el problema, el aparato de decodificación de instantáneas en movimiento, tal como la televisión ex300 y el LSI ex500, está configurado para determinar a qué norma se ajustan los datos de vídeo, y conmutar entre las frecuencias de accionamiento de acuerdo con la norma determinada. La Figura 35 ilustra una configuración ex800 en la realización 6. Una unidad ex803 de conmutación de frecuencia de accionamiento establece una frecuencia de accionamiento a una frecuencia de accionamiento superior cuando se generan datos de vídeo por el procedimiento de codificación de instantáneas en movimiento o el aparato de codificación de instantáneas en movimiento descritos en cada una de las realizaciones. A continuación, la unidad ex803 de conmutación de frecuencia de accionamiento ordena a una unidad ex801 de procesamiento de decodificación que ejecute el procedimiento de decodificación de instantáneas en movimiento descrito en cada una de las realizaciones para decodificar los datos de vídeo. Cuando los datos de vídeo se ajustan a la norma convencional, la unidad ex803 de conmutación de frecuencia de accionamiento establece una frecuencia de accionamiento a una frecuencia de accionamiento menor que la de los datos de vídeo generados por el procedimiento de codificación de instantáneas en movimiento o el aparato de codificación de instantáneas en movimiento descritos en cada una de las realizaciones. A continuación, la unidad ex803 de conmutación de frecuencia de accionamiento ordena a la unidad ex802 de procesamiento de decodificación que se ajuste a la norma convencional que decodifique los datos de vídeo.

Más específicamente, la unidad ex803 de conmutación de frecuencia de accionamiento incluye la CPU ex502 y la unidad ex512 de control de frecuencia de accionamiento en la Figura 34. En este punto, cada una de la unidad ex801 de procesamiento de decodificación que ejecuta el procedimiento de decodificación de instantáneas en movimiento descrito en cada una de las realizaciones y la unidad ex802 de procesamiento de decodificación que se ajusta a la norma convencional corresponde a la unidad ex507 de procesamiento de señales en la Figura 34. La CPU ex502 determina a qué norma se ajustan los datos de vídeo. A continuación, la unidad ex512 de control de frecuencia de accionamiento determina una frecuencia de accionamiento a base de una señal desde la CPU ex502. Adicionalmente, la unidad ex507 de procesamiento de señales decodifica los datos de vídeo a base de una señal desde la CPU ex502. Por ejemplo, la información de identificación descrita en la realización 4 se usa probablemente para identificar los datos de vídeo. La información de identificación no se limita a la descrita en la realización 4, sino que puede ser cualquier información siempre que la información indique a qué norma se ajustan los datos de vídeo. Por ejemplo, cuando a qué norma se ajustan los datos de vídeo puede determinarse a base de una señal externa para determinar que los datos de vídeo se usan para una televisión o un disco, etc., la determinación puede realizarse a base de una señal externa de este tipo. Adicionalmente, la CPU ex502 selecciona una frecuencia de accionamiento a base de, por ejemplo, una tabla de consulta en la que las normas de los datos de vídeo se asocian con las frecuencias de accionamiento como se muestra en la Figura 37. La frecuencia de accionamiento puede seleccionarse almacenando la tabla de consulta en la memoria ex508 intermedia y una memoria interna de un LSI, y con referencia a la tabla de búsqueda por la CPU ex502.

La Figura 36 ilustra las etapas para ejecutar un procedimiento en la realización 6. En primer lugar, en la etapa exS200, la unidad ex507 de procesamiento de señales obtiene información de identificación desde los datos multiplexados. A continuación, en la etapa exS201, la CPU ex502 determina si los datos de vídeo se generan o no basándose en la información de identificación por el procedimiento de codificación y el aparato de codificación descrito en cada una de las realizaciones. Cuando los datos de vídeo se generan por el procedimiento de codificación y el aparato de codificación descritos en cada una de las realizaciones, en la etapa exS202, la CPU ex502 transmite una señal para establecer la frecuencia de accionamiento a una frecuencia de accionamiento más alta a la unidad ex512 de control de frecuencia de accionamiento. A continuación, la unidad ex512 de control de frecuencia de accionamiento establece la frecuencia de accionamiento a la frecuencia de accionamiento más alta. Por otra parte, cuando la información de identificación indica que los datos de vídeo se ajustan a la norma convencional, tal como MPEG-2, de MPEG4-AVC y VC-1, en la etapa exS203, la CPU ex502 transmite una señal para establecer la frecuencia de accionamiento a una frecuencia de accionamiento más baja a la unidad ex512 de control de frecuencia de accionamiento. A continuación, la unidad ex512 de control de frecuencia de accionamiento establece la frecuencia de accionamiento a la frecuencia de accionamiento inferior que la de en el caso en el que los datos de vídeo se generan por el procedimiento de codificación de instantáneas en movimiento y el aparato de codificación de instantáneas en movimiento descritos en cada una de las realizaciones.

Adicionalmente, junto con la conmutación de las frecuencias de accionamiento, el efecto de conservación de potencia puede mejorarse cambiando la tensión a aplicar al LSI ex500 o a un aparato que incluye el LSI ex500. Por ejemplo, cuando la frecuencia de accionamiento se establece más baja, la tensión a aplicar al LSI ex500 o al aparato que incluye el LSI ex500 probablemente se establece a una tensión inferior que en el caso en el que la frecuencia de accionamiento se establece más alta.

Adicionalmente, cuando la cantidad de cálculo para decodificación es mayor, la frecuencia de accionamiento puede establecerse más alta, y cuando la cantidad de cálculo para decodificación es menor, la frecuencia de accionamiento puede establecerse más baja que el procedimiento para establecer la frecuencia de accionamiento. Por lo tanto, el procedimiento de establecimiento no se limita a los anteriormente descritos. Por ejemplo, cuando la cantidad de cálculo para decodificar datos de vídeo que se ajustan a MPEG4-AVC es mayor que la cantidad de cálculo para decodificar datos de vídeo generados por el procedimiento de codificación de instantáneas en movimiento o el aparato de codificación de instantáneas en movimiento descritos en cada una de las realizaciones, la frecuencia de accionamiento se establece probablemente en orden inverso al establecimiento descrito anteriormente.

Adicionalmente, el procedimiento para establecer la frecuencia de accionamiento no se limita al procedimiento para establecer la frecuencia de accionamiento más baja. Por ejemplo, cuando la información de identificación indica que los datos de vídeo se generan por el procedimiento de codificación de instantáneas en movimiento o el aparato de codificación de instantáneas en movimiento descritos en cada una de las realizaciones, la tensión a aplicarse al LSI ex500 o al aparato que incluye el LSI ex500 se establece probablemente más alta. Cuando la información de identificación indica que los datos de vídeo se ajustan a la norma convencional, tal como MPEG-2, MPEG4-AVC y VC-1, la tensión a aplicarse al LSI ex500 o al aparato que incluye el LSI ex500 probablemente se establece más baja. Como otro ejemplo, cuando la información de identificación indica que los datos de vídeo se generan mediante el procedimiento de codificación de instantáneas en movimiento o el aparato de codificación de vídeo descritos en cada una de las realizaciones, el accionamiento de la CPU ex502 probablemente no tiene que suspenderse. Cuando la información de identificación indica que los datos de vídeo se ajustan a la norma convencional, tal como MPEG-2, MPEG4-AVC y VC-1, el accionamiento de la CPU ex502 se suspende probablemente en un momento dado puesto que la CPU ex502 tiene capacidad de procesamiento adicional. Incluso cuando la información de identificación indica que los datos de vídeo se generan por el procedimiento de codificación de instantáneas en movimiento o el aparato de codificación de instantáneas en movimiento descritos en cada una de las realizaciones, en el caso en el que la CPU ex502 tiene capacidad de procesamiento adicional, el accionamiento de la CPU ex502 se suspende probablemente en un momento dado. En un caso de este tipo, el tiempo de suspensión probablemente se establece más corto que en el caso cuando la información de identificación indica que los datos de vídeo se ajustan a la norma convencional, tal como MPEG-2, MPEG4-AVC y VC-1.

Por consiguiente, el efecto de conservación de potencia puede mejorarse conmutando entre las frecuencias de accionamiento de acuerdo con la norma a la que se ajustan los datos de vídeo. Adicionalmente, cuando el LSI ex500 o el aparato que incluye el LSI ex500 se accionan usando una batería, la duración de la batería puede extenderse con el efecto de conservación de potencia.

(Realización 7⁾

Existen casos en los que una pluralidad de datos de vídeo que se ajustan a diferentes normas, se proporcionan a los dispositivos y sistemas, tales como una televisión y un teléfono celular. Para habilitar la decodificación de la pluralidad de datos de vídeo que se ajustan a las diferentes normas, la unidad ex507 de procesamiento de señales del LSI ex500 necesita ajustarse a las diferentes normas. Sin embargo, los problemas de aumento en la escala del circuito del LSI ex500 y el aumento en el coste surgen con el uso individual de las unidades ex507 de procesamiento de señal que se ajustan a las normas respectivas.

Para resolver los problemas, lo que se concibe es una configuración en la que la unidad de procesamiento de decodificación para implementar el procedimiento de decodificación de instantáneas en movimiento descrita en cada una de las realizaciones y la unidad de procesamiento de decodificación que se ajusta a la norma convencional, tal como MPEG-2, de MPEG4-AVC y VC-1 se comparten parcialmente. Ex900 en la Figura 38A muestra un ejemplo de la configuración. Por ejemplo, el procedimiento de decodificación de instantáneas en movimiento descrito en cada una de las realizaciones y el procedimiento de decodificación de instantáneas en movimiento que se ajusta a MPEG4-AVC tienen, parcialmente en común, los detalles de procesamiento, tal como codificación por entropía, cuantificación inversa, filtrado de desbloqueo y compensación de movimiento. Los detalles de procesamiento a compartirse probablemente incluyen el uso de una unidad ex902 de procesamiento de decodificación que se ajusta a MPEG4-AVC. En contraposición, se usa una unidad ex901 de procesamiento de decodificación especializada probablemente para otro procesamiento que es único para un aspecto de la presente invención y no se ajusta a MPEG-4 AVC. Dado que el aspecto de la presente invención presenta particularmente decodificación por entropía, por ejemplo, la unidad ex901 de procesamiento de decodificación especializada se usa para la decodificación por entropía. De lo contrario, la unidad de procesamiento de decodificación se comparte probablemente para uno de cuantificación inversa, filtrado de desbloqueo y compensación de movimiento, o todo el procesamiento. La unidad de procesamiento de decodificación para implementar el procedimiento de decodificación de instantáneas en movimiento descrita en cada una de las realizaciones puede compartirse para el procesamiento a compartir, y una unidad de procesamiento de decodificación dedicada puede usarse para procesamiento único al del de MPEG4-AVC.

Adicionalmente, ex1000 en la Figura 38B muestra otro ejemplo en el que el procesamiento se comparte parcialmente. Este ejemplo usa una configuración que incluye una unidad ex1001 de procesamiento de decodificación especializada que soporta el procesamiento único del aspecto de la presente invención, una unidad ex1002 de procesamiento de decodificación especializada que soporta el procesamiento único de otra norma convencional y una unidad ex1003 de procesamiento de decodificación que soporta procesamiento a compartirse entre el procedimiento de decodificación de instantáneas en movimiento en el aspecto de la presente invención y el procedimiento de decodificación de instantáneas en movimiento convencional. En este punto, las unidades ex1001 y ex1002 de procesamiento de decodificación especializadas no están necesariamente especializadas para el procesamiento del aspecto de la presente invención y el procesamiento de la norma convencional y pueden ser capaces de implementar un procesamiento general. Adicionalmente, la configuración de la realización 7 puede implementarse por el LSI ex500.

Como tal, reducir la escala del circuito de un LSI y reducir el coste son posibles compartiendo la unidad de procesamiento de decodificación para el procesamiento a compartirse entre el procedimiento de decodificación de instantáneas en movimiento en la presente invención y el procedimiento de decodificación de instantáneas en movimiento de conformidad con la norma convencional.

rAplicabilidad industrial!

El aparato de codificación de instantáneas en movimiento o el aparato de decodificación de instantáneas en movimiento de acuerdo con un aspecto de la presente invención es aplicable a, por ejemplo, receptores de televisión, grabadores de vídeo digital, sistema de navegación de automóviles, teléfonos móviles, cámaras digitales y cámaras de vídeo digitales.

[Lista de signos de referencia!

100, 300 Aparato de codificación de instantáneas en movimiento

101 Unidad de particionamiento de bloque

102, 204 Unidad de predicción

103 Unidad de resta

104 Unidad de transformación

105, 203 Unidad de transformación inversa

106, 205 Unidad de suma

107, 206 Unidad de procesamiento de SAO

108 Unidad de codificación de longitud variable de parámetro de SAO

109 Unidad de codificación de longitud variable de coeficiente

110, 208 Memoria de fotograma

121 Unidad de codificación de sao_type_idx

122 Unidad de codificación de sao_offset

140 Unidad de binarización de sao_type_idx

141 Unidad de establecimiento de bin

142, 251 Unidad de determinación de último bin

Unidad de codificación aritmética de sao_type_idx

Unidad de conmutación de codificación aritmética

Primera unidad de codificación aritmética adaptativa según contexto Segunda unidad de codificación aritmética adaptativa según contexto Unidad de codificación aritmética de derivación

, 400 Aparato de decodificación de instantáneas en movimiento

Unidad de decodificación de longitud variable de parámetro de SAO Unidad de combinación de bloques

Unidad de decodificación de sao_type_idx

Unidad de decodificación de sao_offset

Unidad de decodificación aritmética de sao_type_idx

Unidad de conmutación de decodificación aritmética

Primera unidad de decodificación aritmética adaptativa según contexto Segunda unidad de decodificación aritmética adaptativa según contexto Unidad de decodificación aritmética de derivación

Unidad de binarización inversa de sao_type_idx

Unidad de establecimiento de sao_type_idx

Unidad de binarización

Unidad de codificación aritmética

Una unidad de decodificación aritmética

Unidad de binarización inversa

Claims

REIVINDICACIONES

1. Un procedimiento de codificación de instantáneas en movimiento de codificación de una imagen de entrada, comprendiendo el procedimiento:

convertir (S142-S144, S150, S151; S301) una señal no binaria que indica un valor de un primer parámetro (sao_type_idx) en una primera señal binaria, identificando el primer parámetro (sao_type_idx) un tipo de un procedimiento de desplazamiento de muestra que hay que aplicar a una imagen reconstruida que corresponde a la imagen de entrada;

codificar (S145,S146;S302) una primera porción de la primera señal binaria a través de codificación aritmética adaptativa según contexto; y

codificar (S145-S149:S302) una segunda porción de la primera señal binaria a través de codificación aritmética de derivación usando una probabilidad fija, cuando la primera señal binaria incluye la segunda porción posterior a la primera porción;

convertir al menos uno de un valor de un segundo parámetro y un valor de un tercer parámetro en una segunda señal binaria, identificando el segundo parámetro un modo de intra predicción, identificando el tercer parámetro un candidato que hay que usar para inter predicción de entre una lista de candidatos que incluye cada uno al menos un vector de movimiento;

codificar una primera porción de la segunda señal binaria a través de la codificación aritmética adaptativa según contexto; y

codificar una segunda porción de la segunda señal binaria a través de la codificación aritmética de derivación cuando la segunda señal binaria incluye la segunda porción posterior a la primera porción; en el que establecer que una longitud de bit de la primera porción de la primera señal binaria sea idéntica a una longitud de bit de la primera porción de la segunda señal binaria; la primera porción de la primera señal binaria se compone de un primer bit de la primera señal binaria;

la segunda porción de la primera señal binaria se compone de los bits restantes de la primera señal binaria; la segunda porción de la segunda señal binaria se compone de los bits restantes de la segunda señal binaria; la primera porción de la primera señal binaria indica si el procedimiento de desplazamiento de muestra tiene que aplicarse o no a la imagen reconstruida; y

la segunda porción de la primera señal binaria es un bit e indica si se aplica un procedimiento de desplazamiento de banda o un procedimiento de desplazamiento de borde a la imagen reconstruida.

2. Un procedimiento de decodificación de instantáneas en movimiento de decodificación de una imagen codificada, comprendiendo el procedimiento:

decodificar (S242-S246; S401) una primera porción codificada de una primera señal binaria a través de decodificación aritmética adaptativa según contexto;

decodificar una segunda porción codificada de la primera señal binaria a través de decodificación aritmética de derivación usando una probabilidad fija, cuando la primera señal binaria incluye la segunda porción posterior a la primera porción, en el que la primera señal binaria corresponde a un valor de un primer parámetro (sao_type_idx) que identifica un tipo de un procedimiento de desplazamiento de muestra que hay que aplicar a una imagen reconstruida obtenida de la imagen codificada; y

convertir (S247-S251; S402) la primera señal binaria decodificada a una señal no binaria que indica el valor del primer parámetro (sao_type_idx); decodificar una primera porción codificada de una segunda señal binaria que corresponde a al menos uno de un valor de un segundo parámetro y un valor de un tercer parámetro, a través de la decodificación aritmética adaptativa según contexto, identificando el segundo parámetro un modo de intra predicción, identificando el tercer parámetro un candidato que hay que usar para inter predicción de entre una lista de candidatos, cada uno de los cuales incluye al menos un vector de movimiento; y

decodificar una segunda porción codificada de la segunda señal binaria a través de la decodificación aritmética de derivación cuando la segunda señal binaria incluye la segunda porción posterior a la primera porción; en el que establecer que una longitud de bit de la primera porción de la primera señal binaria sea idéntica a una longitud de bit de la primera porción de la segunda señal binaria; la primera porción de la primera señal binaria se compone de un primer bit de la primera señal binaria; la segunda porción de la primera señal binaria se compone de los bits restantes de la primera señal binaria;

la segunda porción de la segunda señal binaria se compone de los bits restantes de la segunda señal binaria; la primera porción de la primera señal binaria indica si el procedimiento de desplazamiento de muestra tiene que aplicarse o no a la imagen reconstruida; y la segunda porción de la primera señal binaria es un bit e indica si se aplica un procedimiento de desplazamiento de banda o un procedimiento de desplazamiento de borde a la imagen reconstruida.