ES2943260T3

ES2943260T3 - Dispositivo de procesamiento de imágenes y método de procesamiento de imágenes

Info

Publication number: ES2943260T3
Application number: ES19203239T
Authority: ES
Inventors: Kazushi Sato
Original assignee: Sony Group Corp
Current assignee: Sony Group Corp
Priority date: 2010-12-09
Filing date: 2011-10-14
Publication date: 2023-06-12
Anticipated expiration: 2031-10-14
Also published as: BR112013013513B1; KR20160108577A; RU2016122534A3; CN105282552A; CN105791844A; EP4199518B1; PH12015501376A1; US20140369620A1; MY165377A; EP3113493B2; CA2997241C; RU2013125499A; KR101837882B1; CO6710956A2; HK1219599A1; RU2598593C2; EP2955921B1; CA2997244A1; US20190327472A1; KR101837796B1

Abstract

Se proporciona un dispositivo de procesamiento de imágenes que incluye una sección de selección configurada para seleccionar, de una pluralidad de unidades de transformación con diferentes tamaños, una unidad de transformación utilizada para la transformación ortogonal inversa de datos de imagen a decodificar, una sección de generación configurada para generar, a partir de una primera cuantificación matriz correspondiente a una unidad de transformación para un primer tamaño, una segunda matriz de cuantificación correspondiente a una unidad de transformación para un segundo tamaño de una primera matriz de cuantificación correspondiente a una unidad de transformación para un primer tamaño, y una sección de cuantificación inversa configurada para cuantificar inversamente el coeficiente de transformación datos para los datos de imagen usando la segunda matriz de cuantificación generada por la sección de generación cuando la sección de selección selecciona la unidad de transformación para el segundo tamaño. (Traducción automática con Google Translate, sin valor legal)

Description

DESCRIPCIÓN

Dispositivo de procesamiento de imágenes y método de procesamiento de imágenes

Campo técnico

La presente divulgación se refiere a un dispositivo de procesamiento de imágenes y a un método de procesamiento de imágenes.

Antecedentes de la técnica

H.264/AVC, una de las especificaciones de normas para esquemas de codificación de imágenes, puede usar diferentes escalones de cuantificación para componentes de coeficientes de transformación ortogonal para cuantificar datos de imagen en un perfil igual a un Perfil Alto o superior. Se puede configurar un escalón de cuantificación para cada componente de coeficiente de transformación ortogonal basándose en una matriz de cuantificación (también denominada lista de ajuste a escala) y un valor escalón de referencia. La matriz de cuantificación se define como de un tamaño sustancialmente igual al de una unidad de transformación ortogonal.

La figura 19 ilustra unos valores preestablecidos (valores por defecto) para cuatro tipos de matrices de cuantificación predefinidas en la norma H.264/AVC. Por ejemplo, la matriz SL01 es un valor por defecto para la matriz de cuantificación si el tamaño de la unidad de transformación es 4 x 4 en modo de intra predicción. La matriz SL02 es un valor por defecto para la matriz de cuantificación si el tamaño de la unidad de transformación es 4 x 4 en modo de inter predicción. La matriz SL03 es un valor por defecto para la matriz de cuantificación si el tamaño de la unidad de transformación es 8 x 8 en modo de intra predicción. La matriz SL04 es un valor por defecto para la matriz de cuantificación si el tamaño de la unidad de transformación es 8 x 8 en modo de inter predicción. Un usuario puede usar un conjunto de parámetros de secuencia o un conjunto de parámetros de imagen para especificar una matriz de cuantificación específica diferente de los valores por defecto mostrados en la figura 19. Si no se usa la matriz de cuantificación, se usa un valor igual para todos los componentes del escalón de cuantificación usado para la cuantificación.

La Codificación de Vídeo de Alta Eficiencia (HEVC) es un esquema de codificación de imágenes de próxima generación como sucesor de la norma H.264/AVC y se promueve su normalización. HEVC incorpora el concepto de unidad de codificación (CU) que corresponde a un macro bloque convencional (véase la Bibliografía no de patente 1 a continuación). El conjunto de parámetros de secuencia especifica un rango de tamaños de unidades de codificación usando un conjunto de valores de potencia de dos que son una unidad de codificación más grande (LCU) y una unidad de codificación más pequeña (SCU). El uso de split_flag especifica un tamaño de unidad de codificación específico dentro del rango especificado por LCU y SCU.

De acuerdo con HEVC, una unidad de codificación se puede dividir en una o más unidades de transformación ortogonal, en concreto, una o más unidades de transformación (TU). El tamaño de la unidad de transformación se puede establecer a cualquiera de entre 4 x 4, 8 x 8, 16 x 16 y 32 x 32. En consecuencia, se puede especificar una matriz de cuantificación de acuerdo con cada uno de estos candidatos de tamaño de unidad de transformación.

H.264/AVC permite designar solo una matriz de cuantificación para un tamaño de unidad de transformación dentro de una imagen, como se especifica en el software de referencia publicado (http://iphome.hhi.de/suehring/tml/index.htm) denominado modelo conjunto (JM). Por el contrario, la Bibliografía no de patente 2 mostrada a continuación propone designar múltiples candidatas de matriz de cuantificación para un tamaño de unidad de transformación dentro de una imagen y seleccionar de forma adaptativa una matriz de cuantificación para cada bloque desde el punto de vista de la optimización de la distorsión de tasa (RD).

Lista de citas

Bibliografía no de patente

Bibliografía no de patente 1: JCTVC-B205, " TestModelunderConsideration", Equipo de Colaboración Mixto sobre Codificación de Vídeo (JCT-VC) de la UIT-T SG16 WP3 e ISO/IEC JTC1/SC29/WG11, 2a Reunión: Ginebra, CH, 21-28 de julio de 2010

Bibliografía no de patente 2: VCEG-AD06, " Adaptive Quantization Matrix Selection on KTA Software", UIT - Sector de Normalización de las Telecomunicaciones, Grupo de Estudio 16, Pregunta 6, Grupo de Expertos en Codificación de Vídeo (VCEG), 30a Reunión: Hangzhou, China, 23-24 de octubre de 2006

El documento WO 2004/0077810 A2 describe el método de codificación de imágenes de la presente invención que es un método de codificación de imágenes para codificar una imagen de una forma bloque a bloque. El documento US 2008/0192824 A1 describe proporcionar un método y un aparato para mejorar adaptativamente la calidad de imagen de imágenes actuales a codificar reduciendo efectos debido a artefactos pulsantes.

Sumario de la invención

Problema técnico

Sin embargo, el aumento de los tipos de tamaño de unidad de transformación seleccionables también aumenta el número de matrices de cuantificación disponibles. El aumento de la cantidad de códigos de matrices de cuantificación puede deteriorar la eficiencia de codificación. La eficiencia de codificación se puede deteriorar más notablemente si el número de matrices de cuantificación que se pueden designar para cada tamaño de unidad de transformación cambia de uno a más.

La tecnología de acuerdo con la presente divulgación tiene por objeto proporcionar un dispositivo de procesamiento de imágenes y un método de procesamiento de imágenes capaces de moderar un aumento en la cantidad de códigos debido a un aumento en el número de matrices de cuantificación.

Solución al problema

De acuerdo con la presente divulgación, se proporciona un dispositivo de procesamiento de imágenes que incluye una sección de selección configurada para seleccionar, desde una pluralidad de unidades de transformación con diferentes tamaños, una unidad de transformación usada para transformación ortogonal inversa de datos de imagen a descodificar, una sección de generación configurada para generar, desde una primera matriz de cuantificación correspondiente a una unidad de transformación para un primer tamaño, una segunda matriz de cuantificación correspondiente a una unidad de transformación para un segundo tamaño, y una sección de cuantificación inversa configurada para cuantificar inversamente datos de coeficiente de transformación para los datos de imagen usando la segunda matriz de cuantificación generada por la sección de generación cuando la sección de selección selecciona la unidad de transformación para el segundo tamaño.

El dispositivo de procesamiento de imágenes puede realizarse típicamente como un dispositivo de descodificación de imágenes para descodificar una imagen. La invención se expone en las reivindicaciones adjuntas.

Además, la sección de generación puede generar la segunda matriz de cuantificación usando información de matriz que especifica la primera matriz de cuantificación e información de diferencia que representa una diferencia entre una matriz prevista que tiene el segundo tamaño previsto desde la primera matriz de cuantificación y la segunda matriz de cuantificación.

Además, la sección de generación puede adquirir la información de matriz y la información de diferencia desde un conjunto de parámetros de secuencia o un conjunto de parámetros de imágenes.

Además, la sección de generación puede configurar la matriz prevista para ser la segunda matriz de cuantificación cuando uno de un conjunto de parámetros de secuencia y un conjunto de parámetros de imágenes proporciona un primer indicador que indica ausencia de una diferencia entre la matriz prevista y la segunda matriz de cuantificación. Además, el primer tamaño puede representar uno mínimo de los tamaños para las unidades de transformación. Además, el segundo tamaño puede ser más grande que el primer tamaño. La sección de generación puede calcular la matriz prevista duplicando uno de un primer elemento y un segundo elemento como un elemento entre el primer elemento y el segundo elemento adyacentes entre sí en la primera matriz de cuantificación.

Además, el segundo tamaño puede ser más grande que el primer tamaño. La sección de generación puede calcular la matriz prevista por interpolación lineal de un elemento entre un primer elemento y un segundo elemento adyacentes entre sí en la primera matriz de cuantificación.

Además, el segundo tamaño puede ser el doble del primer tamaño en un lado.

Además, el segundo tamaño puede ser más pequeño que el primer tamaño. La sección de generación puede calcular la matriz prevista adelgazando un elemento de la primera matriz de cuantificación.

Además, el segundo tamaño puede ser más pequeño que el primer tamaño. La sección de generación puede calcular la matriz prevista promediando una pluralidad de elementos adyacentes entre sí en la primera matriz de cuantificación. Además, la sección de generación puede generar la segunda matriz de cuantificación desde la primera matriz de cuantificación cuando uno de un conjunto de parámetros de secuencia y un conjunto de parámetros de imágenes proporciona un segundo indicador para especificar el uso de una matriz definida por el usuario como la segunda matriz de cuantificación.

Además, de acuerdo con la presente divulgación, se proporciona un método de procesamiento de imágenes que incluye seleccionar, desde una pluralidad de unidades de transformación con diferentes tamaños, una unidad de transformación usada para transformación ortogonal inversa de datos de imagen a descodificar, generar, desde una primera matriz de cuantificación correspondiente a una unidad de transformación para un primer tamaño, una segunda matriz de cuantificación correspondiente a una unidad de transformación para un segundo tamaño, y cuantificar inversamente datos de coeficiente de transformación para los datos de imagen usando la segunda matriz de cuantificación generada desde la primera matriz de cuantificación cuando se selecciona una unidad de transformación para el segundo tamaño.

Además, de acuerdo con la presente divulgación, se proporciona un dispositivo de procesamiento de imágenes que incluye una sección de selección configurada para seleccionar, desde una pluralidad de unidades de transformación con diferentes tamaños, una unidad de transformación usada para transformación ortogonal de datos de imagen a codificar, una sección de cuantificación configurada para cuantificar datos de coeficiente de transformación generados por transformación ortogonal de datos de imagen basado en una unidad de transformación seleccionada por la sección de selección, usando una matriz de cuantificación correspondiente a la unidad de transformación seleccionada, y una sección de codificación configurada para codificar información para generar una segunda matriz de cuantificación correspondiente a una unidad de transformación para un segundo tamaño desde una primera matriz de cuantificación correspondiente a una unidad de transformación para un primer tamaño.

El dispositivo de procesamiento de imágenes puede realizarse típicamente como un dispositivo de codificación de imágenes para codificar una imagen.

Además, de acuerdo con la presente divulgación, se proporciona un método de procesamiento de imágenes que incluye seleccionar, desde una pluralidad de unidades de transformación con diferentes tamaños, una unidad de transformación usada para transformación ortogonal de datos de imagen a codificar, cuantificar datos de coeficiente de transformación generados por transformación ortogonal de datos de imagen basado en una unidad de transformación seleccionada, usando una matriz de cuantificación correspondiente a la unidad de transformación seleccionada, y codificar información para generar una segunda matriz de cuantificación correspondiente a una unidad de transformación para un segundo tamaño desde una primera matriz de cuantificación correspondiente a una unidad de transformación para un primer tamaño.

Efectos ventajosos de la invención

Como se ha descrito anteriormente, el dispositivo de procesamiento de imágenes y el método de procesamiento de imágenes de acuerdo con la presente divulgación pueden moderar un aumento en la cantidad de códigos debido a un aumento en el número de matrices de cuantificación.

Breve descripción de los dibujos

[Fig. 1] La figura 1 es un diagrama de bloques que ilustra una configuración de hardware de un dispositivo de codificación de imágenes.

[Fig. 2] La figura 2 es un diagrama de bloques que ilustra una configuración detallada de una sección de transformación ortogonal y de cuantificación.

[Fig. 3] La figura 3 es un diagrama de bloques que ilustra una configuración más detallada de una sección de procesamiento de matrices.

[Fig. 4] La figura 4 es un diagrama explicativo que ilustra información insertada en un conjunto de parámetros de secuencia.

[Fig. 5] La figura 5 es un diagrama explicativo que ilustra información insertada en un conjunto de parámetros de imagen.

[Fig. 6A] La figura 6A es la primera mitad de un diagrama de flujo que ilustra un primer ejemplo de un flujo de proceso de codificación.

[Fig. 6B] La figura 6B es la última mitad de un diagrama de flujo que ilustra el primer ejemplo de un flujo de proceso de codificación.

[Fig. 7A] La figura 7A es la primera mitad de un diagrama de flujo que ilustra un segundo ejemplo de un flujo de proceso de codificación.

[Fig. 7B] La figura 7B es la última mitad de un diagrama de flujo que ilustra el segundo ejemplo de un flujo de proceso de codificación.

[Fig. 8] La figura 8 es un diagrama de bloques que ilustra una configuración de un dispositivo de descodificación de imágenes.

[Fig. 9] La figura 9 es un diagrama de bloques que ilustra una configuración detallada de una sección de cuantificación inversa y de transformación ortogonal inversa.

[Fig. 10] La figura 10 es un diagrama de bloques que ilustra una configuración más detallada de una sección de generación de matrices.

[Fig. 11A] La figura 11A es la primera mitad de un diagrama de flujo que ilustra un primer ejemplo de un flujo de proceso de descodificación.

[Fig. 11B] La figura 11B es la última mitad de un diagrama de flujo que ilustra el primer ejemplo de un flujo de proceso de descodificación.

[Fig. 12A] La figura 12A es la primera mitad de un diagrama de flujo que ilustra un segundo ejemplo de un flujo de proceso de descodificación.

[Fig. 12B] La figura 12B es la última mitad de un diagrama de flujo que ilustra el segundo ejemplo de un flujo de proceso de descodificación.

[Fig. 13A] La figura 13A es la primera mitad de un diagrama de flujo que ilustra un ejemplo de un flujo de proceso de codificación de acuerdo con una modificación.

[Fig. 13B] La figura 13B es la última mitad de un diagrama de flujo que ilustra el ejemplo de un flujo de proceso de codificación de acuerdo con una modificación.

[Fig. 14A] La figura 14A es la primera mitad de un diagrama de flujo que ilustra un ejemplo de un flujo de proceso de descodificación de acuerdo con una modificación.

[Fig. 14B] La figura 14B es la primera mitad de un diagrama de flujo que ilustra el ejemplo de un flujo de proceso de descodificación de acuerdo con una modificación.

[Fig. 15] La figura 15 es un diagrama de bloques que ilustra una configuración esquemática de un aparato de televisión.

[Fig. 16] La figura 16 es un diagrama de bloques que ilustra una configuración esquemática de un teléfono móvil.

[Fig. 17] La figura 17 es un diagrama de bloques que ilustra una configuración esquemática de un dispositivo de registro/reproducción.

[Fig. 18] La figura 18 es un diagrama de bloques que ilustra una configuración esquemática de un dispositivo de captura de imágenes.

[Fig. 19] La figura 19 es un diagrama explicativo que ilustra valores por defecto de matriz de cuantificación predefinidos en H.264/AVC.

Descripción de realización

En lo sucesivo en el presente documento, se describirán con detalle elementos referentes a la presente invención con referencia a los dibujos adjuntos. Obsérvese que, en esta memoria descriptiva y en los dibujos, elementos que tienen sustancialmente la misma función y estructura se indican con los mismos signos de referencia, y se omite una explicación repetida.

Asimismo, la descripción detallada se describe en un orden siguiente.

1. Ejemplos de configuración del dispositivo de codificación de imágenes

1 -1. Ejemplo de configuración global

1-2. Ejemplo de configuración de la sección de transformación ortogonal y de cuantificación

1-3. Ejemplo de configuración detallado de la sección de procesamiento de matrices

1-4. Ejemplos de información a codificar

2. Flujo de proceso de codificación

3. Ejemplos de configuración del dispositivo de descodificación de imágenes

3-1. Ejemplo de configuración global

3-2. Ejemplo de configuración de la sección de cuantificación inversa y de transformación ortogonal inversa 3-3. Ejemplo de configuración detallado de la sección de generación de matrices

4. Flujo de proceso de descodificación de acuerdo con una realización

5. Modificaciones

6. Aplicaciones de ejemplo

7. En resumen

<1. Ejemplos de configuración del dispositivo de codificación de imágenes>

A continuación se describen ejemplos de configuración del dispositivo de codificación de imágenes.

[1-1. Dispositivo de codificación de imágenes]

La figura 1 es un diagrama de bloques que muestra un ejemplo de una configuración de un dispositivo de codificación de imágenes 10. Haciendo referencia a la figura 1, el dispositivo de codificación de imágenes 10 incluye una sección de conversión A/D (de Analógico a Digital) 11, una memoria intermedia de reordenación 12, una sección de sustracción 13, una sección de transformación ortogonal y de cuantificación 14, una sección de codificación sin pérdidas 16, una memoria intermedia de acumulación 17, una sección de control de tasa 18, una sección de cuantificación inversa 21, una sección de transformación ortogonal inversa 22, una sección de adición 23, un filtro de desbloqueo 24, una memoria de tramas 25, un selector 26, una sección de intra predicción 30, una sección de estimación de movimiento 40 y una sección de selección de modo 50.

La sección de conversión A/D 11 convierte una entrada de señal de imagen en un formato analógico en datos de imagen en un formato digital y emite una serie de datos de imagen digitales a la memoria intermedia de reordenación 12.

La memoria intermedia de reordenación 12 clasifica las imágenes incluidas en la serie de datos de imagen introducidos desde la sección de conversión A/D 11. Después de reordenar las imágenes de acuerdo con la estructura de GOP (Grupo de Imágenes) de acuerdo con el proceso de codificación, la memoria intermedia de reordenación 12 emite los datos de imagen que se han clasificado a la sección de sustracción 13, la sección de intra predicción 30 y la sección de estimación de movimiento 40.

Los datos de imagen introducidos desde la memoria intermedia de reordenación 12 y los datos de imagen predichos seleccionados por la sección de selección de modo 50 descrita más adelante se suministran a la sección de sustracción 13. La sección de sustracción 13 calcula datos de error predichos, que son una diferencia entre los datos de imagen introducidos desde la memoria intermedia de reordenación 12 y los datos de imagen predichos introducidos desde la sección de selección de modo 50, y emite los datos de error predichos calculados a la sección de transformación ortogonal y de cuantificación 14.

La sección de transformación ortogonal y de cuantificación 14 realiza una transformación ortogonal y una cuantificación de los datos de error de predicción suministrados desde la sección de sustracción 13 y emite datos de coeficientes de transformación cuantificados (denominados, en lo sucesivo en el presente documento, datos cuantificados) a una sección de codificación sin pérdidas 16 y a una sección de cuantificación inversa 21. Una tasa de bits de datos cuantificados emitidos desde la sección de transformación ortogonal y de cuantificación 14 se controla basándose en una señal de control de tasa desde una sección de control de tasa 18. Más adelante se describirá una configuración detallada de la sección de transformación ortogonal y de cuantificación 14.

A la sección de codificación sin pérdidas 16, se le suministran datos cuantificados introducidos desde la sección de transformación ortogonal y de cuantificación 14, información para generar una matriz de cuantificación en el lado de descodificación, e información acerca de intra predicción o inter predicción seleccionada por una sección de selección de modo 50. La información acerca de la intra predicción puede contener información de modo de predicción que indica un modo de intra predicción apropiado para cada bloque. La información acerca de inter predicción puede contener información de modo de predicción para la predicción de un vector de movimiento para cada bloque, un vector de movimiento de diferencias e información de imagen de referencia, por ejemplo.

La sección de codificación sin pérdidas 16 realiza una codificación sin pérdidas sobre datos cuantificados para generar un flujo codificado. La sección de codificación sin pérdidas 16 puede proporcionar una codificación de longitud variable o una codificación aritmética como una codificación sin pérdidas. La sección de codificación sin pérdidas 16 multiplexa información para generar una matriz de cuantificación (que se describirá más adelante) en un encabezamiento (por ejemplo, un conjunto de parámetros de secuencia y un conjunto de parámetros de imagen) de un flujo codificado. Además, la sección de codificación sin pérdidas 16 multiplexa información acerca de la intra predicción o la inter predicción en el encabezamiento de flujo codificado. La sección de codificación sin pérdidas 16 emite un flujo codificado generado a la memoria intermedia de almacenamiento 17.

La memoria intermedia de acumulación 17 almacena temporalmente el flujo codificado introducido desde la sección de codificación sin pérdidas 16 usando un medio de almacenamiento, tal como una memoria de semiconductores. Entonces, la memoria intermedia de acumulación 17 emite el flujo codificado acumulado a una tasa de acuerdo con la banda de una línea de transmisión (o una línea de salida desde el dispositivo de codificación de imágenes 10).

La sección de control de tasa 18 supervisa el espacio libre de la memoria intermedia de acumulación 17. Entonces, la sección de control de tasa 18 genera una señal de control de tasa de acuerdo con el espacio libre en la memoria intermedia de acumulación 17, y emite la señal de control de tasa generada a la sección de transformación ortogonal y de cuantificación 14. Por ejemplo, cuando no hay mucho espacio libre en la memoria intermedia de acumulación 17, la sección de control de tasa 18 genera una señal de control de tasa para bajar la tasa de bits de los datos cuantificados. Asimismo, por ejemplo, cuando el espacio libre en la memoria intermedia de acumulación 17 es suficientemente grande, la sección de control de tasa 18 genera una señal de control de tasa para aumentar la tasa de bits de los datos cuantificados.

La sección de cuantificación inversa 21 realiza un proceso de cuantificación inversa sobre los datos cuantificados introducidos desde la sección de transformación ortogonal y de cuantificación 14. Entonces, la sección de cuantificación inversa 21 emite datos de coeficientes de transformación adquiridos por el proceso de cuantificación inversa a la sección de transformación ortogonal inversa 22.

La sección de transformación ortogonal inversa 22 realiza un proceso de transformación ortogonal inversa sobre los datos de coeficientes de transformación introducidos desde la sección de cuantificación inversa 21 para restablecer de ese modo los datos de error predichos. Entonces, la sección de transformación ortogonal inversa 22 emite los datos de error predichos restablecidos a la sección de adición 23.

La sección de adición 23 añade los datos de error predichos restablecidos introducidos desde la sección de transformación ortogonal inversa 22 y los datos de imagen predichos introducidos desde la sección de selección de modo 50 para generar de ese modo datos de imagen descodificados. Entonces, la sección de adición 23 emite los datos de imagen descodificados generados al filtro de desbloqueo 24 y a la memoria de tramas 25.

Un filtro de desbloqueo 24 realiza un proceso de filtrado para disminuir la distorsión de bloque que tiene lugar durante la codificación de imágenes. El filtro de desbloqueo 24 elimina la distorsión de bloque filtrando los datos de imagen descodificados introducidos desde la sección de adición 23 y, entonces, después del filtrado, emite los datos de imagen descodificados a la memoria de tramas 25.

La memoria de tramas 25 almacena, usando un medio de almacenamiento, los datos de imagen descodificados introducidos desde la sección de adición 23 y los datos de imagen descodificados después del filtrado introducidos desde el filtro de desbloqueo 24.

El selector 26 lee, de la memoria de tramas 25, los datos de imagen descodificados antes del filtrado que se van a usar para la intra predicción, y suministra los datos de imagen descodificados que se han leído a la sección de intra predicción 30 como datos de imagen de referencia. Asimismo, el selector 26 lee, de la memoria de tramas 25, los datos de imagen descodificados después del filtrado que se van a usar para la inter predicción, y suministra los datos de imagen descodificados que se han leído a la sección de estimación de movimiento 40 como datos de imagen de referencia.

La sección de intra predicción 30 realiza un proceso de intra predicción en cada modo de intra predicción, basándose en los datos de imagen a codificar que se introducen desde la memoria intermedia de reordenación 12 y los datos de imagen descodificados suministrados a través del selector 26. Por ejemplo, la sección de intra predicción 30 evalúa el resultado de la predicción de cada modo de intra predicción usando una función de coste predeterminada. Entonces, la sección de intra predicción 30 selecciona un modo de intra predicción mediante el cual el valor de función de coste es el más pequeño, es decir, un modo de intra predicción mediante el cual la relación de compresión es la más alta, como el modo de intra predicción óptimo. Además, la sección de intra predicción 30 emite, a la sección de selección de modo 50, información de modo de predicción que indica el modo de intra predicción óptimo, los datos de imagen predichos y la información acerca de intra predicción tal como el valor de función de coste.

Una sección de estimación de movimiento 40 realiza un proceso de inter predicción (proceso de predicción entre tramas) basándose en datos de imagen para su codificación suministrados desde una memoria intermedia de reordenación 12 y datos de imagen descodificados suministrados a través de un selector 26. Por ejemplo, la sección de estimación de movimiento 40 evalúa el resultado de la predicción de cada modo de predicción usando una función de coste predeterminada. Entonces, la sección de estimación de movimiento 40 selecciona un modo de predicción óptimo, en concreto, un modo de predicción que minimiza el valor de función de coste o maximiza la relación de compresión. La sección de estimación de movimiento 40 genera datos de imagen predichos de acuerdo con el modo de predicción óptimo. La sección de estimación de movimiento 40 emite información acerca de la inter predicción, tal como información relacionada con la inter predicción, que incluye información de modo de predicción que indica el modo de intra predicción óptimo, los datos de imagen predichos y el valor de función de coste a una sección de selección de modo 50.

La sección de selección de modo 50 compara el valor de función de coste relacionado con la intra predicción introducido desde la sección de intra predicción 30 y el valor de función de coste relacionado con la inter predicción introducido desde la sección de estimación de movimiento 40. Entonces, la sección de selección de modo 50 selecciona un método de predicción con un valor de función de coste más pequeño, de entre la intra predicción y la inter predicción. En el caso de seleccionar la intra predicción, la sección de selección de modo 50 emite la información acerca de intra predicción a la sección de codificación sin pérdidas 16, y también emite los datos de imagen predichos a la sección de sustracción 13 y a la sección de adición 23. Asimismo, en el caso de seleccionar la inter predicción, la sección de selección de modo 50 emite la información acerca de inter predicción descrita anteriormente a la sección de codificación sin pérdidas 16, y también emite los datos de imagen predichos a la sección de sustracción 13 y a la sección de adición 23.

[1-2. Ejemplo de configuración de la sección de transformación ortogonal y de cuantificación]

La figura 2 es un diagrama de bloques que ilustra una configuración detallada de la sección de transformación ortogonal y de cuantificación 14 del dispositivo de codificación de imágenes 10 ilustrado en la figura 1. Con referencia a la figura 2, la sección de transformación ortogonal y de cuantificación 14 incluye una sección de selección 110, una sección de transformación ortogonal 120, una sección de cuantificación 130, una memoria intermedia de matrices de cuantificación 140 y una sección de procesamiento de matrices 15.

(1) Sección de selección

La sección de selección 110 selecciona una unidad de transformación (TU) usada para la transformación ortogonal de datos de imagen a codificar a partir de múltiples unidades de transformación que tienen diferentes tamaños. Los candidatos de tamaño de las unidades de transformación a seleccionar por la sección de selección 110 incluyen 4 x 4 y 8 x 8 para H.264/AVC y 4 x 4, 8 x 8, 16 x 16 y 32 x 32 para HEVC. La sección de selección 110 puede seleccionar cualquiera de las unidades de transformación de acuerdo con el tamaño de una imagen a codificar, la calidad de imagen o el desempeño del aparato, por ejemplo. Un usuario que desarrolla aparatos puede ajustar manualmente la selección de unidades de transformación por la sección de selección 110. La sección de selección 110 emite información que especifica el tamaño de la unidad de transformación seleccionada a la sección de transformación ortogonal 120, la sección de cuantificación 130, la sección de codificación sin pérdidas 16 y la sección de cuantificación inversa 21.

(2) Sección de transformación ortogonal

La sección de transformación ortogonal 120 transforma ortogonalmente datos de imagen (es decir, datos de error de predicción) suministrados desde la sección de sustracción 13 usando la unidad de transformación seleccionada por la sección de selección 110. La transformación ortogonal realizada por la sección de transformación ortogonal 120 puede representar, por ejemplo, una transformada de coseno discreta (DCT) o una transformada de Karhunen-Loeve. La sección de transformación ortogonal 120 emite datos de coeficientes de transformación adquiridos por un proceso de transformación ortogonal a la sección de cuantificación 130.

(3) Sección de cuantificación

La sección de cuantificación 130 cuantifica datos de coeficientes de transformación generados por la sección de transformación ortogonal 120 usando una matriz de cuantificación que corresponde a la unidad de transformación seleccionada por la sección de selección 110. La sección de cuantificación 130 varía una tasa de bits de datos cuantificados de salida cambiando escalones de cuantificación basándose en una señal de control de tasa desde la sección de control de tasa 18.

La sección de cuantificación 130 permite que la memoria intermedia de matrices de cuantificación 140 almacene conjuntos de matrices de cuantificación que corresponden a unidades de transformación seleccionadas por la sección de selección 110. Por ejemplo, HEVC proporciona candidatos de unidad de transformación de cuatro tipos de tamaño tales como 4 x 4, 8 x 8, 16 x 16 y 32 x 32. En un caso como este, la memoria intermedia de matrices de cuantificación 140 puede almacenar cuatro tipos de conjuntos de matrices de cuantificación que corresponden a los cuatro tipos de tamaño. Se puede dar el caso de que un tamaño específico use una matriz de cuantificación por defecto, como se muestra en la figura 19. En un caso como este, la memoria intermedia de matrices de cuantificación 140 puede almacenar solo un indicador que indica el uso de la matriz de cuantificación por defecto (sin usar una matriz de cuantificación definida por el usuario) en asociación con el tamaño específico.

Un conjunto de matrices de cuantificación que puede usar la sección de cuantificación 130 se puede configurar habitualmente para cada secuencia de flujos codificados. Si se configura un conjunto de matrices de cuantificación para cada secuencia, la sección de cuantificación 130 puede actualizar el conjunto para cada imagen. Se puede insertar información para controlar la configuración y la actualización de conjuntos de matrices de cuantificación en un conjunto de parámetros de secuencia y en un conjunto de parámetros de imagen, por ejemplo.

(4) Memoria intermedia de matrices de cuantificación

La memoria intermedia de matrices de cuantificación 140 usa un medio de almacenamiento tal como una memoria de semiconductores para almacenar temporalmente conjuntos de matrices de cuantificación que corresponden a unidades de transformación seleccionadas por la sección de selección 110. Un proceso realizado por la sección de procesamiento de matrices 150 que se describirá a continuación hace referencia a un conjunto de matrices de cuantificación almacenadas por la memoria intermedia de matrices de cuantificación 140.

(5) Sección de procesamiento de matrices

La sección de procesamiento de matrices 150 hace referencia a un conjunto de matrices de cuantificación almacenadas en la memoria intermedia de matrices de cuantificación 140 para cada secuencia de flujos codificados y cada imagen y genera información que genera una matriz de cuantificación que corresponde a una unidad de transformación de uno o más tamaños a partir de otra matriz de cuantificación que corresponde a una unidad de transformación de un tamaño. Una matriz de cuantificación se puede generar habitualmente basándose en el mínimo de los tamaños de unidad de transformación. Si HEVC proporciona candidatos de unidad de transformación de cuatro tipos de tamaño tales como 4 x 4, 8 x 8, 16 x 16 y 32 x 32, se puede usar una matriz de cuantificación de 4 x 4 para generar la información que genera matrices de cuantificación de los otros tamaños. La información generada por la sección de procesamiento de matrices 15 puede incluir información de matriz básica e información de matriz de diferencias que se describirán más adelante. La información generada por la sección de procesamiento de matrices 150 se emite a la sección de codificación sin pérdidas 16 y se puede insertar en el encabezamiento de flujo codificado.

La memoria descriptiva describe principalmente un ejemplo de generación de una matriz de cuantificación de un tamaño más grande a partir de una matriz de cuantificación del tamaño mínimo. Aunque no se limita a esto, se puede generar una matriz de cuantificación que tiene un tamaño más pequeño y/o un tamaño más grande a partir de una matriz de cuantificación que tiene un tamaño que no sea el tamaño mínimo.

[1-3. Ejemplo de configuración detallado de la sección de procesamiento de matrices]

La figura 3 es un diagrama de bloques que ilustra una configuración más detallada de la sección de procesamiento de matrices 150 de la sección de transformación ortogonal y de cuantificación 14 ilustrada en la figura 2. Con referencia a la figura 3, la sección de procesamiento de matrices 150 incluye una sección de predicción 152 y una sección de cálculo de diferencias 154.

(1) Sección de predicción

La sección de predicción 152 adquiere un conjunto de matrices de cuantificación almacenadas en la memoria intermedia de matrices de cuantificación 140 y predice una segunda matriz de cuantificación que tiene un tamaño más grande a partir de una primera matriz de cuantificación contenida en el conjunto adquirido. Por ejemplo, una matriz de cuantificación de 4 x 4 SL1 se define como sigue.

[Operación matemática 1]

Por ejemplo, una matriz predicha de 8 x 8 PSL2 puede ser predicha por la sección de predicción 152 a partir de la matriz de cuantificación SL1 y calcularse como sigue de acuerdo con la expresión de predicción (2) a continuación.

[Operación matemática 2]

Con referencia a la expresión de predicción (2), duplicar uno de dos elementos adyacentes entre sí en la matriz de cuantificación SL1 genera la matriz predicha PSL2 como un elemento entre los dos elementos.

En lugar de ello, la matriz predicha PSL2 se puede calcular a partir de la matriz de cuantificación SL1 de acuerdo con la expresión de predicción (3) a continuación.

[Operación matemática 3]

Con referencia a la expresión de predicción (3), interpolar linealmente uno de dos elementos adyacentes entre sí en la matriz de cuantificación SL1 genera la matriz predicha PSL2 como un elemento entre los dos elementos. La expresión de predicción (3) duplica el elemento de extremo derecho en la matriz predicha PSL2 a partir del elemento adyacente a la izquierda. En lugar de la duplicación, se puede usar la extrapolación lineal para calcular los elementos de extremo derecho. De modo similar, se puede usar la extrapolación lineal para calcular el elemento inferior en la matriz predicha PSL2 de acuerdo con la expresión de predicción (3), en lugar de duplicar el elemento adyacente justo encima. Por ejemplo, la expresión de predicción (3) produce a33 para el elemento PSL28.8 en la octava fila y la octava columna en la matriz predicha PSL2. El mismo elemento también se puede calcular como sigue de acuerdo con la extrapolación lineal.

[Operación matemática 4]

La expresión de predicción (2) puede generar la matriz predicha PSL2 con unos costes de cálculo menores que los de la expresión de predicción (3). El uso de la expresión de predicción (3) puede generar una matriz predicha suave más aproximada a una matriz de cuantificación a usar originalmente. Por lo tanto, el uso de la expresión de predicción (3) puede reducir la cantidad de información codificada al hacer que los elementos de una matriz de diferencias que se describirá más adelante sean aproximadamente iguales a cero.

Las expresiones de predicción y (2) y (3) son meros ejemplos de expresiones de predicción disponibles. Se puede usar cualquiera otra expresión de predicción.

Después de generar la matriz predicha PSL2 a partir de la matriz de cuantificación SL1, la sección de predicción 152 emite la matriz predicha PSL2 generada a la sección de cálculo de diferencias 154. Por ejemplo, la sección de predicción 152 predice una matriz predicha de 16 x 16 PSL3 a partir de la matriz predicha de 8 x 8 SL2 contenida en el conjunto de matrices de cuantificación y emite la matriz predicha PSL3 a la sección de cálculo de diferencias 154. Además, la sección de predicción 152 predice una matriz predicha de 32 x 32 PSL4 a partir de la matriz de cuantificación de 16 x 16 SL3 contenida en el conjunto de matrices de cuantificación y emite la matriz predicha PSL4 a la sección de cálculo de diferencias 154. Se puede usar una expresión de predicción que es igual a la expresión de predicción (2) o (3) descrita anteriormente para predecir las matrices predichas PSL3 y PSL4. La sección de predicción 152 emite la información de matriz básica a la sección de codificación sin pérdidas 16. La información de matriz básica especifica la matriz de cuantificación de 4 x 4 SL1 como una base para la generación de las matrices predichas PSL2, PSL3 y PSL4 descritas anteriormente.

(2) Sección de cálculo de diferencias

La sección de cálculo de diferencias 154 calcula unas matrices de diferencias DSL2, DSL3 y DSL4 de acuerdo con las expresiones (5) a (7). Cada una de las matrices de diferencias DSL2, DSL3 y DSL4 representa una diferencia entre cada una de las matrices predichas PSL2, PSL3 y PSL4 suministradas desde la sección de predicción 152 y cada una de las matrices de cuantificación SL2, SL3 y SL4 correspondientes.

[Operación matemática 5]

DSL2 = SL2 - PSL2 (5)

DSL3 = SL3 - PSL3 (6)

DSL4 = SL4 - PSL4 (7)

La sección de cálculo de diferencias 154 suministra información que representa las matrices de diferencias DSL2, DSL3 y DSL4 a la sección de codificación sin pérdidas 16.

Si se usa una matriz de cuantificación por defecto para un tamaño dado, la sección de procesamiento de matrices 150 no realiza una predicción y un cálculo de diferencias sobre una matriz de cuantificación de ese tamaño. En cambio, la sección de procesamiento de matrices 150 suministra a la sección de codificación sin pérdidas 16 solo un indicador que indica el uso de la matriz de cuantificación por defecto en asociación con el tamaño correspondiente. Si no hay diferencias entre la matriz predicha y la matriz de cuantificación, la sección de cálculo de diferencias 154 no emite información de matriz de diferencias, sino que emite solo un indicador que indica que no hay diferencias a la sección de codificación sin pérdidas 16. Si la matriz de cuantificación no se actualiza con la temporización del cambio de una imagen, la sección de procesamiento de matrices 150 puede suministrar solo un indicador que indica que no se actualiza la matriz de cuantificación a la sección de codificación sin pérdidas 16.

[1-4. Ejemplos de información a codificar]

(1) Conjunto de parámetros de secuencia

La figura 4 es un diagrama explicativo que ilustra información insertada en un conjunto de parámetros de secuencia. La figura 4 muestra tres tipos de información tales como un "indicador de tipo de matriz", un "indicador de diferencia" e "información de matriz (a codificar) " como información a codificar para cada tamaño de matriz de cuantificación o tamaño de la unidad de transformación (TU).

El indicador de tipo de matriz especifica si usar una matriz de cuantificación definida por el usuario o una matriz de cuantificación por defecto para cada tamaño. Si el indicador de tipo de matriz se establece a 1 para un tamaño dado, se usa una matriz de cuantificación definida por el usuario para el tamaño. Si el indicador de tipo de matriz se establece a 0 para un tamaño dado, se usa una matriz de cuantificación por defecto para el tamaño. Si el indicador de tipo de matriz se establece a 0, no se codifica ninguna de la información de matriz, la información de matriz de diferencias y el indicador de diferencia descritos a continuación.

El indicador de diferencia identifica si hay una diferencia entre la matriz predicha y la matriz de cuantificación si el indicador de tipo de matriz se establece a 1 para cada tamaño para indicar la matriz de cuantificación definida por el usuario. Si el indicador de tipo de matriz se establece a 1 para un tamaño dado, existe una diferencia entre la matriz predicha y la matriz de cuantificación para el tamaño y se codifica la información de matriz de diferencias. Si el indicador de tipo de matriz se establece a 0 para un tamaño dado, no se codifica la información de matriz de diferencias para el tamaño. El indicador de diferencia no se codifica para el tamaño (por ejemplo, 4 x 4) como una base de predicción independientemente del indicador de tipo de matriz.

(2) Conjunto de parámetros de imagen

La figura 5 es un diagrama explicativo que ilustra información insertada en un conjunto de parámetros de imagen de acuerdo con la realización. La figura 5 muestra cuatro tipos de información, tales como un "indicador de actualización", un "indicador de tipo de matriz", un "indicador de diferencia" e "información de matriz (a codificar)" como información a codificar para cada tamaño de matriz de cuantificación o de unidad de transformación (TU). El indicador de tipo de matriz y el indicador de diferencia tienen los mismos significados que los indicadores con los mismos nombres para los conjuntos de parámetros de secuencia que se han descrito con referencia a la figura 4.

El indicador de actualización indica si actualizar la matriz de cuantificación con la temporización del cambio de una imagen para cada tamaño. Si el indicador de actualización se establece a 1 para un tamaño dado, se actualiza una matriz de cuantificación del tamaño. Si el indicador de actualización se establece a 0, no se actualiza una matriz de cuantificación del tamaño y una matriz de cuantificación especificada para la imagen previa o la secuencia actual se usa tal cual. Si el indicador de actualización se establece a 0, no se codifica ninguno de entre el indicador de tipo de matriz, el indicador de diferencia y la información de matriz de diferencias (o la información de matriz para 4 x 4) para el tamaño.

<2. Proceso de codificación>

Las figuras 6A y 6B son diagramas de flujo que ilustran un primer ejemplo de un flujo de proceso de codificación. La sección de procesamiento de matrices 150 y la sección de codificación sin pérdidas 16 pueden realizar el proceso representado por los diagramas de flujo principalmente en cada secuencia de flujos codificados.

Con referencia a la figura 6A, la sección de procesamiento de matrices 150 adquiere de la memoria intermedia de matrices de cuantificación 140 un conjunto de matrices de cuantificación usadas para la sección de cuantificación 130 en esta secuencia (la etapa S100). Como ejemplo, se supone que el conjunto de matrices de cuantificación contiene matrices de cuantificación que corresponden a los tamaños de 4 x 4, de 8 x 8, de 16 x 16 y de 32 x 32.

La sección de procesamiento de matrices 150 determina si una matriz de cuantificación de 4 x 4 es una definida por el usuario (la etapa S102). Si la matriz de cuantificación de 4 x 4 es una definida por el usuario, la sección de codificación sin pérdidas 16 codifica la información de matriz básica que representa una matriz de cuantificación de 4 x 4 con el indicador de tipo de matriz establecido a 1 (la etapa S106). Si la matriz de cuantificación de 4 x 4 es una por defecto, la sección de codificación sin pérdidas 16 codifica solo el indicador de tipo de matriz establecido a 0 (la etapa S108).

La sección de procesamiento de matrices 150 determina si una matriz de cuantificación de 8 x 8 es una definida por el usuario (la etapa S112). Si la matriz de cuantificación de 8 x 8 es una definida por el usuario, la sección de procesamiento de matrices 150 usa la expresión de predicción (2) o (3) descrita anteriormente para calcular una matriz predicha de 8 x 8 a partir de la matriz de cuantificación de 4 x 4 (la etapa S114). La sección de codificación sin pérdidas 16 codifica el indicador de tipo de matriz (= 1), el indicador de diferencia y la información de matriz de diferencias (si existe) indicando una diferencia entre la matriz de cuantificación de 8 x 8 y la matriz predicha calculada (la etapa S116). Si la matriz de cuantificación de 8 x 8 es una por defecto, la sección de codificación sin pérdidas 16 codifica solo el indicador de tipo de matriz establecido a 0 (la etapa S118).

Con referencia a la figura 6B, la sección de procesamiento de matrices 150 determina si una matriz de cuantificación de 16 x 16 es una definida por el usuario (la etapa S122). Si la matriz de cuantificación de 16 x 16 es una definida por el usuario, la sección de procesamiento de matrices 150 calcula una matriz predicha de 16 x 16 a partir de la matriz de cuantificación de 8 x 8 (la etapa S124). La sección de codificación sin pérdidas 16 codifica el indicador de tipo de matriz (= 1), el indicador de diferencia y la información de matriz de diferencias (si existe) indicando una diferencia entre la matriz de cuantificación de 16 x 16 y la matriz predicha calculada (la etapa S126). Si la matriz de cuantificación de 16 x 16 es una por defecto, la sección de codificación sin pérdidas 16 codifica solo el indicador de tipo de matriz establecido a 0 (la etapa S128).

La sección de procesamiento de matrices 150 determina si una matriz de cuantificación de 32 x 32 es una definida por el usuario (la etapa S132). Si la matriz de cuantificación de 32 x 32 es una definida por el usuario, la sección de procesamiento de matrices 150 calcula una matriz predicha de 32 x 32 a partir de la matriz de cuantificación de 16 x 16 (la etapa S134). La sección de codificación sin pérdidas 16 codifica el indicador de tipo de matriz (= 1), el indicador de diferencia y la información de matriz de diferencias (si existe) indicando una diferencia entre la matriz de cuantificación de 32 x 32 y la matriz predicha calculada (la etapa S136). Si la matriz de cuantificación de 32 x 32 es una por defecto, la sección de codificación sin pérdidas 16 codifica solo el indicador de tipo de matriz establecido a 0 (la etapa S138).

Las figuras 7A y 7B son diagramas de flujo que ilustran un segundo ejemplo de un flujo de proceso de codificación. La sección de procesamiento de matrices 150 y la sección de codificación sin pérdidas 16 pueden realizar el proceso representado por los diagramas de flujo principalmente en cada imagen que corresponde a una secuencia de flujos codificados.

Con referencia a la figura 7A, la sección de procesamiento de matrices 150 adquiere de la memoria intermedia de matrices de cuantificación 140 un conjunto de matrices de cuantificación usadas para la sección de cuantificación 130 en la imagen (la etapa S150). De forma similar a la de los ejemplos en las figuras 6A y 6B, se supone que el conjunto de matrices de cuantificación contiene matrices de cuantificación que corresponden a los tamaños de 4 x 4, de 8 x 8, de 16 x 16 y de 32 x 32.

La sección de procesamiento de matrices 150 determina si una matriz de cuantificación de 4 x 4 se actualiza en la imagen (la etapa S152). Si no se actualiza la matriz de cuantificación, la sección de codificación sin pérdidas 16 codifica solo el indicador de actualización establecido a 0 (la etapa S158). Si se actualiza la matriz de cuantificación, el proceso pasa a la etapa S154. Si se actualiza la matriz de cuantificación, la sección de procesamiento de matrices 150 determina si una nueva matriz de cuantificación de 4 x 4 es una definida por el usuario (la etapa S154). Si la matriz de cuantificación de 4 x 4 es una definida por el usuario, la sección de codificación sin pérdidas 16 codifica la información de matriz básica que representa una matriz de cuantificación de 4 x 4 con el indicador de actualización establecido a 1 y el indicador de tipo de matriz establecido a 1 (la etapa S156). Si la matriz de cuantificación de 4 x 4 es una por defecto, la sección de codificación sin pérdidas 16 codifica el indicador de actualización establecido a 1 y el indicador de tipo de matriz establecido a 0 (la etapa S158).

La sección de procesamiento de matrices 150 determina si una matriz de cuantificación de 8 x 8 se actualiza en la imagen (la etapa S160). Si no se actualiza la matriz de cuantificación, la sección de codificación sin pérdidas 16 codifica solo el indicador de actualización establecido a 0 (la etapa S168). Si se actualiza la matriz de cuantificación, el proceso pasa a la etapa S162. Si se actualiza la matriz de cuantificación, la sección de procesamiento de matrices 150 determina si una matriz de cuantificación de 8 x 8 es una definida por el usuario (la etapa S162). Si la matriz de cuantificación de 8 x 8 es una definida por el usuario, la sección de procesamiento de matrices 150 calcula una matriz de cuantificación predicha de 8 x 8 a partir de la matriz de cuantificación de 4 x 4 para una nueva imagen con independencia de si se actualiza la matriz de cuantificación de 4 x 4 (la etapa S164). La sección de codificación sin pérdidas 16 codifica el indicador de actualización (= 1), el indicador de tipo de matriz (= 1), el indicador de diferencia y la información de matriz de diferencias (si existe) indicando una diferencia entre la matriz de cuantificación de 8 x 8 y la matriz predicha calculada (la etapa S166). Si la matriz de cuantificación de 8 x 8 es una por defecto, la sección de codificación sin pérdidas 16 codifica el indicador de actualización establecido a 1 y el indicador de tipo de matriz establecido a 0 (la etapa S168).

Con referencia a la figura 7B, la sección de procesamiento de matrices 150 determina si una matriz de cuantificación de 16 x 16 se actualiza en la imagen (la etapa S170). Si no se actualiza la matriz de cuantificación, la sección de codificación sin pérdidas 16 codifica solo el indicador de actualización establecido a 0 (la etapa S178). Si se actualiza la matriz de cuantificación, el proceso pasa a la etapa S172. Si se actualiza la matriz de cuantificación, la sección de procesamiento de matrices 150 determina si una matriz de cuantificación de 16 x 16 es una definida por el usuario (la etapa S172). Si la matriz de cuantificación de 16 x 16 es una definida por el usuario, la sección de procesamiento de matrices 150 calcula una matriz de cuantificación predicha de 16 x 16 a partir de la matriz de cuantificación de 8 x 8 para una nueva imagen con independencia de si se actualiza la matriz de cuantificación de 8 x 8 (la etapa S174). La sección de codificación sin pérdidas 16 codifica el indicador de actualización (= 1), el indicador de tipo de matriz (= 1), el indicador de diferencia y la información de matriz de diferencias (si existe) indicando una diferencia entre la matriz de cuantificación de 16 x 16 y la matriz predicha calculada (la etapa S176). Si la matriz de cuantificación de 16 x 16 es una por defecto, la sección de codificación sin pérdidas 16 codifica el indicador de actualización establecido a 1 y el indicador de tipo de matriz establecido a 0 (la etapa S178).

La sección de procesamiento de matrices 150 determina si una matriz de cuantificación de 32 x 32 se actualiza en la imagen (la etapa S180). Si no se actualiza la matriz de cuantificación, la sección de codificación sin pérdidas 16 codifica solo el indicador de actualización establecido a 0 (la etapa S188). Si se actualiza la matriz de cuantificación, el proceso pasa a la etapa S182. Si se actualiza la matriz de cuantificación, la sección de procesamiento de matrices 150 determina si una matriz de cuantificación de 32 x 32 es una definida por el usuario (la etapa S182). Si la matriz de cuantificación de 32 x 32 es una definida por el usuario, la sección de procesamiento de matrices 150 calcula una matriz de cuantificación predicha de 32 x 32 a partir de la matriz de cuantificación de 16 x 16 para una nueva imagen con independencia de si se actualiza la matriz de cuantificación de 16 x 16 (la etapa S184). La sección de codificación sin pérdidas 16 codifica el indicador de actualización (= 1), el indicador de tipo de matriz (= 1), el indicador de diferencia y la información de matriz de diferencias (si existe) indicando una diferencia entre la matriz de cuantificación de 32 x 32 y la matriz predicha calculada (la etapa S186). Si la matriz de cuantificación de 32 x 32 es una por defecto, la sección de codificación sin pérdidas 16 codifica el indicador de actualización establecido a 1 y el indicador de tipo de matriz establecido a 0 (la etapa S188).

La técnica para predecir matrices de cuantificación basándose en una matriz de cuantificación puede eliminar la necesidad de transmitir múltiples matrices de cuantificación que corresponden a múltiples tamaños de unidades de transformación desde el lado de codificación al lado de descodificación. Un aumento en la cantidad de códigos se puede moderar de forma eficaz incluso si aumenta el número de matrices de cuantificación.

<3. Ejemplos de configuración del dispositivo de descodificación de imágenes>

A continuación se describen ejemplos de configuración del dispositivo de descodificación de imágenes.

[3-1. Ejemplo de configuración global]

La figura 8 es un diagrama de bloques que muestra un ejemplo de una configuración de un dispositivo de descodificación de imágenes 60. Con referencia a la figura 8, el dispositivo de descodificación de imágenes 60 incluye una memoria intermedia de acumulación 61, una sección de descodificación sin pérdidas 62, una sección de cuantificación inversa y de transformación ortogonal inversa 63, una sección de adición 65, un filtro de desbloqueo 66, una memoria intermedia de reordenación 67, una sección de conversión D/A (de Digital a Analógico) 68, una memoria de tramas 69, unos selectores 70 y 71, una sección de intra predicción 80 y una sección de compensación de movimiento 90.

La memoria intermedia de acumulación 61 almacena temporalmente un flujo codificado introducido a través de una línea de transmisión usando un medio de almacenamiento.

La sección de descodificación sin pérdidas 62 descodifica un flujo codificado suministrado desde la memoria intermedia de almacenamiento 61 de acuerdo con el sistema de codificación usado para la codificación. La sección de descodificación sin pérdidas 62 descodifica información multiplexada en el área de encabezamiento de flujos codificados. La información multiplexada en el área de encabezamiento de flujos codificados puede incluir la información de matriz básica y la información de matriz de diferencias para generar la matriz de cuantificación descrita anteriormente e información acerca de intra predicción e inter predicción en el encabezamiento de bloque. La sección de descodificación sin pérdidas 62 suministra información para generar datos cuantificados y una matriz de cuantificación después de la descodificación a la sección de cuantificación inversa y de transformación ortogonal inversa 63. La sección de descodificación sin pérdidas 62 suministra información acerca de la intra predicción a la sección de intra predicción 80. La sección de descodificación sin pérdidas 62 suministra información acerca de la inter predicción a la sección de compensación de movimiento 90.

La sección de cuantificación inversa y de transformación ortogonal inversa 63 realiza una cuantificación inversa y una transformación ortogonal inversa sobre datos cuantificados suministrados desde la sección de descodificación sin pérdidas 62 para generar datos de error de predicción. La sección de cuantificación inversa y de transformación ortogonal inversa 63 suministra los datos de error de predicción generados a la sección de adición 65.

La sección de adición 65 añade los datos de error predichos introducidos desde la sección de cuantificación inversa y de transformación ortogonal inversa 63 y los datos de imagen predichos introducidos desde el selector 71 para generar de ese modo datos de imagen descodificados. Entonces, la sección de adición 65 emite los datos de imagen descodificados generados al filtro de desbloqueo 66 y a la memoria de tramas 69.

El filtro de desbloqueo 66 elimina la distorsión de bloque filtrando los datos de imagen descodificados introducidos desde la sección de adición 65 y, entonces, después del filtrado, emite los datos de imagen descodificados a la memoria intermedia de reordenación 67 y a la memoria de tramas 69.

La memoria intermedia de reordenación 67 genera una serie de datos de imagen en una secuencia de tiempo reordenando imágenes introducidas desde el filtro de desbloqueo 66. Entonces, la memoria intermedia de reordenación 67 emite los datos de imagen generados a la sección de conversión D/A 68.

La sección de conversión D/A 68 convierte los datos de imagen en un formato digital introducidos desde la memoria intermedia de reordenación 67 en una señal de imagen en un formato analógico. Entonces, la sección de conversión D/A 68 hace que se visualice una imagen emitiendo la señal de imagen analógica a un visualizador (no mostrado) conectado al dispositivo de descodificación de imágenes 60, por ejemplo.

La memoria de tramas 69 usa un medio de almacenamiento para almacenar los datos de imagen descodificados introducidos desde la sección de adición 65 antes del filtrado y los datos de imagen descodificados introducidos desde el filtro de desbloqueo 66 después del filtrado.

El selector 70 conmuta el destino de salida de los datos de imagen desde la memoria de tramas 69 entre la sección de intra predicción 80 y la sección de compensación de movimiento 90 para cada bloque en la imagen de acuerdo con información de modo adquirida por la sección de descodificación sin pérdidas 62. Por ejemplo, en el caso de que se especifique el modo de intra predicción, el selector 70 emite los datos de imagen descodificados antes del filtrado que se suministran desde la memoria de tramas 69 a la sección de intra predicción 80 como datos de imagen de referencia. Asimismo, en el caso de que se especifique el modo de inter predicción, el selector 70 emite los datos de imagen descodificados después del filtrado que se suministran desde la memoria de tramas 69 a la sección de compensación de movimiento 90 como los datos de imagen de referencia.

El selector 71 conmuta el origen de salida de los datos de imagen predichos a suministrar a la sección de adición 65 entre la sección de intra predicción 80 y la sección de compensación de movimiento 90 para cada bloque en la imagen de acuerdo con la información de modo adquirida por la sección de descodificación sin pérdidas 62. Por ejemplo, en el caso de que se especifique el modo de intra predicción, el selector 71 suministra a la sección de adición 65 los datos de imagen predichos emitidos desde la sección de intra predicción 80. En el caso de que se especifique el modo de inter predicción, el selector 71 suministra a la sección de adición 65 los datos de imagen predichos emitidos desde la sección de compensación de movimiento 90.

La sección de intra predicción 80 realiza una predicción en pantalla de un valor de píxel basándose en la información acerca de intra predicción introducida desde la sección de descodificación sin pérdidas 62 y los datos de imagen de referencia introducidos desde la memoria de tramas 69, y genera datos de imagen predichos. Entonces, la sección de intra predicción 80 emite los datos de imagen predichos generados al selector 71.

La sección de compensación de movimiento 90 realiza un proceso de compensación de movimiento basándose en la información acerca de inter predicción introducida desde la sección de descodificación sin pérdidas 62 y los datos de imagen de referencia introducidos desde la memoria de tramas 69, y genera datos de imagen predichos. Entonces, la sección de compensación de movimiento 90 emite los datos de imagen predichos generados al selector 71.

[3-2. Ejemplo de configuración de la sección de cuantificación inversa y de transformación ortogonal inversa]

La figura 9 es un diagrama de bloques que ilustra una configuración detallada de la sección de cuantificación inversa y de transformación ortogonal inversa 63 del dispositivo de descodificación de imágenes 60 ilustrado en la figura 8. Como se muestra en la figura 9, la sección de cuantificación inversa y de transformación ortogonal inversa 63 incluye una sección de generación de matrices 210, una sección de selección 230, una sección de cuantificación inversa 240 y una sección de transformación ortogonal inversa 250.

(1) Sección de generación de matrices

La sección de generación de matrices 210 genera una matriz de cuantificación que corresponde a unidades de transformación que representan uno o más tamaños a partir de una matriz de cuantificación que corresponde a una unidad de transformación que representa un tamaño para cada imagen y secuencia de flujos codificados. Una matriz de cuantificación se puede generar habitualmente basándose en el mínimo de los tamaños de unidad de transformación. De acuerdo con la realización, la sección de generación de matrices 210 genera matrices de cuantificación de 8 x 8, de 16 x 16 y de 32 x 32 a partir de una matriz de cuantificación de 4 x 4 como el tamaño mínimo usando la información de matriz de diferencias acerca de tamaños más grandes.

(2) Sección de selección

La sección de selección 230 selecciona una unidad de transformación (TU) usada para la transformación ortogonal inversa de datos de imagen a descodificar a partir de múltiples unidades de transformación que tienen diferentes tamaños. Los candidatos de tamaño de las unidades de transformación a seleccionar por la sección de selección 230 incluyen 4 x 4 y 8 x 8 para H.264/AVC y 4 x 4, 8 x 8, 16 x 16 y 32 x 32 para HEVC. La sección de selección 230 puede seleccionar una unidad de transformación basándose en LCU, SCU y split_flag contenidos en el encabezamiento de flujo codificado, por ejemplo. La sección de selección 230 emite información que especifica el tamaño de la unidad de transformación seleccionada a la sección de cuantificación inversa 240 y a la sección de transformación ortogonal inversa 250.

(3) Sección de cuantificación inversa

La sección de cuantificación inversa 240 usa una matriz de cuantificación que corresponde a la unidad de transformación seleccionada por la sección de selección 230 para cuantificar inversamente datos de coeficientes de transformación cuantificados durante la codificación de imágenes. Las matrices de cuantificación usadas para la cuantificación inversa contienen una matriz generada por la sección de generación de matrices 210. Por ejemplo, la sección de selección 230 puede seleccionar una unidad de transformación de 8 x 8, de 16 x 16 o de 32 x 32. En un caso como este, la unidad de transformación seleccionada puede corresponder a la matriz de cuantificación que la sección de generación de matrices 210 genera a partir de una matriz de cuantificación de 4 x 4. La sección de cuantificación inversa 240 suministra los datos de coeficientes de transformación cuantificados inversamente a la sección de transformación ortogonal inversa 250.

(4) Sección de transformación ortogonal inversa

La sección de transformación ortogonal inversa 250 genera datos de error de predicción de acuerdo con el sistema de transformación ortogonal usado para la codificación. Para hacer esto, la sección de transformación ortogonal inversa 250 usa la unidad de transformación seleccionada para realizar la transformación ortogonal inversa sobre datos de coeficientes de transformación cuantificados inversamente por la sección de cuantificación inversa 240. La sección de transformación ortogonal inversa 250 suministra los datos de error de predicción generados a la sección de adición 65.

[3-3. Ejemplo de configuración detallado de la sección de generación de matrices]

La figura 10 es un diagrama de bloques que ilustra una configuración más detallada de la sección de generación de matrices 210 de la sección de cuantificación inversa y de transformación ortogonal inversa 63 ilustrada en la figura 9. Con referencia a la figura 10, la sección de generación de matrices 210 incluye una sección de adquisición de matrices de base 212, una sección de adquisición de diferencias 214, una sección de predicción 216, una sección de reconstrucción 218 y una memoria intermedia de matrices de cuantificación 220.

(1) Sección de adquisición de matrices de base

La sección de adquisición de matrices de base 212 adquiere información de matriz básica suministrada desde la sección de descodificación sin pérdidas 62. Como se ha descrito anteriormente, la información de matriz básica de acuerdo con la realización especifica una matriz de cuantificación de 4 x 4 SL1 como el tamaño mínimo. La sección de adquisición de matrices de base 212 permite que la memoria intermedia de matrices de cuantificación 220 almacene una matriz de cuantificación de 4 x 4 SL1 especificada en la información de matriz básica. Si se adquiere el indicador de tipo de matriz establecido a 0 para cada secuencia o imagen, la sección de adquisición de matrices de base 212 permite que la memoria intermedia de matrices de cuantificación 220 almacene la matriz de cuantificación de 4 x 4 por defecto sin adquirir la información de matriz básica. Si se adquiere el indicador de actualización establecido a 0 para cada imagen, la sección de adquisición de matrices de base 212 no actualiza la matriz de cuantificación SL1 almacenada en la memoria intermedia de matrices de cuantificación 220 durante el proceso previo. La sección de adquisición de matrices de base 212 suministra la matriz de cuantificación de 4 x 4 SL1 a la sección de predicción 216.

(2) Sección de adquisición de diferencias

La sección de adquisición de diferencias 214 adquiere la información de matriz de diferencias suministrada desde la sección de descodificación sin pérdidas 62. Como se ha descrito anteriormente, la información de matriz de diferencias de acuerdo con la realización especifica unas matrices de diferencias DSL2, DSL3, y DSL4, cada una de las cuales representa una diferencia entre cada una de las matrices predichas PSL2, PSL3 y PSL4 predichas a partir de la matriz de cuantificación de 4 x 4 SL1 y cada una de las matrices de cuantificación SL2, SL3 y SL4, respectivamente. La sección de adquisición de diferencias 214 suministra las matrices de diferencias DSL2, DSL3 y DSL4 especificadas en la información de matriz de diferencias a la sección de reconstrucción 218. Si se adquiere el indicador de tipo de matriz establecido a 0 para cada secuencia o imagen o se adquiere el indicador de diferencia establecido a 0, la sección de adquisición de diferencias 214 asume que una matriz de diferencias que tiene el tamaño correspondiente es nula sin adquirir la información de matriz de diferencias. Si se adquiere el indicador de actualización establecido a 0 para cada imagen, la sección de adquisición de diferencias 214 no emite matriz de diferencias alguna para el tamaño correspondiente.

(3) Sección de predicción

La sección de predicción 216 sigue la expresión de predicción usada para la codificación de imágenes, tal como la expresión de predicción (2) o (3) descrita anteriormente para calcular la matriz predicha de 8 x 8 PSL2 que tiene un tamaño más grande a partir de la matriz de base, tal como la matriz de cuantificación de 4 x 4 SL1 suministrada desde la sección de adquisición de matrices de base 212. La sección de predicción 216 usa la matriz predicha de 8 x 8 PSL2 calculada para calcular la matriz predicha de 16 x 16 PSL3 a partir de la matriz de cuantificación SL2 reconstruida por la sección de reconstrucción 218. Además, la sección de predicción 216 usa la matriz predicha de 16 x 16 PSL3 calculada para calcular la matriz predicha de 32 x 32 PSL4 a partir de la matriz de cuantificación SL3 reconstruida por la sección de reconstrucción 218. La sección de predicción 216 suministra las matrices predichas PSL2, PSL3 y PSL4 a la sección de reconstrucción 218. La sección de predicción 216 no genera matriz predicha alguna para un tamaño que tiene el indicador de tipo de matriz establecido a 0 y usa la matriz de cuantificación por defecto para calcular matrices predichas que tienen unos tamaños más grandes. La sección de adquisición de matrices de base 212 no genera matriz predicha alguna para un tamaño que tiene el indicador de actualización establecido a 0 y usa la matriz de cuantificación generada en el proceso previo para calcular matrices predichas que tienen unos tamaños más grandes.

(4) Sección de reconstrucción

La sección de reconstrucción 218 reconstruye las matrices de cuantificación SL2, SL3 y SL4 añadiendo las matrices predichas PSL2, PSL3 y PSL4 suministradas desde la sección de predicción 216 a las matrices de diferencias DSL2, DSL3 y DSL4 suministradas desde la sección de adquisición de diferencias 214, respectivamente.

[Operación matemática 6]

SL2 = PSL2 - PDSL2 (8)

SL3 = PSL3 - DSL3 (9)

SL4 = PSL4 - DSL4 (10)

La sección de reconstrucción 218 permite que la memoria intermedia de matrices de cuantificación 220 almacene las matrices de cuantificación reconstruidas SL2, SL3 y SL4 que tienen unos tamaños de 8 x 8, de 16 x 16 y de 32 x 32. Si se adquiere el indicador de tipo de matriz establecido a 0 para cada secuencia o imagen, la sección de reconstrucción 218 permite que la memoria intermedia de matrices de cuantificación 220 almacene la matriz de cuantificación por defecto como una matriz de cuantificación que tiene el tamaño correspondiente. Si se adquiere el indicador de actualización establecido a 0 para cada imagen, la sección de adquisición de matrices de base 212 no actualiza la matriz de cuantificación SL2, SL3 o SL4 que tiene el tamaño correspondiente y se almacena en la memoria intermedia de matrices de cuantificación 220 durante el proceso previo.

(5) Memoria intermedia de matrices de cuantificación

La memoria intermedia de matrices de cuantificación 220 almacena temporalmente la matriz de cuantificación SL1 especificada por la sección de adquisición de matrices de base 212 y las matrices de cuantificación SL2, SL3 y SL4 reconstruidas por la sección de reconstrucción 218. Las matrices de cuantificación SL1, SL2, SL3 y SL4 almacenadas en la memoria intermedia de matrices de cuantificación 220 se usan para que la sección de cuantificación inversa 240 cuantifique inversamente los datos de coeficientes de transformación cuantificados.

La configuración de la sección de cuantificación inversa y de transformación ortogonal inversa 63 del dispositivo de descodificación de imágenes 60 descrito anteriormente también es aplicable a la sección de cuantificación inversa 21 y a la sección de transformación ortogonal inversa 22 del dispositivo de descodificación de imágenes 10 mostrado en la figura 1.

<4. Flujo de proceso de descodificación>

Las figuras 11A y 11B son diagramas de flujo que ilustran un primer ejemplo de un flujo de proceso de descodificación. La sección de generación de matrices 210 puede realizar el proceso representado por los diagramas de flujo principalmente en cada secuencia de flujos codificados.

Con referencia a la figura 11A, la sección de generación de matrices 210 comprueba el indicador de tipo de matriz contenido en el conjunto de parámetros de secuencia de la secuencia para determinar si la matriz de cuantificación de 4 x 4 es una definida por el usuario (la etapa S202). Si la matriz de cuantificación de 4 x 4 es una definida por el usuario, la sección de generación de matrices 210 usa la información de matriz básica para establecer la matriz de cuantificación de 4 x 4, en concreto, almacenar la misma en la memoria intermedia de matrices de cuantificación 220 (la etapa S204). Si la matriz de cuantificación de 4 x 4 es una por defecto, la sección de generación de matrices 210 establece la matriz de cuantificación de 4 x 4 por defecto (la etapa S206).

La sección de generación de matrices 210 determina si una matriz de cuantificación de 8 x 8 es una definida por el usuario (la etapa S212). Si la matriz de cuantificación de 8 x 8 es una definida por el usuario, la sección de generación de matrices 210 usa la expresión de predicción (2) o (3) descrita anteriormente para calcular una matriz predicha de 8 x 8 a partir de la matriz de cuantificación de 4 x 4 y añade la matriz predicha calculada a una matriz de diferencias de 8 x 8. Como resultado, se reconstruye la matriz de cuantificación de 8 x 8 (la etapa S214). Si el indicador de diferencia de 8 x 8 se establece a 0, la matriz de diferencias es nula. La matriz predicha de 8 x 8 se puede establecer directamente como una matriz de cuantificación. Si la matriz de cuantificación de 8 x 8 es una por defecto, la sección de generación de matrices 210 establece la matriz de cuantificación de 8 x 8 por defecto (la etapa S216).

Con referencia a la figura 11B, la sección de generación de matrices 210 determina si una matriz de cuantificación de 16 x 16 es una definida por el usuario (la etapa S222). Si la matriz de cuantificación de 16 x 16 es una definida por el usuario, la sección de generación de matrices 210 calcula una matriz predicha de 16 x 16 a partir de la matriz de cuantificación de 8 x 8 y añade la matriz predicha calculada a una matriz de diferencias de 16 x 16. Como resultado, se reconstruye la matriz de cuantificación de 16 x 16 (la etapa S224). Si el indicador de diferencia de 16 x 16 se establece a 0, la matriz de diferencias es nula. La matriz predicha de 16 x 16 se establece directamente como una matriz de cuantificación. Si la matriz de cuantificación de 16 x 16 es una por defecto, la sección de generación de matrices 210 establece la matriz de cuantificación de 16 x 16 por defecto (la etapa S226).

La sección de generación de matrices 210 determina si una matriz de cuantificación de 32 x 32 es una definida por el usuario (la etapa S232). Si la matriz de cuantificación de 32 x 32 es una definida por el usuario, la sección de generación de matrices 210 calcula una matriz predicha de 32 x 32 a partir de la matriz de cuantificación de 16 x 16 y añade la matriz predicha calculada a una matriz de diferencias de 32 x 32. Como resultado, se reconstruye la matriz de cuantificación de 32 x 32 (la etapa S234). Si el indicador de diferencia de 32 x 32 se establece a 0, la matriz de diferencias es nula. La matriz predicha de 32 x 32 se establece directamente como una matriz de cuantificación. Si la matriz de cuantificación de 32 x 32 es una por defecto, la sección de generación de matrices 210 establece la matriz de cuantificación de 32 x 32 por defecto (la etapa S236).

Las figuras 12A y 12B son diagramas de flujo que ilustran un segundo ejemplo de un flujo de proceso de descodificación. La sección de generación de matrices 210 puede realizar el proceso representado por los diagramas de flujo principalmente en cada imagen para un flujo codificado.

Con referencia a la figura 12A, la sección de generación de matrices 210 comprueba el indicador de actualización contenido en un conjunto de parámetros de imagen para determinar si una matriz de cuantificación de 4 x 4 se actualiza en la imagen (la etapa S250). Si no se actualiza una matriz de cuantificación de 4 x 4, el proceso omite las etapas S252 a S256. Si se actualiza una matriz de cuantificación de 4 x 4, la sección de generación de matrices 210 comprueba el indicador de tipo de matriz para determinar si la nueva matriz de cuantificación de 4 x 4 es una definida por el usuario (la etapa S252). Si la matriz de cuantificación de 4 x 4 es una definida por el usuario, la sección de generación de matrices 210 establece la matriz de cuantificación de 4 x 4 usando la información de matriz básica (la etapa S254). Si la matriz de cuantificación de 4 x 4 es una por defecto, la sección de generación de matrices 210 establece la matriz de cuantificación de 4 x 4 por defecto (la etapa S256).

La sección de generación de matrices 210 comprueba el indicador de actualización para determinar si una matriz de cuantificación de 8 x 8 se actualiza en la imagen (la etapa S260). Si no se actualiza una matriz de cuantificación de 8 x 8, el proceso omite las etapas S262 a S266. Si se actualiza una matriz de cuantificación de 8 x 8, la sección de generación de matrices 210 comprueba el indicador de tipo de matriz para determinar si la nueva matriz de cuantificación de 8 x 8 es una definida por el usuario (la etapa S262). Si la matriz de cuantificación de 8 x 8 es una definida por el usuario, la sección de generación de matrices 210 calcula una matriz de cuantificación predicha de 8 x 8 a partir de la matriz de cuantificación de 4 x 4 para una nueva imagen con independencia de si se actualiza la matriz de cuantificación de 4 x 4. La sección de generación de matrices 210 añade entonces la matriz predicha calculada a una matriz de diferencias de 8 x 8. Como resultado, se reconstruye la matriz de cuantificación de 8 x 8 (la etapa S264). Si el indicador de diferencia de 8 x 8 se establece a 0, la matriz de diferencias es nula. La matriz predicha de 8 x 8 se puede establecer directamente como una matriz de cuantificación. Si la matriz de cuantificación de 8 x 8 es una por defecto, la sección de generación de matrices 210 establece la matriz de cuantificación de 8 x 8 por defecto (la etapa S266).

Con referencia a la figura 12B, la sección de generación de matrices 210 comprueba el indicador de actualización para determinar si una matriz de cuantificación de 16 x 16 se actualiza en la imagen (la etapa S270). Si no se actualiza una matriz de cuantificación de 16 x 16, el proceso omite las etapas S272 a S276. Si se actualiza una matriz de cuantificación de 16 x 16, la sección de generación de matrices 210 comprueba el indicador de tipo de matriz para determinar si la nueva matriz de cuantificación de 16 x 16 es una definida por el usuario (la etapa S272). Si la matriz de cuantificación de 16 x 16 es una definida por el usuario, la sección de generación de matrices 210 calcula una matriz de cuantificación predicha de 16 x 16 a partir de la matriz de cuantificación de 8 x 8 para una nueva imagen con independencia de si se actualiza la matriz de cuantificación de 8 x 8. La sección de generación de matrices 210 añade entonces la matriz predicha calculada a una matriz de diferencias de 16 x 16. Como resultado, se reconstruye la matriz de cuantificación de 16 x 16 (la etapa S274). Si el indicador de diferencia de 16 x 16 se establece a 0, la matriz de diferencias es nula. La matriz predicha de 16 x 16 se establece directamente como una matriz de cuantificación. Si la matriz de cuantificación de 16 x 16 es una por defecto, la sección de generación de matrices 210 establece la matriz de cuantificación de 16 x 16 por defecto (la etapa S276).

La sección de generación de matrices 210 comprueba el indicador de actualización para determinar si una matriz de cuantificación de 32 x 32 se actualiza en la imagen (la etapa S280). Si no se actualiza una matriz de cuantificación de 32 x 32, el proceso omite las etapas S282 a S286. Si se actualiza una matriz de cuantificación de 32 x 32, la sección de generación de matrices 210 comprueba el indicador de tipo de matriz para determinar si la nueva matriz de cuantificación de 32 x 32 es una definida por el usuario (la etapa S282). Si la matriz de cuantificación de 32 x 32 es una definida por el usuario, la sección de generación de matrices 210 calcula una matriz de cuantificación predicha de 32 x 32 a partir de la matriz de cuantificación de 16 x 16 para una nueva imagen con independencia de si se actualiza la matriz de cuantificación de 16 x 16. La sección de generación de matrices 210 añade entonces la matriz predicha calculada a una matriz de diferencias de 32 x 32. Como resultado, se reconstruye la matriz de cuantificación de 32 x 32 (la etapa S284). Si el indicador de diferencia de 32 x 32 se establece a 0, la matriz de diferencias es nula. La matriz predicha de 32 x 32 se establece directamente como una matriz de cuantificación. Si la matriz de cuantificación de 32 x 32 es una por defecto, la sección de generación de matrices 210 establece la matriz de cuantificación de 32 x 32 por defecto (la etapa S286).

El lado de descodificación puede reconstruir de forma adecuada matrices de cuantificación usando la técnica para predecir matrices de cuantificación basándose en una matriz de cuantificación, incluso si el lado de codificación transmite, al lado de descodificación, solo la información de diferencias acerca de una matriz de cuantificación a predecir. Un aumento en la cantidad de códigos se puede moderar de forma eficaz incluso si aumenta el número de matrices de cuantificación.

La memoria descriptiva ha descrito el ejemplo de establecer solo un tipo de matriz de cuantificación para un tamaño de unidad de transformación. Aunque no se limita a esto, se pueden establecer múltiples tipos de matrices de cuantificación para un tamaño de unidad de transformación. En un caso como este, el conjunto de parámetros de secuencia y el conjunto de parámetros de imagen pueden contener un indicador adicional que indica cuál de múltiples tipos de matrices de cuantificación es necesario usar como una base para predecir una matriz de cuantificación de un tamaño más grande. Puede ser preferible establecer múltiples tipos de matrices de cuantificación para un tamaño de unidad de transformación y de forma selectiva una matriz de cuantificación a otra para cada sector o bloque dentro de una imagen.

<5. Modificaciones>

Como se ha descrito anteriormente, la tecnología divulgada en esta memoria descriptiva se puede realizar prediciendo una matriz de cuantificación de un tamaño más pequeño a partir de una matriz de cuantificación de un tamaño más grande. Por ejemplo, una matriz de cuantificación de 8 x 8 SL2 se define como sigue.

[Operación matemática 7]

Por ejemplo, la sección de predicción 152 de la sección de transformación ortogonal y de cuantificación 14 del dispositivo de codificación de imágenes 10 calcula la matriz predicha de 4 x 4 PSL1 a partir de la matriz de cuantificación SL2 de acuerdo con la expresión de predicción (12) como sigue.

[Operación matemática 8]

Con referencia a la expresión de predicción (12), la matriz predicha PSL1 se genera adelgazando elementos de la matriz de cuantificación SL2 en filas y columnas alternas. Los elementos a adelgazar se pueden situar de una forma que no sea la del ejemplo de la expresión de predicción (12). El aumento del número de elementos a adelgazar puede hacer que una matriz de cuantificación genere una matriz predicha que tiene unos lados en los que cada lado es un cuarto o más pequeño.

En lugar de ello, la matriz predicha PSL1 se puede calcular a partir de la matriz de cuantificación SL2 de acuerdo con la expresión de predicción (13) a continuación.

[Operación matemática 9]

Con referencia a la expresión de predicción (13), la matriz predicha PSL1 se genera calculando un promedio de cuatro elementos adyacentes vertical y horizontalmente entre sí en la matriz de cuantificación SL2 como un elemento de la matriz predicha PSL1. Promediar más elementos (por ejemplo, 16 elementos) adyacentes vertical y horizontalmente entre sí puede hacer que una matriz de cuantificación genere una matriz predicha que tiene unos lados en los que cada lado es un cuarto o más pequeño. En lugar del promedio usado en la expresión de predicción (13), se pueden calcular los otros valores representativos, tales como el valor central, el valor mínimo y el valor máximo, a partir de elementos.

Una matriz predicha de un tamaño más pequeño se puede calcular a partir de una matriz de cuantificación de un tamaño más grande. También en un caso como este, la sección de cálculo de diferencias 154 calcula una matriz de diferencias que representa una diferencia entre la matriz predicha suministrada desde la sección de predicción 152 y la matriz de cuantificación correspondiente y suministra información de matriz de diferencias que representa la matriz de diferencias calculada a la sección de codificación sin pérdidas 16. La sección de generación de matrices 210 de la sección de cuantificación inversa y de transformación ortogonal inversa 63 del dispositivo de descodificación de imágenes 60 genera una matriz de cuantificación de un tamaño más pequeño a partir de la matriz de cuantificación especificada en la información de matriz básica usando cualquiera de las expresiones de predicción descritas anteriormente y la información de matriz de diferencias.

Las figuras 13A y 13B son diagramas de flujo que ilustran un ejemplo de un flujo de proceso de codificación de acuerdo con una modificación. La sección de procesamiento de matrices 150 y la sección de codificación sin pérdidas 16 pueden realizar el proceso representado por los diagramas de flujo principalmente en cada secuencia de flujos codificados.

Con referencia a la figura 13A, la sección de procesamiento de matrices 150 adquiere de la memoria intermedia de matrices de cuantificación 140 un conjunto de matrices de cuantificación usadas para la sección de cuantificación 130 en esta secuencia (la etapa S300). Como ejemplo, se supone que el conjunto de matrices de cuantificación contiene matrices de cuantificación que corresponden a los tamaños de 4 x 4, de 8 x 8, de 16 x 16 y de 32 x 32.

La sección de procesamiento de matrices 150 determina si una matriz de cuantificación de 32 x 32 es una definida por el usuario (la etapa S302). Si la matriz de cuantificación de 32 x 32 es una definida por el usuario, la sección de codificación sin pérdidas 16 codifica la información de matriz básica que representa una matriz de cuantificación de 32 x 32 con el indicador de tipo de matriz establecido a 1 (la etapa S306). Si la matriz de cuantificación de 32 x 32 es una por defecto, la sección de codificación sin pérdidas 16 codifica solo el indicador de tipo de matriz establecido a 0 (la etapa S308).

La sección de procesamiento de matrices 150 determina si una matriz de cuantificación de 16 x 16 es una definida por el usuario (la etapa S312). Si la matriz de cuantificación de 16 x 16 es una definida por el usuario, la sección de procesamiento de matrices 150 calcula una matriz predicha de 16 x 16 a partir de la matriz de cuantificación de 32 x 32 de acuerdo con la expresión de predicción (12) o (13) descrita anteriormente (la etapa S314). La sección de codificación sin pérdidas 16 codifica el indicador de tipo de matriz (= 1), el indicador de diferencia y la información de matriz de diferencias (si existe) indicando una diferencia entre la matriz de cuantificación de 16 x 16 y la matriz predicha calculada (la etapa S316). Si la matriz de cuantificación de 16 x 16 es una por defecto, la sección de codificación sin pérdidas 16 codifica solo el indicador de tipo de matriz establecido a 0 (la etapa S318).

Con referencia a la figura 13B, la sección de procesamiento de matrices 150 determina si una matriz de cuantificación de 8 x 8 es una definida por el usuario (la etapa S322). Si la matriz de cuantificación de 8 x 8 es una definida por el usuario, la sección de procesamiento de matrices 150 calcula una matriz predicha de 8 x 8 a partir de la matriz de cuantificación de 16 x 16 (la etapa S324). La sección de codificación sin pérdidas 16 codifica el indicador de tipo de matriz (= 1), el indicador de diferencia y la información de matriz de diferencias (si existe) indicando una diferencia entre la matriz de cuantificación de 8 x 8 y la matriz predicha calculada (la etapa S326). Si la matriz de cuantificación de 8 x 8 es una por defecto, la sección de codificación sin pérdidas 16 codifica solo el indicador de tipo de matriz establecido a 0 (la etapa S328).

La sección de procesamiento de matrices 150 determina si una matriz de cuantificación de 4 x 4 es una definida por el usuario (la etapa S332). Si la matriz de cuantificación de 4 x 4 es una definida por el usuario, la sección de procesamiento de matrices 150 calcula una matriz predicha de 4 x 4 a partir de la matriz de cuantificación de 8 x 8 (la etapa S334). La sección de codificación sin pérdidas 16 codifica el indicador de tipo de matriz (= 1), el indicador de diferencia y la información de matriz de diferencias (si existe) indicando una diferencia entre la matriz de cuantificación de 4 x 4 y la matriz predicha calculada (la etapa S336). Si la matriz de cuantificación de 4 x 4 es una por defecto, la sección de codificación sin pérdidas 16 codifica solo el indicador de tipo de matriz establecido a 0 (la etapa S338).

Si se usa el SPS para definir matrices de cuantificación, la modificación puede calcular y codificar matrices predichas en orden descendente de los tamaños de matriz de cuantificación. Si se usa el PPS para actualizar matrices de cuantificación, la modificación también puede calcular y codificar matrices predichas en orden descendente de los tamaños de matriz de cuantificación.

Las figuras 14A y 14B son diagramas de flujo que ilustran un ejemplo de un flujo de proceso de descodificación. La sección de generación de matrices 210 puede realizar el proceso representado por los diagramas de flujo principalmente en cada secuencia de flujos codificados.

Con referencia a la figura 14A, la sección de generación de matrices 210 comprueba el indicador de tipo de matriz contenido en el conjunto de parámetros de secuencia de la secuencia para determinar si la matriz de cuantificación de 32 x 32 es una definida por el usuario (la etapa S402). Si la matriz de cuantificación de 32 x 32 es una definida por el usuario, la sección de generación de matrices 210 usa la información de matriz básica para establecer la matriz de cuantificación de 32 x 32, en concreto, almacenar la misma en la memoria intermedia de matrices de cuantificación 220 (la etapa S404). Si la matriz de cuantificación de 32 x 32 es una por defecto, la sección de generación de matrices 210 establece la matriz de cuantificación de 32 x 32 por defecto (la etapa S406).

La sección de generación de matrices 210 determina si una matriz de cuantificación de 16 x 16 es una definida por el usuario (la etapa S412). Si la matriz de cuantificación de 16 x 16 es una definida por el usuario, la sección de generación de matrices 210 usa la expresión de predicción (12) o (13) descrita anteriormente para calcular una matriz predicha de 16 x 16 a partir de la matriz de cuantificación de 32 x 32 y añade la matriz predicha calculada a una matriz de diferencias de 16 x 16. Como resultado, se reconstruye la matriz de cuantificación de 16 x 16 (la etapa S414). Si el indicador de diferencia de 16 x 16 se establece a 0, la matriz de diferencias es nula. La matriz predicha de 16 x 16 se establece directamente como una matriz de cuantificación. Si la matriz de cuantificación de 16 x 16 es una por defecto, la sección de generación de matrices 210 establece la matriz de cuantificación de 16 x 16 por defecto (la etapa S416).

Con referencia a la figura 14B, la sección de generación de matrices 210 determina si una matriz de cuantificación de 8 x 8 es una definida por el usuario (la etapa S422). Si la matriz de cuantificación de 8 x 8 es una definida por el usuario, la sección de generación de matrices 210 calcula una matriz predicha de 8 x 8 a partir de la matriz de cuantificación de 16 x 16 y añade la matriz predicha calculada a una matriz de diferencias de 8 x 8. Como resultado, se reconstruye la matriz de cuantificación de 8 x 8 (la etapa S424). Si el indicador de diferencia de 8 x 8 se establece a 0, la matriz de diferencias es nula. La matriz predicha de 8 x 8 se puede establecer directamente como una matriz de cuantificación. Si la matriz de cuantificación de 8 x 8 es una por defecto, la sección de generación de matrices 210 establece la matriz de cuantificación de 8 x 8 por defecto (la etapa S426).

La sección de generación de matrices 210 determina si una matriz de cuantificación de 4 x 4 es una definida por el usuario (la etapa S432). Si la matriz de cuantificación de 4 x 4 es una definida por el usuario, la sección de generación de matrices 210 calcula una matriz predicha de 4 x 4 a partir de la matriz de cuantificación de 8 x 8 y añade la matriz predicha calculada a una matriz de diferencias de 4 x 4. Como resultado, se reconstruye la matriz de cuantificación de 4 x 4 (la etapa S434). Si el indicador de diferencia de 4 x 4 se establece a 0, la matriz de diferencias es nula. La matriz predicha de 4 x 4 se puede establecer directamente como una matriz de cuantificación. Si la matriz de cuantificación de 4 x 4 es una por defecto, la sección de generación de matrices 210 establece la matriz de cuantificación de 4 x 4 por defecto (la etapa S436).

Si se usa el SPS para descodificar matrices de cuantificación, la modificación puede reconstruir matrices de cuantificación en orden descendente de los tamaños de matriz de cuantificación. Si se usa el PPS para actualizar matrices de cuantificación, la modificación también puede reconstruir matrices de cuantificación en orden descendente de los tamaños de matriz de cuantificación.

<6. Aplicaciones de ejemplo>

El dispositivo de codificación de imágenes 10 y el dispositivo de descodificación de imágenes 60 descritos anteriormente se pueden aplicar a diversos aparatos electrónicos tales como un transmisor y un receptor para radiodifusión por satélite, radiodifusión por cable tal como TV por cable, distribución por Internet, distribución a terminales a través de comunicación celular, y similares, un dispositivo de registro que registra imágenes en un medio tal como en un disco óptico, un disco magnético o una memoria flash, un dispositivo de reproducción que reproduce imágenes desde tal medio de almacenamiento, y similares. A continuación se describen cuatro aplicaciones de ejemplo.

[6-1. Primera aplicación de ejemplo]

La figura 15 es un diagrama de bloques que muestra un ejemplo de una configuración esquemática de un televisor descrito anteriormente. Un televisor 900 incluye una antena 901, un sintonizador 902, un desmultiplexor 903, un descodificador 904, una sección de procesamiento de señales de vídeo 905, una sección de visualización 906, una sección de procesamiento de señales de audio 907, un altavoz 908, una interfaz externa 909, una sección de control 910, una interfaz de usuario 911 y un bus 912.

El sintonizador 902 extrae de unas señales de radiodifusión recibidas a través de la antena 901 una señal de un canal deseado, y desmodula la señal extraída. Entonces, el sintonizador 902 emite al desmultiplexor 903 un flujo de bits codificado obtenido mediante desmodulación. Es decir, el sintonizador 902 sirve como medios de transmisión de los televisores 900 para recibir un flujo codificado en el que se codifica una imagen.

El desmultiplexor 903 separa del flujo de bits codificado un flujo de vídeo y un flujo de audio de un programa a visualizar, y emite cada flujo que ha sido separado al descodificador 904. Asimismo, el desmultiplexor 903 extrae datos auxiliares tales como una EPG (guía electrónica de programas) del flujo de bits codificado y suministra los datos extraídos a la sección de control 910. Además, el desmultiplexor 903 puede realizar una desaleatorización en el caso de que el flujo de bits codificado esté aleatorizado.

El descodificador 904 descodifica el flujo de vídeo y el flujo de audio introducidos desde el desmultiplexor 903. Entonces, el descodificador 904 emite datos de vídeo generados por el proceso de descodificación a la sección de procesamiento de señales de vídeo 905. Asimismo, el descodificador 904 emite los datos de audio generados por el proceso de descodificación a la sección de procesamiento de señales de audio 907.

La sección de procesamiento de señales de vídeo 905 reproduce los datos de vídeo introducidos desde el descodificador 904 y hace que la sección de visualización 906 visualice el vídeo. La sección de procesamiento de señales de vídeo 905 también puede hacer que la sección de visualización 906 visualice una pantalla de aplicación suministrada a través de una red. Además, la sección de procesamiento de señales de vídeo 905 puede realizar un proceso adicional tal como eliminación de ruido, por ejemplo, sobre los datos de vídeo de acuerdo con el ajuste. Además, la sección de procesamiento de señales de vídeo 905 puede generar una imagen de una GUI (interfaz gráfica de usuario) tal como, por ejemplo, un menú, un botón, un cursor o similar, y superponer la imagen generada a una imagen de salida.

La sección de visualización 906 es controlada por una señal de control suministrada por la sección de procesamiento de señales de vídeo 905, y visualiza un vídeo o una imagen en una pantalla de vídeo de un dispositivo de visualización (por ejemplo, un visualizador de cristal líquido, un visualizador de plasma, un OLED, o similar).

La sección de procesamiento de señales de audio 907 realiza procesos de reproducción tales como conversión D/A y amplificación sobre los datos de audio introducidos desde el descodificador 904, y emite audio a través del altavoz 908. Asimismo, la sección de procesamiento de señales de audio 907 puede realizar un proceso adicional tal como la eliminación de ruido sobre los datos de audio.

La interfaz externa 909 es una interfaz para conectar el televisor 900 a un aparato externo o a una red. Por ejemplo, un flujo de vídeo o un flujo de audio recibido a través de la interfaz externa 909 puede ser descodificado por el descodificador 904. Es decir, la interfaz externa 909 también sirve como medios de transmisión de los televisores 900 para recibir un flujo codificado en el que se codifica una imagen.

La sección de control 910 incluye un procesador tal como una CPU (Unidad Central de Procesamiento), y una memoria tal como una RAM (Memoria de Acceso Aleatorio), una ROM (Memoria de Solo Lectura), o similar. La memoria almacena un programa para ser ejecutado por la CPU, datos de programa, datos de EPG, datos adquiridos a través de una red, y similares. El programa almacenado en la memoria es leído y ejecutado por la CPU en el momento de la activación del televisor 900, por ejemplo. La CPU controla el funcionamiento del televisor 900 de acuerdo con una señal de operación introducida desde la interfaz de usuario 911, por ejemplo, ejecutando el programa.

La interfaz de usuario 911 se conecta a la sección de control 910. La interfaz de usuario 911 incluye un botón y un conmutador usados por un usuario para hacer funcionar el televisor 900, y una sección de recepción para una señal de control remoto, por ejemplo. La interfaz de usuario 911 detecta una operación de un usuario a través de estos elementos estructurales, genera una señal de operación y emite la señal de operación generada a la sección de control 910.

El bus 912 interconecta el sintonizador 902, el desmultiplexor 903, el descodificador 904, la sección de procesamiento de señales de vídeo 905, la sección de procesamiento de señales de audio 907, la interfaz externa 909 y la sección de control 910.

En el televisor 900 configurado de esta forma, el descodificador 904 tiene una función del dispositivo de descodificación de imágenes. En consecuencia, también en el caso de la descodificación de imágenes en el televisor 900, es posible moderar en un aumento en la cantidad de códigos debido a un aumento en el número de matrices de cuantificación.

[6-2. Segunda aplicación de ejemplo]

La figura 16 es un diagrama de bloques que muestra un ejemplo de una configuración esquemática de un teléfono móvil. Un teléfono móvil 920 incluye una antena 921, una sección de comunicación 922, un códec de audio 923, un altavoz 924, un micrófono 925, una sección de cámara 926, una sección de procesamiento de imágenes 927, una sección de desmultiplexación 928, una sección de registro/reproducción 929, una sección de visualización 930, una sección de control 931, una sección de operación 932 y un bus 933.

La antena 921 se conecta a la sección de comunicación 922. El altavoz 924 y el micrófono 925 se conectan al códec de audio 923. La sección de operación 932 se conecta a la sección de control 931. El bus 933 interconecta la sección de comunicación 922, el códec de audio 923, la sección de cámara 926, la sección de procesamiento de imágenes 927, la sección de desmultiplexación 928, la sección de registro/reproducción 929, la sección de visualización 930 y la sección de control 931.

El teléfono móvil 920 realiza operaciones tales como la transmisión/recepción de la señal de audio, la transmisión/recepción de correos electrónicos o datos de imagen, la captura de imágenes, el registro de datos, etc., en diversos modos de operación que incluyen un modo de comunicación de audio, un modo de comunicación de datos, un modo de captura de imágenes y un modo de videoteléfono.

En el modo de comunicación de audio, se suministra una señal de audio analógica generada por el micrófono 925 al códec de audio 923. El códec de audio 923 convierte la señal de audio analógica en datos de audio, y realiza una conversión A/D y comprime los datos de audio convertidos. Entonces, el códec de audio 923 emite los datos de audio comprimidos a la sección de comunicación 922. La sección de comunicación 922 codifica y modula los datos de audio y genera una señal de transmisión. Entonces, la sección de comunicación 922 transmite la señal de transmisión generada a una estación base (no mostrada) a través de la antena 921. Asimismo, la sección de comunicación 922 amplifica una señal inalámbrica recibida a través de la antena 921 y convierte la frecuencia de la señal inalámbrica y adquiere una señal recibida. Entonces, la sección de comunicación 922 desmodula y descodifica la señal recibida y genera datos de audio, y emite los datos de audio generados al códec de audio 923. El códec de audio 923 extiende y convierte de digital a analógico los datos de audio y genera una señal de audio analógica. Entonces, el códec de audio 923 suministra la señal de audio generada al altavoz 924 y hace que se emita el audio.

Asimismo, en el modo de comunicación de datos, la sección de control 931 genera datos de texto que conforman un correo electrónico, de acuerdo con una operación de un usuario a través de la sección de operación 932, por ejemplo. Además, la sección de control 931 hace que el texto se visualice en la sección de visualización 930. Además, la sección de control 931 genera datos de correo electrónico de acuerdo con una instrucción de transmisión del usuario a través de la sección de operación 932, y emite los datos de correo electrónico generados a la sección de comunicación 922. Entonces, la sección de comunicación 922 codifica y modula los datos del correo electrónico y genera una señal de transmisión. Entonces, la sección de comunicación 922 transmite la señal de transmisión generada a una estación base (no mostrada) a través de la antena 921. Asimismo, la sección de comunicación 922 amplifica una señal inalámbrica recibida a través de la antena 921 y convierte la frecuencia de la señal inalámbrica y adquiere una señal recibida. Entonces, la sección de comunicación 922 desmodula y descodifica la señal recibida, restablece los datos de correo electrónico y emite los datos de correo electrónico restablecidos a la sección de control 931. La sección de control 931 hace que la sección de visualización 930 visualice el contenido del correo electrónico, y también hace que los datos del correo electrónico se almacenen en el medio de almacenamiento de la sección de registro/reproducción 929.

La sección de registro/reproducción 929 incluye un medio de almacenamiento arbitrario legible y grabable. Por ejemplo, el medio de almacenamiento puede ser un medio de almacenamiento integrado tal como una RAM, una memoria flash o similar, o un medio de almacenamiento montado externamente tal como un disco duro, un disco magnético, un disco magneto-óptico, un disco óptico, una memoria de USB, una tarjeta de memoria, o similar.

Además, en el modo de captura de imágenes, la sección de cámara 926 captura una imagen de un sujeto, genera datos de imagen y emite los datos de imagen generados a la sección de procesamiento de imágenes 927, por ejemplo. La sección de procesamiento de imágenes 927 codifica los datos de imagen introducidos desde la sección de cámara 926 y hace que el flujo codificado se almacene en el medio de almacenamiento de la sección de registro/reproducción 929.

Además, en el modo de videoteléfono, la sección de desmultiplexación 928 multiplexa un flujo de vídeo codificado por la sección de procesamiento de imágenes 927 y un flujo de audio introducido desde el códec de audio 923, y emite el flujo multiplexado a la sección de comunicación 922, por ejemplo. La sección de comunicación 922 codifica y modula el flujo y genera una señal de transmisión. Entonces, la sección de comunicación 922 transmite la señal de transmisión generada a una estación base (no mostrada) a través de la antena 921. Asimismo, la sección de comunicación 922 amplifica una señal inalámbrica recibida a través de la antena 921 y convierte la frecuencia de la señal inalámbrica y adquiere una señal recibida. Estas señales de transmisión y de recepción pueden incluir un flujo de bits codificado. Entonces, la sección de comunicación 922 desmodula y descodifica la señal recibida, restablece el flujo y emite el flujo restablecido a la sección de desmultiplexación 928. La sección de desmultiplexación 928 separa del flujo de entrada un flujo de vídeo y un flujo de audio, y emite el flujo de vídeo a la sección de procesamiento de imágenes 927 y el flujo de audio al códec de audio 923. La sección de procesamiento de imágenes 927 descodifica el flujo de vídeo y genera datos de vídeo. Los datos de vídeo se suministran a la sección de visualización 930, y una serie de imágenes es visualizada por la sección de visualización 930. El códec de audio 923 extiende y convierte de digital a analógico el flujo de audio y genera una señal de audio analógica. Entonces, el códec de audio 923 suministra la señal de audio generada al altavoz 924 y hace que se emita el audio.

En el teléfono móvil 920 configurado de esta forma, la sección de procesamiento de imágenes 927 tiene una función del dispositivo de codificación de imágenes 10 y del dispositivo de descodificación de imágenes 60. En consecuencia, también en el caso de la descodificación y codificación de imágenes en el teléfono móvil 920, es posible moderar en un aumento en la cantidad de códigos debido a un aumento en el número de matrices de cuantificación.

[6-3. Tercera aplicación de ejemplo]

La figura 17 es un diagrama de bloques que muestra un ejemplo de configuración esquemática de un registro/reproducción. Un dispositivo de registro/reproducción 940 codifica y registra en un medio de registro, por ejemplo, datos de audio y datos de vídeo de un programa de radiodifusión recibido. El dispositivo de registro/reproducción 940 también puede codificar y registrar en el medio de registro, por ejemplo, datos de audio y datos de vídeo adquiridos desde otro dispositivo. Además, el dispositivo de registro/reproducción 940 reproduce, mediante un monitor o un altavoz, datos registrados en el medio de registro, de acuerdo con instrucciones de un usuario, por ejemplo. En este momento, el dispositivo de registro/reproducción 940 descodifica los datos de audio y de vídeo.

El dispositivo de registro/reproducción 940 incluye un sintonizador 941, una interfaz externa 942, un codificador 943, una HDD (unidad de disco duro) 944, una unidad de disco 945, un selector 946, un descodificador 947, una OSD (Visualización en Pantalla) 948, una sección de control 949 y una interfaz de usuario 950.

El sintonizador 941 extrae de unas señales de radiodifusión recibidas a través de una antena (no mostrada) una señal de un canal deseado, y desmodula la señal extraída. Entonces, el sintonizador 941 emite al selector 946 un flujo de bits codificado obtenido mediante desmodulación. Es decir, el sintonizador 941 sirve como medios de transmisión del dispositivo de registro/reproducción 940.

La interfaz externa 942 es una interfaz para conectar el dispositivo de registro/reproducción 940 y un aparato externo o una red. Por ejemplo, la interfaz externa 942 puede ser una interfaz de IEEE 1394, una interfaz de red, una interfaz de USB, una interfaz de memoria flash o similar. Por ejemplo, los datos de vídeo y datos de audio recibidos por la interfaz externa 942 se introducen en el codificador 943. Es decir, la interfaz externa 942 sirve como medios de transmisión del dispositivo de registro/reproducción 940.

En el caso de que los datos de vídeo y los datos de audio introducidos desde la interfaz externa 942 no estén codificados, el codificador 943 codifica los datos de vídeo y los datos de audio. Entonces, el codificador 943 emite el flujo de bits codificado al selector 946.

La HDD 944 registra en un disco duro interno un flujo de bits codificado, que son datos de contenido comprimido de un vídeo o audio, diversos programas y otras porciones de datos. Asimismo, la HDD 944 lee estas porciones de datos del disco duro en el momento de reproducir un vídeo o audio.

La unidad de disco 945 registra o lee datos en un medio de registro que está montado. Un medio de registro que se monta en la unidad de disco 945 puede ser un disco DVD (un DVD-Video, un DVD-RAM, un DVD-R, un DVD-RW, un DVD+, un DVD+RW, o similar), un disco Blu-ray (marca comercial registrada), o similar, por ejemplo.

El selector 946 selecciona, en el momento de registrar un vídeo o audio, un flujo de bits codificado introducido desde el sintonizador 941 o del codificador 943, y emite el flujo de bits codificado seleccionado a la HDD 944 o a la unidad de disco 945. Asimismo, el selector 946 emite al descodificador 947, en el momento de reproducir un vídeo o audio, un flujo de bits codificado introducido desde la HDD 944 o de la unidad de disco 945.

El descodificador 947 descodifica el flujo de bits codificado y genera datos de vídeo y datos de audio. Entonces, el descodificador 947 emite los datos de vídeo generados a la OSD 948. Asimismo, el descodificador 904 emite los datos de audio generados a un altavoz externo.

La OSD 948 reproduce los datos de vídeo introducidos desde el descodificador 947 y visualiza un vídeo. Asimismo, la OSD 948 puede superponer una imagen de una GUI, tal como un menú, un botón, un cursor o similar, por ejemplo, en un vídeo visualizado.

La sección de control 949 incluye un procesador tal como una CPU, y una memoria tal como una RAM o una ROM. La memoria almacena un programa para ser ejecutado por la CPU, datos de programa y similares. Un programa almacenado en la memoria es leído y ejecutado por la CPU en el momento de la activación del dispositivo de registro/reproducción 940, por ejemplo. La CPU controla el funcionamiento del dispositivo de registro/reproducción 940 de acuerdo con una señal de operación introducida desde la interfaz de usuario 950, por ejemplo, ejecutando el programa.

La interfaz de usuario 950 se conecta a la sección de control 949. La interfaz de usuario 950 incluye un botón y un conmutador usados por un usuario para hacer funcionar el dispositivo de registro/reproducción 940, y una sección de recepción para una señal de control remoto, por ejemplo. La interfaz de usuario 950 detecta una operación de un usuario a través de estos elementos estructurales, genera una señal de operación y emite la señal de operación generada a la sección de control 949.

En el dispositivo de registro/reproducción 940 configurado de esta forma, el codificador 943 tiene una función del dispositivo de codificación de imágenes 10. Asimismo, el descodificador 947 tiene una función del dispositivo de descodificación de imágenes 60 de acuerdo con la realización descrita anteriormente. En consecuencia, también en el caso de la descodificación y codificación de imágenes en el dispositivo de registro/reproducción 940, es posible moderar en un aumento en la cantidad de códigos debido a un aumento en el número de matrices de cuantificación.

[6-4. Cuarta aplicación de ejemplo]

La figura 18 es un diagrama de bloques que muestra un ejemplo de configuración esquemática de un dispositivo de captura de imágenes. Un dispositivo de captura de imágenes 960 captura una imagen de un sujeto, genera una imagen, codifica los datos de imagen y registra los datos de imagen en un medio de registro.

El dispositivo de captura de imágenes 960 incluye un bloque óptico 961, una sección de captura de imágenes 962, una sección de procesamiento de señales 963, una sección de procesamiento de imágenes 964, una sección de visualización 965, una interfaz externa 966, una memoria 967, una unidad de medios 968, una OSD 969, una sección de control 970, una interfaz de usuario 971 y un bus 972.

El bloque óptico 961 se conecta a la sección de captura de imágenes 962. La sección de captura de imágenes 962 se conecta a la sección de procesamiento de señales 963. La sección de visualización 965 se conecta a la sección de procesamiento de imágenes 964. La interfaz de usuario 971 se conecta a la sección de control 970. El bus 972 interconecta la sección de procesamiento de imágenes 964, la interfaz externa 966, la memoria 967, la unidad de medios 968, la OSD 969 y la sección de control 970.

El bloque óptico 961 incluye una lente de enfoque, un mecanismo de parada de apertura y similares. El bloque óptico 961 forma una imagen óptica de un sujeto sobre una superficie de captura de imágenes de la sección de captura de imágenes 962. La sección de captura de imágenes 962 incluye un sensor de imagen tal como un CCD, un CMOS o similar, y convierte por conversión fotoeléctrica la imagen óptica formada en la superficie de captura de imágenes en una señal de imagen que es una señal eléctrica. Entonces, la sección de captura de imágenes 962 emite la señal de imagen a la sección de procesamiento de señales 963.

La sección de procesamiento de señales 963 realiza diversos procesos de señal de cámara, tales como corrección de inflexión, corrección de gamma, corrección de color y similares, en la señal de imagen introducida desde la sección de captura de imágenes 962. La sección de procesamiento de señales 963 emite los datos de imagen después del proceso de señal de cámara a la sección de procesamiento de imágenes 964.

La sección de procesamiento de imágenes 964 codifica los datos de imagen introducidos desde la sección de procesamiento de señales 963, y genera datos codificados. Entonces, la sección de procesamiento de imágenes 964 emite los datos codificados generados a la interfaz externa 966 o a la unidad de medios 968. Asimismo, la sección de procesamiento de imágenes 964 descodifica datos codificados introducidos desde la interfaz externa 966 o la unidad de medios 968 y genera datos de imagen. Entonces, la sección de procesamiento de imágenes 964 emite los datos de imagen generados a la sección de visualización 965. Asimismo, la sección de procesamiento de imágenes 964 puede emitir los datos de imagen introducidos desde la sección de procesamiento de señales 963 a la sección de visualización 965, y hacer que se visualice o muestre la imagen. Además, la sección de procesamiento de imágenes 964 puede superponer datos para su visualización adquiridos desde la OSD 969 sobre una imagen a emitir a la sección de visualización 965.

La OSD 969 genera una imagen de una GUI, tal como un menú, un botón, un cursor o similar, por ejemplo, y emite la imagen generada a la sección de procesamiento de imágenes 964.

La interfaz externa 966 está configurada como un terminal de entrada/salida de USB, por ejemplo. La interfaz externa 966 conecta el dispositivo de captura de imágenes 960 y una impresora en el momento de imprimir una imagen, por ejemplo. Asimismo, se conecta una unidad a la interfaz externa 966 según sea necesario. Un medio extraíble, tal como un disco magnético, un disco óptico o similar, por ejemplo, se monta en la unidad, y un programa leído del medio extraíble se puede instalar en el dispositivo de captura de imágenes 960. Además, la interfaz externa 966 se puede configurar como una interfaz de red para conectarse a una red tal como una LAN, Internet o similar. Es decir, la interfaz externa 966 sirve como medios de transmisión del dispositivo de captura de imágenes 960.

Un medio de registro a montar en la unidad de medios 968 puede ser un medio extraíble legible y grabable arbitrario, tal como un disco magnético, un disco magneto-óptico, un disco óptico, una memoria de semiconductores o similar, por ejemplo. Asimismo, un medio de registro se puede montar de forma fija en la unidad de medios 968, configurando una sección de almacenamiento no transportable tal como, por ejemplo, una unidad de disco duro integrada o una SSD (unidad de estado sólido).

La sección de control 970 incluye un procesador tal como una CPU, y una memoria tal como una RAM o una ROM. La memoria almacena un programa para ser ejecutado por la CPU, datos de programa y similares. Un programa almacenado en la memoria es leído y ejecutado por la CPU en el momento de la activación del dispositivo de captura de imágenes 960, por ejemplo. La CPU controla el funcionamiento del dispositivo de captura de imágenes 960 de acuerdo con una señal de operación introducida desde la interfaz de usuario 971, por ejemplo, ejecutando el programa.

La interfaz de usuario 971 se conecta a la sección de control 970. La interfaz de usuario 971 incluye un botón, un conmutador y similares usados por un usuario para hacer funcionar el dispositivo de captura de imágenes 960, por ejemplo. La interfaz de usuario 971 detecta una operación de un usuario a través de estos elementos estructurales, genera una señal de operación y emite la señal de operación generada a la sección de control 970.

En el dispositivo de captura de imágenes 960 configurado de esta forma, la sección de procesamiento de imágenes 964 tiene una función del dispositivo de codificación de imágenes 10 y del dispositivo de descodificación de imágenes 60 de acuerdo con la realización descrita anteriormente. En consecuencia, en el caso de la descodificación y codificación de imágenes en el dispositivo de captura de imágenes 960, es posible moderar en un aumento en la cantidad de códigos debido a un aumento en el número de matrices de cuantificación.

<7. En resumen>

Se han descrito el dispositivo de codificación de imágenes 10 y el dispositivo de descodificación de imágenes 60 con referencia a las figuras 1 a 18. Esto usa la técnica de predicción para generar una segunda matriz de cuantificación que corresponde a una unidad de transformación que representa un segundo tamaño a partir de una primera matriz de cuantificación que corresponde a una unidad de transformación que representa un primer tamaño si múltiples matrices de cuantificación corresponden a múltiples unidades de transformación que representan diferentes tamaños. Esto puede eliminar la necesidad de codificar la totalidad de la segunda matriz de cuantificación. Un aumento en la cantidad de códigos se puede moderar de forma eficaz incluso si aumenta el número de matrices de cuantificación.

La segunda matriz de cuantificación puede generarse usando la información de matriz que especifica la primera matriz de cuantificación y la información de diferencias (información de matriz de diferencias) que representa una diferencia entre una matriz predicha y la segunda matriz de cuantificación. Por lo tanto, es posible adquirir la segunda matriz de cuantificación apropiada para el lado de descodificación de imágenes simplemente codificando solo una diferencia entre la segunda matriz de cuantificación y una matriz predicha.

El primer indicador puede indicar la ausencia de una diferencia entre una matriz predicha y la segunda matriz de cuantificación y se puede adquirir del conjunto de parámetros de secuencia o del conjunto de parámetros de imagen. En un caso como este, se supone que una matriz predicha que se ha predicho a partir de la segunda matriz de cuantificación es la segunda matriz de cuantificación. En este caso, la cantidad de códigos se puede reducir adicionalmente debido a que ni siquiera se codifica información de diferencias para la segunda matriz de cuantificación.

La primera matriz de cuantificación puede tener el mínimo de los tamaños de unidad de transformación. La configuración descrita anteriormente no necesita codificar todas las matrices de cuantificación que no sean la matriz de cuantificación que tiene el tamaño mínimo. Por lo tanto, un aumento en la cantidad de códigos se puede moderar de forma más eficaz incluso si aumenta el número de matrices de cuantificación.

En esta memoria descriptiva se ha descrito cómo se multiplexa información para generar una matriz de cuantificación en un encabezamiento de un flujo codificado y se transmite desde el lado de codificación al lado de descodificación. Sin embargo, una técnica de transmisión de información usada para transmitir tal información no se limita a la técnica descrita anteriormente. Por ejemplo, la información no se puede multiplexar para dar un flujo de bits codificado, pero se puede transmitir o registrar como datos separados asociados con el flujo de bits codificado. El término "asociación" significa garantizar la posibilidad de vincular una imagen (o parte de una imagen, tal como un sector o un bloque) contenida en el flujo de bits con información correspondiente a la imagen. En concreto, la información se puede transmitir a través de una trayectoria de transmisión diferente de la usada para imágenes (o flujos de bits). La información se puede registrar en un medio de registro (o en un área de registro diferente en el mismo medio de registro) diferente de la usada para imágenes (o flujos de bits). La información y la imagen (o flujo de bits) se pueden asociar entre sí basándose en cualquier unidad tal como múltiples tramas, una trama o parte de una trama.

Lista de signos de referencia

10 Dispositivo de procesamiento de imágenes (dispositivo de codificación de imágenes)

16 Sección de codificación

110 Sección de selección

120 Sección de transformación ortogonal

130 Sección de cuantificación

60 Dispositivo de procesamiento de imágenes (dispositivo de descodificación de imágenes)

210 Sección de generación de matrices

230 Sección de selección

240 Sección de cuantificación inversa

250 Sección de transformación ortogonal inversa

Claims

REIVINDICACIONES

1. Un dispositivo de procesamiento de imágenes (10) que comprende:

una unidad configurada para:

descodificar datos codificados de datos de imagen para generar datos de coeficientes de transformación cuantificados; y

cuantificar inversamente los datos de coeficientes de transformación cuantificados usando una matriz de cuantificación de 16 x 16, mediante lo cual

la unidad está configurada además para generar la matriz de cuantificación de 16 x 16 duplicando cada elemento en una matriz de cuantificación de 8 x 8 como elementos duplicados en la matriz de cuantificación de 16 x 16; en donde, para un elemento en la matriz de cuantificación de 8 x 8, los elementos duplicados que se duplican a partir de ese elemento se sitúan en la matriz de cuantificación de 16 x 16 de la siguiente forma:

un primer elemento duplicado de los elementos duplicados se sitúa adyacente a un elemento y a la derecha del elemento;

un segundo elemento duplicado de los elementos duplicados se sitúa adyacente al elemento y por debajo del elemento;

un tercer elemento duplicado de los elementos duplicados se sitúa adyacente al primer elemento duplicado y por debajo del primer elemento duplicado y adyacente al segundo elemento duplicado y a la derecha del segundo elemento duplicado.

2. El dispositivo de procesamiento de imágenes de acuerdo con la reivindicación 1, en donde la unidad está configurada para almacenar la matriz de cuantificación de 8 x 8.

3. Un método de procesamiento de imágenes que comprende:

cuantificar inversamente, a través de una unidad de un dispositivo de procesamiento de imágenes (10), los datos de coeficientes de transformación cuantificados usando una matriz de cuantificación de 16 x 16; generándose la matriz de cuantificación de 16 x 16 duplicando cada elemento en una matriz de cuantificación de 8 x 8 como elementos duplicados en la matriz de cuantificación de 16 x 16;

en donde, para un elemento en la matriz de cuantificación de 8 x 8, los elementos duplicados que se duplican a partir de ese elemento se sitúan en la matriz de cuantificación de 16 x 16 de la siguiente forma:

4. El método de procesamiento de imágenes de acuerdo con la reivindicación 3, comprendiendo además la reenumeración de la reivindicación almacenar la matriz de cuantificación de 8 x 8.

5. Un medio legible por ordenador no transitorio que almacena instrucciones que, cuando se ejecutan, hacen que un ordenador realice un método, comprendiendo el método:

cuantificar inversamente los datos de coeficientes de transformación cuantificados usando una matriz de cuantificación de 16 x 16;

generándose la matriz de cuantificación de 16x 16 duplicando cada elemento en una matriz de cuantificación de 8 x 8 como elementos duplicados en la matriz de cuantificación de 16 x 16;

6. El medio legible por ordenador no transitorio de acuerdo con la reivindicación 5, en donde el método comprende además almacenar la matriz de cuantificación de 8 x 8.