ES2728112T3

ES2728112T3 - Procedimiento y aparato de codificación de video con intra predicción

Info

Publication number: ES2728112T3
Application number: ES17207504T
Authority: ES
Inventors: Vadim Seregin; Il-Koo Kim
Original assignee: Samsung Electronics Co Ltd
Current assignee: Samsung Electronics Co Ltd
Priority date: 2011-06-28
Filing date: 2012-06-27
Publication date: 2019-10-22
Anticipated expiration: 2032-06-27
Also published as: AU2016201368B2; LT2887670T; TW201817242A; JP2016149814A; HUE035495T2; EP3136728A1; KR101964382B1; LT3136729T; CN104869420B; IN2014CN00479A; DK3136729T3; DK3136728T3; US20150208065A1; HUE044713T2; PH12016500445B1; CN107396115A; RU2619706C2; US9485510B2; PH12016500447A1; EP3313076A1

Abstract

Un procedimiento de codificación de datos de vídeo, comprendiendo el procedimiento: determinar un número fijo de modos de intra predicción candidatos en una lista de candidatos de acuerdo con los modos de intra predicción de un bloque izquierdo y un bloque superior; generar un indicador de modo más probable que indica si uno de los modos de intra predicción candidatos se usa para determinar un modo de intra predicción de un bloque actual; cuando el indicador de modo más probable indica uno de los modos de intra predicción en la lista de candidatos usada para la predicción del bloque actual, generar un índice de modo que indica uno entre los modos de intra predicción candidatos incluidos en la lista de candidatos; y generar una secuencia de bits que incluye el indicador de predicción de modo y el índice de modo, en el que, la lista de candidatos incluye un modo plano, cuando el modo de intra predicción del bloque izquierdo y el bloque superior son iguales entre sí y el modo de intra predicción del bloque izquierdo es el modo DC.

Description

DESCRIPCIÓN

Procedimiento y aparato de codificación de video con intra predicción

Campo técnico

La presente invención se refiere a codificación y decodificación de video al utilizar intra predicción.

Antecedentes de la técnica

A medida que se está desarrollando y distribuyendo hardware para reproducir y almacenar contenido de video de alta resolución y alta calidad, aumenta una necesidad de un códec de video para codificar o decodificar efectivamente el contenido de video de alta resolución o alta calidad. En un códec de video convencional, se codifica un video de conformidad con un procedimiento de codificación limitado con base en un macro bloque que tiene un tamaño predeterminado.

Los datos de imagen de un dominio espacial se convierten en coeficientes de un dominio de frecuencia al utilizar conversión de frecuencia. Un códec de video divide una imagen en bloques de tamaños predeterminados para realizar la conversión de frecuencia rápidamente, y realiza una transformada de coseno discreta (DCT) en cada bloque para codificar el coeficiente de frecuencia de la unidad de bloque. Es fácil comprimir los coeficientes del dominio de frecuencia cuando se compara con compresión de los datos de imagen del dominio espacial. En particular, como los valores de pixel de imagen en el dominio espacial pueden representarse como errores previstos a través de inter predicción o intra predicción del códec de video, puede convertirse una gran cantidad de datos a 0 cuando se realiza la conversión de frecuencia sobre los errores previstos. El códec de video reduce la cantidad de datos al sustituir datos que se generan continúa y repetidamente con datos de pequeña capacidad.

XP030008594, GUO M ET AL: “CE14 Subtest 1: Intra Most Probable Mode Coding for Luma”, 20110310, n.° JCTVC-E088, 10 de marzo de 2011 (10-03-2011) divulga el modo de señalización más probable, donde el modo más probable se selecciona de manera adaptativa a partir de dos modos de intra predictor vecinos. Si los modos de predicción de los bloques izquierdo y superior son diferentes y uno de los mismos es el mismo con el modo actual, se transmite un indicador adicional para indicar cuál debe utilizarse como el modo más probable.

Divulgación

De acuerdo con un aspecto de la presente invención, se proporciona un procedimiento de codificación de vídeo, un aparato para codificar y un medio legible por ordenador no transitorio para almacenar una secuencia de bits de datos de vídeo de acuerdo con las reivindicaciones.

Efectos ventajosos

De conformidad con codificación de video de la presente realización, se asume el número constante de modos de intra predicción candidatos cuando se predice el modo de intra predicción al utilizar los modos de intra predicción candidatos, y de esa forma, el indicador MPM y la información de intra modo actual puede analizarse sin considerar un caso cuando cambia el número de modos de intra predicción candidatos utilizando el procedimiento de análisis de símbolo, reduciendo con ello la complejidad de la operación de análisis.

Breve descripción de las figuras

Las características y ventajas anteriores y otras de la presente invención se harán más evidentes al describir en detalle realizaciones ilustrativas de la misma con referencia a las figuras adjuntas, en las que:

La figura 1 es un diagrama de bloques de un aparato para codificar un video, de conformidad con una realización de la presente invención;

La figura 2 es un diagrama de bloques de un aparato para decodificar un video, de conformidad con una realización de la presente invención;

La figura 3 es un diagrama que muestra unidades de predicción vecinas indicadas para predecir un modo de intra predicción, de conformidad con una realización de la presente invención;

La figura 4 es un diagrama que muestra unidades de predicción indicadas para predecir un modo de intra predicción en codificación de video con base en una unidad de codificación de conformidad con una estructura de árbol, de conformidad con una realización de la presente invención;

La figura 5 es un diagrama de flujo que ilustra un procedimiento de codificación de video de conformidad con la realización de la presente invención;

La figura 6 es un diagrama de flujo que ilustra un procedimiento de decodificación de video de conformidad con la realización de la presente invención;

La figura 7 es un diagrama de bloques de un aparato de codificación de video con base en unidades de codificación de una estructura de árbol de conformidad con una realización de la presente invención;

La figura 8 es un diagrama de bloques de un aparato de decodificación de video con base en unidades de codificación de una estructura de árbol de conformidad con una realización de la presente invención;

La figura 9 es un diagrama para describir un concepto de unidades de codificación de conformidad con una realización de la presente invención;

La figura 10 es un diagrama de bloques de un codificador de imagen con base en unidades de codificación de conformidad con una realización de la presente invención;

La figura 11 es un diagrama de bloques de un decodificador de imagen con base en unidades de codificación de conformidad con una realización de la presente invención;

La figura 12 es un diagrama que ilustra unidades de codificación de conformidad con profundidades, y divisiones de conformidad con una realización de la presente invención;

La figura 13 es un diagrama para describir una relación entre una unidad de codificación y unidades de transformación, de conformidad con una realización de la presente invención;

La figura 14 es un diagrama para describir información de codificación de unidades de codificación que corresponden a una profundidad codificada, de conformidad con una realización de la presente invención;

La figura 15 es un diagrama de unidades de codificación de conformidad con profundidades, de conformidad con una realización de la presente invención;

Las figuras 16 a 18 son diagramas para describir una relación entre unidades de codificación, unidades de predicción, y unidades de transformación, de conformidad con una realización de la presente invención; y La figura 19 es un diagrama para describir una relación entre una unidad de codificación, una unidad de predicción o una división, y una unidad de transformación, de conformidad con información de modo de codificación de la Tabla 1.

Mejor modo

De acuerdo con un aspecto de la presente invención, se proporciona un procedimiento de codificación de vídeo, un aparato de codificación y un medio legible por ordenador no transitorio que almacena un secuencia de bits de datos de vídeo de acuerdo con las reivindicaciones.

Modo para la invención

En lo sucesivo, se describirá un procedimiento de codificación de video y un procedimiento de decodificación de video con base en un procedimiento de predicción de modo de intra predicción con referencia a las figuras 1 a 6 de conformidad con una realización de la presente invención. Además, se describirán realizaciones en donde se utiliza el esquema de predicción del modo de intra predicción en el procedimiento de codificación de video y el procedimiento de decodificación de video con base en unidades de codificación de una estructura de árbol de conformidad con la realización de la presente invención con referencia a las figuras 7 a 19. En lo sucesivo, “imagen” puede referirse a una imagen fija de un video, o puede referirse a una imagen en movimiento, es decir, el mismo video.

En primer lugar, un procedimiento de codificación de video y un procedimiento de decodificación de video con base en el procedimiento de predicción de modo de intra predicción de conformidad con una realización de la presente invención se describirá con referencia a las figuras 1 a 6.

La figura 1 es un diagrama de bloques de un aparato de codificación de video 10 de conformidad con una realización de la presente invención.

El aparato 10 de codificación de video puede codificar datos de video de un dominio espacial a través de intra predicción/inter predicción, transformación, cuantificación, y codificación de símbolo. En lo sucesivo, se describirán operaciones para codificar símbolos que se generan mediante intra predicción del aparato 10 de codificación de video.

El aparato 10 de codificación de video incluye una unidad 12 de intra predicción y una unidad 14 de codificación de símbolo.

El aparato 10 de codificación de video de la presente realización divide datos de imagen de un video en una pluralidad de unidades de datos, y puede realizar codificación en cada unidad de datos. La unidad de datos puede formarse con un cuadrado, un rectángulo, o una forma geométrica arbitraria. La presente invención no está limitada a la unidad de datos de un tamaño predeterminado. Para conveniencia de descripción, se describirá un procedimiento de codificación de video con respecto a un “bloque” que es una clase de unidad de datos. Sin embargo, el procedimiento de codificación de video de conformidad con realizaciones de la presente invención no está limitado al procedimiento de codificación de video con respecto al “bloque”, sino que puede aplicarse a varias unidades de datos.

La unidad 12 de intra predicción realiza una intra predicción con respecto a bloques del video. La unidad 12 de intra predicción puede determinar un modo de intra predicción que representa una dirección en donde se localiza información de referencia entre información vecina, para realizar la intra predicción con respecto a cada uno de los bloques. La unidad 12 de intra predicción puede realizar la intra predicción con respecto al bloque actual de conformidad con una clase de modo de intra predicción.

De conformidad con el procedimiento de intra predicción de la presente realización, el modo de intra predicción del bloque actual (en lo sucesivo, el modo de intra predicción actual) puede predecirse con referencia a modos de intra predicción de bloques vecinos. La unidad 14 de codificación de símbolo puede codificar la información de predicción del modo de intra predicción actual.

La unidad 12 de codificación de símbolo puede comparar el modo de intra predicción actual que se determina a través de la intra predicción del bloque actual con modos de intra predicción de un bloque izquierdo y un bloque superior de entre los bloques vecinos adyacentes al bloque actual, con el fin de predecir el modo de intra predicción actual.

Por ejemplo, la unidad 14 de codificación de símbolo puede codificar un indicador MPM que representa si existe un modo de intra predicción que sea el mismo que el modo de intra predicción actual de entre los modos de intra predicción del bloque izquierdo y el bloque superior.

Por ejemplo, si existe un modo que sea mismo que el modo de intra predicción actual entre los modos de intra predicción del bloque izquierdo y el bloque superior, la 14 unidad de codificación de símbolo puede determinar una pluralidad de modos de intra predicción candidatos, cuyo número es fijo, incluso cuando los modos de intra predicción del bloque izquierdo y el bloque superior son los mismos que o diferentes entre sí. Por ejemplo, la unidad 14 de codificación de símbolo puede codificar la información de intra modo actual bajo una suposición que existen tres modos de intra predicción candidatos para el modo de intra predicción actual, si existe un modo que sea el mismo que el modo de intra predicción actual entre los modos de intra predicción del bloque izquierdo y el bloque superior. Como otro ejemplo, la información de intra modo actual puede codificarse siempre bajo una suposición que existen dos modos de intra predicción candidatos. La unidad 14 de codificación de símbolo determina la información de intra modo actual del bloque actual con base en una pluralidad de modos de intra predicción candidatos, y codifica la información de intra modo actual. La información de intra modo actual puede ser información de índice que representa uno de los modos de intra predicción candidatos, o información de índice que representa el intra modo actual.

La unidad 14 de codificación de símbolo puede determinar dos o más modos de intra predicción candidatos que se utilizan para predecir el modo de intra predicción actual sin considerar si el modo de intra predicción izquierdo y el modo de intra predicción superior son los mismos entre sí, y si existe un modo que sea el mismo que el modo de intra predicción actual entre los modos de intra predicción del bloque izquierdo y el bloque superior. Por ejemplo, puede utilizarse una pluralidad de modos de intra predicción candidatos, por ejemplo, 2, 3, o 4 modos de intra predicción candidatos, para determinar el modo de intra predicción actual.

Además, se codifican símbolos bajo una suposición que existe un número fijo de modos de intra predicción candidatos sin considerar un caso en donde se cambia el número de los modos de intra predicción candidatos, y de esa forma, puede simplificarse la operación de codificación del intra modo.

La unidad 14 de codificación de símbolo de la presente realización puede determinar modos de intra predicción predeterminados como una pluralidad de modos de intra predicción candidatos con base en el modo de intra predicción del bloque izquierdo, si los modos de intra predicción del bloque izquierdo y el bloque superior son los mismos entre sí. De conformidad con otra realización, la unidad 14 de codificación de símbolo puede determinar una pluralidad de modos de intra predicción candidatos al modificar el modo de intra predicción del bloque izquierdo, si los modos de intra predicción del bloque izquierdo y el bloque superior son los mismos entre sí.

De conformidad con una realización, la unidad 14 de codificación de símbolo puede determinar dos modos de intra predicción candidatos de entre la pluralidad de modos de intra predicción candidatos respectivamente como en los modos de intra predicción del bloque izquierdo y el bloque superior, si los modos de intra predicción del bloque izquierdo y el bloque superior son diferentes entre sí.

De conformidad con una realización, la unidad 14 de codificación de símbolo puede codificar información que representa el modo de intra predicción candidato que corresponde al modo de intra predicción actual, con base en la pluralidad de modos de intra predicción candidatos.

De conformidad con una realización, la unidad 14 de codificación de símbolo puede codificar información de índice que representa el modo de intra predicción candidato que corresponde al modo de intra predicción actual de entre la pluralidad de modos de intra predicción candidatos, si existe el modo de intra predicción que es el mismo que el modo de intra predicción del bloque actual entre los modos de intra predicción del bloque izquierdo y el bloque superior.

De conformidad con una realización, la unidad 14 de codificación de símbolo puede codificar la información de modo de intra predicción actual que representa el modo de intra predicción del bloque actual, si el modo de intra predicción del bloque actual es diferente de aquellos del bloque izquierdo y el bloque superior.

De conformidad con otra realización, la unidad 14 de codificación de símbolo puede codificar la información de intra modo actual que representa una relación entre los modos de intra predicción candidatos y el modo de intra predicción actual para que el modo de intra predicción actual pueda inferirse de la pluralidad de modo de intra predicción candidatos, incluso cuando el modo de intra predicción del bloque actual es diferente de los modos de intra predicción del bloque izquierdo y el bloque superior. En este caso, incluso si el modo de intra predicción del bloque actual es diferente de los modos de intra predicción del bloque izquierdo y el bloque superior, la unidad 14 de codificación de símbolo determina la pluralidad de modos de intra predicción candidatos y codifica la información de intra modo actual con base en la pluralidad de modos de intra predicción candidatos.

Por lo tanto, la unidad 14 de codificación de símbolo puede enviar información de intra modo actual, posterior al indicador MPM que se codifica para el bloque actual.

Además, la unidad 14 de codificación de símbolo puede codificar información que representa el número de modos de intra predicción candidatos.

La unidad 14 de codificación de símbolo de la realización puede codificar un coeficiente de transformación cuantificado de datos residuales que se generan como un resultado de la intra predicción del bloque actual.

Por lo tanto, el aparato de codificación de video de la presente realización puede codificar y enviar los símbolos generados como un resultado de la intra predicción de los bloques del video.

El aparato 10 de codificación de video de la presente realización puede incluir un procesador central (no mostrado) para control general de la unidad 12 de intra predicción y la unidad 14 de codificación de símbolo. De otra forma, la unidad 12 de intra predicción y la unidad 14 de codificación de símbolo se accionan respectivamente mediante procesadores exclusivos (no mostrados), y el aparato 10 de codificación de video puede accionarse en general por operaciones sistemáticas de los procesadores (no mostrados). De otra forma, la unidad 12 de intra predicción y la unidad 14 de codificación de símbolo pueden controlarse mediante un procesador externo (no mostrado) del aparato 10 de codificación de video de conformidad con la realización.

De conformidad con la realización, el aparato 10 de codificación de video puede incluir una o más unidades de almacenamiento de datos (no mostradas) para almacenar datos de entrada/salida de la unidad 12 de intra predicción y la unidad 14 de codificación de símbolo. El aparato 10 de codificación de video puede incluir un controlador de memoria (no mostrado) para controlar entrada/salida de datos de la unidad de almacenamiento de datos (no mostrada).

De conformidad con la presente realización, el aparato 10 de codificación de video puede realizar la operación de codificación de video incluyendo la predicción y transformación al operar en conexión con un procesador de codificación de video ahí montado o un procesador de codificación de video externo con el fin de enviar el resultado de codificación de video. El procesador de codificación de video interno en el aparato 10 de codificación de video de conformidad con la realización puede incluir un caso en donde el aparato 10 de codificación de video o un dispositivo de cálculo central o un dispositivo de cálculo gráfico incluye un módulo de procesamiento de codificación de video para realizar una operación de codificación de video básica, así como un procesador separado.

La figura 2 es un diagrama de bloques de un aparato 20 de decodificación de video de conformidad con una realización de la presente invención.

El aparato 20 de decodificación de video puede decodificar datos de video que se codifican mediante el aparato 10 de codificación de video a través de análisis, decodificación de símbolo, cuantificación inversa, transformación inversa, o intra predicción/compensación de movimiento para restaurar datos de video que son similares a los datos de video originales del dominio espacial. En lo sucesivo, se describirán procedimientos para analizar símbolos para la intra predicción de corrientes de bit y restaurar el modo de intra predicción de los símbolos analizados.

El aparato 20 de decodificación de video de la presente realización incluye una unidad 22 de análisis y una unidad 24 de intra predicción.

El aparato 20 de decodificación de video puede recibir una secuencia de bits en la cual se escriben datos codificados del video. La unidad 22 de análisis puede analizar símbolos de la secuencia de bits.

La unidad 22 de análisis de la presente realización puede analizar símbolos que se generan como un resultado de intra predicción con respecto a bloques del video de la secuencia de bits.

La unidad 22 de análisis puede analizar los indicadores MPM de los bloques durante análisis de los símbolos de los bloques de video de la secuencia de bits recibida.

La unidad 22 de análisis de la presente realización puede determinar si se utiliza un número fijo de pluralidad de modos de intra predicción candidatos para predecir un modo de intra predicción de un bloque actual con base en el indicador MPM analizado del bloque actual.

En un caso en donde se utilizan los modos de intra predicción candidatos, ya que se asume un número constante de modos de intra predicción candidatos, la unidad 22 de análisis puede analizar la información de intra modo actual sin considerar un caso en donde se cambia el número de los modos de intra predicción candidatos después de analizar el indicador MPM. Después de analizar los símbolos que indican la intra predicción del bloque actual mediante la unidad 22 de análisis, la unidad 24 de intra predicción puede restaurar datos para la intra predicción, por ejemplo, el modo de intra predicción del bloque actual, al utilizar los símbolos analizados. El coeficiente de transformación cuantificado de los datos residuales generados como un resultado de la intra predicción del bloque actual puede restaurarse de los datos analizados mediante la unidad 22 de análisis.

En un caso en donde se determina que se utiliza la pluralidad de modos de intra predicción candidatos con base en el indicador MPM, la unidad 24 de intra predicción de la presente realización puede determinar la pluralidad de modos de intra predicción candidatos, cuyo número es fijo, para predecir el modo de intra predicción del bloque actual mientras se restaura el modo de intra predicción actual del bloque actual al utilizar los símbolos analizados de los bloques. Por ejemplo, la unidad 24 de intra predicción puede predecir el modo de intra predicción actual al utilizar tres modos de intra predicción candidatos constantemente. Como otro ejemplo, la unidad 24 de intra predicción puede asumir que se utilizaron constantemente dos modos de intra predicción candidatos.

La unidad 24 de intra predicción de la presente realización puede determinar la pluralidad de modos de intra predicción candidatos con base en modos de intra predicción de un bloque izquierdo y un bloque superior que son adyacentes al bloque actual.

La unidad 24 de intra predicción de la presente realización puede restaurar el modo de intra predicción de los símbolos analizados del bloque actual. La unidad 24 de intra predicción puede realizar la intra predicción sobre el bloque actual al utilizar el modo de intra predicción.

El aparato 20 de decodificación de video puede restaurar los datos residuales del dominio espacial del coeficiente de transformación cuantificado de los datos residuales a través de la cuantificación inversa y la transformación inversa, en un caso en donde se analiza el coeficiente de transformación cuantificado de los datos residuales del bloque actual de la secuencia de bits. La unidad 24 de intra predicción la puede realizar intra predicción con respecto a los datos residuales del dominio espacial del bloque actual al utilizar el modo de intra predicción.

El modo 24 de intra predicción de conformidad con la presente realización puede determinar una pluralidad de modos de intra predicción candidatos con el fin de predecir el modo de intra predicción actual incluso cuando los modos de intra predicción del bloque izquierdo y el bloque superior del bloque actual son los mismos que o diferentes entre sí. Por lo tanto, el modo 24 de intra predicción puede determinar la pluralidad de modos de intra predicción sin considerar si los modos de intra predicción del bloque izquierdo y el bloque superior son los mismos entre sí.

Si los modos de intra predicción del bloque izquierdo y el bloque superior son los mismos entre sí, la unidad 24 de intra predicción de la presente realización puede determinar modos de intra predicción predeterminados como la pluralidad de modos de intra predicción candidatos con base en el modo de intra predicción del bloque izquierdo. Por ejemplo, cuando el modo de intra predicción del bloque izquierdo es un modo de intra predicción predeterminado, puede determinarse la pluralidad de modos de intra predicción candidatos para incluir una pluralidad de modos de intra predicción predeterminados.

Como otro ejemplo, si los modos de intra predicción del bloque izquierdo y el bloque superior son los mismos entre sí, el modo 24 de intra predicción puede determinar una pluralidad de modos de intra predicción candidatos al utilizar el modo de intra predicción del bloque izquierdo. Por ejemplo, cuando el modo de intra predicción del bloque izquierdo es un modo de intra predicción predeterminado, puede determinarse la pluralidad de modos de intra predicción candidatos para incluir valores prestados o modificados del modo de intra predicción del bloque izquierdo.

Si los modos de intra predicción del bloque izquierdo y el bloque superior son diferentes entre sí, el modo 24 de inter predicción de la presente realización puede adoptar los modos de intra predicción del bloque izquierdo y el bloque superior como dos modos de intra predicción candidatos de entre la pluralidad de modos de intra predicción candidatos.

La unidad 22 de análisis de la presente realización puede analizar información de intra modo actual posterior al indicador MPM cuando se analizan los símbolos del bloque actual de la secuencia de bits.

La unidad 22 de análisis de la presente realización puede analizar información de índice que representa un modo de intra predicción candidato de entre la pluralidad de modos de intra predicción candidatos como la información de intra modo actual, si se determina que la pluralidad de modos de intra predicción candidato se utiliza para determinar el modo de intra predicción actual con base en el indicador MPM analizado. La unidad 24 de intra predicción puede determinar un modo de predicción candidato seleccionado con base en la información de índice de entre la pluralidad de modos de intra predicción candidatos como el modo de intra predicción actual.

La unidad 22 de análisis de la presente realización puede analizar un índice del modo de intra predicción que representa exactamente la dirección de intra predicción del bloque actual como la información de intra modo actual, en un caso en donde el modo de intra predicción del bloque actual es diferente de los modos de intra predicción del bloque izquierdo y el bloque superior con base en el indicador MPM. Por lo tanto, la unidad 24 de intra predicción puede determinar el intra modo del bloque actual directamente de la información de intra modo actual.

Como otro ejemplo, la unidad 24 de intra predicción puede determinar el modo de intra predicción del bloque con base en la información de intra modo actual del bloque actual y la pluralidad de modos de intra predicción candidatos. Por ejemplo, una relación entre los modos de intra predicción candidatos y el modo de intra predicción actual puede interpretarse de la información de intra modo actual. En este caso, la unidad 24 de intra predicción determina la pluralidad de modos de intra predicción candidatos incluso cuando el modo de intra predicción actual es diferente de los modos de intra predicción del bloque izquierdo y un bloque derecho, y puede determinar el modo de intra predicción actual al inferir de los modos de intra predicción candidatos al utilizar la información de intra modo actual.

El aparato 20 de decodificación de video escalable de la presente realización puede incluir un procesador central (no mostrado) que controla la unidad 22 de análisis y la unidad 24 de intra predicción. De forma similar, la unidad 22 de análisis y la unidad 24 de intra predicción se accionan respectivamente mediante procesadores exclusivos (no mostrados), y el aparato 20 de decodificación de video puede accionarse en general mediante operaciones sistemáticas de los procesadores (no mostrados). De otra forma, la unidad 22 de análisis y la unidad 24 de intra predicción pueden controlarse mediante un procesador externo (no mostrado) del aparato 20 de decodificación de video de conformidad con la realización.

De conformidad con la realización, el aparato 20 de decodificación de video puede incluir una o más unidades de almacenamiento de datos (no mostradas) para almacenar datos de entrada/salida de la unidad 22 de análisis y la unidad 24 de intra predicción. El aparato 20 de decodificación de video puede incluir un controlador de memoria (no mostrado) para controlar entrada/salida de datos de la unidad de almacenamiento de datos (no mostrada).

De conformidad con la presente realización, el aparato 20 de decodificación de video puede realizar la operación de decodificación de video que incluye la transformación inversa al operar en conexión con un procesador de decodificación de video ahí montado o un procesador de decodificación de video externo con el fin de restaurar el video a través de la decodificación de video. El procesador de decodificación de video interno en el aparato 20 de decodificación de video de conformidad con la realización puede incluir un caso en donde el aparato 20 de decodificación de video, o un dispositivo de cálculo central o un dispositivo de cálculo gráfico incluye un módulo de procesamiento de decodificación de video para realizar una operación de decodificación de video básica, así como un procesador separado.

De conformidad con el aparato 10 de codificación de video y el aparato 20 de decodificación de video descrito con referencia a las figuras 1 y 2, mientras se restaura el modo de intra predicción al analizar los símbolos de los bloques de la secuencia de bits, los símbolos de los bloques que incluyen el indicador MPM y la información de intra modo actual se analizan, y entonces, puede restaurarse el modo de intra predicción actual con base en el indicador MPM y la información de intra modo actual entre los símbolos analizados. Por lo tanto, un procedimiento para analizar los símbolos de los bloques de la secuencia de bits y un procedimiento para restaurar el modo de intra predicción de los símbolos analizados pueden separarse entre sí. A menos que se separen los procedimientos de análisis y de restauración de los símbolos, los símbolos tienen que restaurarse mientras se analizan los símbolos y los símbolos se analizan de nuevo, es decir, se repiten las operaciones de análisis y restauración de los símbolos de bloque, degradando con ello eficiencia del procedimiento de decodificación. Por lo tanto, de conformidad con el aparato 10 de decodificación de video y el aparato 20 de decodificación de video de la presente realización, los procedimientos de análisis y restauración del modo de intra predicción se separan durante el análisis de los símbolos, y por consiguiente, puede mejorarse la eficiencia del procedimiento de decodificación.

Si el número de modos de intra predicción candidatos varía dependiendo de casos incluso cuando existe una pluralidad de modos de intra predicción candidatos, el procedimiento de análisis se vuelve complicado debido a que tienen que considerarse variables de conformidad con el número de los modos de intra predicción candidatos cuando se analiza la información intra relacionada. Sin embargo, de conformidad con el aparato 20 de decodificación de video de la presente realización, se asume el número constante de modos de intra predicción candidatos cuando se predice el modo de intra predicción al utilizar los modos de intra predicción candidatos, y de esa forma, puede analizarse el indicador MPM y la información de intra modo actual sin considerar un caso en donde se cambia el número de modos de intra predicción candidatos durante el procedimiento de análisis de símbolo, reduciendo con ello la complejidad de la operación de análisis.

En lo sucesivo, se describirán realizaciones para predecir los modos de intra predicción que pueden lograrse en el aparato 10 de codificación de video y el aparato 20 de decodificación de video de conformidad con la realización de la presente invención.

La figura 3 es un diagrama que muestra bloques indicados para predecir los modos de intra predicción de conformidad con la realización de la presente invención.

Se muestran unidades de predicción (PU) como ejemplos de los bloques. Las PU son unidades de datos para realizar la predicción por cada unidad de codificación, en un procedimiento de codificación de video con base en una unidad de codificación de conformidad con una estructura de árbol. El aparato 10 de codificación de video y el aparato 20 de decodificación de video de conformidad con la presente realización no están limitados a la PU que tiene un tamaño fijo, sino que puede realizar la predicción con respecto a PU de varios tamaños. El procedimiento de codificación de video de la PU, se con base en la unidad de codificación de conformidad con la estructura de árbol se describirá en lo sucesivo con referencia a las figuras 7 a 19. En lo sucesivo, se describirán realizaciones para predecir el modo de intra predicción de la PU; sin embargo, las realizaciones anteriores pueden aplicarse similarmente a varias clases de bloques.

El aparato 10 de codificación de video de conformidad con la presente realización puede determinar si existe un modo de intra predicción que sea el mismo que el modo de predicción actual de una PU 30 actual, de entre los modos de intra predicción de una PU 32 izquierda y una PU 33 superior, con el fin de predecir el modo de intra predicción de la PU 30 actual de conformidad con la presente realización. El indicador MPM puede codificarse de conformidad con el resultado de determinación.

Por ejemplo, si los modos de intra predicción de la PU 32 izquierda y la PU 33 superior son diferentes del modo de intra predicción actual, se codifica el indicador MPM a “cero”, y si al menos uno de los modos de intra predicción de la PU 32 izquierda y la PU 33 superior es el mismo que el modo de intra predicción actual, puede codificarse el indicador MPM a “1”.

En lo sucesivo, se indicarán los modos de intra predicción de las PU 32 y 33 izquierda y superior como modos de intra predicción izquierdos y superiores, para conveniencia de descripción.

Si los modos de intra predicción izquierdos/superiores son diferentes del modo de intra predicción actual, puede codificarse la información de intra modo actual que representa el modo de intra predicción actual.

Si existe el modo de intra predicción que es el mismo que el modo de intra predicción actual entre los modos de intra predicción izquierdos y superiores, pueden determinarse dos o más modos de intra predicción candidatos para predecir el modo de intra predicción actual. Los modos de intra predicción candidatos pueden ser modos de intra predicción que tienen una alta probabilidad para predecirse como el modo de intra predicción actual.

Los dos modos de intra predicción candidatos pueden ser el modo de intra predicción izquierdo y el modo de intra predicción superior.

<Ecuación de determinación de MPM 1>

MPM0 = min(leftIntraMode, aboveInftraMode);

MPM1 = max(leftIntraMode, aboveInftraMode);

En la ecuación de determinación MPM1, MPM0 y MPM1 son respectivamente modos de intérprete de intra predicción candidatos de primer nivel y segundo nivel. min(A, B) es una función para enviar un valor más pequeño entre A y B, y max(A, B) es una función para enviar un valor mayor.

En la ecuación de determinación MPM 1, leftlntraMode y aboveInftraMode son respectivamente un índice del modo de intra predicción izquierdo y un índice del modo de intra predicción superior. Se distribuye un índice más pequeño al modo de intra predicción de alta probabilidad de generación o que se adopta preferiblemente.

Es decir, de conformidad con la ecuación de determinación MPM 1, el índice del modo de intra predicción izquierdo y el modo intra predicción superior se indican con los modos de intra predicción candidatos de primer y segundo nivel en un orden creciente, y de esa forma, el modo de intra predicción izquierdo y el modo de intra predicción superior pueden adoptarse como el modo de intra predicción candidato en un orden de la probabilidad de generación o la prioridad.

El caso anterior también se aplica al aparato 20 de decodificación de video. Los modos de intra predicción izquierdos y superiores son diferentes del modo de intra predicción actual después de analizar el indicador MPM de la secuencia de bits, la información de intra modo actual que representa el presente modo de intra predicción se analiza de la secuencia de bits, y cuando exista el modo de intra predicción entre los modos de intra predicción izquierdos y superiores, que es el mismo que el modo de predicción actual, pueden determinarse dos o más diferentes modos de intra predicción candidatos para predecir el modo de intra predicción actual.

Sin embargo, cuando el modo de intra predicción izquierdo y el modo de intra superior son los mismos entre sí, aún no se ha determinado la pluralidad de modos de intra predicción candidatos incluso si se adoptan los modos de intra predicción izquierdos y superiores como los modos de intra predicción candidatos.

En lo sucesivo, asumiendo que existe el modo de intra predicción entre los modos de intra predicción izquierdos y superiores, que es el mismo que el modo de intra predicción actual, y los modos de intra predicción izquierdos y superiores son los mismos entre sí, se describirán realizaciones para determinar la pluralidad de modos de diferentes modos de intra predicción candidatos.

1. La pluralidad de modos de intra predicción candidatos puede incluir diferentes modos de intra predicción predeterminados. Como un modo de intra predicción predeterminado de conformidad con la presente realización, un modo de intra predicción que tiene una alta probabilidad de generación, un modo de intra predicción que tiene una excelente función de predicción, o un modo similar al modo de intra predicción izquierdo puede adoptarse. El modo de intra predicción que tiene la alta probabilidad de generación o que tiene la excelente función de predicción puede incluir un modo de predicción DC, un modo plano, y un modo de predicción de dirección vertical (en lo sucesivo, un modo vertical).

En un caso en donde se realiza la intra predicción de conformidad con el modo plano de entre los modos de intra predicción, el brillo de pixeles en la PU tiene una forma de graduación y puede predecirse para brillar u obscurecerse gradualmente en una dirección predeterminada.

Por ejemplo, en un caso en donde el modo de intra predicción izquierdo es el modo de predicción DC o el modo plano, tres modos de intra predicción candidatos son modos de intra predicción predeterminados, es decir, el modo de predicción DC, el modo plano, y el modo vertical.

2. La pluralidad de modos de intra predicción candidatos puede incluir el modo de intra predicción izquierdo y los modos de intra predicción predeterminados.

<Ecuación de determinación MPM 2>

if (leftIntraMode == aboveIntraMode == DC)

aboveintraMode = Panar mode {or 0 if no planar mode}

else

abovelntraMode = DC

De conformidad con la ecuación de determinación MPM 2, después de determinar el modo de intra predicción izquierdo y el modo de intra predicción superior, pueden determinarse los modos de intra predicción candidatos por la ecuación de determinación MPM 1.

De conformidad con la ecuación de determinación MPM 1, si los modos de intra predicción izquierdos y superiores son ambos modos de intra predicción DC, el modo de intra predicción superior puede cambiar en el modo plano (o un modo de intra predicción que tiene un índice 0). En este caso, los modos de intra predicción candidatos pueden incluir el modo de predicción DC que es el modo de intra predicción izquierdo o el modo plano (o el modo de intra predicción del índice 0) de conformidad con la ecuación de determinación MPM 1.

Además, de conformidad con la ecuación de determinación MPM 2, en un caso en donde al menos uno de un modo de intra predicción izquierdo y el modo de intra predicción superior no es el modo de intra predicción DC, el modo de intra predicción superior puede cambiar en el modo de intra predicción DC. En este caso, los modos de intra predicción candidatos pueden incluir el modo de intra predicción izquierdo o el modo de intra predicción DC de conformidad con la ecuación de determinación MPM 1.

3. Puede cambiar una pluralidad de modos de intra predicción candidatos en valores utilizando el modo de intra predicción izquierdo o modificarse del modo de intra predicción izquierdo.

Por ejemplo, en un caso en donde el modo de intra predicción izquierdo es un modo de intra predicción de una dirección predeterminada, los modos de intra predicción candidatos incluyen el modo de intra predicción izquierdo y pueden incluir el modo de intra predicción que corresponde a un índice que aumenta o disminuye del índice que representa el modo de intra predicción izquierdo por un desplazamiento predeterminado.

<Ecuación de determinación MPM 3>

MPM0 = leftIntraMode;

MPM1 = leftIntraMode - n;

MPM2 = leftIntraMode n;

De conformidad con la ecuación de determinación MPM 3, el modo de intra predicción izquierdo puede adoptarse como el modo de intra predicción candidato de primer nivel, un modo de intra predicción que tiene un índice que es menor tanto como M de aquel del modo de intra predicción izquierdo que puede adoptarse como el modo de intra predicción candidato del segundo nivel, y un modo de intra predicción que tiene un índice que es mayor por tanto como M que atiende el modo de intra predicción izquierdo que pueda adoptarse como el modo de intra predicción candidato de tercer nivel. Aquí, n puede ser un número entero, por ejemplo, 1, 2, ...

4. Puede determinarse una pluralidad de modos de intra predicción candidatos al utilizar una tabla de búsqueda que muestra correlaciones entre un valor del modo de intra predicción izquierdo y modos de intra predicción candidatos correspondientes. Es decir, puede seleccionarse una pluralidad de modos de intra predicción candidatos que indican con el modo de intra predicción izquierdo, con base en la tabla de búsqueda. Ya que se determinan los modos de intra predicción candidatos de conformidad con el modo de intra predicción izquierdo en los descritos anteriormente 1, 2, y 3, pueden derivarse resultados similares a aquellos del procedimiento de indicación de tabla de búsqueda de conformidad con el modo de intra predicción izquierdo.

5. La tabla de búsqueda de los modos de intra predicción candidatos incluye el modo de intra predicción izquierdo como el primer nivel, y puede incluir los modos de intra predicción que tienen altas frecuencias de generación en un orden decreciente como el segundo nivel y similares.

6. Se determina la frecuencia de generación o probabilidad estadística de cada modo de intra predicción que se codifica (decodifica) previamente, y pueden adoptarse los modos de intra predicción que tienen altas probabilidades estadísticas como los modos de intra predicción candidatos.

7. Si un modo de intra predicción es diferente de los modos de intra predicción de las PU izquierdas y superiores de entre las PU vecinas excepto por las de PU izquierda y superior, los modos de intra predicción candidatos pueden incluir el modo de intra predicción izquierdo (superior) y el modo de intra predicción detectado de la PU vecina.

Se describirán ahora ejemplos de 7 anteriormente con referencia a la figura 4.

La línea la figura 4 muestra ejemplos de PU que se indican para predecir el modo de intra predicción en la codificación de video con base en una unidad de codificación de conformidad con una estructura de árbol.

Para predecir el modo de intra predicción de una PU 40 actual, puede indicarse una PU 40 y 41 izquierda y una PU 42 superior con prioridad superior. Si existen muchas PU adyacentes a un límite izquierdo o superior de la PU actual, los modos de intra predicción de las PU 41 y 42 izquierda y superior que son adyacentes a la muestra izquierda superior en la PU 40 actual pueden indicarse con prioridad.

Si los modos de intra predicción de la PU 41 izquierda y la PU 42 superior son los mismos entre sí, pueden indicarse modos de intra predicción de PU vecinas de ubicaciones predeterminadas excepto para las PU 41 y 42 izquierda y superior de entre las PU vecinas adyacentes a la PU 40 actual. Por ejemplo, pueden indicarse los modos de intra predicción de una PU izquierda superior 45, una PU 47 derecha superior, y una PU 40 izquierda inferior. Si uno de los modos de intra predicción de la PU 45 izquierda superior, la PU 47 derecha superior, y la PU 49 izquierda inferior es diferente de los modos de intra predicción de las PU 41 y 42 izquierda y superior, puede adoptarse como el modo de intra predicción candidato.

Por ejemplo, el modo de intra predicción candidato de primer nivel puede ser los modos de intra predicción de la PU 41 izquierda y la PU 42 superior. Se detecta si existe un modo de intra predicción que es sea diferente de los modos de intra predicción de las PU 41 y 42 izquierda y superior, de entre los modos de intra predicción de la PU 45 izquierda superior, la PU 47 derecha superior, y la PU 49 izquierda inferior en un orden predeterminado, y el modo de intra predicción que se detectó primero puede adoptarse como el modo de intra predicción candidato de segundo nivel.

Como otro ejemplo, si los modos de intra predicción de las PU 41 y 42 izquierda y superior son los mismos entre sí, se detecta secuencialmente en un orden predeterminado si existe un modo de intra predicción que sea diferente de los modos de intra predicción de las PU 41 y 42 izquierda y superior de entre los modos de intra predicción de las PU 43, 44, 45, 47, y 49 vecinas excepto para las PU izquierda y superior, y el modo de intra predicción que se detecta primero puede adoptarse como el modo de predicción candidato de segundo nivel.

En más detalle, el modo de intra predicción se compara con los modos de intra predicción de las PU 41 y 42 izquierda y superior partiendo de la PU derecha superior 47, y se determina al buscar si existe la PU que tenga el modo de intra predicción que sea diferente de los modos de intra predicción de las PU 41 y 42 izquierda y superior a lo largo de la PU 47, 44, y 45 vecinas localizadas sobre una porción superior de la PU 40 actual. El modo de intra predicción que se detecta primero puede adoptarse como el modo de intra predicción candidato de segundo nivel.

Después de buscar la PU 45 izquierda superior, no existe ningún modo de intra predicción que sea diferente de los modos de intra predicción de las PU 41 y 42 izquierda y superior, puede determinarse al buscar si existe la PU que tenga el modo de intra predicción que sea diferente de los modos de intra predicción de las PU 41 y 42 izquierda y superior partiendo de la PU 49 izquierda inferior hacia arriba a lo largo de las PU vecinas localizadas en un lado izquierdo de la PU 40 actual. El modo de intra predicción detectado primero puede adoptarse como el modo de intra predicción candidato de segundo nivel.

En la realización anterior, las PU vecinas localizadas sobre una porción superior de la PU actual partiendo de la PU 47 derecha superior se buscan, y entonces, se buscan las PU vecinas localizadas en el lado izquierdo de la PU actual partiendo de la PU 49 izquierda inferior; sin embargo, el orden de búsqueda anterior puede variar.

En un caso en donde uno de los modos de intra predicción izquierdos y superiores es el mismo que el modo de intra predicción actual y el modo de intra predicción izquierdo y el modo de intra predicción superior son los mismos entre sí, se describen anteriormente varias realizaciones para determinar la pluralidad de diferentes modos de intra predicción candidatos.

Como se describió anteriormente, el aparato 10 de codificación de video y el aparato 20 de decodificación de video de la presente realización pueden predecir el modo de intra predicción actual al utilizar la pluralidad de modos de intra predicción candidatos que siempre son diferentes entre sí en un caso en donde existe uno del modo de intra predicción izquierdo y superior, que es el mismo que el modo de predicción actual, y los modos de intra predicción izquierdos y superiores son diferentes de o iguales entre sí.

Por consiguiente, si los modos de intra predicción de los bloques izquierdos y superiores vecinos son los mismos entre sí, el aparato 10 de codificación de video no necesita codificar la información que representa un caso en donde se cambia el número de modos de intra predicción candidatos, y puede codificar el indicador MPM y la información de intra modo actual únicamente como la información que se refiere al modo de intra predicción.

Por lo tanto, el aparato 20 de decodificación de video de conformidad con la presente realización únicamente analiza el indicador MPM y la información de intra modo actual durante el procedimiento de análisis de la información que se refiere a la intra predicción del bloque actual, y no hay necesidad de determinar si los modos de intra predicción de los bloques izquierdos y superiores vecinos son los mismos entre sí. Ya que no existe necesidad de determinar si los modos de intra predicción de los bloques izquierdos y superiores son los mismos entre sí, no hay necesidad de restaurar los modos de intra predicción de los bloques izquierdos y superiores. Además, ya que el procedimiento de restaurar el modo de intra predicción de los símbolos analizados durante el análisis de los símbolos y el análisis de los símbolos de nuevo se omite, el procedimiento análisis del modo de intra predicción puede realizarse rápidamente. Como tal, puede mejorarse la eficiencia del procedimiento de decodificación incluyendo analizar y restaurar el modo de intra predicción.

Además, el modo de predicción del modo de intra predicción para procesamiento únicamente de un modo de intra predicción candidato se emite, y de esa forma, puede simplificarse el procedimiento de decodificación.

La figura 5 es un diagrama de flujo que ilustra un procedimiento de codificación de video de conformidad con una realización de la presente invención.

En operación S51, el modo de intra predicción determinado a través de la intra predicción del bloque actual de entre los bloques de video se compara con modo de intra predicción del bloque izquierdo y el bloque superior que son adyacentes al bloque actual.

En operación S53, se codifica un indicador MPM que representa si existe el modo de intra predicción entre los modos de intra predicción de los bloques izquierdos y superiores del bloque actual, que es el mismo que el modo de intra predicción del bloque actual.

En operación S55, si existe el modo de intra predicción que es el mismo que el modo de intra predicción del bloque actual entre los modos de intra predicción de los bloques izquierdos y superiores, se determina una pluralidad de modos de intra predicción candidatos, cuyo número es fijo, incluso si los modos de intra predicción de los bloques izquierdos y superiores son diferentes de o iguales entre sí.

En operación S57, la información de intra modo actual del bloque actual, que se determina con base en la pluralidad de modos de intra predicción candidatos, se codifica.

Si los modos de intra predicción de los bloques izquierdos y superiores son los mismos entre sí en la operación S55, pueden determinarse los modos de intra predicción predeterminados como la pluralidad de modos de intra predicción candidatos con base en el modo de intra predicción del bloque izquierdo.

Además, en un caso donde los modos de intra predicción de los bloques izquierdos y superiores son los mismos entre sí, puede determinarse la pluralidad de modos de intra predicción candidatos al utilizar el modo de intra predicción del bloque izquierdo.

Además, si los modos de intra predicción de los bloques izquierdos y superiores son diferentes entre sí, pueden determinarse dos modos de intra predicción candidatos de entre la pluralidad de modos de intra predicción candidatos como los modos de intra predicción de los bloques izquierdos y superiores.

En la operación 57, si existe el modo de intra predicción que es el mismo que el modo de intra predicción del bloque actual entre los modos de intra predicción de los bloques izquierdos y superiores, puede codificarse información de índice que representa el modo de intra predicción candidato que corresponde al bloque de intra predicción del bloque actual de entre la pluralidad de modos de intra predicción candidatos.

Además, se determina el modo de intra predicción actual del bloque actual con base en el modo de intra predicción del bloque actual y la pluralidad de modos de intra predicción candidatos incluso cuando el modo de intra predicción del bloque actual es diferente de los modos de intra predicción de los bloques izquierdos y superiores en operación S 55, y por consiguiente, la información de intra modo actual que representa una relación entre el modo de intra predicción actual y los modos de intra predicción candidatos puede codificarse en operación S57.

La figura 6 es un diagrama de flujo que ilustra un procedimiento de decodificación de video de conformidad con una realización de la presente invención.

En operación S61, el indicador MPM del bloque actual se analiza mientras se analizan los símbolos del bloque actual de entre los bloques de los bloques codificados de la secuencia de bits recibida.

En operación S63, se determina si se utiliza la pluralidad de modos de intra predicción candidatos, cuyo número es fijo, con el fin de predecir el modo de intra predicción del bloque actual con base en el indicador MPM.

En operación S65, después de analizar los símbolos de bloque, se restaura el modo de intra predicción del bloque actual al utilizar los símbolos analizados. En un caso en donde se determina que se utiliza la pluralidad de modos de intra predicción candidatos con base en el indicador MPM en operación S63, puede determinarse la pluralidad de modos de intra predicción candidatos, cuyo número es fijo, con el fin de predecir el modo de intra predicción del bloque actual con base en los modos de intra predicción de los bloques izquierdos y superiores que son adyacentes al bloque actual en operación S65. Puede predecirse el modo de intra predicción del bloque actual al utilizar la pluralidad determinada de modos de intra predicción candidatos.

En operación S67, se realiza la intra predicción sobre el bloque actual al utilizar el modo de intra predicción previsto en la operación S65.

Cuando se determina la pluralidad de modos de intra predicción candidatos en operación S65, si los modos de intra predicción de los bloques izquierdos y superiores son los mismos entre sí, pueden determinarse modos de intra predicción predeterminados como la pluralidad de modos de intra predicción candidatos con base en el modo de intra predicción del bloque izquierdo.

Además, si los modos de intra predicción de los bloques izquierdos y superiores son los mismos entre sí, puede determinarse la pluralidad de modos de intra predicción candidatos al utilizar el modo de intra predicción del bloque izquierdo.

Cuando se determina la pluralidad de modos de intra predicción candidatos en operación S65, si los modos de inter predicción de los bloques izquierdos y superiores son diferentes entre sí, pueden determinarse dos modos de intra predicción candidatos de entre la pluralidad de modos de intra predicción candidatos como los modos de intra predicción de los bloques izquierdos y superiores.

Si se determina que se utiliza la pluralidad de modos de intra predicción con el fin de predecir el modo de intra predicción del bloque actual con base en el indicador MPM en la operación S63, puede analizarse información de índice que representa uno de la pluralidad de modos de intra predicción candidatos de la secuencia de bits. En este caso, en operación S65, puede determinarse un modo de intra predicción candidato seleccionado con base en la información de índice de entre la pluralidad de modos de intra predicción candidatos como el modo de intra predicción del bloque actual.

Además, en un caso donde se determina que el modo de intra predicción del bloque actual es diferente de los modos de intra predicción de los bloques izquierdos y superiores con base en el indicador MPM en operación S63, la información de intra modo actual del bloque actual puede analizarse adicionalmente de la secuencia de bits. En este caso, en operación S64, se interpreta una relación entre el modo de intra predicción del bloque actual y la pluralidad de modos de intra predicción candidatos de la información de intra modo actual analizada del bloque actual, y el modo de intra predicción del bloque puede determinarse con base en el resultado interpretado.

En el aparato 10 de codificación de video de conformidad con la realización y en el aparato 20 de decodificación de video de conformidad con otra realización de la presente invención, los bloques divididos de los datos de video se dividen en las unidades de codificación de la estructura de árbol, y se utilizan las PU para realizar la inter predicción con respecto a las unidades de codificación, como se describió anteriormente. En lo sucesivo, se describirán un procedimiento y un aparato para codificar video, y un procedimiento y un aparato para decodificar video con base en una unidad de codificación de una estructura de árbol y una unidad de transformación con referencia las figuras 7 a 19.

La figura 7 es un diagrama de bloque de un aparato 100 de codificación de video con base en una unidad de codificación de conformidad con una estructura de árbol, de conformidad con una realización de la presente invención.

El aparato 100 de codificación de video que realiza predicción de video con base en una unidad de codificación de la estructura de árbol de conformidad con la presente realización incluye un divisor 110 de unidad de codificación máxima, un determinador de unidad 120 de codificación, y una unidad 130 de salida. En lo sucesivo, el aparato 100 de codificación de video que realiza predicción de video con base en una unidad de codificación de la estructura de árbol de conformidad con la presente realización se indicará en lo sucesivo como el “aparato 100 de codificación de video” para conveniencia de descripción.

El divisor 110 de unidad de codificación máxima puede dividir una ilustración actual de una imagen con base en una unidad de codificación máxima. Si la ilustración actual es mayor que la unidad de codificación máxima, pueden dividirse datos de imagen de la imagen actual en la por lo menos una unidad de codificación máxima. La unidad de codificación máxima de conformidad con la realización de la presente invención puede ser una unidad de datos que tiene un tamaño de 32 x 32, 64 x 64, 128 x 128, 256 x 256, etc., en el que una forma de la unidad de datos es un cuadrado que tiene un ancho y longitud en cuadrados de 2. Los datos de imagen pueden enviarse al determinador 120 de unidad de codificación de conformidad con la por lo menos una unidad de codificación máxima.

Una unidad de codificación de conformidad con una realización de la presente invención puede caracterizarse por un tamaño máximo y una profundidad. La profundidad indica un número de veces que se divide espacialmente la unidad de codificación de la unidad de codificación máxima, y a medida que la profundidad aumenta, pueden dividirse unidades de codificación más profunda de conformidad con profundidades de la unidad de codificación máxima a una unidad de codificación mínima. Una profundidad de la unidad de codificación máxima es una profundidad superior y una profundidad de la unidad de codificación mínima es una profundidad inferior. Como un tamaño de una unidad de codificación que corresponde a cada profundidad disminuye a medida que la profundidad de la unidad de codificación máxima se vuelve mayor, una unidad de codificación correspondiente a una profundidad superior puede incluir una pluralidad de unidades de codificación que corresponden a profundidades inferiores.

Como se describió anteriormente, los datos de imagen de la ilustración actual se dividen en las unidades de codificación máximas de conformidad con un tamaño máximo de la unidad de codificación, y cada una de las unidades de codificación máximas puede incluir unidades de codificación más profundas que se dividen de conformidad con profundidades. Como la unidad de codificación máxima de conformidad con una realización de la presente invención se divide de conformidad con profundidades, los datos de imagen de un dominio espacial incluido en la unidad de codificación máxima pueden clasificarse jerárquicamente de conformidad con profundidades.

Una profundidad máxima y un tamaño máximo de una unidad de codificación, que limitan el número total de veces que se divide jerárquicamente una altura y un ancho de la unidad de codificación máxima, pueden predeterminarse.

El determinador 120 de unidad de codificación codifica al menos una región dividida obtenida al dividir una región de la unidad de codificación máxima de conformidad con profundidades, y determina una profundidad para enviar datos de imagen finalmente codificados de conformidad con al menos una región dividida. En otras palabras, el determinador 120 de unidad de codificación determina una profundidad codificada al codificar los datos de imagen en las unidades de codificación más profundas de conformidad con profundidades, de conformidad con la unidad de codificación máxima de la ilustración actual, y al seleccionar una profundidad que tiene el mínimo error de codificación. La profundidad codificada determinada y los datos de imagen para cada unidad de codificación máxima se envían a la unidad 130 de salida.

Los datos de imagen en la unidad de codificación máxima se codifican con base en las unidades de codificación más profundas que corresponden al menos a una profundidad igual a o bajo la profundidad máxima, y resultados de codificar los datos de imagen se comparan con base en cada una de las unidades de codificación más profundas. Una profundidad que tiene el error de codificación mínimo puede seleccionarse después de comparar errores de codificación de las unidades de codificación más profundas. Puede seleccionarse al menos una profundidad codificada para cada unidad de codificación máxima.

El tamaño de la unidad de codificación máxima se divide como una unidad de codificación que se divide jerárquicamente de conformidad con profundidades, y a medida que aumenta el número de unidades de codificación. Además, incluso si unidades de codificación corresponden a la misma profundidad en una unidad de codificación máxima, se determina sí se divide cada una de las unidades de codificación que corresponden a la misma profundidad a una profundidad inferior al medir un error de codificación de los datos de imagen de cada unidad de codificación, separadamente. Por consiguiente, incluso cuando se incluyen datos de imagen en una unidad de codificación máxima, los datos de imagen se dividen en regiones de conformidad con las profundidades y los errores de codificación pueden diferir de conformidad con regiones en una unidad de codificación máxima, y de esa forma las profundidades codificadas pueden diferir de conformidad con regiones en los datos de imagen. De esa forma, pueden determinarse una o más profundidades codificadas en una unidad de codificación máxima, y los datos de imagen de la unidad de codificación máxima pueden dividirse de conformidad con unidades de codificación de al menos una profundidad codificada.

Por consiguiente, el determinador 120 de unidad de codificación puede determinar unidades de codificación que tienen una estructura de árbol incluida en la unidad de codificación máxima. Las “unidades de codificación que tienen una estructura de árbol” de conformidad con una realización de la presente invención incluyen unidades de codificación que corresponden a una profundidad determinada para ser la profundidad codificada, de entre todas las unidades de codificación más profundas incluidas en la unidad de codificación máxima. Una unidad de codificación de una profundidad codificada puede determinarse jerárquicamente de conformidad con profundidades en la misma región de la unidad de codificación máxima, y puede determinarse independientemente en diferentes regiones. Similarmente, una profundidad codificada en una región actual puede determinarse independientemente de una profundidad codificada en otra región.

Una profundidad máxima de conformidad con una realización de la presente invención es un índice relacionado con el número de veces de división de una unidad de codificación máxima a una unidad de codificación mínima. Una primera profundidad máxima de conformidad con una realización de la presente invención puede indicar el número total de veces de división de la unidad de codificación máxima a la unidad de codificación mínima. Una segunda profundidad máxima de conformidad con una realización de la presente invención puede indicar el número total de niveles de profundidad de la unidad de codificación máxima a la unidad de codificación mínima. Por ejemplo, cuando una profundidad de la unidad de codificación máxima es 0, una profundidad de una unidad de codificación, en la cual la unidad de codificación máxima se divide una vez, puede establecerse a 1, y una profundidad de una unidad de codificación, en la cual la unidad de codificación máxima se divide dos veces, puede establecerse a 2. Aquí, si la unidad de codificación mínima es una unidad de codificación en la cual la unidad de codificación máxima se divide cuatro veces, existen cinco niveles de profundidades 0, 1, 2, 3 y 4, y de esa forma la primera profundidad máxima puede establecerse a 4, y la segunda profundidad máxima puede establecerse a 5.

Puede realizarse codificación de predicción y transformación de conformidad con la unidad de codificación máxima. La codificación de predicción y la transformación también se realizan con base en las unidades de codificación más profundas de conformidad con una profundidad igual a o profundidades menores que la profundidad máxima, de conformidad con la unidad de codificación máxima.

Como el número de unidades de codificación más profundas aumenta en cualquier momento que se divide la unidad de codificación máxima de conformidad con profundidades, se realiza codificación que incluye la codificación de predicción y la transformación en todas las unidades de codificación más profunda generadas a medida que la profundidad se hace mayor. Para conveniencia de descripción, ahora se describirá la codificación de predicción y la transformación con base en una unidad de codificación de una profundidad actual, en una unidad de codificación máxima.

El aparato 100 de codificación de video puede seleccionar de manera variada un tamaño o forma de una unidad de datos para codificar los datos de imagen. Con el fin de codificar los datos de imagen, operaciones, tal como codificación de predicción, transformación, y codificación de entropía, se realizan, y en este momento, la misma unidad de datos puede utilizarse para todas las operaciones o diferentes unidades de datos pueden utilizarse para cada operación.

Por ejemplo, el aparato 100 de codificación de video puede seleccionar no únicamente una unidad de codificación para codificar los datos de imagen, sino también una unidad de datos diferente de la unidad de codificación para realizar la codificación de predicción en los datos de imagen en la unidad de codificación.

Con el fin de realizar codificación de predicción en la unidad de codificación máxima, la codificación de predicción puede realizarse con base en una unidad de codificación que corresponde a una profundidad codificada, es decir, con base en una unidad de codificación que ya no está dividida a unidades de codificación que corresponden a una profundidad inferior. En lo sucesivo, la unidad de codificación que ya no está dividida y se vuelve una unidad básica para codificación de predicción se indicará como una “unidad de predicción”. Una división obtenida al dividir la unidad de predicción puede incluir una unidad de predicción o una unidad de datos obtenida al dividir al menos uno de una altura y un ancho de la unidad de predicción. La división puede ser una unidad de datos obtenida al dividir la unidad de predicción de la unidad de codificación, y la unidad de predicción puede ser una división que tiene el mismo tamaño que la unidad de codificación.

Por ejemplo, cuando una unidad de codificación de 2N x 2N (en donde N es un número entero positivo) ya no se divide y se vuelve una unidad de predicción de 2N x 2N, un tamaño de una división puede ser 2N x 2N, 2N x N, N x 2N, o N x N. Ejemplos de un tipo de división incluyen divisiones simétricas que se obtienen al dividir simétricamente una altura o ancho de la unidad de predicción, divisiones obtenidas al dividir asimétricamente la altura o ancho de la unidad de predicción, tal como 1:n o n:1, divisiones que se obtienen al dividir geométricamente la unidad de predicción, y divisiones que tienen formas arbitrarias.

Un modo de predicción de la unidad de predicción puede ser al menos uno de un intra modo, un inter modo, y un modo de salto. Por ejemplo, el intra modo o el inter modo pueden realizarse en la división de 2N x 2N, 2N x N, N x 2N, o N x N. Además, el modo de salto puede realizarse únicamente en la división de 2N x 2N. La codificación se realiza independientemente sobre una unidad de predicción en una unidad de codificación, seleccionando con ello un modo de predicción que tiene un error de codificación mínimo.

El aparato 100 de codificación de video también puede realizar la transformación sobre los datos de imagen en una unidad de codificación con base no solo en la unidad de codificación para codificar los datos de imagen, sino también con base en una unidad de datos que es diferente de la unidad de codificación. Con el fin de realizar la transformación en la unidad de codificación, la transformación puede realizarse con base en una unidad de datos que tiene un tamaño más pequeño que o igual a la unidad de codificación. Por ejemplo, la unidad de datos para la transformación puede incluir una unidad de datos para un intra modo y una unidad de datos para un inter modo.

Similarmente la unidad de codificación, la unidad de transformación en la unidad de codificación puede dividirse recursivamente en regiones de tamaño más pequeño, para que la unidad de transformación pueda determinarse independientemente en unidades de regiones. De esa forma, datos residuales en la unidad de codificación pueden dividirse de conformidad con la transformación que tiene la estructura de árbol de conformidad con profundidades de transformación.

Una profundidad de transformación que indica el número de veces de división para alcanzar la unidad de transformación al dividir la altura y el ancho de la unidad de codificación también puede establecerse en la unidad de transformación. Por ejemplo, en una unidad de codificación actual de 2N x 2N, una profundidad de transformación puede ser 0 cuando el tamaño de una unidad de transformación también es 2N x 2N, puede ser 1 cuando el tamaño de la unidad de transformación de esa forma es N x N, y puede ser 2 cuando el tamaño de la unidad de transformación de esa forma es N/2 x N/2. Es decir, la unidad de transformación puede establecerse de conformidad con una estructura de árbol.

La información de codificación de conformidad con unidades de codificación que corresponden a una profundidad codificada requiere no solo información sobre la profundidad codificada, sino también información relacionada con codificación de predicción y transformación. Por consiguiente, el determinador 120 de unidad de codificación no solamente determina una profundidad codificada que tiene un error de codificación mínimo, sino también determina un tipo de división en una unidad de predicción, un modo de predicción de conformidad con unidades de predicción, y un tamaño de una unidad de transformación para transformación.

Unidades de codificación de conformidad con una estructura de árbol en una unidad de codificación máxima y un procedimiento para determinar una unidad/división de predicción, y la unidad de transformación de conformidad con realizaciones de la presente invención, se describirá en detalle posteriormente con referencia a las figuras 7 a 19.

El determinador 120 de unidad de codificación puede medir un error de codificación de unidades de codificación más profundas de conformidad con profundidades al utilizar Optimización de Velocidad-Distorsión con base en multiplicadores Lagrangianos.

La unidad 130 de salida envía los datos de imagen de la unidad de codificación máxima, que se codifica con base en al menos una profundidad codificada determinada por el determinador de unidad 120 de codificación, e información sobre el modo de codificación de conformidad con la profundidad codificada, en corrientes de bits.

Pueden obtenerse datos de imagen codificados al codificar datos residuales de una imagen.

La información sobre el modo de codificación de conformidad con profundidad codificada puede incluir información sobre la profundidad codificada, sobre el tipo de división en la unidad de predicción, el modo de predicción, y el tamaño de la unidad de transformación.

La información sobre la profundidad codificada puede definirse al utilizar información de división de conformidad con profundidades, que indica si se realiza codificación sobre unidades de codificación de la profundidad inferior en lugar de una profundidad actual. Si la profundidad actual de la unidad de codificación actual es la profundidad codificada, se codifican datos de imagen en la unidad de codificación actual y se envían, y de esa forma puede definirse la información de división para no dividir la unidad de codificación actual a una profundidad inferior. Alternativamente, si la profundidad actual de la unidad de codificación actual no es la profundidad codificada, se realiza la codificación sobre la unidad de codificación de la profundidad inferior, y de esa forma puede definirse la información de división para dividir la unidad de codificación actual para obtener las unidades de codificación de la profundidad inferior.

Si la profundidad actual no es la profundidad codificada, se realiza codificación sobre la unidad de codificación que se divide en la unidad de codificación de la profundidad inferior. Como al menos una unidad de codificación de la profundidad inferior existe en una unidad de codificación de la profundidad actual, la codificación se realiza repetidamente en cada unidad de la profundidad inferior, y de esa forma la codificación puede realizarse recursivamente para las unidades de codificación que tienen la misma profundidad.

Como las unidades de codificación que tienen una estructura de árbol se determinan para una unidad de codificación máxima, y se determina información sobre al menos un modo de codificación para una unidad de codificación de una profundidad codificada, puede determinarse información sobre al menos un modo de codificación para una unidad de codificación máxima. Además, una profundidad codificada de los datos de imagen de la unidad de codificación máxima puede ser diferente de conformidad con ubicaciones ya que los datos de imagen se dividen jerárquicamente de conformidad con profundidades, y de esa forma puede establecerse información sobre la profundidad codificada y el modo de codificación para los datos de imagen.

Por consiguiente, la unidad 130 de salida puede asignar información de codificación sobre una profundidad codificada correspondiente y un modo de codificación para al menos una de la unidad de codificación, la unidad de predicción, y una unidad mínima incluida en la unidad de codificación máxima.

La unidad mínima de conformidad con una realización de la presente invención es una unidad de datos rectangular obtenida al dividir la unidad de codificación mínima que constituye la profundidad más baja por 4. Alternativamente, la unidad mínima puede ser una unidad de datos rectangular máxima que puede incluirse en todas las unidades de codificación, unidades de predicción, unidades de división, y unidades de transformación incluidas en la unidad de codificación máxima.

Por ejemplo, puede clasificarse la salida de información de codificación a través de la unidad 130 de salida en información de codificación de conformidad con unidades de codificación, e información de codificación de conformidad con unidades de predicción. La información de codificación de conformidad con las unidades de codificación puede incluir la información sobre modos de predicción y sobre el tamaño de las divisiones. La información de codificación de conformidad con las unidades de predicción puede incluir información sobre una dirección estimada de un inter modo, sobre un índice de imagen de referencia del inter modo, sobre un vector de movimiento, sobre un componente croma de un intra modo, y sobre un procedimiento de interpolación del intra modo.

Además, información sobre un tamaño máximo de la unidad de codificación definida de conformidad con imágenes, fragmentos, o grupos de ilustraciones (GOP), e información sobre una profundidad máxima puede insertarse un encabezado de una secuencia de bits, un grupo de parámetro de secuencia (SPS), o un grupo de parámetro de ilustración (PPS).

Además, puede enviarse información sobre un tamaño máximo y un tamaño mínimo de la unidad de transformación permitida al video actual a través de un encabezado de una secuencia de bits, SPS, o PPS. La unidad 130 de salida puede codificar y enviar la información de referencia que se refiere a la predicción descrita con referencia a las figuras 1 a 6, la información de predicción, la información de predicción de dirección individual, e información de tipo de fragmento que incluye un cuarto tipo de fragmento.

En el aparato 100 de codificación de video, la unidad de codificación más profunda puede ser una unidad de codificación obtenida al dividir una altura o un ancho de una unidad de codificación de una profundidad superior, que es una capa por encima, por dos. En otras palabras, cuando el tamaño de la unidad de codificación de la profundidad actual es 2N x 2N, el tamaño de la unidad de codificación de la profundidad inferior es N x N. También, la unidad de codificación de la profundidad actual que tiene el tamaño de 2N x 2N puede incluir máximo 4 de la unidad de codificación de la profundidad inferior.

Por consiguiente, el aparato 100 de codificación de video puede formar las unidades de codificación que tienen la estructura de árbol al determinar unidades de codificación que tiene una forma óptima y un tamaño óptimo para cada unidad de codificación máxima, con base en el tamaño de la unidad de codificación máxima y la profundidad máxima determinada considerando características de la ilustración actual. También, ya que puede realizarse codificación en cada unidad de codificación máxima al utilizar cualquiera de los varios modos de predicción y transformaciones, puede determinarse un modo de codificación óptimo en consideración de características de la unidad de codificación de varios tamaños de imagen.

De esa forma, si se codifica una imagen que tiene alta resolución o gran cantidad de datos en un macro bloque convencional, aumenta un número de macro bloques por imagen excesivamente. Por consiguiente, aumenta un número de piezas de información comprimida generada para cada macro bloque, de esa forma es difícil transmitir la información comprimida y disminuye eficiencia de compresión de datos. Sin embargo, al utilizar el aparato 100 de codificación de video, puede aumentar la eficiencia de compresión de imagen ya que se ajusta una unidad de codificación mientras se consideran características de imagen mientras se aumenta un tamaño máximo de una unidad de codificación mientras se considera un tamaño de la imagen.

El aparato 100 de codificación de video de la figura 7 puede realizar una operación 10 del aparato de codificación de video descrito anteriormente con referencia a la figura 1.

El determinador 120 de unidad de codificación puede realizar operaciones de la unidad 12 de intra predicción del aparato 10 de codificación de video. La unidad de predicción de la intra predicción se determina en cada unidad de codificación máxima de conformidad con las unidades de codificación que tienen la estructura de árbol, y la intra predicción puede realizarse por cada unidad de predicción.

La 130 unidad de salida puede realizar operaciones de la unidad 14 de codificación de símbolo del aparato 10 de codificación de video. El indicador MPM puede codificarse para predecir el modo de intra predicción en cada PU. Si el modo de intra predicción de la PU actual es el mismo que al menos uno de los modos de intra predicción de las PU izquierda y superior, se determina la pluralidad de modos de intra predicción candidatos, cuyo número es fijo, sin considerar si el modo de intra predicción izquierdo y el modo de intra predicción superior son los mismos que o diferentes entre sí, y la información de intra modo actual para la PU actual se determina y codifica con base en los modos de intra predicción candidatos.

La unidad de salida 130 puede determinar el número de modos de predicción candidatos para cada ilustración. De forma similar, puede determinarse el número de modos de intra predicción candidatos para cada fragmento, para cada unidad de codificación máxima, para cada unidad de codificación, o para cada PU. Las realizaciones no están limitadas a esto, puede determinarse el número de modos de intra predicción candidatos de nuevo para cada unidad de datos predeterminada.

La unidad de salida 130 puede codificar la información que representa el número de los modos de intra predicción candidatos como un parámetro de varios niveles de unidad de datos tal como el PPS, el SPS, el nivel de unidad de codificación máximo, el nivel de unidad de codificación, y el nivel de PU, de conformidad con un nivel de la unidad de datos que actualiza el número de los modos de intra predicción candidatos. Sin embargo, incluso si se determina el número de los modos de intra predicción candidatos para cada unidad de datos, no siempre se codifica la información que representa el número de los modos de intra predicción candidatos.

La figura 8 es un diagrama de bloques de un aparato 200 de decodificación de video con base en una unidad de codificación de conformidad con una estructura de árbol, de conformidad con una realización de la presente invención.

El aparato 200 de decodificación de video que realiza predicción de video con base en una unidad de codificación de la estructura de árbol de conformidad con la presente realización incluye un receptor 210, un extractor 220 de datos de imagen y de información de codificación, y un decodificador 230 de datos de imagen. En lo sucesivo, el aparato 200 de decodificación de video que realiza predicción de video con base en una unidad de codificación de la estructura de árbol de conformidad con la presente realización se indicará en lo sucesivo como “aparato 200 de decodificación de video” para conveniencia de descripción.

Definiciones de varios términos, tal como una unidad de codificación, una profundidad, una unidad de predicción, una unidad de transformación, e información sobre varios modos de codificación, para varias operaciones del aparato 200 de decodificación de video son idénticos a aquellos descritos con referencia a la figura 1 y el aparato 100 de codificación de video.

El receptor 210 recibe y analiza una secuencia de bits de un video codificado. El extractor 220 de datos de imagen y de información de codificación extrae datos de imagen codificados para cada unidad de codificación de la secuencia de bits analizada, en donde las unidades de codificación tienen una estructura de árbol de conformidad con cada unidad de codificación máxima, y envía los datos de imagen extraídos al decodificador 230 de datos de imagen. El extractor 220 de datos de imagen e información de codificación puede extraer información sobre un tamaño máximo de una unidad de codificación de una imagen actual, de un encabezado sobre una imagen actual o SPS.

Además, el extractor 220 de datos de imagen e información de codificación extrae información sobre una profundidad codificada y un modo de codificación para las unidades de codificación que tienen una estructura de árbol de conformidad con cada unidad de codificación para las unidades de codificación que tienen una estructura de árbol de conformidad con cada unidad de codificación máxima, de la secuencia de bits analizada. La información extraída acerca de la profundidad codificada y el modo de codificación se envía al decodificador 230 de datos de imagen. En otras palabras, los datos de imagen en una secuencia de bits se dividen en la unión de codificación máxima de manera que el decodificador 230 de datos de imagen decodifica los datos de imagen para cada unidad de codificación máxima.

La información sobre la profundidad codificada y el modo de codificación de conformidad con la unidad de codificación máxima puede establecerse para información acerca de al menos una unidad de codificación que corresponde a la profundidad codificada, e información sobre un modo de codificación puede incluir información acerca de un tipo de división de una unidad de codificación correspondiente que corresponde a la profundidad codificada, acerca de un modo de predicción, y un tamaño de una unidad de transformación. También, información de división de conformidad con profundidades puede extraerse como la información acerca de la profundidad codificada.

La información acerca de la profundidad codificada y el modo de codificación de conformidad con cada unidad de codificación máxima extraída por el extractor 220 de datos de imagen e información de codificación es información acerca de una profundidad codificada y un modo de codificación determinado para generar un error de codificación mínimo cuando un codificador, tal como el aparato 100 de codificación de video, realiza repetidamente codificación para cada unidad de codificación más profunda de conformidad con profundidades de conformidad con cada unidad de codificación máxima. Por consiguiente, el aparato 200 de decodificación de video puede restaurar una imagen al decodificar los datos de imagen de conformidad con una profundidad codificada y un modo de codificación que genera el error de codificación mínimo.

Como puede asignarse información de codificación sobre la profundidad codificada y el modo de codificación a una unidad de datos predeterminada de entre una unidad de codificación correspondiente, una unidad de predicción, y una unidad mínima, el extractor 220 de datos de imagen de información de codificación puede extraer la información acerca de la profundidad codificada y el modo de codificación de conformidad con las unidades de datos predeterminadas. Las unidades de datos predeterminadas a las cuales se asigna la misma información acerca de la profundidad codificada y el modo de codificación puede inferirse para ser las unidades de datos incluidas en la misma unidad de codificación máxima.

El decodificador 230 de datos de imagen restaura la ilustración actual al decodificar los datos de imagen en cada unidad de codificación máxima con base en la información acerca de la profundidad codificada y el modo de codificación de conformidad con las unidades de codificación máximas. En otras palabras, el decodificador 230 de datos de imagen puede decodificar los datos de imagen codificados con base en la información extraída acerca del tipo de división, el modo de predicción, y la unidad de transformación para cada unidad de codificación de entre las unidades de codificación que tienen la estructura de árbol incluida en cada unidad de codificación máxima. Un procedimiento de decodificación puede incluir una predicción que incluye intra predicción y compensación de movimiento, y una transformación inversa.

El decodificador 230 de datos de imagen puede realizar intra predicción o compensación de movimiento de conformidad con una división y un modo de predicción de cada unidad de codificación, con base en información acerca del tipo de predicción y el modo de predicción de la unidad de predicción de la unidad de codificación de conformidad con profundidades codificadas.

Además, el decodificador 230 de datos de imagen puede realizar transformación inversa de conformidad con cada unidad de transformación en la unidad de codificación, con base en la información acerca del tamaño de la unidad de transformación de la unidad de codificación de conformidad con profundidades codificadas máximas. A través de la transformación inversa, pueden restaurarse valores de pixel de la unidad de codificación en el dominio espacial.

El decodificador 230 de datos de imagen puede determinar al menos una profundidad codificada de una unidad de codificación máxima actual al utilizar información de división de conformidad con profundidades. Si la información de división indica que los datos de imagen ya no están divididos en la profundidad actual, la profundidad actual es una profundidad codificada. Por consiguiente, el decodificador 230 de datos de imagen puede decodificar datos codificados de al menos una unidad de codificación que corresponde a cada profundidad codificada en la unidad de codificación máxima actual al utilizar la información acerca del tipo de división de la unidad de predicción, el modo de predicción, y el tamaño de la unidad de transformación para cada unidad de codificación que corresponda a la profundidad codificada, y envía los datos de imagen de la unidad de codificación máxima actual.

En otras palabras, pueden recopilarse unidades de datos que contienen la información de codificación que incluye la misma información de división al observar el grupo de información de codificación asignado para la unidad de datos predeterminada de entre la unidad de codificación, la unión de predicción, y la unidad mínima, y las unidades de datos recogidas pueden considerarse para ser una unidad de datos para decodificarse mediante el decodificador 230 de datos de imagen en el mismo modo de codificación. La decodificación de la unidad de codificación actual puede realizarse al recoger la información acerca del modo de codificación para cada unidad de codificación determinada como anteriormente.

Además, el aparato 200 de decodificación de video de la figura 8 puede realizar operaciones del aparato 20 de decodificación de video descrito anteriormente con referencia a la figura 2.

El receptor 210 puede realizar operaciones de la unidad 22 de análisis del aparato 20 de decodificación de video. El extractor 220 de datos de imagen y de información de codificación y el decodificador 230 de datos de imagen pueden realizar operaciones de la unidad 24 de intra predicción del aparato 20 de decodificación de video.

La unidad 22 de análisis puede analizar el indicador MPM para predecir el modo de intra predicción de la secuencia de bits para cada PU, cuando la PU para la intra predicción se determina mediante la unidad de codificación que tiene la estructura de árbol. La información de intra modo actual puede analizarse de la secuencia de bits posterior al indicador MPM sin determinar si el modo de intra predicción izquierdo y el modo de intra predicción superior son los mismos qué o diferentes entre sí. El extractor 220 de datos y de imagen información de codificación puede restaurar el modo de intra predicción actual de la información analizada después de terminar el análisis de los símbolos de bloque incluyendo el indicador MPM y la información de intra modo. El modo de intra predicción actual puede predecirse al utilizar la pluralidad de modos de intra predicción candidatos, cuyo número es fijo. El decodificador 230 de datos de imagen puede realizar la intra predicción de la PU actual al utilizar el modo de intra predicción restaurado y los datos residuales.

El extractor 220 de datos de imagen y de información de codificación puede determinar el número de los modos de intra predicción candidatos para cada ilustración.

La unidad 22 de análisis puede analizar la información que representa el número de los modos de intra predicción candidatos, cuyo número es fijo, de los parámetros de varios niveles de unidad de datos tal como el PPS de la secuencia de bits, el SPS, el nivel de unidad de codificación máximo, el nivel de unidad de codificación, y el nivel de PU. En este caso, el extractor 220 de datos de imagen y de información de codificación puede determinar los modos de intra predicción candidatos por tanto como el número representado por la información analizada para cada unidad de datos que corresponde al nivel del cual se analiza la información.

Sin embargo, el extractor 220 de datos de imagen y de información de codificación puede actualizar el número de modos de intra predicción candidatos para cada fragmento, la unidad de codificación máxima, la unidad de codificación, o la PU incluso cuando no se analiza la información que representa el número de modos de intra predicción candidatos.

El aparato 200 de decodificación de video puede obtener información sobre al menos una unidad de codificación que genera el error de codificación mínimo cuando la codificación se realiza recursivamente para cada unidad de codificación máxima, y puede utilizar la información para decodificar la ilustración actual. En otras palabras, pueden decodificarse unidades de codificación que tienen la estructura de árbol determinadas para ser las unidades de codificación óptimas en cada unidad de codificación máxima.

Por consiguiente, incluso si datos de imagen tienen alta resolución y una gran cantidad de datos, los datos de imagen pueden decodificarse y restaurarse eficientemente al utilizar un tamaño de una unidad de codificación y un modo de codificación, que se determinan de manera adaptable de conformidad con características de los datos de imagen, al utilizar información sobre un modo de codificación óptimo recibido de un codificador.

La figura 9 es un diagrama para describir un concepto de unidades de codificación de conformidad con una realización de la presente invención.

Un tamaño de una unidad de codificación puede expresarse en ancho por altura, y puede ser 64 x 64, 32 x 32, 16 x 16, y 8 x8. Una unidad de codificación de 64 x 64 puede dividirse en divisiones de 64 x 64, 64 x 32, 32 x 64 o 32 x 32, una unidad de codificación de 32 x 32 puede dividirse en divisiones de 32 x 32, 32 x 16, 16 x 32, o 16x16, una unidad de codificación de 16x16 puede dividirse en divisiones de 16x16, 16x8, 8x16, u 8 x 8, y una unidad de codificación de 8 x 8 puede dividirse en divisiones de 8x 8 , 8x4 , 4x 8 , o 4x 4.

En datos 310 de video, una resolución es 1920 x 1080, un tamaño máximo de una unidad de codificación es 64, y una profundidad máxima es 2. En datos 320 de video, una resolución es 1920 x 1080, un tamaño máximo de una unidad de codificación es 64, y una profundidad máxima es 3. En datos 330 de video, una resolución es 352 x 288, un tamaño máximo de una unidad de codificación es 16, y una profundidad máxima es 1. La profundidad máxima mostrada en la figura 9 indica un número total de divisiones de una unidad de codificación máxima a una unidad de codificación mínima.

Si una resolución es alta o una cantidad de datos es grande, un tamaño máximo de una unidad de codificación puede ser grande para no solo aumentar eficiencia de codificación sino también para reflejar de manera precisa características de una imagen. Por consiguiente, el tamaño máximo de la unidad de codificación de los datos 310 y 320 de video que tienen la resolución más alta que los datos 330 de video puede ser 64.

Como la profundidad máxima de los datos 310 de video es 2, unidades 315 de codificación de los datos 310 de video pueden incluir una unidad de codificación máxima que tiene un tamaño de eje largo de 64, y unidades de codificación que tienen tamaños de eje largo de 32 y 16, ya que las profundidades aumentan a dos capas al dividir la unidad de codificación máxima dos veces. Mientras tanto, como la profundidad máxima de los datos de video 330 es 1, unidades 335 de codificación de los datos 330 de video pueden incluir una unidad de codificación máxima que tiene un tamaño de eje largo de 16, y unidades de codificación que tienen un tamaño de eje largo de 8 ya que aumentan las profundidades a una capa al dividir la unidad de codificación máxima una vez.

Como la profundidad máxima de los datos 320 de video es 3, unidades 325 de codificación de los datos 320 de video pueden incluir una unidad de codificación máxima que tiene un tamaño de eje largo de 64, y unidades de codificación que tienen tamaños de eje largo de 32, 16, y 8, ya que aumentan las profundidades a tres capas al dividir la unidad de codificación máxima tres veces. A medida que aumenta una profundidad, puede expresarse de manera precisa información detallada.

La figura 10 es un diagrama de bloques de un codificador 400 de imagen con base en unidades de codificación, de conformidad con una realización de la presente invención.

El codificador 400 de imagen realiza operaciones del determinador 120 de unidad de codificación del aparato 100 de codificación de video para codificar datos de imagen. En otras palabras, un intra predictor 410 realiza intra predicción sobre unidades de codificación en un intra modo, de entre un marco 405 actual, y un estimador 420 de movimiento y un compensador 425 de movimiento realiza inter estimación y compensación de movimiento sobre unidades de codificación en un inter modo de entre el marco 405 actual al utilizar el marco 405 actual, y un marco 495 de referencia.

La salida de datos del intra predictor 410, el estimador 420 de movimiento, y el compensador 425 de movimiento se envía como un coeficiente de transformación cuantificado a través de un transformador 430 y un cuantificador 440. El coeficiente de transformación cuantificado se restaura como datos en un dominio espacial a través de un cuantificador 460 inverso y un transformador 470 inverso, y los datos restaurados en el dominio espacial se envían como el marco 495 de referencia después de ser procesados posteriormente a través de una unidad 480 de desbloqueo y una unidad 490 de filtración de bucle. El coeficiente de transformación cuantificado puede enviarse como una corriente 455 de bits a través de un codificador 450 de entropía.

Para que se aplique el codificador 400 de imagen en el aparato 100 de codificación de video, todos los elementos del codificador 400 de imagen, es decir, el intra predictor 410, el estimador 420 de movimiento, el compensador 424 de movimiento, el transformador 430, el cuantificador 440, el codificador 450 de entropía, el cuantificador 460 inverso, el transformador 470 inverso, la unidad 480 de desbloqueo, y la unidad 490 de filtración de bucle, tienen que realizar operaciones con base en cada unidad de codificación de entre unidades de codificación que tienen una estructura de árbol mientras se considera la profundidad máxima de cada unidad de codificación máxima.

Específicamente, el intra predictor 410, el estimador 420 de movimiento, y el compensador 425 de movimiento tienen que determinar divisiones y un modo de predicción de cada unidad de codificación de entre las unidades de codificación que tienen una estructura de árbol mientras se considera el tamaño máximo y la profundidad máxima de una unidad de codificación máxima actual, y el transformador 430 tiene que determinar el tamaño de la unidad de transformación en cada unidad de codificación de entre las unidades de codificación que tienen una estructura de árbol.

En particular, el intra predictor 410 puede realizar operaciones de la unidad 12 de intra predicción del aparato 10 de decodificación de video. Se determina una PU para la intra predicción mediante la unidad de codificación que tiene la estructura de árbol para cada unidad de codificación máxima, y puede realizarse la intra predicción para la PU.

En un caso en donde la PU actual y las PU izquierdas/superiores son las mismas entre sí y el modo de intra predicción izquierdo y el modo de intra predicción superior son los mismos que o diferentes entre sí, se determina la pluralidad de modos de intra predicción candidatos, y de esa forma, el codificador 450 de entropía codifica el indicador MPM para cada PU, y entonces, puede codificar la información de intra modo actual con base en los modos de intra predicción candidatos para la unidad de predicción actual.

La figura 11 es un diagrama de bloques de un decodificador 500 de imagen con base en unidades de codificación, de conformidad con una realización de la presente invención.

Un analizador 510 analiza datos de imagen codificados para decodificarse e información sobre codificación requerida para decodificación desde una corriente 505 de bits. Los datos de imagen codificados se envían como datos inversamente cuantificados a través de un decodificador 520 de entropía y un cuantificador 530 inverso, y los datos inversamente cuantificados se restauran a datos de imagen en un dominio espacial a través de un transformador 540 inverso.

Un intra predictor 550 realiza intra predicción sobre unidades de codificación en un intra modo con respecto a los datos de imagen en el dominio espacial, y un compensador 560 de movimiento realiza compensación de movimiento sobre unidades de codificación en un inter modo al utilizar un marco 585 de referencia.

Los datos de imagen en el dominio espacial, que pasan a través del intra predictor 550 y el compensador 560 de movimiento, pueden enviarse como un marco 595 restaurado después de pos-procesarse a través de una unidad 570 de desbloqueo y una unidad 580 de filtración de bucle. También, los datos de imagen que son pos-procesados a través de la unidad 570 de desbloqueo y la unidad 580 de filtración de bucle pueden enviarse como el marco 585 de referencia.

Para decodificar los datos de imagen en el decodificador 230 del aparato 200 de decodificación de video, el decodificador 500 de imagen puede realizar operaciones sobre símbolos analizados después del analizador 510.

Para que se aplique el decodificador 500 de imagen en el aparato 200 de decodificación de video, todos los elementos del decodificador 500 de imagen, es decir, el analizador 510, el decodificador 520 de entropía, el cuantificador 530 inverso, el transformador 540 inverso, el intra predictor 550, el compensador 560 de movimiento, la unidad 570 de desbloqueo, y la unidad 580 de filtración de bucle realizan operaciones con base en unidades de codificación que tienen una estructura de árbol para cada unidad de codificación máxima.

Específicamente, el intra predictor 550 y el compensador 560 de movimiento realizan operaciones con base en divisiones y un modo de predicción para cada una de las unidades de codificación que tienen una estructura de árbol, y el transformador 540 inverso realizan operaciones con base en un tamaño de una unidad de transformación para cada unidad de codificación.

En particular, el analizador 510 puede analizar el indicador MPM para predecir el mofo de intra predicción de la secuencia de bits para cada PV, en el caso donde la PV para la intra predicción esté determinada por la unidad de codificación que tiene la estructura de árbol. La información actual de intra modo puede ser analizada de la secuencia de bits posterior al indicador MPM sin determinar si el modo de intra predicción izquierdo y el modo de intra predicción superior son iguales o diferentes entre sí. El decodificador 520 de entropía termina el análisis de los símbolos en bloque incluyendo el indicador MPM y la información actual de intra modo, y puede restaurar el modo actual de intra predicción de la información analizada. El intra predictor 550 puede llevar a cabo la intra predicción de la PU actual al utilizar el modo actual de intrapredicción restaurado y los datos residuales.

La figura 12 es un diagrama que ilustra unidades de codificación más profundas de conformidad con profundidades, y divisiones, de conformidad con una realización de la presente invención.

El aparato 100 de codificación de video y el aparato 200 de decodificación de video utilizan unidades de codificación jerárquica para considerar características de una imagen. Una altura máxima, un ancho máximo, y una profundidad máxima de unidades de codificación pueden determinarse de manera adaptable de conformidad con las características de la imagen, o pueden establecerse de manera diferente mediante un usuario. Pueden determinarse tamaños de unidades de codificación más profundas de conformidad con profundidades de conformidad con el tamaño máximo predeterminado de la unidad de codificación.

En una estructura 600 jerárquica de unidades de codificación, de conformidad con una realización de la presente invención, la altura máxima y el ancho máximo de las unidades de codificación cada uno son 64, y la profundidad máxima es 4. Aquí, la profundidad máxima indica tiempos de división de la unidad de codificación máxima a la unidad de codificación mínima. Como una profundidad se hace mayor a lo largo de un eje vertical de la estructura 600 jerárquica, cada uno de una altura y un ancho de la unidad de codificación más profunda se divide. También, se muestra una unidad de predicción y divisiones, que son bases para codificación de predicción de cada unidad de codificación más profunda, a lo largo de un eje horizontal de la estructura 600 jerárquica.

En otras palabras, una unidad 610 de codificación es una unidad de codificación máxima a la estructura 600 jerárquica, en la que una profundidad es 0 y un tamaño, es decir, una altura por ancho, es 64 x 64. La profundidad aumenta a lo largo del eje vertical, y una unidad 620 de codificación que tiene un tamaño de 32 x 32 y una profundidad de 1, existe una unidad 630 de codificación que tiene un tamaño de 16x16 y una profundidad de 2, una unidad 640 de codificación que tiene un tamaño de 8 x 8 y una profundidad de 3, y una unidad 650 de codificación que tiene un tamaño de 4 x 4 y una profundidad de 4. La unidad 640 de codificación que tiene el tamaño de 4 x 4 y la profundidad de 4 es una unidad de codificación mínima.

La unidad de predicción y las divisiones de una unidad de codificación se disponen a lo largo del eje horizontal de conformidad con cada profundidad. En otras palabras, si la unidad 610 de codificación que tiene el tamaño de 64 x 64 y la profundidad de 0 es una unidad de predicción, la unidad de predicción puede dividirse en divisiones incluidas en la unidad 610 de codificación, es decir, una división 610 que tiene un tamaño de 64 x 64, divisiones 612 que tienen el tamaño de 64 x 32, divisiones 614 que tienen el tamaño de 32 x 64, o divisiones 616 que tienen el tamaño de 32 x 32.

Similarmente, una unidad de predicción de la unidad 620 de codificación que tiene el tamaño de 32 x 32 y la profundidad de 1 puede dividirse en divisiones incluidas en la unidad 620 de codificación, es decir una división 620 que tiene un tamaño de 32 x 32, divisiones 622 que tienen un tamaño de 32 x 16, divisiones 624 que tienen un tamaño de 16 x 32, o divisiones 626 que tienen un tamaño de 16 x 16.

Similarmente, una unidad de predicción de la unidad 630 de codificación que tiene el tamaño de 16 x 16 y la profundidad de 2 puede dividirse en divisiones incluidas en la unidad 630 de codificación, es decir, una división que tiene un tamaño de 16 x 16 incluida en la unidad 630 de codificación, divisiones 632 que tienen un tamaño de 16 x 8, divisiones 634 que tienen un tamaño de 8 x 16, y divisiones 636 que tienen un tamaño de 8x8.

Similarmente, una unidad de predicción de la unidad 640 de codificación que tiene el tamaño de 8 x 8 y la profundidad de 3 puede dividirse en divisiones incluidas en la unidad 640 de codificación, es decir, una división que tiene un tamaño de 8 x 8 incluida en la unidad 640 de codificación, es decir, una división que tiene un tamaño de 8 x 8 incluida en la unidad 640 de codificación, divisiones 642 que tienen un tamaño de 8 x 4 , divisiones 644 que tienen un tamaño de 4 x 8, y divisiones 646 que tienen un tamaño de 4x4.

La unidad 650 de codificación que tiene el tamaño de 4 x 4 y la profundidad de 4 es la unidad de codificación mínima y una unidad de codificación de la profundidad inferior. Una unidad de predicción de la unidad 650 de codificación se asigna únicamente a una división que tiene un tamaño de 4x4.

Para determinar la por lo menos una profundidad codificada de las unidades de codificación que constituyen la unidad 610 de codificación máxima, el determinador 120 de unidad de codificación del aparato 100 de codificación de video realiza codificación para unidades de codificación que corresponden a cada profundidad incluida en la unidad 610 de codificación máxima.

Un número de unidades de codificación más profundas de conformidad con profundidades que incluyen datos en el mismo rango y el mismo tamaño aumenta a medida que aumenta la profundidad. Por ejemplo, cuatro unidades de codificación que corresponden a una profundidad de 2 se requieren para cubrir datos que se incluyen en una unidad de codificación que corresponde a una profundidad de 1. Por consiguiente, para comparar resultados de codificación de los mismos datos de conformidad con profundidades, se codifica cada una de la unidad de codificación que corresponde a la profundidad de 1 y cuatro unidades de codificación que corresponden a la profundidad de 2.

Para realizar codificación para una profundidad actual de entre las profundidades, puede seleccionarse un error de codificación mínimo para el error actual al realizar codificación para cada unidad de predicción en las unidades de codificación que corresponden a la profundidad actual, a lo largo del eje horizontal de la estructura 600 jerárquica. Alternativamente, puede buscarse el error de codificación mínimo al comparar los errores de codificación mínimos de conformidad con profundidades, al realizar codificación para cada profundidad a medida que aumenta la profundidad a lo largo del eje vertical de la estructura 600 jerárquica. Puede seleccionarse una profundidad y una división que tiene el error de codificación, mínimo en la unidad 610 de codificación como la profundidad codificada y un tipo de división de la unidad 610 de codificación.

La figura 13 es un diagrama para describir una relación de entre una unidad 710 de codificación y unidades 720 de transformación, de conformidad con una realización de la presente invención.

El aparato 100 o 200 de codificación de video codifica o decodifica una imagen de conformidad con unidades de codificación que tienen tamaños más pequeños que o iguales a una unidad de codificación máxima para cada unidad de codificación máxima. Pueden seleccionarse tamaños de unidades de transformación para transformación durante codificación con base en unidades de datos que son más grandes que una unidad de codificación correspondiente.

Por ejemplo, en el aparato 100 o 200 de codificación de video, si un tamaño de la unidad 710 de codificación es 64 x 64, puede realizarse transformación al utilizar las unidades 720 de transformación que tienen un tamaño de 32 x 32.

Además, pueden codificarse datos de la unidad 710 de codificación que tienen el tamaño de 64 x 64 al realizar la transformación en cada una de las unidades de transformación que tienen el tamaño de 32 x 32, 16x 16, 8x 8 , y 4 x 4, que son más pequeñas que 64 x 64, y entonces puede seleccionarse una unidad de transformación que tiene el error de codificación mínimo.

La figura 14 es un diagrama para describir información de codificación de unidades de codificación que corresponden a una profundidad codificada, de conformidad con una realización de la presente invención.

La unidad 130 de salida del aparato 100 de codificación de video puede codificar y transmitir información 800 sobre un tipo de división, información 810 sobre un modo de predicción, e información 820 sobre un tamaño de una unidad de transformación para cada unidad de codificación que corresponde a una profundidad codificada, como información sobre un modo de codificación.

La información 800 representa información sobre una forma de una división obtenida al dividir una unidad de predicción de una unidad de codificación actual, en el que la división es una unidad de datos para codificación de predicción de la unidad de codificación actual. Por ejemplo, una unidad de codificación actual CU_0 que tiene un tamaño de 2N x 2N puede dividirse en cualquiera de una división 810 que tiene un tamaño de 2N x 2N, una división 804 que tiene un tamaño de 2N x N, una división 806 que tiene un tamaño de N x 2N, y una división 808 que tiene un tamaño de N x N. Aquí, la información 800 sobre un tipo de división se establece para indicar una de la división 804 que tiene un tamaño de 2N x N, la división 806 que tiene un tamaño de N x 2N, y la división 808 que tiene un tamaño de N x N.

La información 810 indica un modo de predicción de cada división. Por ejemplo, la información 810 puede indicar un modo de codificación de predicción realizado en una división indicada por la información 800, es decir, un intra modo 812, un inter modo 814, o un modo de salto 816.

La información 820 representa una unidad de transformación que se va a basar en cuando se realiza transformación sobre una unidad de codificación actual. Por ejemplo, la unidad de transformación puede ser una primera unidad de intra transformación 822, una segunda unidad de intra transformación 824, una primera unidad de inter transformación 826, o una segunda unidad de inter transformación 828.

El extractor 220 de datos de imagen y de información de codificación del aparato 200 de decodificación de video puede extraer y utilizar la información 800, 810, y 820 para decodificación, de conformidad con cada unidad de codificación más profunda.

La figura 15 es un diagrama de unidades de codificación más profundas de conformidad con profundidades, de conformidad con una realización de la presente invención.

La información de división puede utilizarse para indicar un cambio de una profundidad. La información de división representa si una unidad de codificación de una profundidad actual está dividida en unidades de codificación de una profundidad inferior.

Una unidad 910 de predicción para codificación de predicción de una unidad 900 de codificación que tiene una profundidad de 0 y un tamaño de 2N_0 x 2N_0 puede incluir divisiones de un tipo de división 912 que tiene un tamaño de 2N_0 x 2N_0, un tipo de división 914 que tiene un tamaño de 2N_0 x N_0, un tipo de división 916 que tiene un tamaño de N_0 x 2N_0, y un tipo de división 918 que tiene un tamaño de N_0 x N_0. La figura 15 únicamente ilustra los tipos de división 912 a 918 que se obtienen al dividir simétricamente la unidad 910 de predicción, pero un tipo de división no está limitado a esto, y las divisiones de la unidad de predicción 910 pueden incluir divisiones asimétricas, divisiones que tienen una forma predeterminada, y divisiones que tienen una forma geométrica.

Se realiza repetidamente codificación de predicción sobre una división que tiene un tamaño de 2N_0 x 2N_0, dos divisiones que tienen un tamaño de 2N_0 x N_0, dos divisiones que tienen un tamaño de N_0 x 2N_0, y cuatro divisiones que tienen un tamaño de N_0 x N_0, de conformidad con cada tipo de división. La codificación de predicción en un intra modo y un inter modo pueden realizarse sobre las divisiones que tienen los tamaños de 2N_0 x 2N_0, N_0 x 2N_0, 2N_0 x N_0 y N_0 x N_0. La codificación de predicción en un modo de salto se realiza únicamente en la división que tiene el tamaño de 2N_0 x 2N_0.

Se comparan errores de codificación que incluyen la codificación de predicción en los tipos de división 912 a 918, y el error de codificación mínimo se determina entre los tipos de división. Si un error de codificación es más pequeño en uno de los tipos de división 912 a 916, la unidad 910 de predicción puede no dividirse en una profundidad inferior.

Si el error de codificación es el más pequeño en el tipo de división 918, se cambia una profundidad de 0 a 1 para dividir el tipo de división 918 en operación 920, y se realiza repetidamente codificación sobre unidades 930 de codificación que tienen una profundidad de 2 y un tamaño de N_0 x N_0 para buscar un error de codificación mínimo.

Una unidad 940 de predicción para codificación de predicción de la unidad 930 de codificación que tiene una profundidad de 1 y un tamaño de 2N_1 x 2N_1 (=N_0 x N_0) puede incluir divisiones de un tipo de división 942 que tienen un tamaño de 2N_1 x 2N_1, un tipo de división 944 que tiene un tamaño de 2N_1 x N_1, un tipo de división 946 que tiene un tamaño de N_1 x 2N_1, y un tipo de división 948 que tiene un tamaño de N_1 x N_1.

Si un error de codificación es el más pequeño en el tipo de división 948, se cambia la profundidad de 1 a 2 para dividir el tipo de división 948 en operación 950, y se realiza repetidamente codificación sobre unidades de codificación 960, que tienen una profundidad de 2 y un tamaño de N_2 x N_2 para buscar un error de codificación mínimo.

Cuando una profundidad máxima es d, puede realizarse operación de conformidad con cada profundidad hasta cuando una profundidad se vuelve d-1, y puede codificarse información de división como hasta cuando una profundidad es uno de 0 a d-2. En otras palabras, cuando se realiza codificación hasta cuando la profundidad es d-1 después que una unidad de codificación que corresponde a una profundidad de d-2 se divide en la operación 970, una unidad 990 de predicción para codificación de predicción de una unidad 980 de codificación que tiene una profundidad de d-1 y un tamaño de 2N_(d-1) x 2N_(d-1) puede incluir divisiones de un tipo de división 992 que tiene un tamaño de 2N_(d-1) x 2N_(d-1), un tipo de división 994 que tiene un tamaño de 2N_(d-1) x N_(d-1), un tipo de división 996 que tiene un tamaño de N_(d-1) x 2N_(d-1), y un tipo de división 998 que tiene un tamaño de N_(d-1) x N_(d-1).

La codificación de predicción puede realizarse repetidamente en una división que tiene un tamaño de 2N_(d-1) x 2N_(d-1), dos divisiones que tienen un tamaño de 2N_(d-1) x N_(d-1), dos divisiones que tienen un tamaño de N_(d-1) x 2N_(d-1), cuatro divisiones que tienen un tamaño de N_(d-1) x N_(d-1) de entre los tipos de división 992 a 998 para buscar un tipo de división que tenga un error de codificación mínimo.

Incluso cuando el tipo de división 998 tiene el error de codificación mínimo, ya que la profundidad máxima es d, una unidad de codificación CU_(d-1) que tiene una profundidad de d-1 ya no se divide una profundidad inferior, y una profundidad codificada para las unidades de codificación que constituyen una unidad 900 de codificación máxima actual se determina para ser d-1 y un tipo de división de la unidad 900 de codificación máxima puede determinarse para ser N_(d-1) x N_(d-1). Además, como la profundidad máxima es d, no se establece información de división para la unidad 952 de codificación que tiene la profundidad d-1.

Una unidad 999 de datos puede ser una “unidad mínima” para la unidad de codificación máxima actual. Una unidad mínima de conformidad con una realización de la presente invención puede ser una unidad de datos rectangular obtenida al dividir una unidad de codificación mínima 980 por 4. Al realizar la codificación repetidamente, el aparato 100 de codificación de video puede seleccionar una profundidad que tiene el error de codificación mínimo al comparar errores de codificación de conformidad con profundidades de la unidad 900 de codificación para determinar una profundidad codificada, y establecer un tipo de división correspondiente y un modo de predicción como un modo de codificación de la profundidad codificada.

Como tal, los errores de codificación mínimos de conformidad con profundidades se comparan en todas las profundidades de 1 a d, y puede determinarse una profundidad que tiene el error de codificación mínimo como una profundidad codificada. La profundidad codificada, el tipo de división de la unidad de predicción, y el modo de predicción pueden codificarse y transmitirse como información sobre un modo de codificación. También, ya que una unidad de codificación se divide de una profundidad de 0 a una profundidad codificada, únicamente información de división de la profundidad codificada se establece a 0, e información de división de profundidades que excluye la profundidad codificada se establece a 1.

El extractor 220 de datos de imagen y de información de codificación del aparato 200 de decodificación de video puede extraer y utilizar la información sobre la profundidad codificada y la unidad 900 de predicción de la unidad de codificación para decodificar la división 912. El aparato 200 de decodificación de video puede determinar una profundidad, en la cual información de división es 0, como una profundidad codificada al utilizar información de división de conformidad con profundidades, y utilizar información sobre un modo de codificación de la profundidad correspondiente para decodificación.

Las figuras 16 a 18 son diagramas para describir una relación entre unidades 1010 de codificación, unidades 1060 de predicción, y unidades 1070 de transformación, de conformidad con una realización de la presente invención.

Las unidades 1010 de codificación son unidades de codificación que tienen una estructura de árbol, correspondiente a profundidades codificadas determinadas por el aparato 100 de codificación de video, en una unidad de codificación máxima. Las unidades 1060 de predicción son divisiones de unidades de predicción de cada una de las unidades 1010 de codificación, y las unidades 1070 de transformación son unidades de transformación de cada una de las unidades 1010 de codificación.

Cuando una profundidad de una unidad de codificación máxima es 0 en las unidades 1010 de codificación, las profundidades de las unidades 1012 y 1050 de codificación son 1, las profundidades de las unidades 1014, 1016, 1018, 1028, 1050, y 1052 de codificación son 2, las profundidades de las unidades 1020, 1022, 1024, 1026, 1030, 1032, y 1048 de codificación son 3, y las profundidades de las unidades 1040, 1042, 1044, y 1046 de codificación son 4.

En las unidades 1060 de predicción, se obtienen algunas unidades 1014, 1016, 1022, 1032, 1048, 1050, 1052, y 1054 de codificación al dividir las unidades de codificación en las unidades 1010 de codificación. En otras palabras, tipos de división en las unidades 1014, 1022, 1050, y 1054 de codificación tienen un tamaño de 2N x N, tipos de división en las unidades 1016, 1048, y 1052 de codificación tienen un tamaño de N x 2N, y un tipo de división de la unidad 1032 de codificación tiene un tamaño de N x N. Las unidades de predicción y las divisiones de las unidades 1010 de codificación son más pequeñas que o iguales a cada unidad de codificación.

Se realiza transformación o transformación inversa sobre datos de imagen de la unidad 1052 de codificación en las unidades 1070 de transformación en una unidad de datos que es más pequeña que la unidad de codificación 1052. También, las unidades 1014, 1016, 1022, 1032, 1048, 1050, y 1052 de codificación en las unidades 1070 de transformación son diferentes de aquellas en las unidades 1060 de predicción en términos de tamaños y formas. En otras palabras, los aparatos 100 y 200 de codificación y decodificación de video pueden realizar intra predicción, estimación de movimiento, compensación de movimiento, transformación, y transformación inversa individualmente sobre una unidad de datos en la misma unidad de codificación.

Por consiguiente, se realiza recursivamente codificación sobre cada una de las unidades de codificación que tiene una estructura jerárquica en cada región de una unidad de codificación máxima para determinar una unidad de codificación óptima, y de esa forma pueden obtenerse unidades de codificación que tienen una estructura de árbol recursiva. Información de codificación puede incluir información de división sobre una unidad de codificación, información sobre un tipo de división, información sobre un modo de predicción, e información sobre un tamaño de una unidad de transformación. La Tabla 1 muestra la información de codificación que puede establecerse mediante los aparatos 100 y 200 de codificación y decodificación de video.

Tabla 1

La unidad 130 de salida del aparato 100 de codificación de video puede enviar la información de codificación sobre las unidades de codificación que tienen una estructura de árbol, y el extractor 220 de datos de imagen y de información de codificación del aparato 200 de decodificación de video extraer la información de codificación sobre las unidades de codificación que tienen una estructura de árbol de una secuencia de bits recibida.

La información de división representa si una unidad de codificación actual está dividida en unidades de codificación de una profundidad inferior. Si la información de división de una profundidad actual d es 0, una profundidad, en la cual una unidad de codificación actual ya no está dividida en una profundidad inferior, es una profundidad codificada, y de esa forma la información sobre un tipo de división, modo de predicción, y un tamaño de una unidad de transformación pueden definirse para la profundidad codificada. Si la unidad de codificación actual además está dividida de conformidad con la información de división, la codificación se realiza independientemente sobre cuatro unidades de codificación divididas de una profundidad inferior.

Un modo de predicción puede ser uno de un intra modo, un inter modo, y un modo de salto. El intra modo y el inter modo pueden definirse en todos los tipos de división, y el modo de salto se define únicamente en un tipo de división que tiene un tamaño de 2N x 2N.

La información sobre el tipo de división puede indicar tipos de división simétrica que tienen tamaños de 2N x 2N, 2N x N, N x 2N, N x N, que se obtienen al dividir simétricamente una altura o un ancho de una unidad de predicción, y tipos de división asimétrica que tienen tamaños de 2N x nU, 2N x nD, nL x 2N y nR x 2N, que se obtienen al dividir asimétricamente la altura o ancho de la unidad de predicción. Los tipos de división asimétrica que tienen los tamaños de 2N x nU y 2N x nD pueden obtenerse respectivamente al dividir la altura de la unidad de predicción en 1:3 y 3:1, y los tipos de división asimétrica que tienen los tamaños de nL x 2N y nR x 2N pueden obtenerse respectivamente al dividir el ancho de la unidad de predicción en 1:3 y 3:1.

El tamaño de la unidad de transformación puede establecerse para ser dos tipos en el intra modo y dos tipos en el inter modo. En otras palabras, si la información de división de la unidad de transformación es 0, el tamaño de la unidad de transformación pues ser 2N x 2N, que es el tamaño de la unidad de codificación actual. Si la información de división de la unidad de transformación es 1, las unidades de transformación pueden obtenerse al dividir la unidad de codificación actual. También, si un tipo de división de la unidad de codificación actual que tiene el tamaño de 2N x 2N es un tipo de división simétrica, un tamaño de una unidad de transformación puede ser N x N, y si el tipo de división de la unidad de codificación actual es un tipo de división asimétrica, el tamaño de la unidad de transformación puede ser N/2 x N/2.

La información de codificación sobre unidades de codificación que tienen una estructura de árbol puede incluir al menos una unidad de codificación que corresponde a una profundidad codificada, una unidad de predicción, y una unidad mínima. La unidad de codificación que corresponde a la profundidad codificada puede incluir al menos uno de una unidad de predicción y una unidad mínima que contiene la misma información de codificación.

Por consiguiente, se determina si se incluyen unidades de datos adyacentes en la misma unidad de codificación que corresponde a la profundidad codificada al comparar la información de codificación de las unidades de datos adyacentes. Además, se determina una unidad de codificación correspondiente que corresponde a una profundidad codificada al utilizar información de codificación de una unidad de datos, y de esa forma puede determinarse una distribución de profundidades codificadas en una unidad de codificación máxima.

Por consiguiente, si se predice una unidad de codificación actual con base en información de codificación de unidades de datos adyacentes, puede indicarse y utilizarse directamente información de codificación de unidades de datos en unidades de codificación más profundas adyacentes a la unidad de codificación actual.

Alternativamente, si se predice una unidad de codificación actual con base en información de codificación de unidades de datos adyacentes, se buscan unidades de datos adyacentes en la unidad de codificación actual utilizando información codificada de las unidades de datos, y pueden indicarse unidades de codificación adyacentes buscadas para predecir la unidad de codificación actual.

La figura 19 es un diagrama para describir una relación entre una unidad de codificación, una unidad de predicción o una división, y una unidad de transformación, de conformidad con información de modo de codificación de la Tabla 1.

Una unidad 1300 de codificación máxima incluye unidades 1302, 1304, 1306, 1312, 1314, 1316, y 1318 de codificación de profundidades codificadas. Aquí, como la unidad 1318 de codificación es una unidad de codificación de una profundidad codificada, la información de división puede establecerse a 0. La información sobre un tipo de división de la unidad 1318 de codificación que tiene un tamaño de 2N x 2N puede establecerse a 1 de un tipo de división 1322 que tiene un tamaño de 2N x 2N, un tipo de división 1324 que tiene un tamaño de 2N x N, un tipo de división 1326 que tiene un tamaño de N x 2N, un tipo de división 1328 que tiene un tamaño de N x N, un tipo de división 1332 que tiene un tamaño de 2N x nU, un tipo de división 1334 que tiene un tamaño de 2N x nD, un tipo de división 1336 que tiene un tamaño de nL x 2N y un tipo de división 1338 que tiene un tamaño de nR x 2N.

La información de división (indicador de tamaño de TU) de una unidad de transformación es una clase de índice de transformación, y el tamaño de la unidad de transformación que corresponde al índice de transformación puede variar dependiendo del tipo de unidad de la unidad de codificación o el tipo de división.

Por ejemplo, cuando el tipo de división se establece para ser simétrico, es decir, el tipo de división 2N x 2N (1322), 2N x N (1324), N x 2N (1326), o N x N (1328), una unidad 1342 de transformación que tiene un tamaño de 2N x 2N se establece si la información de división (indicador de tamaño de TU) de una unidad de transformación es cero, y una unidad 1344 de transformación que tiene un tamaño de N x N se establece si un indicador de tamaño de TU es 1.

Cuando el tipo de división se establece para ser simétrico, es decir, el tipo de división 2NxnU (1332), 2NxnD (1334), nLx2N (1336), o nRx2N (1338), se establece una unidad 1352 de transformación que tiene un tamaño de 2Nx2N se establece si la información de división TU es 0, y una unidad 1354 de transformación que tiene un tamaño de N/2xN/2 se establece si un indicador de tamaño de TU es 1.

Al hacer referencia a la figura 19, el indicador de tamaño de TU es un indicador que tiene un valor de 0 o 1, pero el indicador de tamaño de TU no está limitado a 1 bit, y una unidad de transformación puede dividirse jerárquicamente teniendo una estructura de árbol, mientras el indicador de tamaño de TU aumenta desde 0. La información de división de una unidad de transformación puede utilizarse como un ejemplo de un índice de transformación.

En este caso, el tamaño de una unidad de transformación que se ha utilizado realmente puede expresarse al utilizar un indicador de tamaño de TU de una unidad de transformación, de conformidad con una realización de la presente invención, junto con un tamaño máximo y tamaño mínimo de la unidad transformación. De conformidad con la realización de la presente invención, el aparato 100 de codificación de video es capaz de codificar información de tamaño de unidad de transformación máximo, información de tamaño de unidad de transformación mínimo, y un indicador de tamaño de TU máximo. El resultado de codificación de la información de tamaño de unidad de transformación máximo, la información de tamaño de unidad de transformación mínimo, y el indicador de tamaño de TU máximo puede insertarse en un SPS. De conformidad con una realización de la presente invención, el aparato 200 de decodificación de video puede decodificar video al utilizar la información de tamaño de unidad de transformación máximo, la información de tamaño de unidad de transformación mínimo, y el indicador de tamaño de TU máximo.

Por ejemplo, (a) si el tamaño de una unidad de codificación actual es 64 x 64 y un tamaño de unidad de transformación máximo es 32 x 32, entonces el tamaño de una unidad transformación puede ser 32 x 32 cuando un indicador de tamaño de TU es 0 (a-1), puede ser 16 x 16 cuando el indicador de tamaño de TU es 1 (a-2), y puede ser 8 x 8 cuando el indicador de tamaño de TU es 2 (a-3).

Como otro ejemplo, (b) si el tamaño de la unidad de codificación actual es 32 x 32 y un tamaño de unidad de transformación mínimo es 32 x 32, entonces el tamaño de la unidad de transformación puede ser 32 x 32 cuando el indicador de tamaño de TU es 0 (b-1). Aquí, el tamaño del indicador de tamaño de TU no puede establecerse a un valor diferente a 0, ya que el tamaño de la unidad de transformación no puede ser menor que 32 x 32.

Como otro ejemplo, (c) si el tamaño de la unidad de codificación actual es 64 x 64 y un indicador de tamaño de TU máximo es 1, entonces el indicador de tamaño de TU puede ser 0 o 1. Aquí, el indicador de tamaño de TU no puede establecerse a un valor diferente a 0 o 1.

De esa forma, si se define que el indicador de tamaño de TU máximo es “MaxTransformSizeIndex”, un tamaño de unidad de transformación mínimo es “MinTransformSize”, y un tamaño de unidad de transformación es “RootTuSize” cuando el indicador de tamaño de TU es 0, entonces un tamaño de unidad de transformación mínimo actual “CurrMinTuSize” que puede determinarse en una unidad de codificación actual, puede definirse por la Ecuación (1): CurrMinTuSize = max(MinTransformSize, RootTuSize/(rMaxTransformSizeindex)) ... (1)

Comparado con el tamaño de unidad de transformación mínimo actual “CurrMinTuSize” que puede determinarse en la unidad de codificación actual, el tamaño de unidad de transformación “RootTuSize” cuando el indicador de tamaño de TU es 0 puede indicar un tamaño de unidad de transformación máximo que puede seleccionarse en el sistema. En la Ecuación (1), “RootTuSize/(2AMaxTransformSizeIndex)” indica un tamaño de unidad de transformación cuando el tamaño de unidad de transformación “RootTuSizei”, cuando el indicador de tamaño de TU es 0, se divide un número de veces que corresponde al indicador de tamaño de TU máximo, y “MinTransformSize” indica un tamaño de transformación mínimo. De esa forma, un valor más pequeño de entre “RootTuSize/(2AMaxTransformSizeIndex)” y “MinTransformSize” puede ser el tamaño de unidad de transformación mínimo actual “CurrMinTuSize” que puede determinarse en la unidad de codificación actual.

De conformidad con una realización de la presente invención, el tamaño de unidad de transformación de raíz “RootTuSize” puede variar de conformidad con el tipo de un modo de predicción.

Por ejemplo, si un modo de predicción actual es un inter modo, entonces “RootTuSize” puede determinarse al utilizar la Ecuación (2) a continuación. En la Ecuación (2), “MaxTransformSize” indica un tamaño de unidad de transformación máximo, y “PUSize” indica un tamaño de unidad de predicción actual.

RootTuSize = min(MaxTransformSize, PUSize).......... (2)

Es decir, si el modo de predicción actual es el inter modo, el tamaño de unidad de transformación “RootTuSize” cuando el indicador de tamaño de TU es 0 puede ser un valor más pequeño de entre el tamaño de unidad de transformación máximo y el tamaño de unidad de predicción actual.

Si un modo de predicción de una unidad de división actual es un intra modo, “RootTuSize” puede determinarse al utilizar la Ecuación (3) a continuación. En la Ecuación (3), “PartitionSize” indica el tamaño de la unidad de división actual.

RootTuSize = min(MaxTransformSize, PartitionSize).........(3)

Es decir, si el modo de predicción actual es el intra modo, el tamaño de unidad de transformación “RootTuSize” cuando el indicador de tamaño de TU es 0 puede ser un valor más pequeño de entre el tamaño de unidad de transformación máximo y el tamaño de la unidad de predicción actual.

Sin embargo, el tamaño de unidad de transformación máximo actual “RootTuSize” que varía de conformidad con el tipo de modo de predicción en una unidad de división es solo un ejemplo y la presente invención no está limitada esto.

De conformidad con el procedimiento de codificación de video con base en unidades de codificación que tienen las estructuras de árbol descritas con referencia a las figuras 7 a 19, se codifican los datos de imagen del dominio espacial para cada unidad de codificación que tiene la estructura de árbol, y se realiza la decodificación para cada unidad de codificación máxima de conformidad con el procedimiento de decodificación de video con base en unidades de codificación de la estructura de árbol para restaurar los datos de imagen del dominio espacial, restaurando con ello el video que es la ilustración y la secuencia de ilustración. Puede reproducirse video restaurado por un aparato de reproducción, almacenado en un medio de almacenamiento, o transferido a través una red.

Las realizaciones de la presente invención pueden escribirse como programas de computadora y pueden implementarse en ordenadores digitales de uso general que ejecutan los programas utilizando un medio de grabación legible por ordenador. Ejemplos del medio de grabación legible por ordenador incluyen medios de almacenamiento magnético (por ejemplo, ROM, discos flexibles, discos duros, etc.) y medios de grabación ópticos (por ejemplo, CD-ROM, o DVD).

Claims

REIVINDICACIONES

1. Un procedimiento de codificación de datos de vídeo, comprendiendo el procedimiento:

determinar un número fijo de modos de intra predicción candidatos en una lista de candidatos de acuerdo con los modos de intra predicción de un bloque izquierdo y un bloque superior;

generar un indicador de modo más probable que indica si uno de los modos de intra predicción candidatos se usa para determinar un modo de intra predicción de un bloque actual;

cuando el indicador de modo más probable indica uno de los modos de intra predicción en la lista de candidatos usada para la predicción del bloque actual, generar un índice de modo que indica uno entre los modos de intra predicción candidatos incluidos en la lista de candidatos; y

generar una secuencia de bits que incluye el indicador de predicción de modo y el índice de modo, en el que, la lista de candidatos incluye un modo plano, cuando el modo de intra predicción del bloque izquierdo y el bloque superior son iguales entre sí y el modo de intra predicción del bloque izquierdo es el modo DC.

2. Un aparato de codificación de datos de vídeo, comprendiendo el aparato:

un determinador de una lista de candidatos configurado para determinar un número fijo de modos de intra predicción candidatos en una lista de candidatos de acuerdo con los modos de intra predicción de un bloque izquierdo y un bloque superior;

una unidad de salida de información de predicción configurada para:

generar un indicador de modo más probable que indica si uno de los modos de intra predicción candidatos se usa para determinar un modo de intra predicción de un bloque actual, y

una unidad de salida configurada para generar una secuencia de bits que incluye el indicador de predicción de modo y el índice de modo, en el que,

el candidato incluye un modo plano, cuando los modos de intra predicción del bloque izquierdo y el bloque superior son iguales entre sí y el modo de intra predicción del bloque izquierdo es el modo DC.

3. Un medio grabable por ordenador no transitorio que almacena una secuencia de bits de datos de vídeo, comprendiendo la secuencia de bits:

un indicador de modo más probable configurado para indicar si uno de los modos de intra predicción candidatos se usa para determinar un modo de intra predicción de un bloque actual; y

un índice de modo configurado para indicar uno entre los modos de intra predicción candidatos incluidos en una lista de candidatos, en el que,

la lista de candidatos incluye un número fijo de modos de intra predicción candidatos que comprende un modo plano, cuando los modos de intra predicción del bloque izquierdo y el bloque superior son iguales entre sí y el modo de intra predicción del bloque izquierdo es el modo DC.