ES2533304T3

ES2533304T3 - Método y aparato para codificar vídeo por predicción de movimiento usando una partición arbitraria, y método y aparato para decodificar vídeo por predicción de movimiento usando una partición arbitraria

Info

Publication number: ES2533304T3
Application number: ES13167742.9T
Authority: ES
Inventors: Sun-Il Lee; Min-Su Cheon; Woo-Jin Han
Original assignee: Samsung Electronics Co Ltd
Current assignee: Samsung Electronics Co Ltd
Priority date: 2009-12-08
Filing date: 2010-12-08
Publication date: 2015-04-09
Anticipated expiration: 2030-12-08
Also published as: EP2629528B1; CN103220523B; US20110134998A1; ZA201505589B; LT2908525T; US20140192890A1; CA2816755C; EP2510698A4; JP5813000B2; US20150215636A1; JP2013255274A; DK2899978T3; DK2629528T3; EP3402189B1; BR122013019952A2; PT2629527T; JP6149140B2; EP2899978B1; RU2012128519A; HUE030154T2

Abstract

Método de decodificación de un vídeo, comprendiendo el método: analizar sintácticamente información que indica si se usan particiones asimétricas de una unidad de codificación para una predicción inter, a partir del flujo continuo de bits recibido; determinar por lo menos una unidad de codificación dividida jerárquicamente a partir de una unidad de codificación máxima usando información de división analizada sintácticamente a partir del flujo continuo de bits recibido; cuando la información indica que las particiones asimétricas se usan para una predicción inter, determinar las particiones obtenidas a partir de una unidad de codificación de entre dicha por lo menos una unidad de codificación, usando un tipo de partición de la unidad de codificación, analizado sintácticamente a partir del flujo continuo de bits recibido, que indica una de entre las particiones simétricas y las particiones asimétricas; cuando la información indica que las particiones asimétricas no se usan para una predicción inter, determinar las particiones obtenidas a partir de la unidad de codificación usando el tipo de partición que indica las particiones simétricas; y llevar a cabo una compensación de movimiento usando las particiones para la unidad de codificación, caracterizado por que las particiones simétricas se dividen a partir de por lo menos una de entre una anchura y una altura de la unidad de codificación de acuerdo con una relación simétrica, y las particiones asimétricas se dividen a partir de una de entre una anchura y una altura de la unidad de codificación de acuerdo con una relación asimétrica.

Description

15

25

35

45

55

65 E13167742

18-03-2015

DESCRIPCIÓN

Método y aparato para codificar vídeo por predicción de movimiento usando una partición arbitraria, y método y aparato para decodificar vídeo por predicción de movimiento usando una partición arbitraria.

Campo técnico

Las formas de realización ejemplificativas se refieren a la codificación y decodificación de vídeo.

Antecedentes de la técnica

A medida que se desarrolla y suministra hardware para reproducir y almacenar contenido de vídeo de alta resolución

o alta calidad, aumenta la necesidad de un códec de vídeo para codificar o decodificar de manera eficaz el contenido de vídeo de alta resolución o alta calidad. En un códec de vídeo convencional, un vídeo se codifica según un método de codificación limitado, sobre la base de un macrobloque que tiene un tamaño predeterminado.

La predicción inter existente llevada a cabo por el códec de vídeo estima un vector de movimiento y estima un movimiento de un macrobloque de tamaño 2Nx2N usando particiones que tienen tamaños de 2Nx2N, 2NxN, Nx2N, y NxN del macrobloque.

El documento US 2003/0202602 A1 da a conocer un método de partición y codificación intercuadro de regiones de imágenes.

Exposición

Problema técnico

Las formas de realización ejemplificativas proporcionan una codificación y decodificación de vídeo mediante la ejecución de predicción inter que hace uso de formas arbitrarias de particiones.

Solución técnica

Según un aspecto de la forma de realización ejemplificativa, se proporciona un método de codificación de un vídeo, incluyendo el método: dividir datos de vídeo en una unidad de codificación máxima; codificar los datos de vídeo de la unidad de codificación máxima sobre la base de unidades de codificación más profundas de estructuras jerárquicas en las cuales una unidad de codificación de una profundidad superior se divide a medida que la profundidad aumenta, de acuerdo con por lo menos una región dividida de la unidad de codificación máxima, y determinar una profundidad de codificación en la cual se va a dar salida a un resultado de codificación, incluyendo una predicción inter que hace uso de particiones obtenidas por la división de la unidad de codificación de acuerdo con relaciones arbitrarias; y dar salida a un flujo continuo de bits que incluye los datos de vídeo codificados correspondientes a una profundidad de codificación para dicha por lo menos una región dividida de acuerdo con unidades de codificación máximas e información referente a la profundidad de codificación y nodos de codificación.

Efectos ventajosos

Se puede incrementar la eficiencia de compresión de las imágenes ya que una unidad de codificación se ajusta al mismo tiempo que se tienen en cuenta características de la imagen al mismo tiempo que se aumenta el tamaño máximo de una unidad de codificación al mismo tiempo que se tiene en cuenta el tamaño de la imagen, de acuerdo con formas de realización ejemplificativas. Incluso si los datos de imagen tienen una alta resolución y una gran cantidad de datos, los datos de imagen se pueden decodificar y restablecer de manera eficiente usando un tamaño de una unidad de codificación y un modo de codificación, que se determinan de manera adaptativa de acuerdo con características de los datos de imagen, usando información sobre un modo de codificación óptimo recibido desde un codificador.

Las formas de realización se exponen en el conjunto adjunto de reivindicaciones; los ejemplos adicionales que se denominan formas de realización en la descripción son ejemplos ilustrativos, no formas de realización reivindicadas en la presente solicitud.

Descripción de los dibujos

La figura 1 es un diagrama de bloques de un aparato para codificar un vídeo, según una forma de realización ejemplificativa;

la figura 2 es un diagrama de bloques de un aparato para decodificar un vídeo, según una forma de realización ejemplificativa;

15

25

35

45

55

65 E13167742

18-03-2015

la figura 3 es un diagrama para describir un concepto de unidades de codificación según una forma de realización ejemplificativa;

la figura 4 es un diagrama de bloques de un codificador de imágenes basado en unidades de codificación según una forma de realización ejemplificativa;

la figura 5 es un diagrama de bloques de un decodificador de imágenes basado en unidades de codificación según una forma de realización ejemplificativa;

la figura 6 es un diagrama que ilustra unidades de codificación más profundas de acuerdo con profundidades, y particiones según una forma de realización ejemplificativa;

la figura 7 es un diagrama para describir una relación entre una unidad de codificación y unidades de transformación, según una forma de realización ejemplificativa;

la figura 8 es un diagrama para describir información de codificación de unidades de codificación correspondiente a una profundidad codificada, según una forma de realización ejemplificativa;

la figura 9 es un diagrama de unidades de codificación más profundas de acuerdo con profundidades, según una forma de realización ejemplificativa;

las figuras 10 a 12 son diagramas para describir una relación entre unidades de codificación, unidades de predicción, y unidades de transformación, según una forma de realización ejemplificativa;

la figura 13 es diagrama para describir una relación entre una unidad de codificación, una unidad de predicción o una partición, y una unidad de transformación, de acuerdo con información de modo de codificación de la Tabla 1;

la figura 14 es un diagrama de flujo que ilustra un método de codificación de un vídeo, según una forma de realización ejemplificativa;

la figura 15 es un diagrama de flujo que ilustra un método de decodificación de un vídeo, según una forma de realización ejemplificativa;

la figura 16 es un diagrama de bloques de un aparato de codificación de vídeo con respecto a una predicción inter que hace uso de particiones divididas de acuerdo con relaciones arbitrarias, según otra forma de realización ejemplificativa;

la figura 17 es un diagrama de bloques de un aparato de decodificación de vídeo con respecto a una predicción inter que hace uso de particiones divididas de acuerdo con relaciones arbitrarias, según otra forma de realización ejemplificativa;

la figura 18 es un diagrama de particiones ejemplificativas obtenidas mediante la división de una unidad de codificación de acuerdo con relaciones arbitrarias, según una forma de realización ejemplificativa;

la figura 19 ilustra una sintaxis de un conjunto de parámetros de secuencia que incluye información referente a si un tipo de partición para la predicción inter incluye particiones obtenidas mediante la división de una unidad de codificación de acuerdo con relaciones arbitrarias, según una forma de realización ejemplificativa;

la figura 20 es un diagrama de flujo que ilustra un método de codificación de vídeo con respecto a la predicción inter que hace uso de particiones divididas de acuerdo con relaciones arbitrarias, según otra forma de realización ejemplificativa; y

la figura 21 es un diagrama de flujo que ilustra un método de decodificación de vídeo con respecto a una predicción inter que hace uso de particiones divididas de acuerdo con relaciones arbitrarias, según otra forma de realización ejemplificativa.

Modo óptimo

Según un aspecto de la forma de realización ejemplificativa, se proporciona un método de codificación de un vídeo, incluyendo el método: dividir datos de vídeo en una unidad de codificación máxima; codificar los datos de vídeo de la unidad de codificación máxima sobre la base de unidades de codificación más profundas de estructuras jerárquicas en las cuales una unidad de codificación de una profundidad superior se divide a medida que la profundidad aumenta, de acuerdo con por lo menos una región dividida de la unidad de codificación máxima, y determinar una profundidad de codificación en la cual se va a dar salida a un resultado de codificación, incluyendo una predicción inter que hace uso de particiones obtenidas por la división de la unidad de codificación de acuerdo con relaciones arbitrarias; y dar salida a un flujo continuo de bits que incluye los datos de vídeo codificados correspondientes a una

15

25

35

45

55

65 E13167742

18-03-2015

profundidad de codificación para dicha por lo menos una región dividida, de acuerdo con unidades de codificación máximas e información referente a la profundidad de codificación y nodos de codificación.

La profundidad indica el número de veces que se divide jerárquicamente una unidad de codificación, y a medida que aumenta la profundidad, unidades de codificación más profundas de acuerdo con profundidades se pueden dividir desde la unidad de codificación máxima para obtener unidades de codificación mínimas. La profundidad aumenta desde una profundidad superior a una profundidad inferior. A medida que aumenta la profundidad, se incrementa el número de veces que se divide la unidad de codificación máxima, y el número total de veces posibles que se divide la unidad de codificación máxima se corresponde con una profundidad máxima. El tamaño máximo y la profundidad máxima de la unidad de codificación pueden ser predeterminados.

La determinación de la profundidad de codificación puede incluir: determinar selectivamente si llevar a cabo la predicción inter usando las particiones obtenidas por la división de la unidad de codificación de acuerdo con relaciones arbitrarias.

La acción de dar salida al flujo continuo de bits puede incluir: incluir información que indica si un tipo de partición para la predicción inter incluye las particiones obtenidas por la división de la unidad de codificación de acuerdo con relaciones arbitrarias.

Las particiones obtenidas por la división de la unidad de codificación de acuerdo con relaciones arbitrarias pueden ser particiones obtenidas mediante la división de una altura y una anchura de la unidad de codificación de acuerdo con una relación de 1:3 o 3:1.

La unidad de codificación máxima se puede fijar selectivamente como por lo menos uno de entre bloques que tienen tamaños de 16x16, 32x32, 64x64, 128x128, y 256x256.

La profundidad de codificación se puede determinar como una profundidad de una unidad de codificación más profunda que tiene la eficiencia de codificación más alta entre resultados de codificación sobre la base de unidades de codificación más profundas de acuerdo con las estructuras jerárquicas de una región dividida correspondiente, y se determina de manera independiente para por lo menos una región dividida dentro de la unidad de codificación máxima.

Según otro aspecto de una forma de realización ejemplificativa, se proporciona un método de decodificación de un vídeo, incluyendo el método: recibir y analizar sintácticamente un flujo continuo de bits en relación con datos de vídeo codificados; extraer los datos de vídeo codificados de acuerdo con unidades de codificación máximas, e información referente a profundidades de codificación y modos de codificación de acuerdo con unidades de codificación máximas a partir del flujo continuo de bits; y llevar a cabo una decodificación que incluye compensación de movimiento usando particiones obtenidas mediante la división de una unidad de codificación de acuerdo con relaciones arbitrarias, para una unidad de codificación de por lo menos una profundidad de codificación de acuerdo con unidades de codificación máximas, sobre la base de la información referente a las profundidades de codificación y modos de codificación de acuerdo con las unidades de codificación máximas, en donde las unidades de codificación de por lo menos una profundidad de codificación se determinan como una de las profundidades de las unidades de codificación más profundas de estructuras jerárquicas para por lo menos una región dividida de la unidad de codificación máxima.

La extracción de los datos de vídeo codificados puede incluir: extraer además información que indica un tipo de partición para la predicción inter incluyendo las particiones obtenidas mediante la división de la unidad de codificación de acuerdo con relaciones arbitrarias a partir del flujo continuo de bits.

La ejecución de la decodificación puede incluir: determinar selectivamente si llevar a cabo la compensación de movimiento usando las particiones obtenidas mediante la división de la unidad de codificación de acuerdo con relaciones arbitrarias sobre la base de la información que indica un tipo de partición para predicción inter incluyendo las particiones obtenidas mediante la división de la unidad de codificación de acuerdo con relaciones arbitrarias extraídas a partir del flujo continuo de bits.

Según otro aspecto de una forma de realización ejemplificativa, se proporciona un aparato para codificar un vídeo, incluyendo el aparato: un divisor de unidades de codificación máximas para dividir datos de vídeo en una unidad de codificación máxima; un codificador para codificar los datos de vídeo de la unidad de codificación máxima sobre la base de unidades de codificación más profundas de estructuras jerárquicas en las cuales una unidad de codificación de una profundidad superior se divide a medida que aumenta la profundidad, de acuerdo con por lo menos una región dividida de la unidad de codificación máxima, y para determinar una profundidad de codificación en la cual se va a dar salida a un resultado de codificación, incluyendo una predicción inter que hace uso de particiones obtenidas por la división de la unidad de codificación de acuerdo con relaciones arbitrarias; y una unidad de salida para dar salida a un flujo continuo de bits que incluye los datos de vídeo codificados correspondientes a una profundidad de codificación para dicha por lo menos una región dividida de acuerdo con unidades de codificación máximas e información referente a la profundidad de codificación y modos de codificación.

15

25

35

45

55

65 E13167742

18-03-2015

Según otro aspecto de una forma de realización ejemplificativa, se proporciona un aparato para decodificar un vídeo, incluyendo el aparato: un analizador sintáctico para recibir y analizar sintácticamente un flujo continuo de bits en relación con datos de vídeo codificados; un extractor para extraer los datos de vídeo codificados, de acuerdo con unidades de codificación máximas, e información referente a profundidades de codificación y modos de codificación de acuerdo con unidades de codificación máximas, a partir del flujo continuo de bits; y un decodificador para llevar a cabo una decodificación que incluye compensación de movimiento mediante el uso de particiones obtenidas por la división de una unidad de codificación de acuerdo con relaciones arbitrarias, para una unidad de codificación de por lo menos una profundidad de codificación de acuerdo con unidades de codificación máximas, sobre la base de la información referente a las profundidades de codificación y modos de codificación de acuerdo con las unidades de codificación máximas, en donde las unidades de codificación de por lo menos una profundidad de codificación se determinan como una de las profundidades de las unidades de codificación más profundas de estructuras jerárquicas para por lo menos una región dividida de la unidad de codificación máxima.

Según otro aspecto de una forma de realización ejemplificativa, se proporciona un soporte de grabación legible por ordenador que tiene grabado en el mismo un programa para ejecutar el método de codificación de un vídeo. Según otro aspecto de una forma de realización ejemplificativa, se proporciona un soporte de grabación legible por ordenador que tiene grabado en el mismo un programa para ejecutar el método de decodificación de un vídeo.

Modo de poner en la práctica la invención

En lo sucesivo en la presente memoria, se describirán de forma más detallada las formas de realización ejemplificativas en referencia a los dibujos adjuntos, en los cuales se muestran formas de realización ejemplificativas. En las formas de realización ejemplificativas, “unidad” puede referirse o no a una unidad de tamaño, en función de su contexto.

En lo sucesivo en la presente memoria, una “unidad de codificación” es una unidad de datos de codificación en la cual los datos de imagen se codifican en un lado codificador y una unidad de datos codificados en la cual los datos de imagen codificados se decodifican en un lado de codificador, de acuerdo con formas de realización ejemplificativas. Además, una “profundidad codificada” significa una profundidad en la que se codifica una unidad de codificación.

En lo sucesivo en la presente, una “imagen” puede indicar una imagen fija correspondiente a un vídeo o una imagen en movimiento, es decir, el propio vídeo.

En referencia a las figuras 1 a 15 se describirán la codificación y decodificación de vídeo sobre la base de una unidad de datos espacialmente jerárquica de acuerdo con una forma de realización ejemplificativa, y en referencia a las figuras 16 a 21 se describirán la codificación y decodificación de vídeo mediante predicción inter con el uso de particiones divididas por una relación arbitraria de acuerdo con una forma de realización ejemplificativa.

La figura 1 es un diagrama de bloques de un aparato de codificación de vídeo 100, según una forma de realización ejemplificativa.

El aparato de codificación de vídeo 100 incluye un divisor de unidades de codificación máximas 110, un módulo de determinación de unidades de codificación 120, y una unidad de salida 130.

El divisor de unidades de codificación máximas 110 puede dividir una representación visual actual sobre la base de una unidad de codificación máxima correspondiente a la representación visual actual de una imagen. Si la representación visual actual es mayor que la unidad de codificación máxima, los datos de imagen de la representación visual actual se pueden dividir en dicha por lo menos una unidad de codificación máxima. La unidad de codificación máxima según una forma de realización ejemplificativa puede ser una unidad de datos que tenga un tamaño de 32x32, 64x64, 128x128, 256x256, etcétera, en donde la forma de la unidad de datos es un cuadrado que tiene una anchura y altura en cuadrados de 2. A los datos de imagen se les puede dar salida hacia el módulo de determinación de unidades de codificación 120 de acuerdo con dicha por lo menos una unidad de codificación máxima.

Una unidad de codificación según una forma de realización ejemplificativa se puede caracterizar por un tamaño máximo y una profundidad. La profundidad indica el número de veces que se divide espacialmente la unidad de codificación a partir de la unidad de codificación máxima, y a medida que la profundidad aumenta o se incrementa, se pueden dividir unidades de codificación más profundas de acuerdo con profundidades, a partir de la unidad de codificación máxima hasta una unidad de codificación mínima. La profundidad de la unidad de codificación máxima se encuentra en la profundidad superior y la profundidad de la unidad de codificación mínima se encuentra en la profundidad más baja. Puesto que el tamaño de una unidad de codificación correspondiente a cada profundidad disminuye a medida que aumenta la profundidad de la unidad de codificación máxima, una unidad de codificación correspondiente a una profundidad superior puede incluir una pluralidad de unidades de codificación correspondientes a profundidades inferiores.

15

25

35

45

55

65 E13167742

18-03-2015

Tal como se ha descrito anteriormente, los datos de imagen correspondientes a la representación visual actual se dividen en las unidades de codificación máximas de acuerdo con un tamaño máximo de la unidad de codificación, y cada una de las unidades de codificación máximas puede incluir unidades de codificación más profundas que se dividen de acuerdo con las profundidades. Puesto que la unidad de codificación máxima según una forma de realización ejemplificativa se divide de acuerdo con las profundidades, los datos de imagen de un dominio espacial incluidos en la unidad de codificación máxima se pueden clasificar jerárquicamente de acuerdo con profundidades.

Se pueden predeterminar una profundidad máxima y un tamaño máximo de una unidad de codificación, que limitan el número total de veces que se dividen jerárquicamente la altura y la anchura de la unidad de codificación máxima.

El módulo de determinación de unidades de codificación 120 codifica por lo menos una región dividida que se obtiene dividiendo una región de la unidad de codificación máxima de acuerdo con profundidades, y determina una profundidad para dar salida a unos datos de imagen codificados finalmente, de acuerdo con dicha por lo menos una región dividida. En otras palabras, el módulo de determinación de unidades de codificación 120 determina una profundidad codificada codificando los datos de imagen en las unidades de codificación más profundas de acuerdo con profundidades, en concordancia con la unidad de codificación máxima de la representación visual actual, y seleccionando una profundidad que presenta el error de codificación mínimo. Así, se da salida finalmente a los datos de imagen codificados de la unidad de codificación en correspondencia con la profundidad codificada determinada. Además, las unidades de codificación correspondientes a la profundidad codificada se pueden considerar como unidades de codificación codificadas.

A la profundidad codificada determinada y a los datos de imagen codificados, de acuerdo con la profundidad codificada determinada, se les da salida hacia la unidad de salida 130.

Los datos de imagen en la unidad de codificación máxima se codifican sobre la base de las unidades de codificación más profundas correspondientes a por lo menos una profundidad igual o inferior a la profundidad máxima, y los resultados de codificar los datos de imagen se comparan basándose en cada una de las unidades de codificación más profundas. Se puede seleccionar una profundidad que presente el error de codificación mínimo después de comparar errores de codificación de las unidades de codificación más profundas. Se puede seleccionar por lo menos una profundidad codificada para cada unidad de codificación máxima.

El tamaño de la unidad de codificación máxima se divide a medida que se divide jerárquicamente una unidad de codificación de acuerdo con las profundidades, y a medida que aumenta el número de unidades de codificación. Además, incluso si las unidades de codificación se corresponden con la misma profundidad en una unidad de codificación máxima, se determina si dividir a una profundidad inferior cada una de las unidades de codificación correspondientes a la misma profundidad midiendo un error de codificación de los datos de imagen de dicha cada unidad de codificación, por separado. Por consiguiente, incluso cuando se incluyen datos de imagen en una unidad de codificación máxima, los datos de imagen se dividen en regiones de acuerdo con las profundidades y los errores de codificación pueden diferir según las regiones en la unidad de codificación máxima mencionada, y por lo tanto las profundidades codificadas pueden diferir según regiones en los datos de imagen. Así, en una unidad de codificación máxima se pueden determinar una o más profundidades codificadas, y los datos de imagen de la unidad de codificación máxima se pueden dividir según unidades de codificación de por lo menos una profundidad codificada.

Por consiguiente, el módulo de determinación de unidades de codificación 120 puede determinar unidades de codificación que tienen una estructura en árbol incluida en la unidad de codificación máxima. Las “unidades de codificación que tienen una estructura en árbol” según una forma de realización ejemplificativa incluyen unidades de codificación correspondientes a una profundidad de la cual se determina que es la profundidad codificada, de entre todas las unidades de codificación más profundas incluidas en la unidad de codificación máxima. Una unidad de codificación de una profundidad codificada se puede determinar jerárquicamente de acuerdo con las profundidades en la misma región de la unidad de codificación máxima, que se pueden determinar de forma independiente en regiones diferentes. De manera similar, una profundidad codificada en una región actual se puede determinar de manera independiente a partir de una profundidad codificada, en otra región.

Una profundidad máxima según una forma de realización ejemplificativa es un índice relacionado con el número de veces de la división desde una unidad de codificación máxima hasta una unidad de codificación mínima, es decir, con el número de veces que se divide la unidad de codificación máxima en una unidad de codificación mínima. Una primera profundidad máxima según una forma de realización ejemplificativa puede indicar el número total de veces de la división desde la unidad de codificación máxima hasta la unidad de codificación mínima. Una segunda profundidad máxima según una forma de realización ejemplificativa puede indicar el número total de niveles de profundidad desde la unidad de codificación máxima hasta la unidad de codificación mínima. Por ejemplo, cuando la profundidad de la unidad de codificación máxima es 0, la profundidad de una unidad de codificación, en la cual la unidad de codificación máxima se ha dividido una vez, se puede fijar a 1, y la profundidad de una unidad de codificación, en la cual la unidad de codificación máxima se ha dividido dos veces, se puede fijar a 2. En este caso, si la unidad de codificación mínima es una unidad de codificación en la cual la unidad de codificación máxima se ha dividido cuatro veces, existen 5 niveles de profundidad correspondientes a profundidades 0, 1, 2, 3 y 4, y, por lo

15

25

35

45

55

65 E13167742

18-03-2015

tanto, la primera profundidad máxima se puede fijar a 4, y la segunda profundidad máxima se puede fijar a 5.

La codificación de predicción y la transformación se pueden llevar a cabo de acuerdo con la unidad de codificación máxima. La codificación de predicción y la transformación se llevan a cabo también basándose en las unidades de codificación más profundas en concordancia con una profundidad igual a o profundidades menores que la profundidad máxima, de acuerdo con la unidad de codificación máxima. La transformación se puede llevar a cabo según un método de transformación ortogonal o transformación con enteros.

Puesto que el número de unidades de codificación más profundas aumenta cada vez que la unidad de codificación máxima se divide de acuerdo con las profundidades, la codificación que incluye la codificación de predicción y la transformación se lleva a cabo sobre todas las unidades de codificación más profundas generadas a medida que aumente la profundidad. Por comodidad descriptiva, la codificación de predicción y la transformación se describirán a continuación sobre la base de una unidad de codificación de una profundidad actual, en una unidad de codificación máxima.

El aparato de codificación de vídeo 100 puede seleccionar variablemente un tamaño o forma de una unidad de datos para codificar los datos de imagen. Con el fin de codificar los datos de imagen, se llevan a cabo operaciones, tales como codificación de predicción, transformación, y codificación entrópica, y en este momento, se puede usar la misma unidad de datos para todas las operaciones o se pueden usar unidades de datos diferentes para cada operación.

Por ejemplo, el aparato de codificación de vídeo 100 puede seleccionar no solamente una unidad de codificación para codificar los datos de imagen, sino también una unidad de datos diferente de la unidad de codificación con el fin de llevar a cabo la codificación de predicción sobre los datos de imagen en la unidad de codificación.

Para llevar a cabo la codificación de predicción en la unidad de codificación máxima, la codificación de predicción se puede llevar a cabo basándose en una unidad de codificación correspondiente a una profundidad codificada, es decir, basándose en una unidad de codificación que ya no se divide más en unidades de codificación correspondientes a una profundidad inferior. En la presente memoria en lo sucesivo, a la unidad de codificación que ya no se divide más y que se convierte en una unidad básica para la codificación de predicción se le hará referencia a continuación como “unidad de predicción”. Una partición que se obtiene dividiendo la unidad de predicción puede incluir una unidad de predicción o una unidad de datos obtenida por la división de por lo menos una de la altura y la anchura de la unidad de predicción.

Por ejemplo, cuando una unidad de codificación de 2Nx2N (donde N es un entero positivo) ya no se divide más y se convierte en una unidad de predicción de 2Nx2N, y el tamaño de una partición puede ser 2Nx2N, 2NxN, Nx2N, o NxN. Los ejemplos de un tipo de partición incluyen particiones simétricas que se obtienen dividiendo simétricamente la altura o anchura de la unidad de predicción, particiones obtenidas por la división asimétrica de la altura o anchura de la unidad de predicción, tal como 1:n o n:1, particiones que se obtienen dividiendo geométricamente la unidad de predicción, y particiones que presentan formas arbitrarias.

Un modo de predicción de la unidad de predicción puede ser por lo menos uno de entre un modo intra, un modo inter, y un modo de omisión (skip). Por ejemplo, el modo intra o el modo inter se pueden llevar a cabo sobre la partición de 2Nx2N, 2NxN, Nx2N o NxN. Además, el modo de omisión se puede llevar a cabo únicamente sobre la partición de 2Nx2N. La codificación se lleva a cabo independientemente sobre una unidad de predicción en una unidad de codificación, seleccionando así un modo de predicción que tiene el error de codificación mínimo.

El aparato de codificación de vídeo 100 también puede llevar a cabo la transformación sobre los datos de imagen en una unidad de codificación basándose no solamente en la unidad de codificación para codificar los datos de imagen, sino también basándose en una unidad de datos que es diferente con respecto a la unidad de codificación.

Para llevar a cabo la transformación en la unidad de codificación, la transformación se puede llevar a cabo basándose en una unidad de datos que tiene un tamaño menor que o igual a la unidad de codificación. Por ejemplo, la unidad de datos para la transformación puede incluir una unidad de datos para un modo intra y una unidad de datos para un modo inter.

A continuación, a una unidad de datos usada como base de la transformación se le hará referencia como “unidad de transformación”. En la unidad de transformación también se puede fijar una profundidad de transformación que indica el número de veces de la división para alcanzar la unidad de transformación dividiendo la altura y la anchura de la unidad de codificación. Por ejemplo, en una unidad de codificación actual de 2Nx2N, la profundidad de transformación puede ser 0 cuando el tamaño de una unidad de transformación es también 2Nx2N, puede ser 1 cuando cada una de la altura y la anchura de la unidad de codificación actual se divide en dos partes iguales, dividida totalmente en 4^1 unidades de transformación, y el tamaño de la unidad de transformación es por lo tanto NxN, y puede ser 2 cuando cada una de la altura y la anchura de la unidad de codificación actual se divide en cuatro partes iguales, dividida totalmente en 4^2 unidades de transformación y el tamaño de la unidad de transformación es por lo tanto N/2xN/2. Por ejemplo, la unidad de transformación se puede fijar de acuerdo con una estructura en árbol

15

25

35

45

55

65 E13167742

18-03-2015

jerárquica, en la cual una unidad de transformación de una profundidad de transformación superior se divide en cuatro unidades de transformación de una profundidad de transformación inferior de acuerdo con las características jerárquicas de una profundidad de transformación.

De modo similar a la unidad de codificación, la unidad de transformación en la unidad de codificación se puede dividir de manera recursiva en regiones de tamaño menor, de manera que la unidad de transformación se puede determinar de manera independiente en unidades de regiones. Así, datos residuales en la unidad de codificación se pueden dividir de acuerdo con la transformación que presenta la estructura en árbol según profundidades de transformación.

La codificación de información de acuerdo con unidades de codificación correspondientes a una profundidad codificada requiere no solamente información sobre la profundidad codificada, sino también sobre información relacionada con la codificación de predicción y la transformación. Por consiguiente, el módulo de determinación de unidades de codificación 120 no solamente determina una profundidad codificada que tiene un error de codificación mínimo, sino que también determina un tipo de partición en una unidad de predicción, un modo de predicción de acuerdo con unidades de predicción, y un tamaño de una unidad de transformación para la transformación.

Posteriormente se describirán de forma detallada, en referencia a las figuras 3 a 12, unidades de codificación de acuerdo con una estructura en árbol en una unidad de codificación máxima y un método de determinación de una partición.

El módulo de determinación de unidades de codificación 120 puede medir un error de codificación de unidades de codificación más profundas de acuerdo con profundidades usando una Optimización de Distorsión-Velocidad basada en multiplicadores Lagrangianos.

La unidad de salida 130 da salida a los datos de imagen de la unidad de codificación máxima, los cuales se codifican basándose en dicha por lo menos una profundidad codificada que ha sido determinada por el módulo de determinación de unidades de codificación 120, e información sobre el modo de codificación de acuerdo con la profundidad codificada, en flujos continuos de bits.

Los datos de imagen codificados se pueden obtener codificando datos residuales de una imagen.

La información sobre el modo de codificación de acuerdo con la profundidad codificada puede incluir información sobre la profundidad codificada, sobre el tipo de partición en la unidad de predicción el modo de predicción, y el tamaño de la unidad de transformación.

La información sobre la profundidad codificada se puede definir usando información de división de acuerdo con profundidades, la cual indica si la codificación se lleva a cabo sobre unidades de codificación de una profundidad inferior en lugar de una profundidad actual. Si la profundidad actual de la unidad de codificación actual es la profundidad codificada, los datos de imagen de la unidad de codificación actual se codifican y se da salida a los mismos, y por lo tanto la información de división se puede definir de manera que la unidad de codificación actual no se divide a una profundidad inferior. Alternativamente, si la profundidad actual de la unidad de codificación actual no es la profundidad codificada, la codificación se lleva a cabo sobre la unidad de codificación de la profundidad inferior, y por lo tanto la información de división se puede definir para dividir la unidad de codificación actual con el fin de obtener las unidades de codificación de la profundidad inferior.

Si la profundidad actual no es la profundidad codificada, la codificación se lleva a cabo sobre la unidad de codificación que se divide en por lo menos una unidad de codificación de la profundidad inferior. Puesto que, en una unidad de codificación de la profundidad actual, existe por lo menos una unidad de codificación de la profundidad inferior, la codificación se lleva a cabo de manera repetida sobre cada unidad de codificación de la profundidad inferior, y por lo tanto la codificación se puede ejecutar de forma recursiva para las unidades de codificación que presentan la misma profundidad.

Puesto que las unidades de codificación que tienen una estructura en árbol se determinan para una unidad de codificación máxima, y se determina información sobre por lo menos un modo de codificación para una unidad de codificación de una profundidad codificada, se puede determinar información sobre por lo menos un modo de codificación para una unidad de codificación máxima. Además, la profundidad codificada de los datos de imagen de la unidad de codificación máxima puede ser diferente según las posiciones puesto que los datos de imagen se dividen jerárquicamente de acuerdo con profundidades, y por lo tanto se puede fijar información sobre la profundidad codificada y el modo de codificación para los datos de imagen.

Por consiguiente, la unidad de salida 130 puede asignar información de codificación sobre una profundidad codificada correspondiente y un modo de codificación a por lo menos una de entre dicha unidad de codificación, la unidad de predicción, y una unidad mínima incluida en la unidad de codificación máxima.

La unidad mínima según una forma de realización ejemplificativa es una unidad de datos rectangular obtenida

15

25

35

45

55

65 E13167742

18-03-2015

mediante la división de la unidad de codificación mínima que constituye la profundidad más baja por 4. Alternativamente, la unidad mínima puede ser una unidad de datos rectangular máxima que se puede incluir en todas las unidades de codificación, unidades de predicción, unidades de partición, y unidades de transformación incluidas en la unidad de codificación máxima.

Por ejemplo, la información de codificación a la que se da salida a través de la unidad de salida 130 se puede clasificar en información de codificación de acuerdo con unidades de codificación, e información de codificación de acuerdo con unidades de predicción. La información de codificación de acuerdo con las unidades de codificación puede incluir la información sobre el modo de predicción y sobre el tamaño de las particiones. La información de codificación de acuerdo con las unidades de predicción puede incluir información sobre una dirección estimada de un modo inter, sobre un índice de imagen de referencia del modo inter, sobre un vector de movimiento, sobre un componente de croma de un modo intra, y sobre un método de interpolación del modo intra. Además, en el SPS (Conjunto de Parámetros de Secuencia) o un encabezamiento de un flujo continuo de bits se puede insertar información sobre un tamaño máximo de la unidad de codificación definida de acuerdo con representaciones visuales, franjas (slice), o GOPs, e información sobre una profundidad máxima.

En el aparato de codificación de vídeo 100, la unidad de codificación más profunda puede ser una unidad de codificación obtenida mediante la división de la altura o anchura de una unidad de codificación de una profundidad superior, la cual está una capa por encima, por dos. En otras palabras, cuando el tamaño de la unidad de codificación de la profundidad actual es 2Nx2N, el tamaño de la unidad de codificación de la profundidad inferior es NxN. Además, la unidad de codificación de la profundidad actual que tiene el tamaño de 2Nx2N puede incluir un máximo de 4 unidades de codificación de la profundidad inferior.

Por consiguiente, el aparato de codificación de vídeo 100 puede formar las unidades de codificación que presentan la estructura en árbol determinando unidades de codificación que tienen una forma óptima y un tamaño óptimo para cada unidad de codificación máxima, sobre la base del tamaño de la unidad de codificación máxima y la profundidad máxima determinadas mientras se consideran características de la representación visual actual. Además, puesto que la codificación se puede llevar a cabo sobre cada unidad de codificación máxima usando uno cualquiera de varios modos de predicción y transformaciones, se puede determinar un modo de codificación óptimo mientras se consideran características de la unidad de codificación de varios tamaños de imagen.

Así, si una imagen que tiene una alta resolución o una gran cantidad de datos se codifica en un macrobloque convencional, el número de macrobloques por cada representación visual aumenta de manera excesiva. Por consiguiente, aumenta el número de informaciones comprimidas que se generan para cada macrobloque, y por lo tanto resulta difícil transmitir la información comprimida y se reduce la eficiencia de compresión de datos. No obstante, usando el aparato de codificación de vídeo 100, se puede aumentar la eficiencia de compresión de las imágenes ya que la unidad de codificación se ajusta al mismo tiempo que se consideran características de la imagen y al mismo tiempo que se aumenta el tamaño máximo de la unidad de codificación y al mismo tiempo que se tiene en cuenta el tamaño de la imagen.

La figura 2 es un diagrama de bloques de un aparato de decodificación de vídeo 200, según una forma de realización ejemplificativa.

El aparato de decodificación de vídeo 200 incluye un receptor 210, un extractor de datos de imagen y de información de codificación 220, y un decodificador de datos de imagen 230. Las definiciones de diversos términos, tales como unidad de codificación, profundidad, unidad de predicción, unidad de transformación, e información sobre varios modos de codificación, para diversas operaciones del aparato de decodificación de vídeo 200, son idénticas a las descritas en referencia a la figura 1 y al aparato de codificación de vídeo 100.

El receptor 210 recibe y analiza sintácticamente un flujo continuo de bits de un vídeo codificado. El extractor de datos de imagen y de información de codificación 220 extrae datos de imagen codificados, para cada unidad de codificación, a partir del flujo continuo de bits analizado sintácticamente, en donde las unidades de codificación tienen una estructura en árbol de acuerdo con cada unidad de codificación máxima, y da salida a los datos de imagen extraídos hacia el decodificador de datos de imagen 230. El extractor de datos de imagen y de información de codificación 220 puede extraer información sobre el tamaño máximo de una unidad de codificación de una representación visual actual, a partir de un encabezamiento sobre el SPS o representación visual actual.

Además, el extractor de datos de imagen y de información de codificación 220 extrae información sobre una profundidad codificada y un modo de codificación para las unidades de codificación que tienen una estructura en árbol de acuerdo con cada unidad de codificación máxima, a partir del flujo continuo de bits analizado sintácticamente. A la información extraída sobre la profundidad codificada y el modo de codificación se le da salida hacia el decodificador de datos de imagen 230. En otras palabras, los datos de imagen de un flujo continuo de bits se dividen en la unidad de codificación máxima de manera que el decodificador de datos de imagen 230 decodifica los datos de imagen para cada unidad de codificación máxima.

La información sobre la profundidad codificada y el modo de codificación de acuerdo con la unidad de codificación

10

15

20

25

30

35

40

45

50

55

60

65 E13167742

18-03-2015

máxima se puede fijar para información sobre por lo menos una unidad de codificación correspondiente a la profundidad codificada, y la información sobre un modo de codificación puede incluir información sobre un tipo de partición de una unidad de codificación pertinente que se corresponda con la profundidad codificada, sobre un modo de predicción, y un tamaño de una unidad de transformación. Además, la información de división de acuerdo con las profundidades se puede extraer como información sobre la profundidad codificada.

La información sobre la profundidad codificada y el modo de codificación de acuerdo con cada unidad de codificación máxima extraída por el extractor de datos de imagen y de información de codificación 220 es información sobre una profundidad codificada y un modo de codificación determinados para generar un error de codificación mínimo cuando un codificador, tal como el aparato de codificación de vídeo 100, lleva a cabo de manera repetida una codificación para cada unidad de codificación más profunda de acuerdo con profundidades según cada unidad de codificación máxima. Por consiguiente, el aparato de decodificación de vídeo 200 puede restablecer una imagen mediante la decodificación de los datos de imagen de acuerdo con una profundidad codificada y un modo de codificación que genera el error de codificación mínimo.

Puesto que se puede asignar información de codificación sobre la profundidad codificada y el modo de codificación a una unidad de datos predeterminada de entre una unidad de codificación correspondiente, una unidad de predicción, y una unidad mínima, el extractor de datos de imagen y de información de codificación 220 puede extraer la información sobre la profundidad codificada y el modo de codificación de acuerdo con las unidades de datos predeterminadas. Se pueden deducir que las unidades de datos predeterminadas a las cuales se asigna la misma información sobre la profundidad codificada y el modo de codificación son las unidades de datos incluidas en la misma unidad de codificación máxima.

El decodificador de datos de imagen 230 restablece la representación visual actual decodificando los datos de imagen de cada unidad de codificación máxima basándose en la información sobre la profundidad codificada y el modo de codificación de acuerdo con las unidades de codificación máximas. En otras palabras, el decodificador de datos de imagen 230 puede decodificar los datos de imagen codificados sobre la base de la información extraída sobre el tipo de partición, el modo de predicción, y la unidad de transformación para cada unidad de codificación de entre las unidades de codificación que tienen la estructura en árbol incluida en cada unidad de codificación máxima. Un proceso de decodificación puede incluir una predicción que incluye predicción intra y compensación de movimiento, y una transformación inversa. La transformación inversa se puede llevar a cabo de acuerdo con un método de transformación ortogonal inversa o transformación con enteros inversa.

El decodificador de datos de imagen 230 puede llevar a cabo una predicción intra o una compensación de movimiento de acuerdo con una partición y un modo de predicción de cada unidad de codificación, basándose en la información sobre el tipo de partición y el modo de predicción de la unidad de predicción de la unidad de codificación de acuerdo con profundidades codificadas.

Además, el decodificador de datos de imagen 230 puede llevar a cabo una transformación inversa de acuerdo con cada unidad de transformación en la unidad de codificación, basándose en la información sobre el tamaño de la unidad de transformación de la unidad de codificación de acuerdo con profundidades codificadas, para llevar a cabo la transformación inversa de acuerdo con unidades de codificación máximas.

El decodificador de datos de imagen 230 puede determinar por lo menos una profundidad codificada de una unidad de codificación máxima actual usando información de división de acuerdo con profundidades. Si la información de división indica que ya no se dividen datos de imagen con la profundidad actual, la profundidad actual es una profundidad codificada. Por consiguiente, el decodificador de datos de imagen 230 puede decodificar datos codificados de por lo menos una unidad de codificación correspondiente a cada profundidad codificada de la unidad de codificación máxima actual usando la información sobre el tipo de partición de la unidad de predicción, el modo de predicción, y el tamaño de la unidad de transformación para cada unidad de codificación correspondiente a la profundidad codificada, y puede dar salida a los datos de imagen de la unidad de codificación máxima actual.

En otras palabras, se pueden recopilar unidades de datos que contienen la información de codificación que incluye la misma información de división observando el conjunto de información de codificación asignada para la unidad de datos predeterminada de entre la unidad de codificación, la unidad de predicción, y la unidad mínima, y se puede considerar que las unidades de datos recopiladas son una unidad de datos que será decodificada por el decodificador de datos de imagen 230 en el mismo modo de codificación.

El aparato de decodificación de vídeo 200 puede obtener información sobre por lo menos una unidad de codificación que genera el error de codificación mínimo cuando la codificación se lleva a cabo de manera recursiva para cada unidad de codificación máxima, y puede usar la información para decodificar la representación visual actual. En otras palabras, se pueden decodificar las unidades de codificación que presentan la estructura en árbol de las cuales se ha determinado que son las unidades de codificación óptimas de cada unidad de codificación máxima. Además, se determina el tamaño máximo de la unidad de codificación al mismo tiempo que teniendo en cuenta la resolución y una cantidad de datos de imagen.

15

25

35

45

55

65 E13167742

18-03-2015

Por consiguiente, incluso si los datos de imagen tienen una alta resolución y una gran cantidad de datos, los datos de imagen se pueden decodificar y restablecer de manera eficiente usando un tamaño de una unidad de codificación y un modo de codificación, que se determinan de manera adaptativa de acuerdo con características de los datos de imagen, usando información sobre un modo de codificación óptimo recibido desde un codificador.

A continuación se describirá, en referencia a las figuras 3 a 13, un método de determinación de unidades de codificación que tienen una estructura en árbol, una unidad de predicción, y una unidad de transformación, según una forma de realización ejemplificativa.

La figura 3 es un diagrama para describir un concepto de unidades de codificación de acuerdo con una forma de realización ejemplificativa.

El tamaño de una unidad de codificación se puede expresar en anchura x altura, y puede ser 64x64, 32x32, 16x16, y 8x8. Una unidad de codificación de 64x64 se puede dividir en particiones de 64x64, 64x32, 32x64, o 32x32, y una unidad de codificación de 32x32 se puede dividir en particiones de 32x32, 32x16, 16x32, o 16x16, una unidad de codificación de 16x16 se puede dividir en particiones de 16x16, 16x8, 8x16, u 8x8, y una unidad de codificación de 8x8 se puede dividir en particiones de 8x8, 8x4, 4x8, o 4x4.

En los datos de vídeo 310, la resolución es 1.920x1.080, el tamaño máximo de una unidad de codificación es 64x64, y la profundidad máxima es 2. En los datos de vídeo 320, la resolución es 1.920x1.080, el tamaño máximo de una unidad de codificación es 64x64, y la profundidad máxima es 3. En los datos de vídeo 330, la resolución es 352x288, el tamaño máximo de una unidad de codificación es 16x16, y la profundidad máxima es 1. La profundidad máxima mostrada en la figura 3 indica el número total de divisiones desde una unidad de codificación máxima a una unidad de decodificación mínima.

Si la resolución es alta o la cantidad de datos es grande, el tamaño máximo de una unidad de codificación puede ser grande de manera que no solamente aumente la eficiencia de codificación sino también que refleje de manera precisa características de una imagen. Por consiguiente, el tamaño máximo de la unidad de codificación de los datos de vídeo 310 y 320 que tienen la resolución mayor que los datos de vídeo 330 puede ser 64.

Puesto que la profundidad máxima de los datos de vídeo 310 es 2, las unidades de codificación 315 de los datos de vídeo 310 pueden incluir una unidad de codificación máxima con un tamaño del eje largo de 64, y unidades de codificación con tamaños del eje largo de 32 y 16 puesto que las profundidades se internan hasta dos capas dividiendo la unidad codificación máxima dos veces. Al mismo tiempo, puesto que la profundidad máxima de los datos de vídeo 330 es 1, las unidades de codificación 335 de los datos de vídeo 330 pueden incluir una unidad de codificación máxima con un tamaño del eje largo de 16, y unidades de codificación con un tamaño del eje largo de 8 puesto que las profundidades se internan hasta una capa dividiendo la unidad de codificación máxima una vez.

Puesto que la profundidad máxima de los datos de vídeo 320 es 3, las unidades de codificación 325 de los datos de vídeo 320 pueden incluir una unidad de codificación máxima con un tamaño del eje largo de 64, y unidades de codificación con tamaños del eje largo de 32, 16, y 8 ya que las profundidades se internan hasta 3 capas dividiendo la unidad de codificación máxima tres veces. A medida que la profundidad aumenta, se puede expresar de manera precisa información detallada.

La figura 4 es un diagrama de bloques de un codificador de imágenes 400 basado en unidades de codificación, de acuerdo con una forma de realización ejemplificativa.

El codificador de imágenes 400 lleva a cabo operaciones del módulo de determinación de unidades de codificación 120 del aparato de codificación de vídeo 100 para codificar datos de imagen. En otras palabras, un predictor intra 410 lleva a cabo una predicción intra sobre unidades de codificación en un modo intra, de entre un cuadro actual 405, y un estimador de movimiento 420 y un compensador de movimiento 425 llevan a cabo una estimación inter y una compensación de movimiento sobre unidades de codificación en un modo inter de entre el cuadro actual 405 usando el cuadro actual 405, y un cuadro de referencia 495.

A los datos obtenidos a la salida del predictor intra 410, el estimador de movimiento 420, y el compensador de movimiento 425 se les da salida en forma de un coeficiente de transformación cuantificado a través de un módulo de transformación 430 y un cuantificador 440. El coeficiente de transformación cuantificado se restablece como datos en un dominio espacial a través de un cuantificador inverso 460 y un módulo de transformación inversa 470, y a los datos restablecidos en el dominio espacial se les da salida como cuadro de referencia 495 después de haberse sometido a un post-procesado a través de una unidad de deblocking 480 y una unidad de filtrado de bucle 490. Al coeficiente de transformación cuantificado se le puede dar salida en forma de un flujo continuo de bits 455 a través de un codificador entrópico 450.

Para que el codificador de imágenes 400 se aplique en el aparato de codificación de vídeo 100, todos los elementos del codificador de imágenes 400, es decir, el predictor intra 410, el estimador de movimiento 420, el compensador de movimiento 425, el módulo de transformación 430, el cuantificador 440, el codificador entrópico 450, el cuantificador

15

25

35

45

55

65 E13167742

18-03-2015

inverso 460, el módulo de transformación inversa 470, la unidad de deblocking 480, y la unidad de filtrado de bucle 490, realizan operaciones basadas en cada unidad de codificación de entre unidades de codificación que presentan una estructura de árbol al mismo tiempo que teniendo en cuenta la profundidad máxima de cada unidad de codificación máxima.

Específicamente, el predictor intra 410, el estimador de movimiento 420, y el compensador de movimiento 425 determinan particiones y un modo de predicción de cada unidad de codificación de entre las unidades de codificación que presentan una estructura de árbol al mismo tiempo que teniendo en cuenta el tamaño máximo y la profundidad máxima de una unidad de codificación máxima actual, y el módulo de transformación 430 determina el tamaño de la unidad de transformación en cada unidad de codificación de entre las unidades de codificación que presentan una estructura en árbol.

La figura 5 es un diagrama de bloques de un decodificador de imágenes 500 basado en unidades de codificación, según una forma de realización ejemplificativa.

Un analizador sintáctico 510 analiza sintácticamente datos de imagen codificados que se van a decodificar e información sobre codificación requerida para la decodificación a partir de un flujo continuo de bits 505. A los datos de imagen codificados se les da salida en forma de datos cuantificados inversos a través de un decodificador entrópico 520 y un cuantificador inverso 530, y los datos cuantificados inversos se restablecen en datos de imagen en un dominio espacial a través de un módulo de transformación inversa 540.

Un predictor intra 550 lleva a cabo una predicción intra sobre unidades de codificación en un modo intra con respecto a los datos de imagen en el dominio espacial, y un compensador de movimiento 560 lleva a cabo una compensación de movimiento sobre unidades de codificación en un modo inter usando un cuadro de referencia 585.

A los datos de imagen en el dominio espacial, que pasaron a través del predictor intra 550 y el compensador de movimiento 560, se les puede dar salida en forma de un cuadro restablecido 595 después de haberse sometido a un post-procesado a través de una unidad de deblocking 570 y una unidad de filtrado de bucle 580. Además, a los datos de imagen a los que se somete a post-procesado a través de la unidad de deblocking 570 y la unidad de filtrado de bucle 580 se les puede dar salida en forma del cuadro de referencia 585.

Para decodificar los datos de imagen en el decodificador de datos de imagen 230 del aparato de decodificación de vídeo 200, el decodificador de imágenes 500 puede llevar a cabo operaciones que se realizan después del analizador sintáctico 510.

Para que el decodificador de imágenes 500 se aplique en el aparato de decodificación de vídeo 200, todos los elementos del decodificador de imágenes 500, es decir, el analizador sintáctico 510, el decodificador entrópico 520, el cuantificador inverso 530, el módulo de transformación inversa 540, el predictor intra 550, el compensador de movimiento 560, la unidad de deblocking 570, y la unidad de filtrado de bucle 580, llevan a cabo operaciones basadas en unidades de codificación que presentan una estructura en árbol para cada unidad de codificación máxima.

Específicamente, el predictor intra 550 y el compensador de movimiento 560 llevan a cabo operaciones basadas en particiones y un modo de predicción para cada una de las unidades de codificación que presenta una estructura en árbol, y el módulo de transformación inversa 540 lleva a cabo operaciones basadas en el tamaño de una unidad de transformación para cada unidad de codificación.

La figura 6 es un diagrama que ilustra unidades de codificación más profundas de acuerdo con las profundidades, y particiones, según una forma de realización ejemplificativa.

El aparato de codificación de vídeo 100 y el aparato de decodificación de vídeo 200 usan unidades de codificación jerárquicas para tener en cuenta características de una imagen. La altura máxima, la anchura máxima, y la profundidad máxima de unidades de codificación se pueden determinar de manera adaptativa de acuerdo con las características de la imagen, o pueden ser establecidas de manera diferente por un usuario. Los tamaños de unidades de codificación más profundas de acuerdo con las profundidades se pueden determinar según el tamaño máximo predeterminado de la unidad de codificación.

En una estructura jerárquica 600 de unidades de codificación, según una forma de realización ejemplificativa, la altura máxima y la anchura máxima de las unidades de codificación son, cada una de ellas, 64, y la profundidad máxima es 4. Puesto que la profundidad aumenta a lo largo de un eje vertical de la estructura jerárquica 600, la altura y la anchura de la unidad de codificación más profunda se dividen todas ellas. Además, a lo largo de un eje horizontal de la estructura jerárquica 600 se muestran una unidad de predicción y particiones, que son las bases para la codificación por predicción de cada unidad de codificación más profunda.

En otras palabras, una unidad de codificación 610 es una unidad de codificación máxima en la estructura jerárquica 600, en donde la profundidad es 0 y el tamaño, es decir, altura por anchura, es 64x64. La profundidad aumenta a lo

10

15

20

25

30

35

40

45

50

55

60

65 E13167742

18-03-2015

largo del eje vertical, y existen una unidad de codificación 620 que tiene un tamaño de 32x32 y una profundidad de 1, una unidad de codificación 630 que tiene un tamaño de 16x16 y una profundidad de 2, una unidad de codificación 640 que tiene un tamaño de 8x8 y una profundidad de 3, y una unidad de codificación 650 que tiene un tamaño de 4x4 y una profundidad de 4. La unidad de codificación 650 que presenta el tamaño de 4x4 y la profundidad de 4 es una unidad de codificación mínima.

La unidad de predicción y las particiones de una unidad de codificación están dispuestas a lo largo del eje horizontal de acuerdo con cada profundidad. En otras palabras, si la unidad de codificación 610 que tiene el tamaño de 64x64 y la profundidad de 0 es una unidad de predicción, la unidad de predicción se puede dividir en particiones incluidas en la unidad de codificación 610, es decir, una partición 610 que tiene un tamaño de 64x64, particiones 612 que tienen el tamaño de 64x32, particiones 614 que tienen el tamaño de 32x64, o particiones 616 que tienen el tamaño de 32x32.

De manera similar, una unidad de predicción de la unidad de codificación 620 que tiene el tamaño de 32x32 y la profundidad de 1 se puede dividir en particiones incluidas en la unidad de codificación 620, es decir, una partición 620 con un tamaño de 32x32, particiones 622 con un tamaño de 32x16, particiones 624 con un tamaño de 16x32, y particiones 626 con un tamaño de 16x16.

De manera similar, una unidad de predicción de la unidad de codificación 630 con el tamaño de 16x16 y la profundidad de 2 se puede dividir en particiones incluidas en la unidad de codificación 630, es decir, una partición con un tamaño de 16x16 incluida en la unidad de codificación 630, particiones 632 con un tamaño de 16x8, particiones 634 con un tamaño de 8x16, y particiones 636 con un tamaño de 8x8.

De manera similar, una unidad de predicción de la unidad de codificación 640 que tiene el tamaño de 8x8 y la profundidad de 3 se puede dividir en particiones incluidas en la unidad de codificación 640, es decir, una partición con un tamaño de 8x8 incluida en la unidad de codificación 640, particiones 642 con un tamaño de 8x4, particiones 644 con un tamaño de 4x8, y particiones 646 con un tamaño de 4x4.

La unidad de codificación 650 que presenta el tamaño de 4x4 y la profundidad de 4 es la unidad de codificación mínima y una unidad de codificación de la profundidad inferior. Una unidad de predicción de la unidad de codificación 650 se asigna únicamente a una partición que tiene un tamaño de 4x4.

Para determinar dicha por lo menos una profundidad codificada de las unidades de codificación que constituyen la unidad de codificación máxima 610, el módulo de determinación de unidades de codificación 120 del aparato de codificación de vídeo 100 lleva a cabo la codificación para unidades de codificación en correspondencia con cada profundidad incluidas en la unidad de codificación máxima 610.

El número de unidades de codificación más profundas de acuerdo con las profundidades, que incluyen datos del mismo orden y el mismo tamaño aumenta a medida que se incrementa la profundidad. Por ejemplo, se requieren cuatro unidades de codificación correspondientes a una profundidad de 2 para cubrir datos que están incluidos en una unidad de codificación correspondiente a una profundidad de 1. Por consiguiente, para comparar resultados de codificación de los mismos datos según las profundidades, se codifica cada una de entre la unidad de codificación correspondiente a la profundidad de 1 y las cuatro unidades de codificación correspondientes a la profundidad de 2.

Para llevar a cabo la codificación para una profundidad actual de entre las profundidades, se puede seleccionar un error de codificación mínimo para la profundidad actual llevando a cabo una codificación para cada unidad de predicción en las unidades de codificación correspondientes a la profundidad actual, a lo largo del eje horizontal de la estructura jerárquica 600. Alternativamente, el error de codificación mínimo se puede buscar comparando los errores de codificación mínimos de acuerdo con las profundidades, llevando a cabo una codificación para cada profundidad a medida que aumenta la profundidad a lo largo del eje vertical de la estructura jerárquica 600. Como profundidad codificada y tipo de partición de la unidad de codificación 610 se puede seleccionar una profundidad y una partición que presenten el error de codificación mínimo en la unidad de codificación 610.

La figura 7 es un diagrama para describir una relación entre una unidad de codificación 710 y unidades de transformación 720, según una forma de realización ejemplificativa.

El aparato de codificación de vídeo 100 ó 200 codifica o decodifica una imagen de acuerdo con unidades de codificación que presentan tamaños inferiores o iguales a una unidad de codificación máxima para cada unidad de codificación máxima. Los tamaños de unidades de transformación para la transformación durante la codificación se pueden seleccionar basándose en unidades de datos que no son mayores que una unidad de codificación correspondiente.

Por ejemplo, en el aparato de codificación de vídeo 100 ó 200, si el tamaño de la unidad de codificación 710 es 64x64, la transformación se puede llevar a cabo usando las unidades de transformación 720 que presentan un tamaño de 32x32.

10

15

20

25

30

35

40

45

50

55

60

65 E13167742

18-03-2015

Además, los datos de la unidad de codificación 710 que presentan el tamaño de 64x64 se pueden codificar llevando a cabo la transformación sobre cada una de las unidades de transformación que presentan el tamaño de 32x32, 16x16, 8x8, y 4x4, las cuales son menores que 64x64, y a continuación se puede seleccionar una unidad de transformación que presente el error de codificación mínimo.

La figura 8 es un diagrama para describir información de codificación de unidades de codificación correspondientes a una profundidad codificada, según una forma de realización ejemplificativa.

La unidad de salida 130 del aparato de codificación de vídeo 100 puede codificar y transmitir información 800 sobre un tipo de partición, información 810 sobre un modo de predicción, e información 820 sobre un tamaño de una unidad de transformación para cada unidad de codificación correspondiente a una profundidad codificada, en forma de información sobre un modo de codificación.

La información 800 indica información sobre la forma de una partición obtenida al dividir una unidad de predicción de una unidad de codificación actual, en donde la partición es una unidad de datos para codificar por predicción la unidad de codificación actual. Por ejemplo, una unidad de codificación actual CU_0 que tiene un tamaño de 2Nx2N se puede dividir en una cualquiera de entre una partición 802 con un tamaño de 2Nx2N, una partición 804 con un tamaño de 2NxN, una partición 806 con un tamaño de Nx2N, y una partición 808 con un tamaño de NxN. En este caso, la información 800 sobre un tipo de partición se establece para indicar una de entre la partición 804 con un tamaño de 2NxN, la partición 806 con un tamaño de Nx2N, y la partición 808 con un tamaño de NxN.

La información 810 indica un modo de predicción de cada partición. Por ejemplo, la información 810 puede indicar un modo de codificación por predicción llevado a cabo sobre una partición indicada por la información 800, es decir, un modo intra 812, un modo inter 814, o un modo de omisión 816.

La información 820 indica una unidad de transformación que se tomará como base cuando se lleve a cabo la transformación sobre una unidad de codificación actual. Por ejemplo, la unidad de transformación puede ser una primera unidad de transformación intra 822, una segunda unidad de transformación intra 824, una primera unidad de transformación inter 826, o una segunda unidad de transformación intra 828.

El extractor de datos de imagen e información de codificación 220 del aparato de decodificación de vídeo 200 puede extraer y usar la información 800, 810, y 820 para la decodificación, de acuerdo con cada unidad de codificación más profunda.

La figura 9 es un diagrama de unidades de codificación más profundas de acuerdo con profundidades, según una forma de realización ejemplificativa.

Se puede usar información de división para indicar un cambio de una profundidad. La información de división indica si una unidad de codificación de una profundidad actual se divide en unidades de codificación de una profundidad inferior.

Una unidad de predicción 910 para codificar por predicción una unidad de codificación 900 que tiene una profundidad de 0 y un tamaño de 2N_0x2N_0, puede incluir particiones de un tipo de partición 912 con un tamaño de 2N_0x2N_0, un tipo de partición 914 con un tamaño de 2N_0xN_0, un tipo de partición 916 con un tamaño de N_0x2N_0, y un tipo de partición 918 con un tamaño de N_0xN_0. La figura 9 únicamente ilustra los tipos de partición 912 a 918 que se obtienen al dividir simétricamente la unidad de predicción 910, aunque el tipo de partición no se limita a los mencionados, y las particiones de la unidad de predicción 910 pueden incluir particiones asimétricas, particiones con una forma predeterminada, y particiones con una forma geométrica.

La codificación por predicción se lleva a cabo de manera repetida sobre una partición con un tamaño de 2N_0x2N_0, dos particiones con un tamaño de 2N_0xN_0, dos particiones con un tamaño de N_0x2N_0, y cuatro particiones con un tamaño de N_0xN_0, de acuerdo con cada tipo de partición. La codificación por predicción en un modo intra y un modo inter se puede llevar a cabo sobre las particiones con los tamaños de 2N_0x2N_0, N_0x2N_0, 2N_0xN_0, y N_0xN_0. La codificación por predicción en un modo de omisión se lleva a cabo solamente sobre la partición con el tamaño de 2N_0x2N_0.

Se comparan errores de codificación que incluyen la codificación por predicción en los tipos de partición 912 a 918, y se determina el error de codificación mínimo entre los tipos de partición. Si un error de codificación es el más pequeño en uno de los tipos de partición 912 a 916, la unidad de predicción 910 no se puede dividir a una profundidad inferior.

Si el error de codificación es el más pequeño en el tipo de partición 918, la profundidad se cambia de 0 a 1 para dividir el tipo de partición 918 en la operación 920, y la codificación se lleva a cabo de manera repetida sobre unidades de codificación 930 que tienen una profundidad de 2 y un tamaño de N_0xN_0 para buscar un error de codificación mínimo.

15

25

35

45

55

65 E13167742

18-03-2015

Una unidad de predicción 940 para codificar por predicción la unidad de codificación 930 que tiene una profundidad de 1 y un tamaño de 2N_1x2N_1 (=N_0xN_0) puede incluir particiones de un tipo de partición 942 con un tamaño de 2N_1x2N_1, un tipo de partición 944 con un tamaño de 2N_1xN_1, un tipo de partición 946 con un tamaño de N_1x2N_1, y un tipo de partición 948 con un tamaño de N_1xN_1.

Si el error de codificación es el más pequeño en el tipo de partición 948, la profundidad se cambia de 1 a 2 para dividir el tipo de partición 948 en la operación 950, y la codificación se lleva a cabo de manera repetida sobre unidades de codificación 960, que tienen una profundidad de 2 y un tamaño de N_2xN_2 para buscar un error de codificación mínimo.

Cuando la profundidad máxima es d, se puede llevar a cabo una operación de división de acuerdo con cada profundidad hasta cuando la profundidad se convierte en d-1, y la información de división se puede codificar como hasta cuando la profundidad es una de 0 a d-2. En otras palabras, cuando la codificación se lleva a cabo hasta cuando la profundidad es d-1 después de que una unidad de codificación correspondiente a una profundidad de d-2 se divida en la operación 970, una unidad de predicción 990 para codificar por predicción una unidad de codificación 980 con una profundidad de d-1 y un tamaño de 2N_(d-1)x2N_(d-1) puede incluir particiones de un tipo de partición 992 con un tamaño de 2N_(d-1)x2N_(d-1), un tipo de partición 994 con un tamaño de 2N_(d-1)xN_(d-1), un tipo de partición 996 con un tamaño de N_(d-1)x2N_(d-1), y un tipo de partición 998 con un tamaño de N_(d-1)xN_(d-1).

La codificación por predicción se puede llevar a cabo de forma repetida sobre una partición con un tamaño de 2N_(d-1)x2N_(d-1), dos particiones con un tamaño de 2N_(d-1)xN_(d-1), dos particiones con un tamaño de N_(d1)x2N_(d-1), cuatro particiones con un tamaño de N_(d-1)xN_(d-1) de entre los tipos de partición 992 a 998 para buscar un tipo de partición que tenga un error de codificación mínimo.

Incluso cuando el tipo de partición 998 tiene el error de codificación mínimo, puesto que la profundidad máxima es d, una unidad de codificación CU_(d-1) que tiene una profundidad de d-1 ya no se divide a una profundidad inferior, y se determina que la profundidad codificada para las unidades de codificación que constituyen una unidad de codificación máxima actual 900 es d-1, y se puede determinar que el tipo de partición de la unidad de codificación máxima actual 900 es N_(d-1)xN_(d-1). Además, puesto que la profundidad máxima es d y una unidad de codificación mínima 980 que tenga la profundidad más baja de d-1 ya no se divide a una profundidad inferior, no se establece información de división para la unidad de codificación mínima 980.

Una unidad de datos 999 puede ser una “unidad mínima” para la unidad de codificación máxima actual. Una unidad mínima de acuerdo con una forma de realización ejemplificativa puede ser una unidad de datos rectangular obtenida mediante la división de una unidad de codificación mínima 980 por 4. Mediante la ejecución de la codificación repetidamente, el aparato de codificación de vídeo 100 puede seleccionar una profundidad que tiene el mínimo error de codificación comparando errores de codificación de acuerdo con profundidades de la unidad de codificación 900 para determinar una profundidad codificada, y establecer un tipo de partición correspondiente y un modo de predicción como modo de codificación de la profundidad codificada.

Como tal, los errores de codificación mínimos de acuerdo con las profundidades se comparan en la totalidad de las profundidades de 1 a d, y se puede determinar como profundidad codificada una profundidad que tenga el error de codificación mínimo. La profundidad codificada, el tipo de partición de la unidad de predicción, y el modo de predicción se pueden codificar y transmitir como información sobre un modo de codificación. Además, puesto que una unidad de codificación se divide desde una profundidad de 0 a una profundidad codificada, solamente la información de división de la profundidad codificada se fija a 0, y la información de división de profundidades que excluyen la profundidad codificada se fija a 1.

El extractor de datos de imagen e información de codificación 220 del aparato de decodificación de vídeo 200 puede extraer y usar la información sobre la profundidad codificada y la unidad de predicción de la unidad de codificación 900 para decodificar la partición 912. El aparato de decodificación de vídeo 200 puede determinar una profundidad, en la cual la información de división es 0, como profundidad codificada usando información de división según las profundidades, y puede usar información sobre un modo de codificación de la profundidad correspondiente para la decodificación.

Las figuras 10 a 12 son diagramas para describir una relación entre unidades de codificación 1010, unidades de predicción 1060, y unidades de transformación 1070, según una forma de realización ejemplificativa.

Las unidades de codificación 1010 son unidades de codificación que presentan una estructura en árbol, correspondientes a profundidades codificadas determinadas por el aparato de codificación de vídeo 100, en una unidad de codificación máxima. Las unidades de predicción 1060 son particiones de unidades de predicción de cada una de las unidades de codificación 1010, y las unidades de transformación 1070 son unidades de transformación de cada una de las unidades de codificación 1010.

Cuando una profundidad de una unidad de codificación máxima es 0 en las unidades de codificación 1010, las profundidades de las unidades de codificación 1012 y 1054 son 1, las profundidades de las unidades de codificación

10

15

20

25

30

35

40

45

50

E13167742

18-03-2015

1014, 1016, 1018, 1028, 1050 y 1052 son 2, las profundidades de las unidades de codificación 1020, 1022, 1024, 1026, 1030, 1032 y 1048 son 3, y las profundidades de las unidades de codificación 1040, 1042, 1044 y 1046 son 4.

En las unidades de predicción 1060, algunas unidades de codificación 1014, 1016, 1022, 1032, 1048, 1050, 1052 y 1054 se obtienen dividiendo las unidades de codificación en las unidades de codificación 1010. En otras palabras, los tipos de partición de las unidades de codificación 1014, 1022, 1050 y 1054 presentan un tamaño de 2NxN, los tipos de partición de las unidades de codificación 1016, 1048 y 1052 presentan un tamaño de Nx2N, y el tipo de partición de la unidad de codificación 1032 presenta un tamaño de NxN. Las unidades de predicción y las particiones de las unidades de codificación 1010 son inferiores o iguales a cada unidad de codificación.

La transformación o transformación inversa se lleva a cabo sobre datos de imagen de las unidades de codificación 1052 en las unidades de transformación 1070 en una unidad de datos que es menor que la unidad de codificación 1052. Además, las unidades de codificación 1014, 1016, 1022, 1032, 1048, 1050 y 1052 de las unidades de transformación 1070 son diferentes con respecto a las correspondientes de las unidades de predicción 1060 en términos de tamaños y formas. En otras palabras, los aparatos de codificación y decodificación de vídeo 100 y 200 pueden llevar a cabo una predicción intra, una estimación de movimiento, una compensación de movimiento, una transformación, y una transformación inversa individualmente sobre una unidad de datos en la misma unidad de codificación.

Por consiguiente, la codificación se lleva a cabo de manera recursiva sobre cada una de unidades de codificación que tienen una estructura jerárquica en cada región de una unidad de codificación máxima para determinar una unidad de codificación óptima, y por lo tanto se pueden obtener unidades de codificación que tienen una estructura en árbol recursiva. La información de codificación puede incluir información de división sobre una unidad de codificación, información sobre un tipo de partición, información sobre un modo de predicción, e información sobre un tamaño de una unidad de transformación. La tabla 1 muestra la información de codificación que puede ser establecida por los aparatos de codificación y de decodificación de vídeo 100 y 200.

[Tabla 1]

Información de división 0 (Codificación Sobre Unidad de Codificación con Tamaño de 2Nx2N y Profundidad Actual de d): Información de división 1

Modo de Predicción: Tipo de Partición Tamaño de Unidad de Transformación Codificar de Manera Repetida Unidades de Codificación con Profundidad Inferior de d+1

Intra Inter Omisión (Solo 2Nx2N): Tipo de partición Simétrica Tipo de Partición Asimétrica Información de División 0 de Unidad de Transformación Información de División 1 de Unidad de Transformación

2Nx2N 2NxN Nx2N NxN: 2NxnU 2NxnD nLx2N nRx2N 2Nx2N NxN (Tipo Simétrico) N/2xN/2 (Tipo Asimétrico)

La unidad de salida 130 del aparato de codificación de vídeo 100 puede dar salida a la información de codificación sobre las unidades de codificación que tienen una estructura en árbol, y el extractor de datos de imagen y de información de codificación 220 del aparato de decodificación de vídeo 200 puede extraer la información de codificación sobre las unidades de codificación que tienen una estructura en árbol a partir de un flujo continuo de bits recibido.

La información de división indica si una unidad de codificación actual se divide en unidades de codificación de una profundidad inferior. Si la información de división de una profundidad actual d es 0, la profundidad, en la cual una unidad de codificación actual ya no se divide más a una profundidad inferior, es una profundidad codificada, y por lo tanto se puede definir información sobre un tipo de partición, un modo de predicción, y un tamaño de una unidad de transformación para la profundidad codificada. Si la unidad de codificación actual se divide adicionalmente de acuerdo con la información de división, la codificación se lleva a cabo de manera independiente sobre cuatro unidades de codificación divididas de una profundidad inferior.

Un modo de predicción puede ser uno de entre un modo intra, un modo inter, y un modo de omisión. El modo intra y el modo inter se puede definir en todos los tipos de partición, y el modo de omisión se define únicamente en un tipo de partición que tiene un tamaño de 2Nx2N.

La información sobre el tipo de partición puede indicar tipos de partición simétricos con tamaños de 2Nx2N, 2NxN, Nx2N, y NxN, los cuales se obtienen dividiendo simétricamente una altura o una anchura de una unidad de predicción, y tipos de partición asimétricos con tamaños de 2NxnU, 2NxnD, nLx2N, y nRx2N, los cuales se obtienen dividiendo asimétricamente la altura o anchura de la unidad de predicción. Los tipos de partición asimétricos con los tamaños de 2NxnU y 2NxnD se pueden obtener respectivamente dividiendo la altura de la unidad de predicción en

15

25

35

45

55

65 E13167742

18-03-2015

1:3 y 3:1, y los tipos de partición asimétricos con los tamaños de nLx2N y nRx2N se pueden obtener respectivamente dividiendo la anchura de la unidad de predicción en 1:3 y 3:1.

El tamaño de la unidad de transformación se puede establecer de manera que sea dos tipos en el modo intra y dos tipos en el modo inter. En otras palabras, si la información de división de la unidad de transformación es 0, el tamaño de la unidad de transformación puede ser 2Nx2N, el cual es el tamaño de la unidad de codificación actual. Si la información de división de la unidad de transformación es 1, las unidades de transformación se pueden obtener dividiendo la unidad de codificación actual. Además, si el tipo de partición de la unidad de codificación actual que tiene el tamaño de 2Nx2N es un tipo de partición simétrico, el tamaño de una unidad de transformación puede ser NxN, y si el tipo de partición de la unidad de codificación actual es un tipo de partición asimétrico, el tamaño de la unidad de transformación puede ser N/2xN/2.

La información de codificación sobre unidades de codificación que tienen una estructura en árbol puede incluir por lo menos una de entre una unidad de codificación correspondiente a una profundidad codificada, una unidad de predicción, y una unidad mínima. La unidad de codificación correspondiente a la profundidad codificada puede incluir por lo menos una de entre una unidad de predicción y una unidad mínima que contiene la misma información de codificación.

Por consiguiente, se determina si unidades de datos adyacentes están incluidas en la misma unidad de codificación correspondiente a la profundidad codificada mediante la comparación de información de codificación de las unidades de datos adyacentes. Además, se determina una unidad de codificación pertinente correspondiente a una profundidad codificada usando información de codificación de una unidad de datos, y por lo tanto se puede determinar una distribución de profundidades codificadas en una unidad de codificación máxima.

Por consiguiente, si una unidad de codificación actual se predice basándose en información de codificación de unidades de datos adyacentes, se puede hacer referencia directamente a información de codificación de unidades de datos en unidades de codificación más profundas adyacentes a la unidad de codificación actual y la misma puede ser usada.

Alternativamente, si una unidad de codificación actual se predice basándose en información de codificación de unidades de datos adyacentes, se realiza una búsqueda en unidades de datos adyacentes a la unidad de codificación actual usando información codificada de las unidades de datos, y se puede hacer referencia a las unidades de codificación adyacentes en las que se ha buscado para predecir la unidad de codificación actual.

La figura 13 es un diagrama para describir una relación entre una unidad de codificación, una unidad de predicción o una partición, y una unidad de transformación, de acuerdo con información del modo de codificación de la Tabla 1.

Una unidad de codificación máxima 1300 incluye unidades de codificación 1302, 1304, 1306, 1312, 1314, 1316, y 1318 de profundidades codificadas. En este caso, puesto que la unidad de codificación 1318 es una unidad de codificación de una profundidad codificada, la información de división se puede fijar a 0. La información sobre un tipo de partición de la unidad de codificación 1318 que tiene un tamaño de 2Nx2N se puede fijar de manera que sea una de un tipo de partición 1322 con un tamaño de 2Nx2N, un tipo de partición 1324 con un tamaño de 2NxN, un tipo de partición 1326 con un tamaño de Nx2N, un tipo de partición 1328 con un tamaño de NxN, un tipo de partición 1332 con un tamaño de 2NxnU, un tipo de partición 1334 con un tamaño de 2NxnD, un tipo de partición 1336 con un tamaño de nLx2N, y un tipo de partición 1338 con un tamaño de nRx2N.

Cuando el tipo de partición se fija de manera que es simétrico, es decir, el tipo de partición 1322, 1324, 1326, ó 1328, se fija una unidad de transformación 1342 que tiene un tamaño de 2Nx2N si la información de división (bandera de tamaño de TU) de una unidad de transformación es 0, y se fija una unidad de transformación 1344 que tiene un tamaño de NxN si la bandera de tamaño de TU es 1.

Cuando el tipo de partición se fija de manera que es asimétrico, es decir, el tipo de partición 1332, 1334, 1336, ó 1338, se fija una unidad de transformación 1352 que tiene un tamaño de 2Nx2N si la bandera de tamaño de TU es 0, y se fija una unidad de transformación 1354 que tiene un tamaño de N/2xN/2 si la bandera de tamaño de TU es 1.

En referencia a la figura 13, la bandera de tamaño de TU es una bandera que tiene un valor de 0 ó 1, aunque dicha bandera de tamaño de TU no se limita a 1 bit, y una unidad de transformación se puede dividir jerárquicamente con una estructura en árbol mientras la bandera de tamaño de TU aumente desde 0.

En este caso, el tamaño de una unidad de transformación que ya ha sido usada realmente se puede expresar usando una bandera de tamaño de TU de una unidad de transformación, según una forma de realización ejemplificativa, junto con un tamaño máximo y un tamaño mínimo de la unidad de transformación. Según una forma de realización ejemplificativa, el aparato de codificación de vídeo 100 tiene la capacidad de codificar información de tamaño de unidad de transformación máxima, información de tamaño de unidad de transformación mínima, y una bandera de tamaño de TU máxima. El resultado de codificar la información de tamaño de unidad de transformación máxima, la información de tamaño de unidad de transformación mínima, y la bandera de tamaño de TU máxima se

15

25

35

45

55

65 E13167742

18-03-2015

puede insertar en un SPS. Según una forma de realización ejemplificativa, el aparato de decodificación de vídeo 200 puede decodificar vídeo usando la información de tamaño de unidad de transformación máxima, la información de tamaño de unidad de transformación mínima, y la bandera de tamaño de TU máxima.

Por ejemplo, si el tamaño de una unidad de codificación actual es 64x64 y el tamaño de unidad de transformación máxima es 32x32, entonces el tamaño de una unidad de transformación puede ser 32x32 cuando la bandera de tamaño de TU es 0, puede ser 16x16 cuando la bandera de tamaño de TU es 1, y puede ser 8x8 cuando la bandera de tamaño de TU es 2.

Como ejemplo adicional, si el tamaño de la unidad de codificación actual es 32x32 y el tamaño de unidad de transformación mínima es 32x32, entonces el tamaño de la unidad de transformación puede ser 32x32 cuando la bandera de tamaño de TU es 0. En este caso, la bandera de tamaño de TU no se puede fijar a un valor diferente de 0, puesto que el tamaño de la unidad de transformación no puede ser menor que 32x32.

Como ejemplo adicional, si el tamaño de la unidad de codificación actual es 64x64 y la bandera de tamaño de TU máxima es 1, entonces la bandera de tamaño de TU puede ser 0 ó 1. En este caso, la bandera de tamaño de TU no se puede fijar a un valor diferente de 0 ó 1.

Así, si se define que la bandera de tamaño de TU máxima es “MaxTransformSizeIndex”, el tamaño de unidad de transformación mínima es “MinTransformSize”, y el tamaño de unidad de transformación es “RootTuSize” cuando la bandera de tamaño de TU es 0, entonces el tamaño de unidad de transformación mínima actual “CurrMinTuSize” que se puede determinar en una unidad de codificación actual, se puede definir por la Ecuación (1):

CurrMinTuSize = max(MinTransformSize, RootTuSize/(2^MaxTransformSizeIndex))......(1)

En comparación con el tamaño de unidad de transformación mínima actual “CurrMinTuSize” que se puede determinar en la unidad de codificación actual, el tamaño de unidad de transformación “RootTuSize” cuando la bandera de tamaño de TU es 0 puede indicar un tamaño de unidad de transformación máxima que se puede seleccionar en el sistema. En la Ecuación (1), “RootTuSize/(2^MaxTransformSizeIndex)” indica un tamaño de unidad de transformación cuando el tamaño de unidad de transformación “RootTuSize”, cuando la bandera de tamaño de TU es 0, se divide un número de veces correspondiente a la bandera de tamaño de TU máxima, y “MinTransformSize” indica un tamaño de transformación mínimo. Por lo tanto, el valor más pequeño de entre “RootTuSize/(2^MaxTransformSizeIndex)” y “MinTransformSize” puede ser el tamaño de unidad de transformación mínima actual “CurrMinTuSize” que se puede determinar en la unidad de codificación actual.

Según una forma de realización ejemplificativa, el tamaño de unidad de transformación máxima RootTuSize puede variar de acuerdo con el tipo del modo de predicción.

Por ejemplo, si el modo de predicción actual es un modo inter, entonces “RootTuSize” se puede determinar usando la siguiente Ecuación (2). En la Ecuación (2), “MaxTransformSize” indica un tamaño de unidad de transformación máxima, y “PUSize” indica un tamaño de unidad de predicción actual.

RootTuSize = min(MaxTransformSize, PUSize)......(2)

Es decir, si el modo de predicción actual es el modo inter, el tamaño de unidad de transformación “RootTuSize” cuando la bandera de tamaño de TU es 0, puede ser el valor menor de entre el tamaño de unidad de transformación máxima y el tamaño de unidad de predicción actual.

Si el modo de predicción de una unidad de partición actual es un modo intra, “RooTuSize” se puede determinar usando la siguiente Ecuación (3). En la Ecuación (3), “PartitionSize” indica el tamaño de la unidad de partición actual.

RootTuSize = min(MaxTransformSize, PartitionSize)............(3)

Es decir, si el modo de predicción actual es el modo intra, el tamaño de unidad de transformación “RootTuSize” cuando la bandera de tamaño de TU es 0 puede ser el valor menor de entre el tamaño de unidad de transformación máxima y el tamaño de la unidad de partición actual.

No obstante, el tamaño de unidad de transformación máximo actual “RootTuSize” que varía de acuerdo con el tipo del modo de predicción en una unidad de partición es simplemente un ejemplo y no se limita a lo mencionado.

La figura 14 es un diagrama de flujo que ilustra un método de codificación de un vídeo, según una forma de realización ejemplificativa.

En la operación 1210, una representación visual actual se divide en por lo menos una unidad de codificación máxima, se puede predeterminar una profundidad máxima que indica el número total de posibles veces de la

10

15

20

25

30

35

40

45

50

55

60

65 E13167742

18-03-2015

división.

En la operación 1220, se determina una profundidad codificada para dar salida a un resultado de codificación final de acuerdo con por lo menos una región dividida, que se obtiene dividiendo una región de cada unidad de codificación máxima según profundidades, codificando dicha por lo menos una región dividida, y se determina una unidad codificación de acuerdo con una estructura en árbol.

La unidad de codificación máxima se divide espacialmente cada vez que aumenta la profundidad, y por lo tanto se divide en unidades de codificación de una profundidad inferior. Cada unidad de codificación se puede dividir en unidades de codificación de otra profundidad inferior al dividirla espacialmente de manera independiente con respecto a unidades de codificación adyacentes. La codificación se lleva a cabo de manera repetida sobre cada unidad de codificación de acuerdo con las profundidades.

Además, se determina una unidad de transformación según tipos de partición con el error de codificación mínimo, para cada unidad de codificación más profunda. Para determinar una profundidad codificada que tiene un error de codificación mínimo en cada unidad de codificación máxima, se pueden medir errores de codificación y los mismos se pueden comparar en todas las unidades de codificación más profundas de acuerdo con las profundidades.

En la operación 1230, se da a salida a datos de imagen codificados que constituyen el resultado de codificación final de acuerdo con la profundidad codificada, para cada unidad de codificación máxima, con información de codificación sobre la profundidad codificada y un modo de codificación. La información sobre el modo de codificación puede incluir información sobre una profundidad codificada o información de división, información sobre un tipo de partición de una unidad de predicción, un modo de predicción, y un tamaño de una unidad de transformación. La información codificada sobre el modo de codificación se puede transmitir a un decodificador con los datos de imagen codificados.

La figura 15 es un diagrama de flujo que ilustra un método de decodificación de un vídeo, según una forma de realización ejemplificativa.

En la operación 1310, se recibe y se analiza sintácticamente un flujo continuo de bits de un vídeo codificado.

En la operación 1320, del flujo continuo de bits analizado sintácticamente se extraen datos de imagen codificados de una representación visual actual asignada a una unidad de codificación máxima, e información de codificación sobre una profundidad codificada y un modo de codificación de acuerdo con unidades de codificación máximas. La profundidad codificada de cada unidad de codificación máxima es una profundidad que presenta el mínimo error de codificación en cada unidad de codificación máxima. En la codificación de cada unidad de codificación máxima, los datos de imagen se codifican basándose en por lo menos una unidad de datos obtenida mediante la división jerárquica de cada unidad de codificación máxima mencionada, de acuerdo con profundidades.

De acuerdo con la información sobre la profundidad codificada y el modo de codificación, la unidad de codificación máxima se puede dividir en unidades de codificación que tienen una estructura en árbol. Cada una de las unidades de codificación que presenta la estructura en árbol se determina como unidad de codificación correspondiente a una profundidad codificada, y se codifica de manera óptima para dar salida al mínimo error de codificación. Por consiguiente, la eficiencia de codificación y de decodificación de una imagen se puede mejorar decodificando cada dato de imagen codificado de las unidades de codificación después de determinar por lo menos una profundidad codificada, de acuerdo con unidades de codificación.

En la operación 1330, los datos de imagen de cada unidad de codificación máxima se decodifican basándose en la información de codificación sobre la profundidad codificada y el modo de codificación de acuerdo con las unidades de codificación máximas. Los datos de imagen decodificados se pueden reproducir por medio de un aparato de reproducción, se pueden almacenar en un soporte de almacenamiento, o se pueden transmitir a través de una red.

La figura 16 es un diagrama de bloques de un aparato de codificación de vídeo 1400 con respecto a una predicción inter que hace uso de particiones divididas en concordancia con relaciones arbitrarias, según otra forma de realización ejemplificativa.

El aparato de codificación de vídeo 1400 incluye un divisor de unidades de codificación máximas 1410, un codificador 1420, y una unidad de salida 1430.

El divisor de unidades de codificación máximas 1410 puede dividir datos de vídeo en una unidad de codificación máxima. A los datos de vídeo máximos divididos en la unidad de codificación máxima se les da salida hacia la unidad de salida 1430. La unidad de codificación máxima se puede establecer previamente en unidades de datos, tales como una secuencia de cuadros, un cuadro, una franja, una unidad de codificación, etcétera.

Los datos de vídeo máximos se pueden establecer de manera selectiva como por lo menos uno de bloques que presentan tamaños respectivos de 16x16, 32x32, 64x64, 128x128, y 256x256.

15

25

35

45

55

65 E13167742

18-03-2015

El codificador 1420 codifica los datos de vídeo de la unidad de codificación máxima dividida por el divisor de unidades de codificación máximas 1410. El codificador 1420 codifica los datos de vídeo para por lo menos una región dividida de la unidad de codificación máxima basándose en unidades de codificación más profundas de estructuras jerárquicas. Durante una operación de codificación de las unidades de codificación más profundas, se lleva a cabo una predicción inter con el fin de buscar una región similar mediante el uso de particiones incluidas en las unidades de codificación más profundas y estimar información de movimiento de las particiones.

La predicción inter puede usar particiones que se obtienen mediante la división de una unidad de codificación de acuerdo con relaciones arbitrarias. Los ejemplos de la unidad de predicción y las particiones mostradas en las figuras 3 a 13 incluyen particiones con tamaños de 2Nx2N, 2NxN, Nx2N, y NxN divididas a partir de una unidad de codificación que tiene un tamaño de 2Nx2N. el codificador 1420 puede llevar a cabo la predicción inter de acuerdo con tipos de partición que incluyen particiones divididas según relaciones arbitrarias o según relaciones asimétricas, así como particiones obtenidas mediante la división de la anchura o la altura de la unidad de codificación a una relación de 1:1.

Por ejemplo, las particiones obtenidas mediante la división de la unidad de codificación según relaciones arbitrarias se pueden obtener dividiendo la anchura o la altura de la unidad de codificación a una relación de 1:3 ó 3:1. Las particiones se pueden dividir con diversas relaciones arbitrarias, tales como 1:2, 2:1, 1:3, 3:1, 2:3, 3:2, 1:4, 4:1, etcétera.

Los tipos de partición pueden incluir particiones que se obtienen por la división asimétrica de la unidad de codificación así como particiones obtenidas al dividir las unidades de codificación de acuerdo con relaciones arbitrarias. Los tipos de partición para la predicción inter de la unidad de codificación no se pueden limitar a la inclusión de particiones divididas en una dirección definida de acuerdo con relaciones arbitrarias y pueden incluir particiones que tengan formas arbitrarias.

El codificador 1420 puede determinar de manera selectiva si lleva a cabo la predicción inter usando las particiones obtenidas por la división de la unidad de codificación de acuerdo con relaciones arbitrarias. En un flujo continuo de bits se puede codificar por separado y se puede incluir información que indica si llevar a cabo la predicción inter usando las particiones obtenidas al dividir la unidad de codificación de acuerdo con relaciones arbitrarias.

El codificador 1420 codifica los datos de vídeo de la unidad de codificación máxima de acuerdo con regiones divididas sobre la base de las unidades de codificación más profundas según las estructuras jerárquicas, selecciona resultados de codificación de acuerdo con profundidades, y selecciona una profundidad que tiene la eficiencia de codificación más alta. La profundidad seleccionada es una profundidad de codificación para una región dividida de una unidad de codificación máxima correspondiente. La información referente a la profundidad de codificación se codifica como resultado de codificar una unidad de codificación correspondiente. La profundidad de codificación para por lo menos una región dividida dentro de la unidad de codificación máxima se determina de manera independiente, y por lo tanto se puede determinar por lo menos una profundidad de codificación para una unidad de codificación máxima individual.

La unidad de salida 1430 da salida a un flujo continuo de bits que incluye información referente a los datos de vídeo codificados correspondientes a profundidades de codificación de acuerdo con unidades de codificación máximas y regiones divididas, las profundidades de codificación, y modos de codificación. La unidad de salida 1430 puede dar salida al flujo continuo de bits que incluye información referente a si los tipos de partición para la predicción inter incluyen las particiones obtenidas al dividir la unidad de codificación de acuerdo con relaciones arbitrarias. La información referente a si los tipos de partición para la predicción inter incluyen las particiones obtenidas al dividir la unidad de codificación de acuerdo con relaciones arbitrarias se puede establecer en concordancia con unidades de datos, tales como una secuencia de cuadros, una franja, una unidad de codificación, etcétera, y se puede incluir en un conjunto de parámetros de secuencia del flujo continuo de bits, un encabezamiento de franja, e información de codificación en concordancia con unidades de codificación.

La unidad de codificación puede grabar una cantidad de datos bastante mayor que la correspondiente de un macrobloque dado, y por lo tanto una única unidad de codificación puede incluir regiones con diferentes características de imagen. Para llevar a cabo una codificación por predicción de la unidad de codificación, es preferible dividir la unidad de codificación en regiones según características de la imagen y generar particiones para codificar por predicción la unidad de codificación recopilando regiones vecinas que tienen las mismas características de imagen que una partición.

Aunque los datos de vídeo se pueden dividir en regiones con diferentes características de la imagen con respecto a un centro de la unidad de codificación, cuanto mayor sea el tamaño de la unidad de codificación, mayor será la posibilidad de que un límite entre regiones diferenciadas sea un lado cualquiera, izquierda, derecha, arriba o abajo. Si se usa solamente las particiones que se obtienen al dividir la anchura y la altura de la unidad de codificación con la relación de 1:1, para llevar a cabo de manera precisa la codificación por predicción sobre la unidad de codificación en la cual el límite entre regiones diferenciadas es un lado, una unidad de codificación actual se debe dividir en una unidad de codificación de una profundidad inferior con el fin de generar particiones pequeñas que incluyen una

15

25

35

45

55

65 E13167742

18-03-2015

región independiente individual.

No obstante, si la predicción inter se lleva a cabo usando las particiones divididas de acuerdo con relaciones arbitrarias, como el aparato de codificación de vídeo 1400 según la presente forma de realización, la predicción inter se realiza usando las particiones que se dividen en un lado con una profundidad actual sin tener que dividir adicionalmente una unidad de codificación actual más profunda en profundidades inferiores. Por lo tanto, si las particiones de la unidad de codificación incluyen las particiones de acuerdo con relaciones arbitrarias o particiones que tienen formas arbitrarias y también las particiones obtenidas al dividir la anchura o altura de la unidad de codificación con la relación de 1:1, se puede realizar una codificación por predicción más eficiente y precisa sobre una unidad de codificación de tamaño grande.

Además, la codificación por predicción que usa las particiones obtenidas al dividir la unidad de codificación de acuerdo con relaciones arbitrarias o las particiones que tienen formas arbitrarias se puede llevar a cabo de manera selectiva de acuerdo con el rendimiento del hardware de un codificador/decodificador de vídeo, los requisitos del usuario para recibir un servicio de codificación/decodificación de vídeo, y un entorno de transmisión de un flujo continuo de bits en relación con vídeo codificado.

La figura 17 es un diagrama de bloques de un aparato de decodificación de vídeo 1500 con respecto a una predicción inter que hace uso de particiones divididas de acuerdo con relaciones arbitrarias, según otra forma de realización ejemplificativa.

En referencia a la figura 17, el aparato de decodificación de vídeo 1500 incluye un analizador sintáctico 1510, un extractor 1520, y un decodificador 1530. El analizador sintáctico 1510 recibe un flujo continuo de bits referente a vídeo codificado y analiza sintácticamente símbolos del flujo continuo de bits recibido. El extractor 1520 extrae datos de vídeo codificados de acuerdo con unidades de codificación máximas e información referente a profundidades de codificación y modos de codificación de acuerdo con unidades de codificación máximas, a partir del flujo continuo de bits analizado sintácticamente.

El extractor 1520 puede extraer además información referente a si un tipo de partición para la predicción inter incluye particiones obtenidas al dividir una unidad de codificación de acuerdo con relaciones arbitrarias, a partir del flujo continuo de bits. La información referente a si el tipo de partición para la predicción inter incluye particiones obtenidas al dividir la unidad de codificación de acuerdo con relaciones arbitrarias se puede extraer a partir de un conjunto de parámetros de secuencia del flujo continuo de bits, un encabezamiento de franja, información de codificación para unidades de codificación, etcétera.

El decodificador 1530 recibe los datos de vídeo y la información de codificación extraídos desde el extractor 1520 y decodifica datos de vídeo basándose en la información de codificación. Más específicamente, el decodificador 1530 decodifica los datos de vídeo para una unidad de codificación de por lo menos una profundidad de codificación de acuerdo con unidades de codificación máximas sobre la base de la información referente a las profundidades de codificación y modos de codificación de acuerdo con las unidades de codificación máximas.

En particular, el decodificador 1530 puede llevar a cabo de manera selectiva una compensación de movimiento usando las particiones obtenidas al dividir la unidad de codificación de acuerdo con relaciones arbitrarias según la información referente a si el tipo de partición para la predicción inter incluye particiones obtenidas al dividir la unidad de codificación de acuerdo con relaciones arbitrarias extraídas por el extractor 1520.

Es decir, el decodificador 1530 puede llevar a cabo una compensación de movimiento usando un vector de movimiento predicho de acuerdo con un tipo de partición que incluye particiones obtenidas al dividir asimétricamente la unidad de codificación de acuerdo con relaciones arbitrarias, tales como 1:2, 2:1, 1:3, 3:1, 2:3, 3:2, 1:4, 4:1, etcétera, y también las particiones obtenidas al dividir la unidad de codificación con la relación arbitraria de 1:1. Además, el decodificador 1530 puede llevar a cabo una compensación de movimiento usando particiones que tienen formas arbitrarias así como particiones obtenidas al dividir la unidad de codificación en una dirección.

El decodificador 1530 puede llevar a cabo de manera selectiva una compensación de movimiento de acuerdo con particiones que tienen anchuras y alturas en relaciones arbitrarias determinando si la predicción inter se codifica con el uso de las particiones que se obtienen al dividir la unidad de codificación de acuerdo con relaciones arbitrarias, con lo cual se restablece de forma precisa la unidad de codificación diferenciada con respecto a regiones que tienen varias características de una imagen.

El aparato de decodificación de vídeo 1500 puede restablecer y reproducir los datos de vídeo decodificados de acuerdo con unidades de codificación máximas.

Por lo tanto, si se lleva a cabo una codificación/decodificación por predicción usando las particiones divididas de acuerdo con relaciones arbitrarias como el aparato de codificación de vídeo 1400 y el aparato de decodificación de vídeo 1500, la predicción inter se lleva a cabo usando las particiones que se dividen en un lado con una profundidad actual sin tener que dividir adicionalmente una unidad de codificación actual más profunda a profundidades

15

25

35

45

55

65 E13167742

18-03-2015

inferiores. Por lo tanto, las particiones divididas de acuerdo con relaciones arbitrarias se pueden usar para llevar a cabo de manera más eficiente y precisa una codificación o decodificación por predicción sobre una unidad de codificación de tamaño grande.

La figura 18 es un diagrama de particiones ejemplificativas que se obtienen al dividir una unidad de codificación de acuerdo con relaciones arbitrarias, según una forma de realización ejemplificativa.

En referencia a la figura 18, un tipo de partición para codificar por predicción la unidad de codificación puede incluir particiones obtenidas al dividir la altura y la anchura de la unidad de codificación de acuerdo con relaciones arbitrarias. Por ejemplo, un tipo de partición de una unidad de codificación 1600 con un tamaño de 64x64 puede incluir particiones obtenidas al dividir la unidad de codificación 1600 según una relación de 1:3 ó 3:1 y particiones con tamaños de 64x32, 32x64, y 32x32 obtenidas asimismo al dividir la altura o la anchura de la unidad de codificación 1600 de acuerdo con una relación de 1:1.

Más específicamente, un tipo de partición de la unidad de codificación 1600 con el tamaño de 64x64 puede incluir particiones 1610 y 1620 con tamaños, respectivamente, de 64x16 y 64x48, obtenidas al dividir la altura de la unidad de codificación 1600 según la relación de 1:3 ó 3:1. Además, el tipo de partición de la unidad de codificación 1600 que tiene el tamaño de 64x64 puede incluir particiones 1630 y 1640 con tamaños de 64x16 y 64x48 obtenidas al dividir la anchura de la unidad de codificación 1600 según la relación de 1:3 ó 3:1.

La figura 19 ilustra una sintaxis de un conjunto de parámetros de secuencia 1700 que incluye información referente a si un tipo de partición para predicción inter incluye particiones obtenidas al dividir una unidad de codificación de acuerdo con relaciones arbitrarias, según una forma de realización ejemplificativa.

En referencia a la figura 19, sequence_parameter_set es la sintaxis del conjunto de parámetros de secuencia 1700 para una franja de imagen actual. La información referente a si el tipo de partición para la predicción inter incluye particiones obtenidas al dividir la unidad de codificación de acuerdo con relaciones arbitrarias se inserta en la sintaxis del conjunto de parámetros de secuencia 1700 para la franja de imagen actual.

picture_width es la sintaxis de la anchura de una imagen de entrada. picture_height es la sintaxis de la altura de la imagen de entrada. max_coding_unit_size es la sintaxis del tamaño de una unidad de codificación máxima. max_coding_unit_depth es la sintaxis de la profundidad máxima.

Un ejemplo de un parámetro de secuencia puede definir información que indica si un nivel de unidad de codificación se decodifica de manera independiente, es decir, use_independent_cu_decode_flag, información que indica si el nivel de unidad de codificación se analiza sintácticamente de manera independiente, es decir, use_independent_cu_parse_flag, una disponibilidad de una operación de control de precisión de vectores de movimiento, es decir, use_mv_accuracy_control_flag, una disponibilidad de una operación de predicción intra con direccionalidad arbitraria, es decir, use_arbitrary_direction_intra_flag, una disponibilidad de una operación de codificación/decodificación por predicción con respecto al dominio de la frecuencia según una transformación de frecuencia, es decir, use_frequency_domain_prediction_flag, una disponibilidad de una operación de transformación rotacional, es decir, use_rotational_transform_flag, una disponibilidad de codificación/decodificación usando un mapa de relevancia por árboles, es decir, use_tree_significant_map_flag, una disponibilidad de una operación de codificación por predicción intra usando un parámetro múltiple, es decir, use_multi_parameter_intra_prediction_flag, una disponibilidad de una operación de codificación por predicción con vectores de movimiento mejorada, es decir, use_advanced_motion_vector_prediction_flag, una disponibilidad de una operación de filtrado de bucle adaptativo, es decir, use_adaptive_loop_filter_flag, una disponibilidad de una operación de filtrado de bucle adaptativo de una estructura de árbol cuaternario, es decir, use_quadtree_adaptive_loop_filter_flag, una disponibilidad de una operación de cuantificación usando un valor delta de un parámetro de cuantificación, es decir, use_delta_qp_flag, una disponibilidad de una operación de generación de ruido aleatorio, es decir, use_random_noise_generation_flag, e información que indica si se permiten particiones que tienen particiones arbitrarias para la predicción inter de una unidad de codificación, es decir, use_arbitrary_motion_partition_flag.

En particular, de acuerdo con la disponibilidad de la operación de filtrado de bucle adaptativo, es decir, use_adaptive_loop_filter_flag, y la disponibilidad de la operación de filtrado de bucle adaptativo de la estructura de árbol cuaternario, es decir, use_quadtree_adaptive_loop_filter_flag, el conjunto de parámetros de secuencia 1700 puede definir una longitud de filtro correspondiente al filtro de bucle adaptativo, es decir, alf_filter_length, un tipo de filtro de bucle adaptativo, es decir, alf_filter_type, un valor de referencia para la cuantificación de un coeficiente del filtro del bucle adaptativo, es decir, alf_qbits, y el número de componentes de color del filtrado de bucle adaptativo, es decir, alf_num_color.

La información referente a correlaciones entre una profundidad de una unidad de codificación, una herramienta de codificación, y un modo de funcionamiento que se usan en el aparato de codificación de vídeo 1400 y el aparato de decodificación de vídeo 1500 puede incluir un modo de funcionamiento mbp_mode[uiDepth] de predicción inter correspondiente a una profundidad uiDepth de una unidad de codificación y un modo de funcionamiento significant_map_mode[uiDepth] que indica un tipo de mapa relevante de entre mapas relevantes de árboles. Más

15

25

35

45

55

65 E13167742

18-03-2015

específicamente, el conjunto de parámetros de secuencia 1700 puede establecer las correlaciones entre la predicción inter y un modo de funcionamiento correspondiente de acuerdo con la profundidad de la unidad de codificación o las correlaciones entre codificación/decodificación que usa el mapa significativo de árboles y un modo de funcionamiento correspondiente.

El conjunto de parámetros de secuencia 1700 también puede establecer una profundidad de bits de una muestra de entrada input_sample_bit_depth y una profundidad de bits de una muestra interna internal_sample_bit_depth.

El aparato de decodificación de vídeo 1500 puede leer un parámetro de secuencia, extraer la información que indica si se permiten particiones que tienen particiones arbitrarias para la predicción inter de la unidad de codificación, es decir, use_arbitrary_motion_partition_flag, a partir del parámetro de secuencia leído, y determinar si llevar a cabo una predicción inter usando particiones obtenidas al dividir una unidad de codificación de una secuencia correspondiente de acuerdo con relaciones arbitrarias.

La información que indica si se permiten particiones que presentan particiones arbitrarias para la predicción inter de la unidad de codificación, es decir, use_arbitrary_motion_partition_flag, que es usada por el aparato de codificación de vídeo 1400 y el aparato de decodificación de vídeo 1500, no se limita al conjunto de parámetros de secuencia 1700 de la figura 22, y se puede codificar/decodificar en unidades de una unidad de codificación máxima, una franja, un cuadro, una representación visual (picture), un GOP, etcétera.

Si la información que indica si se permiten particiones que presentan particiones arbitrarias para la predicción inter de la unidad de codificación, es decir, use_arbitrary_motion_partition_flag, y tiene un valor de verdadero en un encabezamiento de franja, la predicción inter se lleva a cabo usando particiones obtenidas al dividir la unidad de codificación de acuerdo con relaciones arbitrarias en una franja correspondiente. Si la información tiene un valor de falso, la predicción inter se lleva a cabo usando particiones obtenidas al dividir la anchura o la altura de la unidad de codificación de acuerdo con una relación de 1:1 en la franja correspondiente.

La figura 20 es un diagrama de flujo que ilustra un método de codificación de vídeo con respecto a una predicción inter que usa particiones divididas de acuerdo con relaciones arbitrarias, según otra forma de realización ejemplificativa.

En referencia a la figura 20, en la operación 1810, datos de vídeo se dividen en una unidad de codificación máxima.

En la operación 1820, los datos de vídeo de la unidad de codificación máxima se codifican sobre la base de unidades de codificación más profundas de estructuras jerárquicas de acuerdo con por lo menos una región dividida de la unidad de codificación máxima, y se determina una profundidad de codificación con la cual se va a dar salida a un resultado de codificación. La predicción inter puede usar de forma selectiva particiones obtenidas al dividir una unidad de codificación de acuerdo con relaciones arbitrarias. El hecho de llevar a cabo o no la predicción inter usando las particiones obtenidas mediante la división de la unidad de codificación de acuerdo con relaciones arbitrarias se puede establecer en concordancia con unidades de datos, tales como una secuencia de cuadros, un cuadro, una franja, una unidad de codificación, etcétera.

En la operación 1830, se da salida a un flujo continuo de bits que incluye los datos de vídeo codificados correspondientes a profundidades de codificación para regiones divididas, de acuerdo con unidades de codificación máximas, e información de codificación referente a la profundidad de codificación y modos de codificación. La información que indica si la predicción inter se lleva a cabo usando las particiones obtenidas al dividir la unidad de codificación de acuerdo con relaciones arbitrarias se puede codificar e insertar en un flujo continuo de bits, y a continuación se puede dar salida al flujo continuo de bits.

La figura 21 es un diagrama de flujo que ilustra un método de decodificación de vídeo con respecto a una predicción inter que usa particiones divididas de acuerdo con relaciones arbitrarias, según otra forma de realización ejemplificativa.

En referencia a la figura 21, en la operación 1910, se recibe un flujo continuo de bits referente a datos de vídeo codificados y se analizan sintácticamente símbolos del flujo continuo de bits.

En la operación 1920, del flujo continuo de bits se extraen los datos de vídeo codificados, de acuerdo con unidades de codificación máximas, e información de codificación referente a profundidades de codificación y modos de codificación de acuerdo con unidades de codificación máximas. A partir del flujo continuo de bits se puede extraer información que indica si se lleva a cabo una predicción inter usando particiones obtenidas al dividir una unidad de codificación de acuerdo con relaciones arbitrarias. La información que indica si la predicción inter se lleva a cabo usando las particiones obtenidas al dividir la unidad de codificación de acuerdo con relaciones arbitrarias se puede extraer de un conjunto de parámetros de secuencia, un encabezamiento de franja, información de codificación para unidades de codificación, etcétera.

En la operación 1930, se puede llevar a cabo una decodificación que incluye compensación de movimiento usando

10

15

20

25

30

35

E13167742

18-03-2015

las particiones obtenidas al dividir la unidad de codificación de acuerdo con relaciones arbitrarias, para una unidad de codificación de por lo menos una profundidad de codificación, de acuerdo con unidades de codificación máximas, sobre la base de la información referente a las profundidades de codificación y modos de codificación de acuerdo con las unidades de codificación máximas. El hecho de llevar a cabo o no una decodificación que incluye compensación de movimiento usando las particiones obtenidas al dividir la unidad de codificación según relaciones arbitrarias se puede determinar de manera selectiva de acuerdo con información que indica si la predicción inter se lleva a cabo usando particiones obtenidas al dividir la unidad de codificación según relaciones arbitrarias extraídas del flujo continuo de bits.

Si se lleva a cabo una predicción inter usando las particiones divididas de acuerdo con relaciones arbitrarias, como el método de codificación de vídeo y el método de decodificación de vídeo de las presentes formas de realización, la predicción inter se lleva a cabo usando las particiones que se dividen en un lado con una profundidad actual sin tener que dividir adicionalmente una unidad de codificación actual más profunda en profundidades inferiores.

Además, se puede seleccionar si las particiones de la unidad de codificación incluyen las particiones divididas de acuerdo con relaciones arbitrarias o particiones que tienen formas arbitrarias así como las particiones obtenidas al dividir la anchura o altura de la unidad de codificación de acuerdo con la relación de 1:1, y, por lo tanto, el sistema convencional de codificación/decodificación que no presta soporte a particiones divididas de acuerdo con relaciones arbitrarias puede usar el método de codificación de vídeo y el método de decodificación de vídeo de las presentes formas de realización. Por tanto, se puede llevar a cabo de manera selectiva una codificación de predicción más eficiente y precisa de acuerdo con los métodos de codificación y de decodificación de vídeo de las presentes formas de realización.

Las formas de realización ejemplificativas se pueden escribir en forma de programas de ordenador y se pueden implementar en ordenadores digitales de uso general que ejecuten los programas usando un soporte de grabación legible por ordenador. Los ejemplos del soporte de grabación legible por ordenador incluyen soportes de almacenamiento magnético (por ejemplo, ROM, discos flexibles, discos duros, etcétera) y soportes de grabación óptica (por ejemplo, CD-ROMs, o DVDs). También se pueden implementar formas de realización ejemplificativas en forma de procesadores de ordenador y dispositivos de hardware.

Aunque la presente invención se ha mostrado y descrito particularmente en referencia a sus formas de realización ejemplificativas, aquellos con conocimientos habituales en la materia entenderán que, en la misma, se pueden aplicar varios cambios en cuanto a forma y detalles sin desviarse con respecto al alcance de la invención que definen las reivindicaciones adjuntas. Las formas de realización ejemplificativas deben considerarse únicamente en un sentido descriptivo y no con fines limitativos. Por lo tanto, el alcance de la invención se define no por la descripción detallada de la misma sino por las reivindicaciones adjuntas, y se considerará que todas las diferencias dentro de dicho alcance están incluidas en la presente invención.

Claims

REIVINDICACIONES

1. Método de decodificación de un vídeo, comprendiendo el método:

5 analizar sintácticamente información que indica si se usan particiones asimétricas de una unidad de codificación para una predicción inter, a partir del flujo continuo de bits recibido;

determinar por lo menos una unidad de codificación dividida jerárquicamente a partir de una unidad de codificación máxima usando información de división analizada sintácticamente a partir del flujo continuo de bits recibido;

cuando la información indica que las particiones asimétricas se usan para una predicción inter, determinar las particiones obtenidas a partir de una unidad de codificación de entre dicha por lo menos una unidad de codificación, usando un tipo de partición de la unidad de codificación, analizado sintácticamente a partir del flujo

15 continuo de bits recibido, que indica una de entre las particiones simétricas y las particiones asimétricas;

cuando la información indica que las particiones asimétricas no se usan para una predicción inter, determinar las particiones obtenidas a partir de la unidad de codificación usando el tipo de partición que indica las particiones simétricas; y

llevar a cabo una compensación de movimiento usando las particiones para la unidad de codificación,

caracterizado por que las particiones simétricas se dividen a partir de por lo menos una de entre una anchura y una altura de la unidad de codificación de acuerdo con una relación simétrica, y las particiones asimétricas se

25 dividen a partir de una de entre una anchura y una altura de la unidad de codificación de acuerdo con una relación asimétrica.
2. Método según la reivindicación 1, en el que el tipo de partición comprende unos tipos de partición simétrica 2Nx2N, 2NxN, Nx2N, y NxN que indican unidades de predicción simétricas obtenidas dividiendo por lo menos una de entre una altura y una anchura de la unidad de codificación de acuerdo con una relación de 1:1, y unos tipos de partición asimétrica 2NxnU, 2NxnD, nLx2N, nRx2N que indican unidades de predicción asimétricas obtenidas dividiendo una de entre una altura y una anchura de la unidad de codificación de acuerdo con una relación de 1:3 o

3:1.

35 3. Método según la reivindicación 1, en el que, cuando la información indica que los tipos de partición incluyen los tipos de partición asimétrica, el tipo de partición indica uno de entre 2Nx2N, 2NxN, Nx2N, NxN, 2NxnU, 2NxnD, nLx2N y nRx2N, y cuando la información indica que los tipos de partición no incluyen los tipos de partición asimétrica, el tipo de partición indica uno de entre 2Nx2N, 2NxN, Nx2N y NxN.
4. Aparato para decodificar un vídeo, comprendiendo el aparato:

un analizador sintáctico que analiza sintácticamente información que indica si se usan particiones asimétricas de una unidad de codificación para una predicción inter, a partir del flujo continuo de bits recibido; y

45 un decodificador que determina por lo menos una unidad de codificación dividida jerárquicamente a partir de una unidad de codificación máxima usando información de división analizada sintácticamente a partir del flujo continuo de bits recibido, determina las particiones obtenidas a partir de una unidad de codificación entre dicha por lo menos una unidad de codificación, y lleva a cabo una compensación de movimiento usando las particiones para la unidad de codificación,

caracterizado por que:

cuando la información indica que las particiones asimétricas se usan para la predicción inter, el decodificador determina las particiones obtenidas a partir de la unidad de codificación usando un tipo de partición de la unidad

55 de codificación, analizado sintácticamente a partir del flujo continuo de bits recibido, que indica una de entre las particiones simétricas y las particiones asimétricas,

cuando la información indica que las particiones asimétricas no se usan para la predicción inter, el decodificador determina las particiones obtenidas a partir de la unidad de codificación usando el tipo de partición que indica las particiones simétricas,

las particiones simétricas se dividen a partir de por lo menos una de entre una anchura y una altura de la unidad de codificación de acuerdo con una relación simétrica, y

65 las particiones asimétricas se dividen a partir de una de entre una anchura y una altura de la unidad de codificación de acuerdo con una relación asimétrica.

25