ES2613647T3

ES2613647T3 - Procedimiento y aparato de codificación de vídeo y procedimiento y aparato de decodificación de vídeo, basándose en estructura jerárquica de unidad de codificación

Info

Publication number: ES2613647T3
Application number: ES10825221.4T
Authority: ES
Inventors: Woo-Jin Han; Jung-Hye Min; Il-Koo Kim
Original assignee: Samsung Electronics Co Ltd
Current assignee: Samsung Electronics Co Ltd
Priority date: 2009-10-23
Filing date: 2010-10-22
Publication date: 2017-05-25
Anticipated expiration: 2030-10-22
Also published as: CY1118489T1; JP2013509080A; PL2489186T3; BR122015021751B1; CA2890991A1; CN104853189A; PL2838267T3; RU2012121176A; RU2559757C9; US20150023414A1; PT2940997T; EP2940996B1; JP2015144469A; RU2559757C2; JP2015144472A; BR122015021748B1; RU2013156612A; KR101457418B1; WO2011049396A2; PT2897364T

Abstract

Un aparato de decodificación de datos (1500) de vídeo, comprendiendo el aparato: un receptor (1510) que recibe y analiza un flujo de bits que comprende datos de vídeo codificados; un extractor (1520) que extrae, desde el flujo de bits, los datos de vídeo codificados, información acerca de un tamaño máximo de una unidad de codificación, información de división de una unidad de codificación, e información sobre una relación entre una profundidad de una unidad de codificación y un modo de cuantificación, en el que el modo de cuantificación indica si se ha de usar un delta de parámetro de cuantificación; y un decodificador (1530) que decodifica los datos de vídeo codificados realizando cuantificación inversa, en el que: una imagen se divide en una pluralidad de unidades de codificación máxima usando la información acerca de un tamaño máximo de una unidad de codificación, la unidad de codificación máxima se divide jerárquicamente en una o más unidades de codificación de profundidades que incluyen al menos una de una profundidad actual y una profundidad inferior de acuerdo con la información de división de la unidad de codificación, que comprende adicionalmente, para una unidad de codificación de la profundidad actual: el extractor determina adicionalmente si se ha de usar el delta del parámetro de cuantificación en la unidad de codificación de la profundidad actual, basándose en la información sobre dicha relación, cuando la información de división indica una división para la profundidad actual, la unidad de codificación de la profundidad actual se divide en cuatro unidades de codificación de la profundidad inferior, independientemente de las unidades de codificación vecinas, y cuando la información de división indica una no división para la profundidad actual, se determinan unidades de transformación desde la unidad de codificación de la profundidad actual, y el decodificador realiza cuantificación inversa en las unidades de transformación usando el resultado de la determinación de si se ha de usar el delta del parámetro de cuantificación en la unidad de codificación de la profundidad actual.

Description

5

10

15

20

25

30

35

40

45

DESCRIPCION

Procedimiento y aparato de codificacion de v^deo y procedimiento y aparato de decodificacion de v^deo, basandose en estructura jerarquica de unidad de codificacion

Campo tecnico

Los aparatos y procedimientos coherentes con las realizaciones ejemplares se refieren a codificacion y decodificacion de un video.

Antecedentes de la tecnica

A medida que se esta desarrollando y suministrando hardware para reproducir y almacenar contenido de video de alta resolucion o de alta calidad, aumenta una necesidad de un codec de video para codificar o decodificar eficazmente el contenido de video de alta resolucion o de alta calidad. En un codec de video de la tecnica relacionada, un video se codifica de acuerdo con un procedimiento de codificacion limitado basandose en un macrobloque que tiene un tamano predeterminado. Un ejemplo de la tecnica se muestra en el documento W02004/104930, que desvela un procedimiento de compresion de video hforido.

Divulgacion de la invencion

Problema tecnico

Una o mas realizaciones ejemplares proporcionan un procedimiento y aparato para codificar un video y un procedimiento y aparato para decodificar un video en un modo de operacion de una herramienta de codificacion que vana de acuerdo con un tamano de una unidad de codificacion con estructura jerarquica.

Solucion al problema

De acuerdo con un aspecto de una realizacion ejemplar, se proporciona un aparato para decodificar datos de video segun se revindica en el presente documento.

La invencion se expone en el conjunto de reivindicaciones adjuntas; los ejemplos adicionales denominados realizaciones ejemplares en la descripcion son ejemplos ilustrativos, no realizaciones reivindicadas en la presente solicitud.

Efectos ventajosos de la invencion

Un aparato de decodificacion de video de acuerdo con realizaciones ejemplares puede reconstruir la imagen original decodificando un flujo de bits recibido, basandose en la informacion con respecto a una relacion entre la profundidad de la unidad de codificacion, la herramienta de codificacion y el modo de operacion. Por consiguiente, el aparato de decodificacion de video de acuerdo con las realizaciones ejemplares puede decodificar una gran cantidad de datos de imagen, tal como una imagen de alta resolucion o de alta calidad.

Breve descripcion de los dibujos

Los anteriores y/u otros aspectos se haran mas evidentes describiendo en detalle realizaciones ejemplares con referencia a los dibujos adjuntos en los que:

La Figura 1 es un diagrama de bloques de un aparato de codificacion de video de acuerdo con una realizacion ejemplar;

La Figura 2 es un diagrama de bloques de un aparato de decodificacion de video de acuerdo con una realizacion ejemplar;

La Figura 3 es un diagrama para describir un concepto de unidades de codificacion de acuerdo con una realizacion ejemplar;

La Figura 4 es un diagrama de bloques de un codificador de imagen basandose en unidades de codificacion, de acuerdo con una realizacion ejemplar;

La Figura 5 es un diagrama de bloques de un decodificador de imagen basandose en unidades de codificacion, de acuerdo con una realizacion ejemplar;

La Figura 6 es un diagrama que ilustra unidades de codificacion mas profundas de acuerdo con las profundidades y particiones de acuerdo con una realizacion ejemplar;

La Figura 7 es un diagrama para describir una relacion entre una unidad de codificacion y unidades de transformacion, de acuerdo con una realizacion ejemplar;

5

10

15

20

25

30

35

40

45

50

La Figura 8 es un diagrama para describir informacion de codificacion de unidades de codificacion que corresponden a una profundidad codificada, de acuerdo con una realizacion ejemplar;

La Figura 9 es un diagrama de unidades de codificacion mas profundas de acuerdo con las profundidades, de acuerdo con una realizacion ejemplar;

Las Figuras 10 a 12 son diagramas para describir una relacion entre unidades de codificacion, unidades de prediccion y unidades de transformacion, de acuerdo con una o mas realizaciones ejemplares;

La Figura 13 es un diagrama para describir una relacion entre una unidad de codificacion, una unidad de prediccion o una particion y una unidad de transformacion, de acuerdo con la informacion de modo de codificacion de la Tabla 1 ejemplar a continuacion, de acuerdo con una realizacion ejemplar;

La Figura 14 es un diagrama de flujo que ilustra un procedimiento de codificacion de video de acuerdo con una realizacion ejemplar;

La Figura 15 es un diagrama de flujo que ilustra un procedimiento de decodificacion de video de acuerdo con una realizacion ejemplar;

La Figura 16 es un diagrama de bloques de un aparato de codificacion de video basandose en una herramienta de codificacion que considera el tamano de una unidad de codificacion, de acuerdo con una realizacion ejemplar;

La Figura 17 es un diagrama de bloques de un aparato de decodificacion de video basandose en una herramienta de codificacion que considera el tamano de una unidad de codificacion, de acuerdo con una realizacion ejemplar;

La Figura 18 es un diagrama para describir una relacion entre el tamano de una unidad de codificacion, una herramienta de codificacion y un modo de operacion, de acuerdo con una realizacion ejemplar;

La Figura 19 es un diagrama para describir una relacion entre una profundidad de una unidad de codificacion, una herramienta de codificacion y un modo de operacion, de acuerdo con una realizacion ejemplar;

La Figura 20 es un diagrama para describir una relacion entre una profundidad de una unidad de codificacion, una herramienta de codificacion y un modo de operacion, de acuerdo con una realizacion ejemplar;

La Figura 21 ilustra sintaxis de un conjunto de parametros de secuencia, en los que se inserta informacion con respecto a una relacion entre una profundidad de una unidad de codificacion, una herramienta de codificacion y un modo de operacion, de acuerdo con una realizacion ejemplar;

La Figura 22 es un diagrama de flujo que ilustra un procedimiento de codificacion de video basandose en una herramienta de codificacion que considera el tamano de una unidad de codificacion, de acuerdo con una realizacion ejemplar; y

La Figura 23 es un diagrama de flujo que ilustra un procedimiento de decodificacion de video basandose en una herramienta de codificacion que considera el tamano de una unidad de codificacion, de acuerdo con una realizacion ejemplar.

Modo para la invencion

En lo sucesivo, se describiran realizaciones ejemplares mas completamente con referencia a los dibujos adjuntos. Adicionalmente, expresiones tales como “al menos uno de”, cuando preceden una lista de elementos, modifican la lista entera de elementos y no modifican los elementos individuales de la lista. En las realizaciones ejemplares, “unidad” puede o puede no hacer referencia a una unidad de tamano, dependiendo de su contexto. Espedficamente, se describira la codificacion y decodificacion de video realizadas basandose en unidades de datos espacialmente jerarquicas de acuerdo con una o mas realizaciones ejemplares con referencia a las Figuras 1 a 15. Tambien, se describira la codificacion y decodificacion de video realizada en un modo de operacion de una herramienta de codificacion que vana de acuerdo con el tamano de una unidad de codificacion de acuerdo con una o mas realizaciones ejemplares con referencia a las Figuras 16 a 23.

En las siguientes realizaciones ejemplares, una “unidad de codificacion” hace referencia a una unidad de datos de codificacion en la que los datos de imagen se codifican en un lado del codificador o una unidad de datos codificados en la que se decodifican datos de imagen codificada en un lado del decodificador. Tambien, una “profundidad codificada” significa una profundidad en la que se codifica una unidad de codificacion. En lo sucesivo, una “imagen” puede indicar una imagen fija para un video o una imagen en movimiento, es decir, el propio video.

Un aparato y procedimiento para codificar un video y un aparato y procedimiento para decodificar un video de acuerdo con realizaciones ejemplares se describiran ahora con referencia a las Figuras 1 a 15.

La Figura 1 es un diagrama de bloques de un aparato 100 de codificacion de video, de acuerdo con una realizacion ejemplar. Haciendo referencia a la Figura 1, el aparato 100 de codificacion de video incluye un divisor 110 de unidad

5

10

15

20

25

30

35

40

45

50

55

de codificacion maxima, un determinador 120 de unidad de codificacion, y una unidad 130 de salida.

El divisor 110 de unidad de codificacion maxima puede dividir una instantanea actual de una imagen basandose en una unidad de codificacion maxima para la instantanea actual. Si la instantanea actual es mayor que la unidad de codificacion maxima, los datos de imagen de la instantanea actual pueden dividirse en al menos una unidad de codificacion maxima. La unidad de codificacion maxima de acuerdo con una realizacion ejemplar puede ser una unidad de datos que tiene un tamano de 32x32, 64x64, 128x128, 256x256, etc., en el que una forma de la unidad de datos es un cuadrado que tiene una anchura y altura en cuadrados de 2. Los datos de imagen pueden emitirse al determinador 120 de unidad de codificacion de acuerdo con la al menos una unidad de codificacion maxima.

Una unidad de codificacion de acuerdo con una realizacion ejemplar puede estar caracterizada por un tamano maximo y una profundidad. La profundidad indica un numero de veces que se divide espacialmente la unidad de codificacion desde la unidad de codificacion maxima, y a medida que la profundidad se hace profunda o aumenta, pueden dividirse unidades de codificacion mas profundas de acuerdo con las profundidades desde la unidad de codificacion maxima a una unidad de codificacion minima. Una profundidad de la unidad de codificacion maxima es una profundidad mas alta y una profundidad de la unidad de codificacion minima es una profundidad mas baja. Puesto que un tamano de una unidad de codificacion que corresponde a cada profundidad disminuye a medida que la profundidad de la unidad de codificacion maxima se hace profunda, una unidad de codificacion que corresponde a una profundidad superior puede incluir una pluralidad de unidades de codificacion que corresponden a profundidades inferiores.

Como se ha descrito anteriormente, los datos de imagen de la instantanea actual pueden dividirse en las unidades de codificacion maxima de acuerdo con un tamano maximo de la unidad de codificacion, y cada una de las unidades de codificacion maxima puede incluir unidades de codificacion mas profundas que se dividen de acuerdo con las profundidades. Puesto que la unidad de codificacion maxima de acuerdo con una realizacion ejemplar se divide de acuerdo con las profundidades, los datos de imagen de un dominio espacial incluidos en la unidad de codificacion maxima pueden clasificarse jerarquicamente de acuerdo con las profundidades.

Puede predeterminarse una profundidad maxima y un tamano maximo de una unidad de codificacion, que limita el numero total de veces que puede dividirse jerarquicamente una altura y una anchura de la unidad de codificacion maxima.

El determinador 120 de unidad de codificacion codifica al menos una region de division obtenida dividiendo una region de la unidad de codificacion maxima de acuerdo con las profundidades, y determina una profundidad para emitir unos datos de imagen codificada de acuerdo con la al menos una region de division. Es decir, el determinador 120 de unidad de codificacion determina una profundidad codificada codificando los datos de imagen en las unidades de codificacion mas profundas de acuerdo con las profundidades, basandose en la unidad de codificacion maxima de la instantanea actual, y seleccionando una profundidad que tiene un menor error de codificacion. Por lo tanto, se emiten los datos de imagen codificada de la unidad de codificacion que corresponden a la profundidad codificada determinada a la unidad 130 de salida. Tambien, las unidades de codificacion que corresponden a la profundidad codificada pueden considerarse como unidades de codificacion codificadas.

La profundidad codificada determinada y los datos de imagen codificada de acuerdo con la profundidad codificada determinada se emiten a la unidad 130 de salida.

Los datos de imagen en la unidad de codificacion maxima se codifican basandose en las unidades de codificacion mas profundas que corresponden a al menos una profundidad igual a o por debajo de la profundidad maxima, y los resultados de codificar los datos de imagen se comparan basandose en cada una de las unidades de codificacion mas profundas. Una profundidad que tiene el menor error de codificacion puede seleccionarse despues de comparar errores de codificacion de las unidades de codificacion mas profundas. Al menos una profundidad codificada puede seleccionarse para cada unidad de codificacion maxima.

El tamano de la unidad de codificacion maxima se divide a medida que una unidad de codificacion se divide jerarquicamente de acuerdo con las profundidades, y a medida que el numero de unidades de codificacion aumenta. Tambien, incluso si las unidades de codificacion corresponden a la misma profundidad en una unidad de codificacion maxima, se determina si dividir cada una de las unidades de codificacion que corresponden a la misma profundidad a una profundidad inferior midiendo un error de codificacion de los datos de imagen de cada unidad de codificacion, por separado. Por consiguiente, incluso cuando se incluyen datos de imagen en una unidad de codificacion maxima, los datos de imagen se dividen en regiones de acuerdo con las profundidades y los errores de codificacion pueden diferenciarse de acuerdo con regiones en una unidad de codificacion maxima, y por lo tanto las profundidades codificadas puede diferenciarse de acuerdo con regiones en los datos de imagen. Por lo tanto, una o mas profundidades codificadas pueden determinarse en una unidad de codificacion maxima, y los datos de imagen de la unidad de codificacion maxima pueden dividirse de acuerdo con unidades de codificacion de al menos una profundidad codificada.

Por consiguiente, el determinador 120 de unidad de codificacion puede determinar unidades de codificacion que tienen una estructura de arbol incluida en la unidad de codificacion maxima. Las unidades de codificacion que tienen

5

10

15

20

25

30

35

40

45

50

55

una estructura de arbol de acuerdo con una realizacion ejemplar incluyen unidades de codificacion que corresponden a una profundidad determinada para que sea la profundidad codificada, de entre unidades de codificacion mas profundas incluidas en la unidad de codificacion maxima. Una unidad de codificacion de una profundidad codificada puede determinarse jerarquicamente de acuerdo con las profundidades en la misma region de la unidad de codificacion maxima, y puede determinarse independientemente en diferentes regiones. De manera similar, una profundidad codificada en una region actual puede determinarse independientemente a partir de una profundidad codificada en otra region.

Una profundidad maxima de acuerdo con una realizacion ejemplar es un mdice relacionado con un numero de veces de division desde una unidad de codificacion maxima a una unidad de codificacion minima. Una primera profundidad maxima de acuerdo con una realizacion ejemplar puede indicar un numero total de veces de division desde la unidad de codificacion maxima a la unidad de codificacion minima. Una segunda profundidad maxima de acuerdo con una realizacion ejemplar puede indicar un numero total de niveles de profundidad desde la unidad de codificacion maxima a la unidad de codificacion minima. Por ejemplo, cuando una profundidad de la unidad de codificacion maxima es 0, una profundidad de una unidad de codificacion, en la que la unidad de codificacion maxima se divide una vez, puede establecerse a 1, y una profundidad de una unidad de codificacion, en la que la unidad de codificacion maxima se divide dos veces, puede establecerse a 2. En este punto, si la unidad de codificacion minima es una unidad de codificacion en la que la unidad de codificacion maxima se divide cuatro veces, existen 5 niveles de profundidad de profundidades 0, 1, 2, 3 y 4. Por lo tanto, la primera profundidad maxima puede establecerse a 4 y la segunda profundidad maxima puede establecerse a 5.

La codificacion de prediccion y transformacion pueden realizarse de acuerdo con la unidad de codificacion maxima. La codificacion de prediccion y la transformacion se realizan tambien basandose en las unidades de codificacion mas profundas de acuerdo con una profundidad igual a o profundidades menores que la profundidad maxima, basandose en la unidad de codificacion maxima. La transformacion puede realizarse de acuerdo con un procedimiento de transformacion ortogonal o transformacion de numeros enteros.

Puesto que el numero de unidades de codificacion mas profundas aumenta cada vez que la unidad de codificacion maxima se divide de acuerdo con las profundidades, se realiza la codificacion tal como la codificacion de prediccion y la transformacion en todas las unidades de codificacion mas profundas generadas a medida que la profundidad se hace profunda. Por conveniencia de descripcion, la codificacion de prediccion y la transformacion se describiran en lo sucesivo basandose en una unidad de codificacion de una profundidad actual, en una unidad de codificacion maxima.

El aparato 100 de codificacion de video puede seleccionar de manera variable al menos uno de un tamano y una forma de una unidad de datos para codificar los datos de imagen. Para codificar los datos de imagen, pueden realizarse las operaciones, tales como codificacion de prediccion, transformacion y codificacion por entropfa, y en este momento, la misma unidad de datos puede usarse para todas las operaciones o pueden usarse diferentes unidades de datos para cada operacion.

Por ejemplo, el aparato 100 de codificacion de video puede seleccionar una unidad de codificacion para codificar los datos de imagen y una unidad de datos diferente de la unidad de codificacion para realizar la codificacion de prediccion en los datos de imagen en la unidad de codificacion.

Para realizar codificacion de prediccion en la unidad de codificacion maxima, la codificacion de prediccion puede realizarse basandose en una unidad de codificacion que corresponde a una profundidad codificada, es decir, basandose en una unidad de codificacion que ya no se divide en unidades de codificacion que corresponden a una profundidad inferior. En lo sucesivo, la unidad de codificacion que ya no se divide se hace una unidad base para codificacion de prediccion que se denominara como una unidad de prediccion. Una particion obtenida dividiendo la unidad de prediccion puede incluir una unidad de prediccion o una unidad de datos obtenida dividiendo al menos una de una altura y una anchura de la unidad de prediccion.

Por ejemplo, cuando una unidad de codificacion de 2Nx2N (donde N es un numero entero positivo) ya no se divide y se hace una unidad de prediccion de 2Nx2N, un tamano de una particion puede ser 2Nx2N, 2NxN, Nx2N, o NxN. Ejemplos de un tipo de particion incluyen particiones simetricas que se obtienen dividiendo simetricamente al menos una de una altura y una anchura de la unidad de prediccion, las particiones obtenidas dividiendo asimetricamente la altura o la anchura de la unidad de prediccion (tales como 1:n o n:1), particiones que se obtienen dividiendo geometricamente la unidad de prediccion, y particiones que tienen formas arbitrarias.

Un modo de prediccion de la unidad de prediccion puede ser al menos uno de un modo intra, un modo inter, y un modo de salto. Por ejemplo, el modo intra o el modo inter pueden realizarse en la particion de 2Nx2N, 2NxN, Nx2N, o NxN. En este caso, el modo de salto puede realizarse unicamente en la particion de 2Nx2N. La codificacion se realiza independientemente en una unidad de prediccion en una unidad de codificacion, seleccionando de esta manera un modo de prediccion que tiene un menor error de codificacion.

El aparato 100 de codificacion de video puede realizar tambien la transformacion en los datos de imagen en una unidad de codificacion no basandose en la unidad de codificacion para codificar los datos de imagen y basandose en

5

10

15

20

25

30

35

40

45

50

55

una unidad de datos que es diferente de la unidad de codificacion.

Para realizar la transformacion en la unidad de codificacion, la transformacion puede realizarse basandose en una unidad de datos que tiene un tamano menor que o igual a la unidad de codificacion. Por ejemplo, la unidad de datos para la transformacion puede incluir una unidad de datos para un modo intra y una unidad de datos para un modo inter.

Una unidad de datos usada como una base de la transformacion se denominara en lo sucesivo como una unidad de transformacion. Puede establecerse tambien una profundidad de transformacion que indica un numero de veces de division para alcanzar la unidad de transformacion dividiendo la altura y la anchura de la unidad de codificacion en la unidad de transformacion. Por ejemplo, en una unidad de codificacion actual de 2Nx2N, una profundidad de transformacion puede ser 0 cuando el tamano de una unidad de transformacion es tambien 2Nx2N, puede ser 1 cuando cada una de la altura y anchura de la unidad de codificacion actual se divide en dos partes iguales, dividida totalmente en 4 unidades de transformacion, y el tamano de la unidad de transformacion es por lo tanto NxN, y puede ser 2 cuando cada una de la altura y anchura de la unidad de codificacion actual se divide en cuatro partes iguales, dividida totalmente en 4A2 unidades de transformacion y el tamano de la unidad de transformacion es por lo tanto N/2xN/2. Por ejemplo, la unidad de transformacion puede establecerse de acuerdo con una estructura de arbol jerarquico, en la que una unidad de transformacion de una profundidad de transformacion superior se divide en cuatro unidades de transformacion de una profundidad de transformacion inferior de acuerdo con caractensticas jerarquicas de una profundidad de transformacion.

De manera similar a la unidad de codificacion, la unidad de transformacion en la unidad de codificacion puede dividirse recursivamente en regiones con tamano mas pequeno, de modo que la unidad de transformacion puede determinarse independientemente en unidades de regiones. Por lo tanto, los datos residuales en la unidad de codificacion pueden dividirse de acuerdo con la transformacion que tiene la estructura de arbol de acuerdo con las profundidades de transformacion.

La informacion de codificacion de acuerdo con las unidades de codificacion que corresponden a una profundidad codificada usa informacion acerca de la profundidad codificada e informacion relacionada con codificacion de prediccion y transformacion. Por consiguiente, el determinador 120 de unidad de codificacion determina una profundidad codificada que tiene un menor error de codificacion y determina un tipo de particion en una unidad de prediccion, un modo de prediccion de acuerdo con unidades de prediccion, y un tamano de una unidad de transformacion para transformacion.

Las unidades de codificacion de acuerdo con una estructura de arbol en una unidad de codificacion maxima y un procedimiento de determinacion de una particion, de acuerdo con realizaciones ejemplares, se describiran en detalle a continuacion con referencia a las Figuras 3 a 12.

El determinador 120 de unidad de codificacion puede medir un error de codificacion de unidades de codificacion mas profundas de acuerdo con las profundidades usando optimizacion de tasa-distorsion basandose en multiplicadores de Lagrange.

La unidad 130 de salida emite los datos de imagen de la unidad de codificacion maxima, que se codifica basandose en la al menos una profundidad codificada determinada mediante el determinador 120 de unidad de codificacion, y la informacion acerca del modo de codificacion de acuerdo con la profundidad codificada, en flujos de bits.

Los datos de imagen codificada pueden obtenerse codificando datos residuales de una imagen.

La informacion acerca del modo de codificacion de acuerdo con la profundidad codificada puede incluir al menos una de informacion acerca de la profundidad codificada, el tipo de particion en la unidad de prediccion, el modo de prediccion, y el tamano de la unidad de transformacion.

La informacion acerca de la profundidad codificada puede definirse usando informacion de division de acuerdo con las profundidades, que indica si se realiza codificacion en unidades de codificacion de una profundidad inferior en lugar de en una profundidad actual. Si la profundidad actual de la unidad de codificacion actual es la profundidad codificada, los datos de imagen en la unidad de codificacion actual se codifican y emiten. En este caso, la informacion de division puede definirse para no dividir la unidad de codificacion actual a una profundidad inferior. Como alternativa, si la profundidad actual de la unidad de codificacion actual no es la profundidad codificada, la codificacion se realiza en la unidad de codificacion de la profundidad inferior. En este caso, la informacion de division puede definirse para dividir la unidad de codificacion actual para obtener las unidades de codificacion de la profundidad inferior.

Si la profundidad actual no es la profundidad codificada, se realiza la codificacion en la unidad de codificacion que se divide en la unidad de codificacion de la profundidad inferior. En este caso, puesto que existe al menos una unidad de codificacion de la profundidad inferior en una unidad de codificacion de la profundidad actual, la codificacion se realiza repetitivamente en cada unidad de codificacion de la profundidad inferior, y por lo tanto la codificacion puede realizarse recursivamente para las unidades de codificacion que tienen la misma profundidad.

5

10

15

20

25

30

35

40

45

50

55

Puesto que las unidades de codificacion que tienen una estructura de arbol se determinan para una unidad de codificacion maxima, y la informacion acerca de al menos un modo de codificacion se determina para una unidad de codificacion de una profundidad codificada, la informacion acerca de al menos un modo de codificacion puede determinarse para una unidad de codificacion maxima. Tambien, una profundidad codificada de los datos de imagen de la unidad de codificacion maxima puede ser diferente de acuerdo con las localizaciones puesto que los datos de imagen se dividen jerarquicamente de acuerdo con las profundidades, y por lo tanto la informacion acerca de la profundidad codificada y el modo de codificacion pueden establecerse para los datos de imagen.

Por consiguiente, la unidad 130 de salida puede asignar informacion de codificacion acerca de una profundidad codificada correspondiente y un modo de codificacion a al menos una de la unidad de codificacion, la unidad de prediccion, y una unidad minima incluida en la unidad de codificacion maxima.

La unidad minima de acuerdo con una realizacion ejemplar es una unidad de datos rectangular obtenida dividiendo la unidad de codificacion minima de la profundidad mas baja por 4. Como alternativa, la unidad minima puede ser una unidad de datos rectangular maxima que puede incluirse en todas las unidades de codificacion, unidades de prediccion, unidades de particion, y unidades de transformacion incluidas en la unidad de codificacion maxima.

Por ejemplo, la informacion de codificacion emitida a traves de la unidad 130 de salida puede clasificarse en informacion de codificacion de acuerdo con unidades de codificacion, e informacion de codificacion de acuerdo con unidades de prediccion. La informacion de codificacion de acuerdo con las unidades de codificacion puede incluir la informacion acerca del modo de prediccion y el tamano de las particiones. La informacion de codificacion de acuerdo con las unidades de prediccion puede incluir informacion acerca de una direccion estimada de un modo inter, un mdice de imagen de referencia del modo inter, un vector de movimiento, un componente de crominancia de un modo intra, y un procedimiento de interpolacion del modo intra. Tambien, puede insertarse informacion acerca de un tamano maximo de la unidad de codificacion definido de acuerdo con las instantaneas, cortes, o GOP, e informacion acerca de una profundidad maxima en al menos uno de un Conjunto de Parametros de Secuencia SPS o un encabezamiento de un flujo de bits.

En el aparato 100 de codificacion de video, la unidad de codificacion mas profunda puede ser una unidad de codificacion obtenida dividiendo por dos al menos una de una altura y una anchura de una unidad de codificacion de una profundidad superior, que esta una capa por encima. Por ejemplo, cuando el tamano de la unidad de codificacion de la profundidad actual es 2Nx2N, el tamano de la unidad de codificacion de la profundidad inferior puede ser NxN. Tambien, la unidad de codificacion de la profundidad actual que tiene el tamano de 2Nx2N puede incluir un maximo de 4 unidades de codificacion de la profundidad inferior.

Por consiguiente, el aparato 100 de codificacion de video puede formar las unidades de codificacion que tienen la estructura de arbol determinando unidades de codificacion que tienen una forma optima y un tamano optimo para cada unidad de codificacion maxima, basandose en el tamano de la unidad de codificacion maxima y la profundidad maxima determinada considerando caractensticas de la instantanea actual. Tambien, puesto que la codificacion puede realizarse en cada unidad de codificacion maxima usando uno cualquiera de diversos modos de prediccion y transformaciones, puede determinarse un modo de codificacion optimo considerando caractensticas de la unidad de codificacion de diversos tamanos de imagen.

Por lo tanto, si una imagen que tiene alta resolucion o una gran cantidad de datos se codifica en un macrobloque de la tecnica relacionada, aumenta un numero de macrobloques por instantanea de manera excesiva. Por consiguiente, aumenta un numero de piezas de informacion comprimida generada para cada macrobloque, y por lo tanto es diffcil transmitir la informacion comprimida y la eficacia de compresion de datos disminuye. Sin embargo, usando el aparato 100 de codificacion de video de acuerdo con una realizacion ejemplar, la eficacia de compresion de imagen puede aumentarse puesto que una unidad de codificacion se ajusta mientras se consideran caractensticas de una imagen y se aumenta un tamano maximo de una unidad de codificacion mientras se considera un tamano de la imagen.

La Figura 2 es un diagrama de bloques de un aparato 200 de decodificacion de video, de acuerdo con una realizacion ejemplar. Haciendo referencia a la Figura 2, el aparato 200 de decodificacion de video incluye un receptor 210, un extractor 220 de datos de imagen e informacion de codificacion, y un decodificador 230 de datos de imagen. Las definiciones de diversos terminos, tales como una unidad de codificacion, una profundidad, una unidad de prediccion y una unidad de transformacion e informacion acerca de diversos modos de codificacion, para diversas operaciones del aparato 200 de decodificacion de video son similares a aquellas descritas anteriormente con referencia a la Figura 1.

El receptor 210 recibe y analiza un flujo de bits de un video codificado. El extractor 220 de datos de imagen e informacion de codificacion extrae datos de imagen codificada para cada unidad de codificacion desde el flujo de bits analizado, en el que las unidades de codificacion tienen una estructura de arbol de acuerdo con cada unidad de codificacion maxima, y emite los datos de imagen extrafdos al decodificador 230 de datos de imagen. El extractor 220 de datos de imagen e informacion de codificacion puede extraer informacion acerca de un tamano maximo de una unidad de codificacion de una instantanea actual desde un encabezamiento acerca de la instantanea actual o un SPS.

5

10

15

20

25

30

35

40

45

50

55

Tambien, el extractor 220 de datos de imagen e informacion de codificacion extrae informacion acerca de una profundidad codificada y un modo de codificacion para las unidades de codificacion que tienen una estructura de arbol de acuerdo con cada unidad de codificacion maxima, desde el flujo de bits analizado. La informacion extrafda acerca de la profundidad codificada y el modo de codificacion se emite al decodificador 230 de datos de imagen. Es decir, los datos de imagen en un flujo de bits se dividen en la unidad de codificacion maxima de modo que el decodificador 230 de datos de imagen decodifica los datos de imagen para cada unidad de codificacion maxima.

La informacion acerca de la profundidad codificada y el modo de codificacion de acuerdo con la unidad de codificacion maxima puede establecerse para informacion acerca de al menos una unidad de codificacion que corresponde a la profundidad codificada, y la informacion acerca de un modo de codificacion puede incluir informacion acerca de al menos uno de un tipo de particion de una unidad de codificacion correspondiente que corresponde a la profundidad codificada, un modo de prediccion, y un tamano de una unidad de transformacion. Tambien, dividir la informacion de acuerdo con profundidades puede extraerse como la informacion acerca de la profundidad codificada.

La informacion acerca de la profundidad codificada y el modo de codificacion de acuerdo con cada unidad de codificacion maxima extrafda mediante el extractor 220 de datos de imagen e informacion de codificacion es informacion acerca de una profundidad codificada y un modo de codificacion determinado para generar un error de codificacion mmimo cuando un codificador, tal como un aparato 100 de codificacion de video de acuerdo con una realizacion ejemplar, realiza repetitivamente codificacion para cada unidad de codificacion mas profunda basandose en las profundidades de acuerdo con cada unidad de codificacion maxima. Por consiguiente, el aparato 200 de decodificacion de video puede restaurar una imagen decodificando los datos de imagen de acuerdo con una profundidad codificada y un modo de codificacion que genera el error de codificacion mmimo.

Puesto que la informacion de codificacion acerca de la profundidad codificada y el modo de codificacion pueden asignarse a una unidad de datos predeterminada de entre una unidad de datos correspondiente, una unidad de prediccion, y una unidad minima, el extractor 220 de datos de imagen e informacion de codificacion puede extraer la informacion acerca de la profundidad codificada y el modo de codificacion de acuerdo con las unidades de datos predeterminadas. Las unidades de datos predeterminadas a las que se asigna la misma informacion acerca de la profundidad codificada y el modo de codificacion pueden ser las unidades de datos incluidas en la misma unidad de codificacion maxima.

El decodificador 230 de datos de imagen restaura la instantanea actual decodificando los datos de imagen en cada unidad de codificacion maxima basandose en la informacion acerca de la profundidad codificada y el modo de codificacion de acuerdo con las unidades de codificacion maxima. Por ejemplo, el decodificador 230 de datos de imagen puede decodificar los datos de imagen codificada basandose en la informacion extrafda acerca del tipo de particion, el modo de prediccion, y la unidad de transformacion para cada unidad de codificacion de entre las unidades de codificacion que tienen la estructura de arbol incluida en cada unidad de codificacion maxima. Un procedimiento de decodificacion puede incluir una prediccion que incluye intra prediccion y compensacion de movimiento, y una transformacion inversa. La transformacion inversa puede realizarse de acuerdo con un procedimiento de la transformacion ortogonal inversa o transformacion de numeros enteros inversa.

El decodificador 230 de datos de imagen puede realizar al menos una de intra prediccion y compensacion de movimiento de acuerdo con una particion y un modo de prediccion de cada unidad de codificacion, basandose en la informacion acerca del tipo de particion y el modo de prediccion de la unidad de prediccion de la unidad de codificacion de acuerdo con las profundidades codificadas.

Tambien, el decodificador 230 de datos de imagen puede realizar transformacion inversa de acuerdo con cada unidad de transformacion en la unidad de codificacion, basandose en la informacion acerca del tamano de la unidad de transformacion de la unidad de codificacion de acuerdo con las profundidades codificadas, para realizar la transformacion inversa de acuerdo con unidades de codificacion maxima.

El decodificador 230 de datos de imagen puede determinar al menos una profundidad codificada de una unidad de codificacion maxima actual usando informacion de division de acuerdo con las profundidades. Si la informacion de division indica que los datos de imagen ya no se dividen en la profundidad actual, la profundidad actual es una profundidad codificada. Por consiguiente, el decodificador 230 de datos de imagen puede decodificar datos codificados de al menos una unidad de codificacion que corresponde a cada profundidad codificada en la unidad de codificacion maxima actual usando al menos uno de la informacion acerca del tipo de particion de la unidad de prediccion, el modo de prediccion, y el tamano de la unidad de transformacion para cada unidad de codificacion que corresponde a la profundidad codificada, y emitir los datos de imagen de la unidad de codificacion maxima actual.

Por ejemplo, las unidades de datos que incluyen la informacion de codificacion que tiene la misma informacion de division pueden recogerse observando el conjunto de informacion de codificacion asignado para la unidad de datos predeterminada de entre la unidad de codificacion, la unidad de prediccion, y la unidad minima, y las unidades de datos recogidas pueden considerarse para que sean una unidad de datos a decodificar mediante el decodificador 230 de datos de imagen en el mismo modo de codificacion.

5

10

15

20

25

30

35

40

45

50

55

El aparato 200 de decodificacion de video puede obtener informacion acerca de al menos una unidad de codificacion que genera el error de codificacion mmimo cuando se realiza recursivamente codificacion para cada unidad de codificacion maxima, y puede usar la informacion para decodificar la instantanea actual. Es decir, pueden decodificarse las unidades de codificacion que tienen la estructura de arbol determinadas para que sean las unidades de codificacion optimas en cada unidad de codificacion maxima. Tambien, el tamano maximo de la unidad de codificacion puede determinarse considerando al menos una de la resolucion y una cantidad de datos de imagen.

Por consiguiente, incluso si los datos de imagen tienen alta resolucion y una gran cantidad de datos, los datos de imagen pueden decodificarse y restaurarse eficazmente usando un tamano de una unidad de codificacion y un modo de codificacion, que se determinan de manera adaptativa de acuerdo con caractensticas de los datos de imagen e informacion acerca de un modo de codificacion optimo recibido desde un codificador.

Un procedimiento de determinacion de unidades de codificacion que tienen una estructura de arbol, una unidad de prediccion, y una unidad de transformacion, de acuerdo con una o mas realizaciones ejemplares se describiran ahora con referencia a las Figuras 3 a 13.

La Figura 3 es un diagrama para describir un concepto de unidades de codificacion de acuerdo con una realizacion ejemplar. Un tamano de una unidad de codificacion puede expresarse en anchura x altura. Por ejemplo, el tamano de la unidad de codificacion puede ser 64x64, 32x32, 16x16, u 8x8. Una unidad de codificacion de 64x64 puede dividirse en particiones de 64x64, 64x32, 32x64, o 32x32, y una unidad de codificacion de 32x32 puede dividirse en particiones de 32x32, 32x16, 16x32, o 16x16, una unidad de codificacion de 16x16 puede dividirse en particiones de 16x16, 16x8, 8x16, u 8x8, y una unidad de codificacion de 8x8 puede dividirse en particiones de 8x8, 8x4, 4x8, o 4x4.

Haciendo referencia a la Figura 3, se proporciona de manera ejemplar primeros datos 310 de video con una resolucion de 1920x1080 y una unidad de codificacion con un tamano maximo de 64 y una profundidad maxima de 2. Adicionalmente, se proporciona de manera ejemplar segundos datos 320 de video con una resolucion de 1920x1080 y una unidad de codificacion con un tamano maximo de 64 y una profundidad de maxima de 3. Tambien, se proporciona de manera ejemplar terceros datos 330 de video con una resolucion de 352x288, y una unidad de codificacion con un tamano maximo de 16 y una profundidad maxima de 1. La profundidad maxima mostrada en la Figura 3 indica un numero total de divisiones desde una unidad de codificacion maxima a una unidad de decodificacion minima.

Si una resolucion es alta o una cantidad de datos es grande, un tamano maximo de una unidad de codificacion puede ser grande para aumentar la eficacia de codificacion y para reflejar con precision las caractensticas de una imagen. Por consiguiente, el tamano maximo de la unidad de codificacion de los primeros y segundos datos 310 y 320 de video que tienen la resolucion superior a los terceros datos 330 de video puede ser 64.

Puesto que la profundidad maxima de los primeros datos 310 de video es 2, las unidades 315 de codificacion de los primeros datos 310 de video pueden incluir una unidad de codificacion maxima que tiene un tamano de eje de longitud de 64, y unidades de codificacion que tienen tamanos de ejes de longitud de 32 y 16 puesto que las profundidades se hacen profundas en dos capas dividiendo la unidad de codificacion maxima dos veces. Mientras tanto, puesto que la profundidad maxima de los terceros datos 330 de video es 1, las unidades 335 de codificacion de los terceros datos 330 de video pueden incluir una unidad de codificacion maxima que tiene un tamano de eje de longitud de 16, y unidades de codificacion que tienen un tamano de eje de longitud de 8 puesto que las profundidades se hacen profundas en una capa dividiendo la unidad de codificacion maxima una vez.

Puesto que la profundidad maxima de los segundos datos 320 de video es 3, las unidades 325 de codificacion de los segundos datos 320 de video pueden incluir una unidad de codificacion maxima que tiene un tamano de eje de longitud de 64, y unidades de codificacion que tienen tamanos de ejes de longitud de 32, 16, y 8 puesto que las profundidades se hacen profundas a 3 capas dividiendo la unidad de codificacion maxima tres veces. A medida que una profundidad se hace profunda, puede expresarse con precision la informacion detallada.

La Figura 4 es un diagrama de bloques de un codificador 400 de imagen basandose en unidades de codificacion, de acuerdo con una realizacion ejemplar. El codificador 400 de imagen puede realizar operaciones de un determinador 120 de unidad de codificacion de un aparato 100 de codificacion de video de acuerdo con una realizacion ejemplar para codificar datos de imagen. Es decir, haciendo referencia a la Figura 4, un predictor 410 intra realiza intra prediccion en unidades de codificacion, de entre un fotograma 405 actual, en un modo intra, y un estimador 420 de movimiento y un compensador 425 de movimiento realizan estimacion inter y compensacion de movimiento en unidades de codificacion, de entre el fotograma 405 actual, en un modo inter usando el fotograma 405 actual y un fotograma 495 de referencia.

Los datos emitidos desde el predictor 410 intra, el estimador 420 de movimiento, y el compensador 425 de movimiento se emiten como un coeficiente de transformacion cuantificado a traves de un transformador 430 y un cuantificador 440. El coeficiente de transformacion cuantificado se restaura como datos en un dominio espacial a traves de un cuantificador 460 inverso y un transformador 470 inverso, y los datos restaurados en el dominio espacial se emiten como el fotograma 495 de referencia despues de que se post-procesan a traves de una unidad

5

10

15

20

25

30

35

40

45

50

55

480 de desbloqueo y una unidad 490 de filtrado en bucle. El coeficiente de transformacion cuantificado puede emitirse como un flujo de bits 455 a traves de un codificador 450 por entrc^a.

Para que se aplique el codificador 400 de imagen en el aparato 100 de codificacion de video, los elementos del codificador 400 de imagen, es decir, el predictor 410 intra, el estimador 420 de movimiento, el compensador 425 de movimiento, el transformador 430, el cuantificador 440, el codificador 450 por entropfa, el cuantificador 460 inverso, el transformador 470 inverso, la unidad 480 de desbloqueo, y la unidad 490 de filtrado en bucle realizan operaciones basandose en cada unidad de codificacion de entre las unidades de codificacion que tienen una estructura de arbol mientras consideran la profundidad maxima de cada unidad de codificacion maxima.

Espedficamente, el predictor 410 intra, el estimador 420 de movimiento, y el compensador 425 de movimiento determinan particiones y un modo de prediccion de cada unidad de codificacion de entre las unidades de codificacion que tienen una estructura de arbol mientras consideran un tamano maximo y una profundidad maxima de una unidad de codificacion maxima actual, y el transformador 430 determina el tamano de la unidad de transformacion en cada unidad de codificacion de entre las unidades de codificacion que tienen una estructura de arbol.

La Figura 5 es un diagrama de bloques de un decodificador 500 de imagen basandose en unidades de codificacion, de acuerdo con una realizacion ejemplar. Haciendo referencia a la Figura 5, un analizador 510 analiza datos de imagen codificada a decodificar e informacion acerca de la codificacion usada para decodificar desde un flujo de bits 505. Los datos de imagen codificada se emiten como datos cuantificados inversos a traves de un decodificador 520 por entropfa y un cuantificador 530 inverso, y los datos cuantificados inversos se restauran a datos de imagen en un dominio espacial a traves de un transformador 540 inverso.

Un predictor 550 intra realiza intra prediccion en unidades de codificacion en un modo intra con respecto a los datos de imagen en el dominio espacial, y un compensador 560 de movimiento realiza compensacion de movimiento en unidades de codificacion en un modo inter usando un fotograma 585 de referencia.

Los datos de imagen en el dominio espacial, que se pasan a traves del predictor 550 intra y del compensador 560 de movimiento, pueden emitirse como un fotograma 595 restaurado despues de post-procesarse a traves de una unidad 570 de desbloqueo y una unidad 580 de filtrado en bucle. Tambien, los datos de imagen que se post- procesan a traves de la unidad 570 de desbloqueo y la unidad 580 de filtrado en bucle pueden emitirse como el fotograma 585 de referencia.

Para decodificar los datos de imagen en un decodificador 230 de datos de imagen de un aparato 200 de decodificacion de video de acuerdo con una realizacion ejemplar, el decodificador 500 de imagen puede realizar operaciones que se realizan despues del analizador 510. Para que el decodificador 500 de imagen se aplique en el aparato 200 de decodificacion de video, los elementos del decodificador 500 de imagen, es decir, el analizador 510, el decodificador 520 por entropfa, el cuantificador 530 inverso, el transformador 540 inverso, el predictor 550 intra, el compensador 560 de movimiento, la unidad 570 de desbloqueo, y la unidad 580 de filtrado en bucle realizan operaciones basandose en unidades de codificacion que tienen una estructura de arbol para cada unidad de codificacion maxima.

Espedficamente, el predictor 550 intra y el compensador 560 de movimiento realizan operaciones basandose en particiones y un modo de prediccion para cada una de las unidades de codificacion que tienen una estructura de arbol, y el transformador 540 inverso realiza operaciones basandose en un tamano de una unidad de transformacion para cada unidad de codificacion.

La Figura 6 es un diagrama que ilustra unidades de codificacion mas profundas de acuerdo con las profundidades y particiones, de acuerdo con una realizacion ejemplar.

Un aparato 100 de codificacion de video y un aparato 200 de decodificacion de video de acuerdo con realizaciones ejemplares usan unidades de codificacion jerarquicas para considerar las caractensticas de una imagen. Una altura maxima, una anchura maxima y una profundidad maxima de unidades de codificacion pueden determinarse de manera adaptativa de acuerdo con las caractensticas de la imagen, o pueden establecerse de manera diferente por un usuario. Los tamanos de las unidades de codificacion mas profundas de acuerdo con las profundidades pueden determinarse de acuerdo con el tamano maximo predeterminado de la unidad de codificacion.

Haciendo referencia a la Figura 6, en una estructura 600 jerarquica de unidades de codificacion de acuerdo con una realizacion ejemplar, la altura maxima y la anchura maxima de las unidades de codificacion son cada una 64, y la profundidad maxima es 4. Puesto que una profundidad se hace profunda a lo largo de un eje vertical de la estructura 600 jerarquica, una altura y una anchura de una unidad de codificacion mas profunda se divide cada una. Tambien, una unidad de prediccion y las particiones, que son las bases para la codificacion de prediccion de cada unidad de codificacion mas profunda, se muestran a lo largo de un eje horizontal de la estructura 600 jerarquica.

Es decir, una primera unidad 610 de codificacion es una unidad de codificacion maxima en la estructura 600 jerarquica, en la que una profundidad es 0 y un tamano, es decir, una altura por anchura, es 64x64. La profundidad se hace profunda a lo largo del eje vertical, y existe una segunda unidad 620 de codificacion que tiene un tamano de

5

10

15

20

25

30

35

40

45

50

55

32x32 y una profundidad de 1, una tercera unidad 630 de codificacion que tiene un tamano de 16x16 y una profundidad de 2, una cuarta unidad 640 de codificacion que tiene un tamano de 8x8 y una profundidad de 3, y una quinta unidad 650 de codificacion que tiene un tamano de 4x4 y una profundidad de 4. La quinta unidad 650 de codificacion que tiene el tamano de 4x4 y la profundidad de 4 es una unidad de codificacion minima.

La unidad de prediccion y las particiones de una unidad de codificacion estan dispuestas a lo largo del eje horizontal de acuerdo con cada profundidad. Es decir, si la primera unidad 610 de codificacion que tiene el tamano de 64x64 y la profundidad de 0 es una unidad de prediccion, la unidad de prediccion puede dividirse en particiones incluidas en la primera unidad 610 de codificacion, es decir, una particion 610 que tiene un tamano de 64x64, particiones 612 que tienen un tamano de 64x32, particiones 614 que tienen un tamano de 32x64, o particiones 616 que tienen un tamano de 32x32.

De manera similar, una unidad de prediccion de la segunda unidad 620 de codificacion que tiene el tamano de 32x32 y la profundidad de 1 puede dividirse en particiones incluidas en la segunda unidad 620 de codificacion, es decir, una particion 620 que tiene un tamano de 32x32, particiones 622 que tienen un tamano de 32x16, particiones 624 que tienen un tamano de 16x32, y particiones 626 que tienen un tamano de 16x16.

De manera similar, una unidad de prediccion de la tercera unidad 630 de codificacion que tiene el tamano de 16x16 y la profundidad de 2 puede dividirse en particiones incluidas en la tercera unidad 630 de codificacion, es decir, una particion que tiene un tamano de 16x16 incluida en la tercera unidad 630 de codificacion, particiones 632 que tienen un tamano de 16x8, particiones 634 que tienen un tamano de 8x16, y particiones 636 que tienen un tamano de 8x8.

De manera similar, una unidad de prediccion de la cuarta unidad 640 de codificacion que tiene el tamano de 8x8 y la profundidad de 3 puede dividirse en particiones incluidas en la cuarta unidad 640 de codificacion, es decir, una particion que tiene un tamano de 8x8 incluida en la cuarta unidad 640 de codificacion, particiones 642 que tienen un tamano de 8x4, particiones 644 que tienen un tamano de 4x8, y particiones 646 que tienen un tamano de 4x4.

La quinta unidad 650 de codificacion que tiene el tamano de 4x4 y la profundidad de 4 es la unidad de codificacion minima y una unidad de codificacion de la profundidad mas baja. Una unidad de prediccion de la quinta unidad 650 de codificacion se asigna unicamente a una particion que tiene un tamano de 4x4.

Para determinar la al menos una profundidad codificada de las unidades de codificacion de la unidad 610 de codificacion maxima, un determinador 120 de unidad de codificacion del aparato 100 de codificacion de video realiza codificacion para unidades de codificacion que corresponden a cada profundidad incluida en la unidad 610 de codificacion maxima.

Un numero de unidades de codificacion mas profundas de acuerdo con las profundidades que incluyen datos en el mismo intervalo y el mismo tamano aumenta a medida que la profundidad se hace profunda. Por ejemplo, se usan cuatro unidades de codificacion que corresponden a una profundidad de 2 para cubrir datos que estan incluidos en una unidad de codificacion que corresponde a una profundidad de 1. Por consiguiente, para comparar resultados de codificacion de los mismos datos de acuerdo con las profundidades, cada una de la unidad de codificacion que corresponde a la profundidad de 1 y cuatro unidades de codificacion que corresponden a la profundidad de 2 se codifican.

Para realizar codificacion para una profundidad actual de entre las profundidades, puede seleccionarse un menor error de codificacion para la profundidad actual realizando codificacion para cada unidad de prediccion en las unidades de codificacion que corresponden a la profundidad actual, a lo largo del eje horizontal de la estructura 600 jerarquica. Como alternativa, el error de codificacion mmimo puede buscarse comparando los menores errores de codificacion de acuerdo con las profundidades, realizando codificacion para cada profundidad a medida que la profundidad se hace profunda a lo largo del eje vertical de la estructura 600 jerarquica. Puede seleccionarse una profundidad y una particion que tienen el error de codificacion mmimo en la primera unidad 610 de codificacion como la profundidad codificada y un tipo de particion de la primera unidad 610 de codificacion.

La Figura 7 es un diagrama para describir una relacion entre una unidad 710 de codificacion y unidades 720 de transformacion de acuerdo con una realizacion ejemplar.

Un aparato 100 o 200 de codificacion o decodificacion de video de acuerdo con realizaciones ejemplares codifica o decodifica una imagen de acuerdo con unidades de codificacion que tienen tamanos menores o iguales a una unidad de codificacion maxima para cada unidad de codificacion maxima. Los tamanos de las unidades de transformacion para transformacion durante la codificacion pueden seleccionarse basandose en unidades de datos que no son mayores que una unidad de codificacion correspondiente.

Por ejemplo, en el aparato 100 o 200 de codificacion o decodificacion de video, si un tamano de la unidad 710 de codificacion es 64x64, la transformacion puede realizarse usando las unidades 720 de transformacion que tienen un tamano de 32x32.

Tambien, los datos de la unidad 710 de codificacion que tiene el tamano de 64x64 pueden codificarse realizando la transformacion en cada una de las unidades de transformacion que tienen el tamano de 32x32, 16x16, 8x8, y 4x4,

5

10

15

20

25

30

35

40

45

50

55

que son menores que 64x64, de manera que puede seleccionarse una unidad de transformacion que tiene el menor error de codificacion.

La Figura 8 es un diagrama para describir informacion de codificacion de unidades de codificacion que corresponden a una profundidad codificada de acuerdo con una realizacion ejemplar. Haciendo referencia a la Figura 8, una unidad 130 de salida de un aparato 100 de codificacion de video de acuerdo con una realizacion ejemplar puede codificar y transmitir informacion 800 acerca de un tipo de particion, la informacion 810 acerca de un modo de prediccion, y la informacion 820 acerca de un tamano de una unidad de transformacion para cada unidad de codificacion que corresponde a una profundidad codificada, como informacion acerca de un modo de codificacion.

La informacion 800 acerca del tipo de particion es informacion acerca de una forma de una particion obtenida dividiendo una unidad de prediccion de una unidad de codificacion actual, en la que la particion es una unidad de datos para codificacion de prediccion de la unidad de codificacion actual. Por ejemplo, una unidad de codificacion actual CU_0 que tiene un tamano de 2Nx2N puede dividirse en una cualquiera de una particion 802 que tiene un tamano de 2Nx2N, una particion 804 que tiene un tamano de 2NxN, una particion 806 que tiene un tamano de Nx2N, y una particion 808 que tiene un tamano de NxN. En este punto, la informacion 800 acerca del tipo de particion se establece para indicar una de la particion 804 que tiene un tamano de 2NxN, la particion 806 que tiene un tamano de Nx2N, y la particion 808 que tiene un tamano de NxN.

La informacion 810 acerca del modo de prediccion indica un modo de prediccion de cada particion. Por ejemplo, la informacion 810 acerca del modo de prediccion puede indicar un modo de codificacion de prediccion realizada en una particion indicada mediante la informacion 800 acerca del tipo de particion, es decir, un modo 812 intra, un modo 814 inter, o un modo 816 de salto.

La informacion 820 acerca del tamano de una unidad de transformacion indica una unidad de transformacion para basarse cuando se realiza transformacion en una unidad de codificacion actual. Por ejemplo, la unidad de transformacion puede ser una primera unidad 822 de intra transformacion, una segunda unidad 824 de intra transformacion, una primera unidad 826 de inter transformacion, o una segunda unidad 828 de intra transformacion.

Un extractor 220 de datos de imagen e informacion de codificacion del aparato 200 de decodificacion de video de acuerdo con una realizacion ejemplar puede extraer y usar la informacion 800, 810, y 820 para decodificacion, de acuerdo con cada unidad de codificacion mas profunda.

La Figura 9 es un diagrama de unidades de codificacion mas profundas de acuerdo con las profundidades, de acuerdo con una realizacion ejemplar.

La informacion de division puede usarse para indicar un cambio de una profundidad. La informacion de division indica si una unidad de codificacion de una profundidad actual se divide unidades de codificacion de una profundidad inferior.

Haciendo referencia a la Figura 9, una unidad 910 para codificar por prediccion una unidad 900 de codificacion que tiene una profundidad de 0 y un tamano de 2N_0x2N_0 puede incluir particiones de un tipo 912 de particion que tiene un tamano de 2N_0x2N_0, un tipo 914 de particion que tiene un tamano de 2N_0xN_0, un tipo 916 de particion que tiene un tamano de N_0x2N_0, y un tipo 918 de particion que tiene un tamano de N_0xN_0. Aunque la Figura 9 ilustra unicamente los tipos 912 a 918 de particiones que se obtienen dividiendo simetricamente la unidad 910 de prediccion, se entiende que un tipo de particion no esta limitado a las mismas. Por ejemplo, de acuerdo con otra realizacion ejemplar, las particiones de la unidad 910 de prediccion pueden incluir particiones asimetricas, particiones que tienen una forma determinada y particiones que tienen una forma geometrica.

La codificacion de prediccion se realiza repetitivamente en una particion que tiene un tamano de 2N_0x2N_0, dos particiones que tienen un tamano de 2N_0xN_0, dos particiones que tienen un tamano de N_0x2N_0, y cuatro particiones que tienen un tamano de N_0xN_0, de acuerdo con cada tipo de particion. La codificacion de prediccion en un modo intra y en un modo inter puede realizarse en las particiones que tienen los tamanos de 2N_0x2N_0, N_0x2N_0, 2N_0xN_0, y N_0xN_0. La codificacion de prediccion en un modo de salto se realiza unicamente en la particion que tiene el tamano de 2N_0x2N_0.

Se comparan los errores de codificacion que incluyen la codificacion de prediccion en los tipos 912 a 918 de particiones, y se determina el menor error de codificacion entre los tipos de particion. Si un error de codificacion es el mas pequeno en uno de los tipos de particiones 912 a 916, la unidad 910 de prediccion puede no dividirse en una profundidad inferior.

Por ejemplo, si el error de codificacion es el mas pequeno en el tipo 918 de particion, se cambia una profundidad desde 0 a 1 para dividir el tipo 918 de particion en la operacion 920, y la codificacion se realiza repetitivamente en las unidades 930 de codificacion que tienen una profundidad de 2 y un tamano de N_0xN_0 para buscar un error de codificacion mmimo.

Una unidad 940 de prediccion para codificar por prediccion la unidad 930 de codificacion que tiene una profundidad de 1 y un tamano de 2N_1x2N_1 (=N_0xN_0) puede incluir particiones de un tipo 942 de particion que tiene un

5

10

15

20

25

30

35

40

45

50

55

tamano de 2N_1x2N_1, un tipo 944 de particion que tiene un tamano de 2N_1xN_1, un tipo 946 de particion que tiene un tamano de N_1x2N_1, y un tipo 948 de particion que tiene un tamano de N_1xN_1.

Como un ejemplo, si un error de codificacion es el mas pequeno en el tipo 948 de particion, se cambia una profundidad desde 1 a 2 para dividir el tipo 948 de particion en la operacion 950, y se realiza la codificacion repetitivamente en unidades 960 de codificacion, que tienen una profundidad de 2 y un tamano de N_2xN_2 para buscar un error de codificacion mmimo.

Cuando una profundidad maxima es d, las operaciones de division de acuerdo con cada profundidad pueden realizarse hasta cuando una profundidad se hace d-1, y la informacion de division puede codificarse como hasta cuando una profundidad es una de 0 a d-2. Por ejemplo, cuando se realiza codificacion hasta cuando la profundidad es d-1 despues de que se divide una unidad de codificacion que corresponde a una profundidad de d-2 en la operacion 970, una unidad 990 de prediccion para codificar por prediccion una unidad 980 de codificacion que tiene una profundidad de d-1 y un tamano de 2N_(d-1)x2N_(d-1) puede incluir particiones de un tipo 992 de particion que tienen un tamano de 2N_(d-1)x2N_(d-1), un tipo 994 de particion que tiene un tamano de 2N_(d-1)xN_(d-1), un tipo 996 de particion que tiene un tamano de N_(d-1)x2N_(d-1), y un tipo 998 de particion que tiene un tamano de N_(d- 1)xN_(d-1).

La codificacion de prediccion puede realizarse repetitivamente en una particion que tiene un tamano de 2N_(d- 1)x2N_(d-1), dos particiones que tienen un tamano de 2N_(d-1)xN_(d-1), dos particiones que tienen un tamano de N_(d-1)x2N_(d-1), cuatro particiones que tienen un tamano de N_(d-1)xN_(d-1) de entre los tipos 992 a 998 de particiones para buscar un tipo de particion que tiene un error de codificacion mmimo.

Incluso cuando el tipo 998 de particion tiene el error de codificacion mmimo, puesto que una profundidad maxima es d, una unidad de codificacion CU_(d-1) que tiene una profundidad de d-1 ya no se divide a una profundidad inferior. En este caso, una profundidad codificada para las unidades de codificacion de una unidad 900 de codificacion maxima actual se determina que es d-1 y un tipo de particion de la unidad 900 de codificacion maxima actual puede determinarse que es N_(d-1)xN_(d-1). Tambien, puesto que la profundidad maxima es d y una unidad 980 de codificacion minima que tiene una profundidad mas baja de d-1 ya no se divide a una profundidad inferior, no se establece la informacion de division para la unidad 980 de codificacion minima.

Una unidad 999 de datos puede ser una unidad minima para la unidad de codificacion maxima actual. Una unidad minima de acuerdo con una realizacion ejemplar puede ser una unidad de datos rectangular obtenida dividiendo una unidad 980 de codificacion minima por 4. Realizando la codificacion repetitivamente, un aparato 100 de codificacion de video de acuerdo con una realizacion ejemplar puede seleccionar una profundidad que tiene el menor error de codificacion comparando errores de codificacion de acuerdo con las profundidades de la unidad 900 de codificacion para determinar una profundidad codificada, y establecer un tipo de particion correspondiente y un modo de prediccion como un modo de codificacion de la profundidad codificada.

Como tal, los errores de codificacion mmimos de acuerdo con las profundidades se comparan en todas las profundidades de 1 a d, y puede determinarse una profundidad que tiene el menor error de codificacion como una profundidad codificada. La profundidad codificada, el tipo de particion de la unidad de prediccion, y el modo de prediccion pueden codificarse y transmitirse como informacion acerca de un modo de codificacion. Tambien, puesto que una unidad de codificacion se divide desde una profundidad de 0 a una profundidad codificada, la informacion de division de la profundidad codificada se establece a 0, y la informacion de division de las profundidades excluyendo la profundidad codificada se establece a 1.

Un extractor 220 de datos de imagen e informacion de codificacion de un aparato 200 de decodificacion de video de acuerdo con una realizacion ejemplar puede extraer y usar la informacion acerca de la profundidad codificada y la unidad de prediccion de la unidad 900 de codificacion para decodificar la particion 912. El aparato 200 de decodificacion de video puede determinar una profundidad, en la que la informacion de division es 0 como una profundidad codificada usando informacion de division de acuerdo con las profundidades, y usar la informacion acerca de un modo de codificacion de la correspondiente profundidad para decodificar.

Las Figuras 10 a 12 son diagramas para describir una relacion entre unidades 1010 de codificacion, unidades 1060 de prediccion, y unidades 1070 de transformacion, de acuerdo con una o mas realizaciones ejemplares.

Haciendo referencia a la Figura 10, las unidades 1010 de codificacion son unidades de codificacion que tienen una estructura de arbol, que corresponde a profundidades codificadas determinadas por un aparato 100 de codificacion de video de acuerdo con una realizacion ejemplar, en una unidad de codificacion maxima. Haciendo referencia a las Figuras 11 y 12, las unidades 1060 de prediccion son particiones de unidades de prediccion de cada una de las unidades 1010 de codificacion, y las unidades 1070 de transformacion son unidades de transformacion de cada una de las unidades 1010 de codificacion.

Cuando una profundidad de una unidad de codificacion maxima es 0 en las unidades 1010 de codificacion, las profundidades de las unidades 1012 y 1054 de codificacion son 1, las profundidades de las unidades 1014, 1016, 1018, 1028, 1050, y 1052 de codificacion son 2, las profundidades de las unidades 1020, 1022, 1024, 1026, 1030, 1032, y 1048 de codificacion son 3, y las profundidades de las unidades 1040, 1042, 1044, y 1046 de codificacion

5

10

15

20

25

30

35

40

45

son 4.

En las unidades 1060 de prediccion, se obtienen algunas unidades 1014, 1016, 1022, 1032, 1048, 1050, 1052, y 1054 de codificacion dividiendo unidades de codificacion de las unidades 1010 de codificacion. En particular, los tipos de particion en las unidades 1014, 1022, 1050, y 1054 de codificacion tienen un tamano de 2NxN, los tipos de particion en las unidades 1016, 1048, y 1052 de codificacion tienen un tamano de Nx2N, y un tipo de particion de la unidad 1032 de codificacion tiene un tamano de NxN. Las unidades de prediccion y las particiones de las unidades 1010 de codificacion son menores que o iguales a cada unidad de codificacion.

Se realiza transformacion o transformacion inversa en los datos de imagen de la unidad 1052 de codificacion en las unidades 1070 de transformacion en una unidad de datos que es menor que la unidad 1052 de codificacion. Tambien, las unidades 1014, 1016, 1022, 1032, 1048, 1050, y 1052 de codificacion de las unidades 1070 de transformacion son diferentes de aquellas de las unidades 1060 de prediccion en terminos de tamanos y formas. Es decir, los aparatos 100 y 200 de codificacion y decodificacion de video de acuerdo con realizaciones ejemplares pueden realizar intra prediccion, estimacion de movimiento, compensacion de movimiento, transformacion y transformacion inversa individualmente en una unidad de datos en la misma unidad de codificacion.

Por consiguiente, se realiza codificacion recursivamente en cada una de las unidades de codificacion que tienen una estructura jerarquica en cada region de una unidad de codificacion maxima para determinar una unidad de codificacion optima, y por lo tanto pueden obtenerse las unidades de codificacion que tienen una estructura de arbol recursiva. La informacion de codificacion puede incluir informacion de division acerca de una unidad de codificacion, informacion acerca de un tipo de particion, informacion acerca de un modo de prediccion, e informacion acerca de un tamano de una unidad de transformacion. La Tabla 1 ejemplar muestra la informacion de codificacion que puede establecerse por los aparatos 100 y 200 de codificacion y decodificacion de video.

Tabla 1 [Tabla 11

Informacion de division 0 (codificacion en unidad de codificacion que tiene tamano de 2Nx2N y profundidad actual de d): Informacion de division 1

Modo de prediccion: Tipo de particion Tamano de unidad de transformacion Codificar repetitivamente unidades de codificacion que tienen profundidad inferior de d+1

Intra lnter Salto (unicamente 2Nx2N): Tipo de particion simetrica Tipo de particion asimetrica Informacion de division 0 de unidad de transformacion Informacion de division 1 de unidad de transformacion

2Nx2N2NxNN x2NNxN: 2NxnU2NxnDn Lx2NnRx2N 2Nx2N NxN (tipo simetrico)N/2xN/2(ti po asimetrico)

Una unidad 130 de salida del aparato 100 de codificacion de video puede emitir la informacion de codificacion acerca de las unidades de codificacion que tienen una estructura de arbol, y un extractor 220 de datos de imagen e informacion de codificacion del aparato 200 de decodificacion de video puede extraer la informacion de codificacion acerca de las unidades de codificacion que tienen una estructura de arbol desde un flujo de bits recibido.

La informacion de division indica si una unidad de codificacion actual se divide en unidades de codificacion de una profundidad inferior. Si la informacion de division de una profundidad actual d es 0, una profundidad en la que una unidad de codificacion actual ya no se divide en una profundidad inferior, es una profundidad codificada. La informacion acerca de un tipo de particion, modo de prediccion, y un tamano de una unidad de transformacion puede definirse para la profundidad codificada. Si la unidad de codificacion actual se divide adicionalmente de acuerdo con la informacion de division, la codificacion se realiza independientemente en unidades de codificacion de division de una profundidad inferior.

Un modo de prediccion puede ser uno de un modo intra, un modo inter, y un modo de salto. El modo intra y el modo inter pueden definirse en todos los tipos de particion, y el modo de salto puede definirse unicamente en un tipo de particion que tiene un tamano de 2Nx2N.

La informacion acerca del tipo de particion puede indicar tipos de particion simetrica que tienen tamanos de 2Nx2N, 2NxN, Nx2N, y NxN, que se obtienen dividiendo simetricamente una altura o una anchura de una unidad de prediccion, y tipos de particion asimetrica que tienen tamanos de 2NxnU, 2NxnD, nLx2N, y nRx2N, que se obtienen dividiendo asimetricamente la altura o la anchura de la unidad de prediccion. Los tipos de particion asimetrica que tienen los tamanos de 2NxnU y 2NxnD pueden obtenerse respectivamente dividiendo la altura de la unidad de prediccion en proporciones de 1:3 y 3:1, y los tipos de particion asimetrica que tienen los tamanos de nLx2N y nRx2N pueden obtenerse respectivamente dividendo la anchura de la unidad de prediccion en proporciones de 1:3 y 3:1

5

10

15

20

25

30

35

40

45

50

55

El tamano de la unidad de transformacion puede establecerse para que sea dos tipos en el modo intra y dos tipos en el modo inter. Por ejemplo, si la informacion de division de la unidad de transformacion es 0, el tamano de la unidad de transformacion puede ser 2Nx2N, que es el tamano de la unidad de codificacion actual. Si la informacion de division de la unidad de transformacion es 1, las unidades de transformacion pueden obtenerse dividiendo la unidad de codificacion actual. Tambien, si un tipo de particion de la unidad de codificacion actual que tiene el tamano de 2Nx2N es un tipo de particion simetrica, un tamano de una unidad de transformacion puede ser NxN, y si el tipo de particion de la unidad de codificacion actual es un tipo de particion asimetrica, el tamano de la unidad de transformacion puede ser N/2xN/2.

La informacion de codificacion acerca de las unidades de codificacion que tienen una estructura de arbol puede incluir al menos una de una unidad de codificacion que corresponde a una profundidad codificada, una unidad de codificacion que corresponde a una unidad de prediccion, y una unidad de codificacion que corresponde a una unidad minima. La unidad de codificacion que corresponde a la profundidad codificada puede incluir al menos una de una unidad de prediccion y una unidad minima que incluye la misma informacion de codificacion.

Por consiguiente, se determina si se incluyen unidades de datos adyacentes en la misma unidad de codificacion que corresponde a la profundidad codificada comparando informacion de codificacion de las unidades de datos adyacentes. Tambien, se determina una unidad de codificacion correspondiente que corresponde a una profundidad codificada usando informacion de codificacion de una unidad de datos, y por lo tanto puede determinarse una distribucion de profundidades codificadas en una unidad de codificacion maxima.

Por consiguiente, si se predice una unidad de codificacion actual basandose en informacion de codificacion de unidades de datos adyacentes, puede hacerse referencia directamente y usarse la informacion de codificacion de unidades de datos en unidades de codificacion mas profundas adyacentes a la unidad de codificacion actual. Sin embargo, se entiende que otra realizacion ejemplar no esta limitada a lo mismo. Por ejemplo, de acuerdo con otra realizacion ejemplar, si una unidad de codificacion actual se predice basandose en informacion de codificacion de unidades de datos adyacentes, se buscan las unidades de datos adyacentes a la unidad de codificacion actual usando informacion codificada de las unidades de datos, y puede hacerse referencia a las unidades de codificacion adyacentes buscadas para predecir la unidad de codificacion actual.

La Figura 13 es un diagrama para describir una relacion entre una unidad de codificacion, una unidad de prediccion

0 una particion, y una unidad de transformacion, de acuerdo con la informacion de modo de codificacion de la Tabla

1 ejemplar, de acuerdo con una realizacion ejemplar.

Haciendo referencia a la Figura 13, una unidad 1300 de codificacion maxima incluye las unidades 1302, 1304, 1306, 1312, 1314, 1316, y 1318 de codificacion de profundidades codificadas. En este punto, puesto que la unidad 1318 de codificacion es una unidad de codificacion de una profundidad codificada, la informacion de division puede establecerse a 0. La informacion acerca de un tipo de particion de la unidad 1318 de codificacion que tiene un tamano de 2Nx2N puede establecerse para que sea uno de un tipo 1322 de particion que tiene un tamano de 2Nx2N, un tipo 1324 de particion que tiene un tamano de 2NxN, un tipo 1326 de particion que tiene un tamano de Nx2N, un tipo 1328 de particion que tiene un tamano de NxN, un tipo 1332 de particion que tiene un tamano de 2NxnU, un tipo 1334 de particion que tiene un tamano de 2NxnD, un tipo 1336 de particion que tiene un tamano de nLx2N, y un tipo 1338 de particion que tiene un tamano de nRx2N.

Cuando el tipo de particion se establece para que sea simetrica, es decir, el tipo 1322, 1324, 1326, o 1328 de particion, se establece una unidad 1342 de transformacion que tiene un tamano de 2Nx2N si la informacion de division (bandera de tamano TU) de una unidad de transformacion es 0, y se establece una unidad 1344 de transformacion que tiene un tamano de NxN si una bandera de tamano TU es 1.

Cuando el tipo de particion se establece para que sea asimetrica, es decir, el tipo 1332, 1334, 1336, o 1338 de particion, se establece una unidad 1352 de transformacion que tiene un tamano de 2Nx2N si una bandera de tamano TU es 0, y se establece una unidad 1354 de transformacion que tiene un tamano de N/2xN/2 si una bandera de tamano TU es 1.

Haciendo referencia a la Figura 13, la bandera de tamano TU es una banderea que tiene un valor o 0 o 1, aunque se entiende que la bandera de tamano TU no esta limitada a 1 bit, y una unidad de transformacion puede dividirse jerarquicamente teniendo una estructura de arbol mientras la bandera de tamano TU aumenta desde 0.

En este caso, el tamano de una unidad de transformacion que se ha usado realmente puede expresarse usando una bandera de tamano TU de una unidad de transformacion, de acuerdo con una realizacion ejemplar, junto con un tamano maximo y tamano mmimo de la unidad de transformacion. De acuerdo con una realizacion ejemplar, un aparato 100 de codificacion de video puede codificar informacion de tamano de unidad de transformacion maximo, informacion de tamano de unidad de transformacion mmimo y una bandera de tamano TU maximo. El resultado de codificar la informacion de tamano de unidad de transformacion maximo, la informacion de tamano de unidad de transformacion mmimo, y la bandera de tamano TU maximo puede insertarse en un SPS. De acuerdo con una realizacion ejemplar, un aparato 200 de decodificacion de video puede decodificar video usando la informacion de tamano de unidad de transformacion maximo, la informacion de tamano de unidad de transformacion mmimo, y la

5

10

15

20

25

30

35

40

45

50

bandera de tamano TU maximo.

Por ejemplo, si el tamano de una unidad de codificacion actual es 64x64 y un tamano de unidad de transformacion maximo es 32x32, el tamano de una unidad de transformacion puede ser 32x32 cuando una bandera de tamano TU es 0, puede ser 16x16 cuando la bandera de tamano TU es 1, y puede ser 8x8 cuando la bandera de tamano TU es 2.

Como otro ejemplo, si el tamano de la unidad de codificacion actual es 32x32 y un tamano de unidad de transformacion mmimo es 32x32, el tamano de la unidad de transformacion puede ser 32x32 cuando la bandera de tamano TU es 0. En este punto, la bandera de tamano TU no puede establecerse a un valor distinto de 0, puesto que el tamano de la unidad de transformacion no puede ser menor de 32x32.

Como otro ejemplo, si el tamano de la unidad de codificacion actual es 64x64 y una bandera de tamano TU maximo es 1, la bandera de tamano TU puede ser 0 o 1. En este punto, la bandera de tamano TU no puede establecerse a un valor distinto de 0 o 1.

Por lo tanto, si se define que la bandera de tamano TU maximo es MaxTransformSizelndex, un tamano de unidad de transformacion mmimo es MinTransformSize, y un tamano de unidad de transformacion es RootTuSize cuando la bandera de tamano TU es 0, un tamano de unidad de transformacion mmimo actual CurrMinTuSize que puede determinarse en una unidad de codificacion actual, puede definirse mediante la Ecuacion (1):

CurrMinTuSize

= max(MinTransformSize, RootTuSize/(2AMaxTransformSizelndex))......(1).

]

En comparacion con el tamano de unidad de transformacion mmimo actual CurrMinTuSize que puede determinarse en la unidad de codificacion actual, un tamano de unidad de transformacion RootTuSize cuando la bandera de tamano TU es 0 puede indicar un tamano de unidad de transformacion maximo que puede seleccionarse en el sistema. En la Ecuacion (1), 'RootTuSize/(2AMaxTransformSizelndex) indica un tamano de unidad de transformacion cuando el tamano de la unidad de transformacion RootTuSize, cuando la bandera de tamano TU es 0, se divide un numero de veces que corresponde a la bandera de tamano TU maximo. Adicionalmente, MinTransformSize indica un tamano de transformacion mmimo. Por lo tanto, un valor mas pequeno de entre RootTuSize/(2AMaxTransformSizelndex) y MinTransformSize puede ser el tamano de unidad de transformacion mmimo actual CurrMinTuSize que puede determinarse en la unidad de codificacion actual.

De acuerdo con una realizacion ejemplar, el tamano de unidad de transformacion maximo RootTuSize puede variar de acuerdo con el tipo de un modo de prediccion.

Por ejemplo, si un modo de prediccion actual es un modo inter, entonces RootTuSize puede determinarse usando la Ecuacion (2) a continuacion. En la Ecuacion (2), MaxTransformSize indica un tamano de unidad de transformacion maximo, y PUSize indica un tamano de unidad de prediccion actual.

RootTuSize = min(MaxTransformSize, PUSize)...... (2).

Es decir, si el modo de prediccion actual es el modo inter, el tamano de la unidad de transformacion RootTuSize cuando la bandera de tamano TU es 0 puede ser un valor menor de entre el tamano de unidad de transformacion maximo y el tamano de unidad de prediccion actual.

Si un modo de prediccion de una unidad de particion actual es un modo intra, RootTuSize puede determinarse usando la Ecuacion (3) a continuacion. En la Ecuacion (3), Partitionsize indica el tamano de la unidad de particion actual.

RootTuSize = min(MaxTransformSize, Partitionsize)......(3).

Es decir, si el modo de prediccion actual es el modo intra, el tamano de la unidad de transformacion RootTuSize cuando la bandera de tamano TU es 0 puede ser un valor menor de entre el tamano de unidad de transformacion maximo y el tamano de la unidad de particion actual.

Sin embargo, el tamano de unidad de transformacion maximo actual RootTuSize que vana de acuerdo con el tipo de un modo de prediccion en una unidad de particion es meramente ejemplar, y no esta limitado a lo mismo en otra realizacion ejemplar.

La Figura 14 es un diagrama de flujo que ilustra un procedimiento de codificacion de video de acuerdo con una realizacion ejemplar. Haciendo referencia a la Figura 14, en la operacion 1210, una instantanea actual se divide en al menos una unidad de codificacion maxima. Puede predeterminarse una profundidad maxima que indica un numero total de posibles veces de division.

En la operacion 1220, se determina una profundidad codificada para emitir un resultado de codificacion final de acuerdo con al menos una region de division, que se obtiene dividiendo una region de cada unidad de codificacion

5

10

15

20

25

30

35

40

45

50

55

maxima de acuerdo con las profundidades, codificando la al menos una region de division, y se determina una unidad de codificacion de acuerdo con una estructura de arbol.

La unidad de codificacion maxima se divide espacialmente cada vez que la profundidad se hace profunda, y por lo tanto se divide en unidades de codificacion de una profundidad inferior. Cada unidad de codificacion puede dividirse en unidades de codificacion de otra profundidad inferior dividiendose espacialmente de manera independiente desde unidades de codificacion adyacentes. La codificacion se realiza repetitivamente en cada unidad de codificacion de acuerdo con las profundidades.

Tambien, se determina una unidad de transformacion de acuerdo con los tipos de particion que tienen el menor error de codificacion para cada unidad de codificacion mas profunda. Para determinar una profundidad codificada que tiene un error de codificacion mmimo en cada unidad de codificacion maxima, pueden medirse errores de codificacion y compararse en todas las unidades de codificacion mas profundas de acuerdo con las profundidades.

En la operacion 1230, los datos de imagen codificada que son el resultado de codificacion final de acuerdo con la profundidad codificada se emiten para cada unidad de codificacion maxima, con informacion de codificacion acerca de la profundidad codificada y un modo de codificacion. La informacion acerca del modo de codificacion puede incluir al menos uno de informacion acerca de una profundidad codificada o la informacion de division, informacion acerca de un tipo de particion de una unidad de prediccion, un modo de prediccion, y un tamano de una unidad de transformacion. La informacion codificada acerca del modo de codificacion puede transmitirse a un decodificador con los datos de imagen codificada.

La Figura 15 es un diagrama de flujo que ilustra un procedimiento de decodificacion de video de acuerdo con una realizacion ejemplar. Haciendo referencia a la Figura 15, en la operacion 1310, se recibe y analiza un flujo de bits de un video codificado.

En la operacion 1320, los datos de imagen codificada de una instantanea actual asignados a una unidad de codificacion maxima, y la informacion acerca de una profundidad codificada y un modo de codificacion de acuerdo con unidades de codificacion maxima se extraen desde del flujo de bits analizado. La profundidad codificada de cada unidad de codificacion maxima es una profundidad que tiene el menor error de codificacion en cada unidad de codificacion maxima. Al codificar cada unidad de codificacion maxima, los datos de imagen se codifican basandose en al menos una unidad de datos obtenida dividiendo jerarquicamente cada unidad de codificacion maxima de acuerdo con las profundidades.

De acuerdo con la informacion acerca de la profundidad codificada y el modo de codificacion, la unidad de codificacion maxima puede dividirse en unidades de codificacion que tienen una estructura de arbol. Cada una de las unidades de codificacion que tienen la estructura de arbol se determina como una unidad de codificacion que corresponde a una profundidad codificada, y se codifica de manera optima para emitir el menor error de codificacion. Por consiguiente, la eficacia de codificacion y decodificacion de una imagen puede mejorarse decodificando cada pieza de los datos de imagen codificada en las unidades de codificacion despues de determinar al menos una profundidad codificada de acuerdo con unidades de codificacion.

En la operacion 1330, los datos de imagen de cada unidad de codificacion maxima se decodifican basandose en la informacion acerca de la profundidad codificada y el modo de codificacion de acuerdo con las unidades de codificacion maxima. Los datos de imagen decodificada pueden reproducirse mediante un aparato de reproduccion, almacenarse en un medio de almacenamiento, o transmitirse a traves de una red.

En lo sucesivo, se describira la codificacion y decodificacion de video realizadas en un modo de operacion de una herramienta de codificacion que considera un tamano de una unidad de codificacion de acuerdo con realizaciones ejemplares con referencia a las Figuras 16 a 23.

La Figura 16 es un diagrama de bloques de un aparato 1400 de codificacion de video basandose en una herramienta de codificacion que considera el tamano de una unidad de codificacion, de acuerdo con una realizacion ejemplar. Haciendo referencia a la Figura 16, el aparato 1400 incluye un divisor 1410 de unidad de codificacion maxima, un determinador 1420 de unidad de codificacion y una unidad 1430 de salida.

El divisor 1410 de unidad de codificacion maxima divide una instantanea actual en al menos una unidad de codificacion maxima.

El determinador 1420 de unidad de codificacion codifica la al menos una unidad de codificacion maxima en unidades de codificacion que corresponden a las profundidades. En este caso, el determinador 1420 de unidad de codificacion puede codificar una pluralidad de regiones de division de la al menos una unidad de codificacion maxima en modos de operacion que corresponden a herramientas de codificacion de acuerdo con las profundidades de las unidades de codificacion, respectivamente, basandose en una relacion entre una profundidad de una unidad de codificacion, una herramienta de codificacion y un modo de operacion.

El determinador 1420 de unidad de codificacion codifica unidades de codificacion que corresponden a todas las profundidades, compara los resultados de codificacion entre sf, y determina una profundidad de una unidad de

5

10

15

20

25

30

35

40

45

50

55

codificacion que tiene una eficacia de codificacion mas alta como una profundidad codificada. Puesto que en las regiones de division de la al menos una unidad de codificacion maxima, una profundidad que tiene una eficacia de codificacion mas alta puede diferenciarse de acuerdo con la localizacion, una profundidad codificada de cada una de las regiones de division de la al menos una unidad de codificacion maxima puede determinarse de manera independiente de aquella de las otras regiones. Por lo tanto, puede definirse mas de una profundidad codificada en una unidad de codificacion maxima.

Ejemplos de una herramienta de codificacion para codificar pueden incluir cuantificacion, transformacion, intra prediccion, inter prediccion, compensacion de movimiento, codificacion por entropfa y filtrado de bucle, que son tecnicas de codificacion de video. De acuerdo con una realizacion ejemplar, en el aparato 1400 de codificacion de video, cada una de una pluralidad de herramientas de codificacion puede realizarse de acuerdo con al menos un modo de operacion. En este punto, la expresion, modo de operacion indica una manera en la que se realiza una herramienta de codificacion.

Por ejemplo, si una herramienta de codificacion es inter prediccion, un modo de operacion de la herramienta de codificacion puede clasificarse en un primer modo de operacion en el que se selecciona un valor de mediana de vectores de movimiento de unidades de prediccion vecinas, un segundo modo de operacion en el que se selecciona un vector de movimiento de una unidad de prediccion en una localizacion particular de entre unidades de prediccion vecinas, y un tercer modo de operacion en el que se selecciona un vector de movimiento de una unidad de prediccion que incluye una plantilla mas similar a una plantilla de una unidad de prediccion actual de entre unidades de prediccion vecinas.

De acuerdo con una realizacion ejemplar, el aparato 1400 de codificacion de video puede establecer de manera variable un modo de operacion de una herramienta de codificacion de acuerdo con el tamano de una unidad de codificacion. En la presente realizacion ejemplar, el aparato 1400 de codificacion de video puede establecer de manera variable un modo de operacion de al menos una herramienta de codificacion de acuerdo con el tamano de una unidad de codificacion. Puesto que una profundidad de una unidad de codificacion corresponde al tamano de la unidad de codificacion, el modo de operacion de al menos una herramienta de codificacion puede determinarse basandose en la profundidad de la unidad de codificacion que corresponde al tamano de la unidad de codificacion. Por lo tanto, puede establecerse la relacion entre una profundidad de una unidad de codificacion, una herramienta de codificacion, y un modo de operacion. De manera similar, si una herramienta de codificacion puede realizarse en una unidad de prediccion o una particion de una unidad de codificacion, un modo de operacion de la herramienta de codificacion puede determinarse basandose en el tamano de una unidad de prediccion o una particion.

El aparato 1400 de codificacion de video puede establecer la relacion entre una profundidad de una unidad de codificacion, una herramienta de codificacion, y un modo de operacion antes de que se realice la codificacion. Por ejemplo, de acuerdo con otra realizacion ejemplar, el aparato 1400 de codificacion de video puede establecer la relacion entre una profundidad de una unidad de codificacion, una herramienta de codificacion y un modo de operacion codificando las unidades de codificacion de la al menos una unidad de codificacion maxima que corresponden a las profundidades en todos los modos de operacion de una herramienta de codificacion predeterminada y detectar un modo de operacion que tiene una eficacia de codificacion mas alta de entre los modos de operacion.

El aparato 1400 de codificacion de video puede asignar un modo de operacion que provoca bits de tara a unidades de codificacion que corresponden a las profundidades, los tamanos de las cuales son iguales o mayores que un tamano predeterminado, y puede asignar un modo de operacion que no provoca bits de tara a las otras unidades de codificacion, los tamanos de las cuales son menores que el tamano predeterminado.

El aparato 1400 de codificacion de video puede codificar y transmitir informacion con respecto a la relacion entre una profundidad de una unidad de codificacion, una herramienta de codificacion, y un modo de operacion en unidades de corte, unidades de fotograma, unidades de instantanea o unidades de GOP de una imagen. De acuerdo con otra realizacion ejemplar, el aparato 1400 de codificacion de video puede insertar la informacion con respecto a la codificacion y la informacion con respecto a la relacion entre una profundidad de una unidad de codificacion, una herramienta de codificacion y un modo de operacion en un SPS.

Si el determinador 1420 de unidad de codificacion realiza intra prediccion, que es un tipo de una herramienta de codificacion, un modo de operacion de intra prediccion puede clasificarse de acuerdo con un numero de direcciones de prediccion, es decir, direcciones en las que puede hacerse referencia a la informacion de las cercamas. Por lo tanto, un modo de operacion de intra prediccion realizado por el aparato 1400 de codificacion de video puede incluir modos de intra prediccion que representan el numero de direcciones de prediccion que vanan de acuerdo con el tamano de una unidad de codificacion.

Tambien, si el determinador 1420 de unidad de codificacion realiza intra prediccion, un modo de operacion de intra prediccion puede clasificarse de acuerdo con si se ha de realizar suavizado en consideracion de un patron de imagen. Por lo tanto, un modo de operacion de intra prediccion realizado por el aparato 1400 de codificacion de video puede representar si se ha de realizar intra prediccion de acuerdo con el tamano de una unidad de codificacion diferenciando un modo de intra prediccion para suavizar una region de una unidad de codificacion y un

5

10

15

20

25

30

35

40

45

50

55

modo de intra prediccion para mantener una lmea Kmite entre sr

Si el determinador 1420 de unidad de codificacion realiza inter prediccion, que es otro tipo de una herramienta de codificacion, el determinador 1420 de unidad de codificacion puede realizar de manera selectiva al menos un procedimiento de determinacion de un vector de movimiento. Por lo tanto, un modo de operacion de inter prediccion realizado por el aparato 1400 de codificacion de video puede incluir un modo de inter prediccion que representa un procedimiento de determinacion de un vector de movimiento, que se realiza de manera selectiva de acuerdo con el tamano de una unidad de codificacion.

Si el determinador 1420 de unidad de codificacion realiza transformacion, que es otro tipo de una herramienta de codificacion, el determinador 1420 de unidad de codificacion puede realizar de manera selectiva transformacion rotacional de acuerdo con el patron de una imagen. El determinador 1420 de unidad de codificacion puede almacenar una matriz de transformacion rotacional para que se multiplique por una matriz de datos con tamano predeterminado, que es un objetivo de transformacion, para realizar de manera eficaz transformacion rotacional. Por lo tanto, un modo de operacion de transformacion realizado por el aparato 1400 de codificacion de video puede incluir un modo de transformacion que representa un mdice de una matriz de transformacion rotacional que corresponde al tamano de una unidad de codificacion.

Si el determinador 1420 de unidad de codificacion realiza cuantificacion, que es otro tipo de una herramienta de codificacion, entonces puede usarse un delta de parametro de cuantificacion que representa una diferencia entre un parametro de cuantificacion actual y un parametro de cuantificacion representativo predeterminado. Por lo tanto, un modo de operacion de cuantificacion realizado por el aparato 1400 de codificacion de video puede incluir un modo de cuantificacion que indica si se ha de usar el delta del parametro de cuantificacion que vana de acuerdo con el tamano de una unidad de codificacion.

Si el determinador 1420 de unidad de codificacion realiza interpolacion, que es otro tipo de una herramienta de codificacion, puede usarse filtro de interpolacion. El determinador 1420 de unidad de codificacion puede establecer de manera selectiva coeficientes o el numero de derivaciones del filtro de interpolacion basandose en el tamano de una unidad de codificacion, una unidad de prediccion o una particion y la profundidad de una unidad de codificacion. Por lo tanto, un modo de operacion de filtrado de interpolacion realizado por el aparato 1400 de codificacion de video puede incluir un modo de interpolacion que indica coeficientes o el numero de derivaciones de un filtro de interpolacion que vanan de acuerdo con el tamano o la profundidad de una unidad de codificacion y el tamano de una unidad de prediccion o una particion.

La unidad 1430 de salida puede emitir un flujo de bits, en el que los datos de video codificados (es decir, un resultado final de la codificacion recibida desde el determinador 1420 de unidad de codificacion), informacion con respecto a una profundidad codificada, y un modo de codificacion estan incluidos para cada una de la al menos una unidad de codificacion maxima. Los datos de video codificados pueden ser un conjunto de una pluralidad de piezas de datos de video que se codifican en unidades de codificacion que corresponden a profundidades codificadas de las regiones de division de la al menos una unidad de codificacion maxima, respectivamente.

Tambien, los modos de operacion anteriores de herramientas de codificacion para unidades de codificacion que corresponden a las profundidades pueden codificarse en forma de la informacion con respecto a la relacion entre una profundidad de una unidad de codificacion, una herramienta de codificacion y un modo de operacion y a continuacion insertarse en un flujo de bits.

De acuerdo con una realizacion ejemplar, el aparato 1400 de codificacion de video puede realizar una herramienta de codificacion, tal como cuantificacion, transformacion, intra prediccion, inter prediccion, compensacion de movimiento, codificacion por entropfa y filtrado de bucle. Estas herramientas de codificacion pueden realizarse en diferentes modos de operacion en unidades de codificacion que corresponden a las profundidades, respectivamente. Los modos de operacion anteriores son solamente ejemplos ilustrativos dados por conveniencia de explicacion, y la relacion entre una profundidad de una unidad de codificacion (o el tamano de una unidad de codificacion), una herramienta de codificacion, y un modo de operacion en el aparato 1400 de codificacion de video no esta limitada a las realizaciones ejemplares anteriores.

La Figura 17 es un diagrama de bloques de un aparato 1500 de decodificacion de video basandose en una herramienta de codificacion que considera un tamano de una unidad de codificacion, de acuerdo con una realizacion ejemplar. Haciendo referencia a la Figura 17, el aparato 1500 de decodificacion de video incluye un receptor 1510, un extractor 1520 y un decodificador 1330.

El receptor 1510 recibe y analiza un flujo de bits que incluye datos de video codificados. El extractor 1520 extrae los datos de video codificados, informacion con respecto a la codificacion e informacion con respecto a una relacion entre una profundidad de una unidad de codificacion, una herramienta de codificacion y un modo de operacion del flujo de bits recibido mediante el receptor 1510.

Los datos de video codificados se obtienen codificando datos de imagen en unidades de codificacion maxima. Los datos de imagen en cada una de las unidades de codificacion maxima se dividen jerarquicamente en una pluralidad de regiones de division de acuerdo con las profundidades, y cada una de las regiones de division se codifica en una

5

10

15

20

25

30

35

40

45

50

55

unidad de codificacion de una profundidad codificada correspondiente. La informacion con respecto a la codificacion incluye informacion con respecto a profundidades codificadas de las unidades de codificacion maxima y un modo de codificacion.

Por ejemplo, la informacion con respecto a la relacion entre una profundidad de una unidad de codificacion, una herramienta de codificacion y un modo de operacion puede establecerse en unidades de datos de imagen, por ejemplo, unidades de codificacion maxima, unidades de fotograma, unidades de campo, unidades de corte o unidades de GOP. En otro ejemplo, la informacion con respecto a la codificacion, y la informacion con respecto a la relacion entre una profundidad de una unidad de codificacion, una herramienta de codificacion y un modo de operacion puede extraerse desde un SPS. Los datos de imagen codificados en unidades de codificacion de datos de imagen pueden decodificarse en un modo de operacion selectivo de una herramienta de codificacion, basandose en la informacion con respecto a la relacion entre una profundidad de una unidad de codificacion, una herramienta de codificacion, y un modo de operacion, que se define en unidades predeterminadas de datos de imagen.

El decodificador 1530 puede decodificar los datos de video codificados en unidades de codificacion maxima y en modos de operacion de herramientas de codificacion en unidades de codificacion que corresponden a al menos una profundidad codificada, respectivamente, basandose en la informacion con respecto a la codificacion y la informacion con respecto a la relacion entre una profundidad de una unidad de codificacion, una herramienta de codificacion y un modo de operacion que se extraen mediante el extractor 1520. El modo de operacion de una herramienta de codificacion puede establecerse de acuerdo con un tamano de una unidad de codificacion. Puesto que un tamano de una unidad de codificacion que corresponde a la profundidad codificada corresponde a la profundidad codificada, el modo de operacion de la herramienta de codificacion para la unidad de codificacion que corresponde a la profundidad codificada puede determinarse basandose en la profundidad codificada. De manera similar, si la herramienta de codificacion para la unidad de codificacion se realiza basandose en una unidad de prediccion o una particion de la unidad de codificacion, el modo de operacion de la herramienta de codificacion puede determinarse basandose en el tamano de una unidad de prediccion o una particion.

Incluso si la relacion entre una profundidad de una unidad de codificacion, una herramienta de codificacion y un modo de operacion se establece de acuerdo con una herramienta de codificacion, el decodificador 1530 puede realizar una herramienta de decodificacion que corresponde a la herramienta de codificacion. Por ejemplo, el decodificador 1530 puede cuantificar de manera inversa un flujo de bits en una unidad de codificacion que corresponde a una profundidad codificada, basandose en informacion con respecto a una relacion entre una profundidad de una unidad de codificacion, cuantificacion y un modo de operacion.

Si el decodificador 1530 realiza intra prediccion, que es un tipo de una herramienta de decodificacion, el decodificador 1530 puede realizar intra prediccion en una unidad de codificacion actual que corresponde a una profundidad codificada, basandose en informacion con respecto a una relacion entre una profundidad de una unidad de codificacion, intra prediccion y un modo de intra prediccion. Por ejemplo, el decodificador 1530 puede realizar intra prediccion en la unidad de codificacion actual que corresponde a la profundidad codificada basandose en la informacion con respecto a la relacion entre una profundidad de una unidad de codificacion, intra prediccion y un modo de intra prediccion, e informacion de las cercamas de acuerdo con un numero de direcciones de intra prediccion que corresponde al tamano de la unidad de codificacion actual.

Tambien, el decodificador 1530 puede determinar si realizar intra prediccion de acuerdo con la unidad codificada de la unidad de codificacion actual diferenciando un modo de intra prediccion para suavizar y un modo de intra prediccion para mantener una lmea lfmite entre sf, basandose en la informacion con respecto a la relacion entre una profundidad de una unidad de codificacion, intra prediccion y un modo de intra prediccion.

Si el decodificador 1530 realiza inter prediccion, que es otro tipo de una herramienta de decodificacion, el decodificador 1530 puede realizar inter prediccion en la unidad de codificacion actual que corresponde a la profundidad codificada basandose en la informacion con respecto a la relacion entre una profundidad de una unidad de codificacion, inter prediccion, y un modo de inter prediccion. Por ejemplo, el decodificador 1530 puede realizar el modo de inter prediccion en la unidad de codificacion actual de la profundidad codificada usando un procedimiento de determinacion de un vector de movimiento, basandose en la informacion con respecto a la relacion entre una profundidad de una unidad de codificacion, inter prediccion y el modo de inter prediccion.

Si el decodificador 1530 realiza transformacion inversa, que es otro tipo de una herramienta de decodificacion, el decodificador 1530 puede realizar de manera selectiva transformacion rotacional inversa basandose en informacion con respecto a una relacion entre una profundidad de una unidad de codificacion, transformacion y un modo de transformacion. Por lo tanto, el decodificador 1530 puede realizar transformacion rotacional inversa en la unidad de codificacion actual que corresponde a la profundidad codificada usando una matriz de transformacion rotacional de un mdice que corresponde a la profundidad codificada, basandose en informacion con respecto a la relacion entre una profundidad de una unidad de codificacion, transformacion, y el modo de transformacion inversa.

Si el decodificador 1530 realiza cuantificacion inversa, que es otro tipo de una herramienta de codificacion, el decodificador 1530 puede realizar cuantificacion inversa en la unidad de codificacion actual que corresponde a la profundidad codificada usando un delta de parametro de cuantificacion que corresponde a la profundidad codificada,

5

10

15

20

25

30

35

40

45

50

55

basandose en informacion con respecto a una profundidad de una unidad de codificacion, cuantificacion y un modo de cuantificacion.

Si el decodificador 1530 realiza interpolacion o extrapolacion, que es otro tipo de una herramienta de codificacion, puede usarse un filtro para interpolacion o extrapolacion. El decodificador 1530 puede realizar filtrado usando el filtro para interpolacion o extrapolacion para una unidad de codificacion actual que corresponde a la profundidad codificada, usando coeficientes o el numero de derivaciones del filtro para interpolacion o extrapolacion basandose en el modo de operacion de filtrado para interpolacion o extrapolacion, que indica coeficientes o el numero de derivaciones del filtro para interpolacion o extrapolacion. El modo de operacion de filtrado para interpolacion o extrapolacion puede corresponder a al menos uno del tamano de la unidad de codificacion actual, y el tamano de una unidad de prediccion o una particion de la unidad de codificacion actual.

El aparato 1500 de decodificacion de video puede reconstruir la imagen original desde datos de imagen decodificados por el decodificador 1530. La imagen reconstruida puede reproducirse por un aparato de visualizacion (no mostrado) o puede almacenarse en un medio de almacenamiento (no mostrado).

En el aparato 1400 de codificacion de video y el aparato 1500 de decodificacion de video de acuerdo con realizaciones ejemplares, el tamano de una unidad de codificacion puede variar de acuerdo con las caractensticas de una imagen y una eficacia de codificacion de la imagen. El tamano de una unidad de datos, tal como una unidad de codificacion, una unidad de prediccion, o una unidad de transformacion, puede aumentarse para codificar una gran cantidad de datos de imagen, por ejemplo, una imagen de alta resolucion o de alta calidad. El tamano de un macrobloque que tiene una estructura jerarquica de acuerdo con las normas H.264 puede ser 4x4, 8x8, o 16x16, pero el aparato 1400 de codificacion de video y el aparato 1500 de decodificacion de video de acuerdo con una o mas realizaciones ejemplares pueden ampliar el tamano de una unidad de datos a 4x4, 8x8, 16x16, 32x32, 64x64, 128x128, o mas.

Cuanto mayor es una unidad de datos, mas datos de imagen se incluyen en la unidad de datos, y mas diversas caractensticas de imagen en unidades de datos. Por lo tanto, sena ineficaz codificar todas las unidades de datos que tienen diversos tamanos usando unicamente una herramienta de codificacion.

Por consiguiente, el aparato 1400 de codificacion de video puede determinar una profundidad de una unidad de codificacion y un modo de operacion de una herramienta de codificacion de acuerdo con las caractensticas de datos de imagen para aumentar una eficacia de codificacion y codificar informacion con respecto a una relacion entre la profundidad de la unidad de codificacion, la herramienta de codificacion y el modo de operacion. Adicionalmente, el aparato 1500 de decodificacion de video puede reconstruir la imagen original decodificando un flujo de bits recibido, basandose en la informacion con respecto a una relacion entre la profundidad de la unidad de codificacion, la herramienta de codificacion, y el modo de operacion.

Por consiguiente, el aparato 1400 de codificacion de video y el aparato 1500 de decodificacion de video pueden codificar y decodificar de manera eficaz una gran cantidad de datos de imagen, tal como una imagen de alta resolucion o de alta calidad, respectivamente.

La Figura 18 es un diagrama para describir una relacion entre el tamano de una unidad de codificacion, una herramienta de codificacion y un modo de operacion, de acuerdo con una realizacion ejemplar.

Haciendo referencia a la Figura 18, de acuerdo con una realizacion ejemplar, en un aparato 1400 de codificacion de video o un aparato 1500 de decodificacion de video, una unidad 1610 de codificacion de 4x4, una unidad 1620 de codificacion de 8x8, una unidad 1630 de codificacion de 16x16, una unidad 1640 de codificacion de 32x32, y una unidad 1650 de codificacion de 64x64 pueden usarse como unidades de codificacion. Si una unidad de codificacion maxima es la unidad 1650 de codificacion de 64x64, una profundidad de la unidad 1650 de codificacion de 64x64 es 0, una profundidad de la unidad 1640 de codificacion de 32x32 es 1, una profundidad de la unidad 1630 de codificacion de 16x16 es 2, una profundidad de la unidad 1620 de codificacion de 8x8 es 3, y una profundidad de la unidad 1610 de codificacion de 4x4 es 4.

El aparato 1400 de codificacion de video puede determinar de manera adaptativa un modo de operacion de una herramienta de codificacion de acuerdo con una profundidad de una unidad de codificacion. Por ejemplo, si una primera herramienta de codificacion TOOL1 puede realizarse en un primer modo de operacion TOOL1-1 1660, un segundo modo de operacion TOOL1-2 1662, y un tercer modo de operacion TOOL1-3, el aparato 1400 de codificacion de video puede realizar la primera herramienta de codificacion TOOL1 en el primer modo de operacion TOOL1-1 1660 con respecto a la unidad 1610 de codificacion de 4x4 y la unidad 1620 de codificacion de 8x8, realizar la primera herramienta de codificacion TOOL1 en el segundo modo de operacion 1662 con respecto a la unidad 1630 de codificacion de 16x16 y la unidad 1640 de codificacion de 32x32, y realizar la primera herramienta de codificacion TOOL1 en el tercer modo de operacion 1664 con respecto a la unidad 1650 de codificacion de 64x64.

La relacion entre el tamano de una unidad de codificacion, una herramienta de codificacion y un modo de operacion puede determinarse codificando una unidad de codificacion actual en todos los modos de operacion de una herramienta de codificacion correspondiente y detectar un modo de operacion que provoca un resultado de

5

10

15

20

25

30

35

40

45

codificacion con una eficacia de codificacion mas alta entre los modos de operacion, durante la codificacion de la unidad de codificacion actual. En otra realizacion ejemplar, la relacion entre el tamano de una unidad de codificacion, una herramienta de codificacion y un modo de operacion puede predeterminarse mediante, por ejemplo, al menos uno del rendimiento de un sistema de codificacion, unos requisitos del usuario o condiciones del entorno.

Puesto que el tamano de una unidad de codificacion maxima se fija con respecto a datos predeterminados, el tamano de una unidad de codificacion corresponde a una profundidad de la misma unidad de codificacion. Por lo tanto, una relacion entre una herramienta de codificacion adaptativa al tamano de una unidad de codificacion y un modo de operacion pueden codificarse usando informacion con respecto a una relacion entre una profundidad de una unidad de codificacion, una herramienta de codificacion y un modo de operacion.

La informacion con respecto a la relacion entre una profundidad de una unidad de codificacion, una herramienta de codificacion, y un modo de operacion puede indicar modos optimos de operacion de herramientas de codificacion en unidades de profundidades de unidades de codificacion, respectivamente.

Tabla 2 [Tabla 21

: Profundidad de unidad de codificacion = 4 Profundidad de unidad de codificacion = 3 Profundidad de unidad de codificacion = 2 Profundidad de unidad de codificacion = 1 Profundidad de unidad de codificacion = 0

modo de operacion de primera herramienta de codificacion: primer modo de operacion primer modo de operacion segundo modo de operacion segundo modo de operacion tercer modo de operacion

modo de operacion de segunda herramienta de codificacion: primer modo de operacion segundo modo de operacion segundo modo de operacion tercer modo de operacion tercer modo de operacion

De acuerdo con la Tabla 2 ejemplar, los modos de operacion de la primera y segunda herramientas de codificacion pueden aplicarse de manera variable a unidades de codificacion que tienen profundidades 4, 3, 2, 1 y 0, respectivamente. La informacion con respecto a la relacion entre una profundidad de una unidad de codificacion, una herramienta de codificacion y un modo de operacion puede codificarse y transmitirse en unidades de secuencia, unidades de GOP, unidades de instantanea, unidades de fotograma, o unidades de corte de una imagen.

Diversas realizaciones ejemplares de una relacion entre una profundidad de una unidad de codificacion, una herramienta de codificacion y un modo de operacion se describiran ahora en detalle.

La Figura 19 es un diagrama para describir una relacion entre una profundidad de una unidad de codificacion, una herramienta de codificacion (por ejemplo, inter prediccion), y un modo de operacion, de acuerdo con una realizacion ejemplar.

Si un aparato 1400 de codificacion de video de acuerdo con una realizacion ejemplar realiza inter prediccion, al menos puede usarse un procedimiento de determinacion de un vector de movimiento. Por lo tanto, un modo de operacion de inter prediccion, que es un tipo de una herramienta de codificacion, puede clasificarse de acuerdo con un procedimiento de determinacion de un vector de movimiento.

Por ejemplo, haciendo referencia a la Figura 19, en un primer modo de operacion de inter prediccion, se selecciona un valor de mediana de vectores de movimiento mvpA, mvpB, y mvpC de unidades de codificacion vecinas A, B, y C 1710, 1720, y 1730 como un vector de movimiento predicho MVP de una unidad 1700 de codificacion actual, como se indica en la Ecuacion (4) a continuacion:

MVP = median(mvpA, mvpB, mvpC)... (4).

Si se emplea el primer modo de operacion, una cantidad de calculo es baja y los bits de tara pueden no usarse. Por lo tanto, incluso si se realiza inter prediccion en unidades de codificacion con tamano pequeno en el primer modo de operacion, una cantidad de calculo o una cantidad de bits a transmitirse es pequena.

Por ejemplo, en un segundo modo de operacion de inter prediccion, un mdice del vector de movimiento de una unidad de codificacion que se selecciona como un vector de movimiento predicho de la unidad 1700 de codificacion actual de entre los vectores de movimiento de las unidades de codificacion vecinas A, B, y C 1710, 1720 y 1730, se visualiza directamente.

Por ejemplo, si el aparato 1400 de codificacion de video realiza inter prediccion en la unidad 1700 de codificacion actual, el vector de movimiento mvpA de la unidad de codificacion vecina A 1710 puede seleccionarse como un vector de movimiento predicho optimo de la unidad 1700 de codificacion actual y un mdice del vector de movimiento mvpA puede codificarse. Por lo tanto, aunque tiene lugar tara en un lado de codificacion, provocada por un mdice que representa el vector de movimiento predicho, una cantidad de calculo cuando se realiza inter prediccion en el

5

10

15

20

25

30

35

40

45

50

segundo modo de operacion es pequena en un lado de decodificacion.

Por ejemplo, en un tercer modo de operacion de inter prediccion, los pfxeles 1705 en una localizacion predeterminada en la unidad 1700 de codificacion actual se comparan con los pfxeles 1715, 1725, 1735 en localizaciones predeterminadas en los pfxeles de las unidades de codificacion vecinas A, B, y C 1710, 1720 y 1730, los grados de distorsion de los cuales son mas bajos se detectan de entre los pfxeles 1715, 1725, 1735, y un vector de movimiento de una unidad de codificacion vecina que incluye los pfxeles detectados se selecciona como un vector de movimiento predicho de la unidad 1700 de codificacion actual.

Por lo tanto, aunque una cantidad de calculo puede ser grande para el lado de decodificacion para detectar pfxeles, los grados de distorsion de los cuales son los mas bajos, el lado de codificacion no experimenta tara en bits a transmitir. En particular, si se realiza inter prediccion en una secuencia de imagen que incluye un patron de imagen espedfico en el tercer modo de operacion, un resultado de prediccion es mas preciso que cuando se usa un valor de mediana de vectores de movimiento de unidades de codificacion vecinas.

El aparato 1400 de codificacion de video puede codificar informacion con respecto a una relacion entre el primer modo de operacion, el segundo modo de operacion y el tercer modo de operacion de inter prediccion determinados de acuerdo con una profundidad de una unidad de codificacion. El aparato 1500 de decodificacion de video de acuerdo con una realizacion ejemplar puede decodificar datos de imagen extrayendo la informacion con respecto al primer modo de operacion, el segundo modo de operacion y el tercer modo de operacion de inter prediccion determinados de acuerdo con la profundidad de la unidad de codificacion, desde un flujo de bits recibido, y realizar una herramienta de decodificacion relacionada con compensacion de movimiento e inter prediccion realizadas en una unidad de codificacion actual de una profundidad codificada, basandose en la informacion extrafda.

El aparato 1400 de codificacion de video comprueba si tiene lugar tara en bits a transmitir para determinar un modo de operacion de inter prediccion de acuerdo con un tamano o profundidad de una unidad de codificacion. Si se codifica una unidad de codificacion pequena, la tara adicional puede reducir enormemente una eficacia de codificacion de la misma, mientras que si se codifica una unidad de codificacion grande, una eficacia de codificacion no se ve influenciada significativamente por tara adicional.

Por consiguiente, puede ser eficaz realizar inter prediccion en el tercer modo de operacion que no provoca tara adicional cuando se codifica una unidad de codificacion pequena. En este sentido, un ejemplo de una relacion entre el tamano de una unidad de codificacion y un modo de operacion de inter prediccion se muestra de manera ejemplar en la Tabla 3 a continuacion:

Tabla 3 [Tabla 31

: Tamano de unidad de codificacion = 4 Tamano de unidad de codificacion = 8 Tamano de unidad de codificacion = 16 Tamano de unidad de codificacion = 32 Tamano de unidad de codificacion = 64

modo de operacion de inter prediccion: tercer modo de operacion tercer modo de operacion primer modo de operacion segundo modo de operacion segundo modo de operacion

La Figura 20 es un diagrama para describir una relacion entre una profundidad de una unidad de codificacion, una herramienta de codificacion (por ejemplo, intra prediccion), y un modo de operacion, de acuerdo con una realizacion ejemplar.

Un aparato 1400 de codificacion de video de acuerdo con una realizacion ejemplar puede realizar extrapolacion direccional como intra prediccion usando los pfxeles 1810 reconstruidos vecinos a una unidad 1800 de codificacion actual. Por ejemplo, una direccion de intra prediccion puede definirse como tan-1(dx, dy), y puede realizarse inter prediccion en diversas direcciones de acuerdo con una pluralidad de parametros (dx, dy).

Un pixel 1830 vecino en una lmea que se extiende desde un pixel 1820 actual en la unidad 1800 de codificacion actual, que se ha de predecir, y que esta inclinado por un angulo de tan-1(dy/dx) determinado por los valores dx y dy desde el pixel 1820 actual, puede usarse como un predictor del pixel 1830 actual. El pixel 1830 vecino puede pertenecer a una unidad de codificacion que esta localizada a un lado superior o izquierdo de la unidad 1800 de codificacion actual, que se codifico y reconstruyo anteriormente.

Si se realiza intra prediccion, el aparato 1400 de codificacion de video puede ajustar un numero de direcciones de intra prediccion de acuerdo con el tamano de una unidad de codificacion. Por lo tanto, los modos de operacion de intra prediccion, que es un tipo de una herramienta de codificacion, pueden clasificarse de acuerdo con el numero de las direcciones de intra prediccion.

Un numero de direcciones de intra prediccion puede variar de acuerdo con el tamano y estructura de arbol jerarquica de una unidad de codificacion. Los bits de tara usados para representar un modo de intra prediccion pueden reducir una eficacia de codificacion de una unidad de codificacion pequena pero no afectan una eficacia de codificacion de una unidad de codificacion grande.

Por lo tanto, el aparato 1400 de codificacion de video puede codificar informacion con respecto a una relacion entre una profundidad de una unidad de codificacion y el numero de direcciones de intra prediccion. Tambien, un aparato 1500 de decodificacion de video de acuerdo con una realizacion ejemplar puede decodificar datos de imagen extrayendo la informacion con respecto a una relacion entre una profundidad de una unidad de codificacion y el 5 numero de direcciones de intra prediccion desde un flujo de bits recibido, y realizar una herramienta de decodificacion relacionada con intra prediccion realizada en una unidad de codificacion actual de una profundidad codificada, basandose en la informacion extrafda.

El aparato 1400 de codificacion de video considera un patron de imagen de la unidad de codificacion actual para determinar un modo de operacion de intra prediccion de acuerdo con el tamano o profundidad de una unidad de 10 codificacion. En el caso de una imagen que contiene componentes detallados, puede realizarse intra prediccion usando extrapolacion lineal, y por lo tanto, puede usarse un gran numero de direcciones de intra prediccion. Sin embargo, en el caso de una region plana de una imagen, el numero de direcciones de intra prediccion puede ser relativamente pequeno. Por ejemplo, puede usarse un modo plano o un modo bilineal usando interpolacion de pfxeles vecinos reconstruidos para realizar intra prediccion en una region plana de una imagen.

15 Puesto que una unidad de codificacion grande se determina probablemente en una region plana de una imagen, el numero de direcciones de intra prediccion puede ser relativamente pequeno cuando se realiza un modo de intra prediccion en la unidad de codificacion grande. Tambien, puesto que una unidad de codificacion pequena se determina probablemente en una region que incluye componentes detallados de una imagen, el numero de direcciones de intra prediccion puede ser relativamente grande cuando se realiza el modo de intra prediccion en la 20 unidad de codificacion pequena. Por lo tanto, una relacion entre el tamano de una unidad de codificacion y el modo de intra prediccion puede considerarse como una relacion entre el tamano de la unidad de codificacion y el numero de direcciones de intra prediccion. Un ejemplo de la relacion entre el tamano de la unidad de codificacion y el numero de direcciones de intra prediccion se muestra en la Tabla 4 ejemplar a continuacion:

Tabla 4 [Tabla 41

Numero de direcciones de intra prediccion: 9 9 33 17 5

25

Una unidad de codificacion grande puede incluir patrones de imagen que estan dispuestos en diversas direcciones, y por lo tanto puede realizarse intra prediccion en la unidad de codificacion grande usando extrapolacion lineal. En este caso, una relacion entre el tamano de una unidad de codificacion y el modo de intra prediccion puede establecerse como se muestra en la Tabla 5 ejemplar a continuacion:

30 Tabla 5 [Tabla 51 _________________________________________________________________________

Numero de direcciones de intra prediccion: 9 9 33 33 17

De acuerdo con una realizacion ejemplar, se realiza codificacion de prediccion en diversos modos de intra prediccion establecidos de acuerdo con los tamanos de unidades de codificacion, comprimiendo de esta manera mas eficazmente una imagen de acuerdo con las caracteristicas de la imagen.

35 Las unidades de codificacion predichas emitidas desde el aparato 1400 de codificacion de video realizando diversos modos de intra prediccion de acuerdo con las profundidades de unidades de codificacion tienen una direccionalidad predeterminada de acuerdo con el tipo de un modo de intra prediccion. Debido a una direccionalidad en tales unidades de codificacion predichas, una eficacia de prediccion puede ser alta cuando los pfxeles de una unidad de codificacion actual que se han de codificar tienen una direccionalidad predeterminada, y puede ser baja cuando los 40 pfxeles de la unidad de codificacion actual no tienen la orientacion predeterminada. Por lo tanto, una unidad de codificacion predicha obtenida usando intra prediccion puede post-procesarse produciendo una nueva unidad de codificacion predicha cambiando valores de pfxeles en la unidad de codificacion predicha usando estos pfxeles y al menos un pixel vecino, mejorando de esta manera una eficacia de prediccion de una imagen.

Por ejemplo, en el caso de una region plana de una imagen, puede ser eficaz realizar post-procesamiento para 45 suavizar una unidad de codificacion predicha obtenida usando intra prediccion. Tambien, en el caso de una region

5

10

15

20

25

30

35

40

45

50

que tiene componentes detallados de la imagen, puede ser eficaz realizar post-procesamiento para mantener los componentes detallados en una unidad de codificacion predicha obtenida usando intra prediccion.

Por lo tanto, el aparato 1400 de codificacion de video puede codificar informacion con respecto a una relacion entre una profundidad de una unidad de codificacion y un modo de operacion que indica si una unidad de codificacion predicha obtenida usando intra prediccion se ha de post-procesar. Tambien, el aparato 1500 de decodificacion de video puede decodificar datos de imagen extrayendo la informacion con respecto a la relacion entre una profundidad de una unidad de codificacion y un modo de operacion que indica si una unidad de codificacion predicha obtenida usando intra prediccion se ha de post-procesar, desde un flujo de bits recibido, y realizar una herramienta de decodificacion relacionada con intra prediccion realizada en una unidad de codificacion actual de una profundidad codificada, basandose en la informacion extrafda.

En el aparato 1400 de codificacion de video, un modo de intra prediccion, en el que se realiza post-procesamiento para suavizar y un modo de intra prediccion en el que no se realiza post-procesamiento para suavizar, pueden seleccionarse para una region plana de una imagen y una region que incluye componentes detallados de la imagen, respectivamente, como el modo de operacion que indica si una unidad de codificacion predicha obtenida usando intra prediccion se ha de post-procesar.

Una unidad de codificacion grande puede determinarse en una region plana de una imagen y una unidad de codificacion pequena puede determinarse en una region que contiene componentes detallados de la imagen. Por lo tanto, el aparato 1400 de codificacion de video puede determinar que un modo de intra prediccion, en el que se realiza post-procesamiento para suavizar, se realiza en la unidad de codificacion grande y un modo de intra prediccion, en el que no se realiza post-procesamiento para suavizar, se realiza en la unidad de codificacion pequena.

Por consiguiente, una relacion entre una profundidad de una unidad de codificacion y un modo de operacion que indica si una unidad de codificacion predicha obtenida por intra prediccion se ha de post-procesar puede considerarse como una relacion entre el tamano de una unidad de codificacion y si se ha de realizar post- procesamiento. En este sentido, un ejemplo de una relacion entre el tamano de una unidad de codificacion y un modo de operacion de intra prediccion puede mostrarse en la Tabla 6 ejemplar a continuacion:

Tabla 6 [Tabla 61

Modo de post- procesamiento de intra prediccion: 0 0 1 1 1

Si el aparato 1400 de codificacion de video realiza transformacion, que es un tipo de una herramienta de codificacion, puede realizarse de manera selectiva transformacion rotacional de acuerdo con un patron de imagen. Para calculo eficaz de transformacion rotacional, una matriz de datos para transformacion rotacional puede almacenarse en memoria. Si el aparato 1400 de codificacion de video realiza transformacion rotacional o si el aparato 1500 de decodificacion de video realiza transformacion rotacional inversa, pueden solicitarse datos relacionados desde la memoria usando un mdice de datos de transformacion rotacional usados para el calculo. Tales datos de transformacion rotacional pueden establecerse en unidades de codificacion o unidades de transformacion, o de acuerdo con el tipo de una secuencia.

Por lo tanto, el aparato 1400 de codificacion de video puede establecer un modo de transformacion indicado por un mdice de una matriz de transformacion rotacional que corresponde a una profundidad de una unidad de codificacion como un modo de operacion de transformacion. El aparato 1400 de codificacion de video puede codificar informacion con respecto a una relacion entre el tamano de una unidad de codificacion y el modo de transformacion que indica el mdice de la matriz de transformacion rotacional.

El aparato 1500 de decodificacion de video puede decodificar datos de imagen extrayendo la informacion con respecto a la relacion entre una profundidad de una unidad de codificacion y el modo de transformacion que indica el mdice de la matriz de transformacion rotacional desde un flujo de bits recibido, y realizar transformacion rotacional inversa en una unidad de codificacion actual de una profundidad codificada, basandose en la informacion extrafda.

Por consiguiente, una relacion entre una profundidad de una unidad de codificacion, transformacion rotacional, y un modo de operacion puede considerarse como una relacion entre el tamano de una unidad de codificacion y el mdice de la matriz de transformacion rotacional. En este sentido, una relacion entre el tamano de una unidad de codificacion y un modo de operacion de transformacion rotacional puede mostrarse en la Tabla 7 ejemplar a continuacion:

5

10

15

20

25

30

35

40

45

Tabla 7 [Tabla 71

indice de matriz de transformacion rotacional: 4-7 4-7 0-3 0-3 0-3

Si el aparato 1400 de codificacion de v^deo realiza cuantificacion, que es un tipo de una herramienta de codificacion, puede usarse un delta de parametro de cuantificacion que representa una diferencia entre un parametro de cuantificacion actual y un parametro de cuantificacion representativo predeterminado. El delta del parametro de cuantificacion puede variar de acuerdo con el tamano de una unidad de codificacion. Por lo tanto, en el aparato 1400 de codificacion de video, un modo de operacion de cuantificacion puede incluir un modo de cuantificacion que indica si se ha de usar el delta del parametro de cuantificacion que vana de acuerdo con el tamano de una unidad de codificacion.

Por lo tanto, el aparato 1400 de codificacion de video puede establecer un modo de cuantificacion que indica si el delta del parametro de cuantificacion que corresponde al tamano de una unidad de codificacion se ha de usar como un modo de operacion de cuantificacion. El aparato 1400 de codificacion de video puede codificar informacion con respecto a una relacion entre una profundidad de una unidad de codificacion y el modo de cuantificacion que indica si se ha de usar el delta del parametro de cuantificacion.

El aparato 1500 de decodificacion de video puede decodificar datos de imagen extrayendo la informacion con respecto a la relacion entre una profundidad de una unidad de codificacion y el modo de cuantificacion que indica si se ha de usar el delta del parametro de cuantificacion, desde un flujo de bits recibido, y realizar cuantificacion inversa en una unidad de codificacion actual de una profundidad codificada, basandose en la informacion extrafda.

Por consiguiente, una relacion entre una profundidad de una unidad de codificacion, cuantificacion, y un modo de operacion puede considerarse como una relacion entre el tamano de una unidad de codificacion y si se ha de usar el delta del parametro de cuantificacion. En este sentido, un ejemplo de una relacion entre el tamano de una unidad de codificacion y un modo de operacion de cuantificacion es como se muestra en la Tabla 8 ejemplar a continuacion:

Tabla 8 [Tabla 81

Delta de parametro de cuantificacion: falso falso verdadero falso falso

La Figura 21 ilustra sintaxis de un conjunto 1900 de parametros de secuencia, en el que se inserta la informacion con respecto a una relacion entre una profundidad de una unidad de codificacion, una herramienta de codificacion, y un modo de operacion, de acuerdo con una realizacion ejemplar.

En la Figura 21, sequence_parameter_set indica la sintaxis del conjunto 1900 de parametros de secuencia para un corte actual. Haciendo referencia a la Figura 21, la informacion con respecto a la relacion entre una profundidad de una unidad de codificacion, una herramienta de codificacion, y un modo de operacion se inserta en la sintaxis del conjunto 1900 de parametros de secuencia para el corte actual.

Adicionalmente, en la Figura 21, picture_width indica la anchura de una imagen de entrada, picture_height indica la altura de la imagen de entrada, max_coding_unit_size indica el tamano de una unidad de codificacion maxima, y max_coding_unit_depth indica una profundidad maxima.

De acuerdo con una realizacion ejemplar, la sintaxis use_independent_cu_decode_flag que indica si se ha de realizar de manera independiente la decodificacion en unidades de codificacion, use_independent_cu_parse_flag que indica si se ha de realizar de manera independiente el analisis en unidades de codificacion, use_mv_accuracy_control_flag que indica si un vector de movimiento se ha de controlar con precision, use_arbitrary_direction_intra_flag que indica si se ha de realizar intra prediccion en una direccion arbitraria, use_frequency_domain_prediction_flag que indica si se ha de realizar codificacion/decodificacion de prediccion en el dominio de transformacion de frecuencia, use_rotational_transform_flag que indica si se ha de realizar transformacion rotacional, use_tree_significant_map_flag que indica si se ha de realizar codificacion/decodificacion usando un mapa significativo de arbol, use_multi_parameter_intra_prediction_flag que indica si se ha de realizar codificacion de intra prediccion usando un parametro multiple, use_advanced_motion_vector_prediction_flag que indica si se ha de realizar prediccion de vector de movimiento avanzada, use_adaptive_loop_filter_flag que indica si

5

10

15

20

25

30

35

40

45

50

55

se ha de realizar filtrado de bucle adaptativo, use_quadtree_adaptive_loop_filter_flag que indica si se ha de realizar filtrado de bucle adaptativo de arbol cuadruple, use_delta_qp_flag que indica si se ha de realizar cuantificacion usando un delta de parametro de cuantificacion, use_random_noise_generation_flag que indica si se ha de realizar generacion de ruido aleatorio, use_asymmetric_motion_partition_flag que indica si se ha de realizar estimacion de movimiento en unidades de prediccion asimetricas, pueden usarse como ejemplos de un parametro de secuencia de un corte. Es posible codificar o decodificar eficazmente el corte actual estableciendo si se han de usar las operaciones anteriores usando estas sintaxis.

En particular, la longitud de un filtro de bucle adaptativo alf_filter_length, el tipo del filtro de bucle adaptativo alf_filter_type, un valor de referencia para cuantificar un coeficiente de filtro de bucle adaptativo alf_qbits, y el numero de componentes de color de filtrado de bucle adaptativo alf_num_color pueden establecerse en el conjunto 1900 de parametros de secuencia, basandose en use_adaptive_loop_filter_flag y use_quadtree_adaptive_loop_filter_flag.

La informacion con respecto a la relacion entre una profundidad de una unidad de codificacion, una herramienta de codificacion, y un modo de operacion usados en un aparato 1400 de codificacion de video y un aparato 1500 de decodificacion de video de acuerdo con realizaciones ejemplares puede indicar un modo de operacion de inter prediccion que corresponde a una profundidad de una unidad de codificacion uiDepth mvp_mode[uiDepth], y un modo de operacion significant_map_mode[uiDepth] que indica el tipo de un mapa de significado de entre mapas de significado de arbol. Es decir, cualquiera de una relacion entre inter prediccion y un modo de operacion correspondiente de acuerdo con una profundidad de una unidad de codificacion, o una relacion entre codificacion/decodificacion usando el mapa de significado de arbol y un modo de operacion correspondiente de acuerdo con una profundidad de una unidad de codificacion, puede establecerse en el conjunto 1900 de parametros de secuencia.

Una profundidad de bits de una muestra de entrada input_sample_bit_depth y una profundidad de bits de una muestra interna internal_sample_bit_depth puede establecerse tambien en el conjunto 1900 de parametros de secuencia.

La informacion con respecto a una relacion entre una profundidad de una unidad de codificacion, una herramienta de codificacion, y un modo de operacion codificada por el aparato 1400 de codificacion de video o decodificada por el aparato 1500 de decodificacion de video de acuerdo con una realizacion ejemplar no esta limitada a la informacion insertada en el conjunto 1900 de parametros de secuencia ilustrado en la Figura 21. Por ejemplo, la informacion puede codificarse o decodificarse en unidades de codificacion maxima, unidades de corte, unidades de fotograma, unidades de instantanea, o unidades de GOP de la imagen.

La Figura 22 es un diagrama de flujo que ilustra un procedimiento de codificacion de video basandose en una herramienta de codificacion que considera un tamano de una unidad de codificacion, de acuerdo con una realizacion ejemplar. Haciendo referencia a la Figura 22, en la operacion 2010, una instantanea actual se divide en al menos una unidad de codificacion maxima.

En la operacion 2020, una profundidad codificada se determina codificando la al menos una unidad de codificacion maxima en unidades de codificacion que corresponden a las profundidades en modos de operacion de herramientas de codificacion, respectivamente, basandose en una relacion entre una profundidad de al menos una unidad de codificacion de la al menos una unidad de codificacion maxima, una herramienta de codificacion, y un modo de operacion. Por lo tanto, la al menos una unidad de codificacion maxima incluye unidades de codificacion que corresponden a al menos una profundidad codificada.

La relacion entre una profundidad de al menos una unidad de codificacion de la al menos una unidad de codificacion maxima, una herramienta de codificacion, y un modo de operacion puede preestablecerse en unidades de cortes, fotogramas, GOP, o secuencias de fotogramas de una imagen. La relacion entre una profundidad de al menos una unidad de codificacion de la al menos una unidad de codificacion maxima, una herramienta de codificacion, y un modo de operacion puede determinarse comparando resultados de codificacion de las unidades de codificacion que corresponden a las profundidades en al menos un modo de operacion haciendo coincidir herramientas de codificacion entre sf, y seleccionando un modo de operacion que tiene una eficacia de codificacion mas alta de entre el al menos un modo de operacion durante la codificacion de la al menos una unidad de codificacion maxima. De otra manera, la relacion entre una profundidad de al menos una unidad de codificacion de la al menos una unidad de codificacion maxima, una herramienta de codificacion, y un modo de operacion, puede determinarse de tal manera que las unidades de codificacion que corresponden a las profundidades, los tamanos de las cuales son menores o iguales que un tamano predeterminado, puede corresponder a un modo de operacion que no provoca que se inserten bits de tara en un flujo de datos codificado y las otras unidades de codificacion, los tamanos de las cuales son mayores que el tamano predeterminado, puede corresponder a un modo de operacion que provoca los bits de tara.

En la operacion 2030, se emite un flujo de bits que incluye datos de video codificados de la al menos una profundidad codificada, informacion con respecto a la codificacion, e informacion con respecto a la relacion entre una profundidad de al menos una unidad de codificacion de la al menos una unidad de codificacion maxima, una

5

10

15

20

25

30

herramienta de codificacion, y un modo de operacion en la al menos una unidad de codificacion maxima. La informacion con respecto a la codificacion puede incluir la al menos una profundidad codificada e informacion con respecto a un modo de codificacion en la al menos una unidad de codificacion maxima. La informacion con respecto a la relacion entre una profundidad de al menos una unidad de codificacion de la al menos una unidad de codificacion maxima, una herramienta de codificacion, y un modo de operacion, puede insertarse en unidades de corte, unidades de fotograma, GOP, o secuencias de fotogramas de la imagen.

La Figura 23 es un diagrama de flujo que ilustra un procedimiento de decodificacion de video basandose en una herramienta de codificacion que considera un tamano de una unidad de codificacion, de acuerdo con una realizacion ejemplar. Haciendo referencia a la Figura 23, en la operacion 2110, un flujo de bits que incluye datos de video codificados se recibe y analiza.

En la operacion 2120, los datos de video codificados, informacion con respecto a la codificacion, e informacion con respecto a una relacion entre una profundidad de una unidad de codificacion, una herramienta de codificacion, y un modo de operacion se extraen desde el flujo de bits. La informacion con respecto a una relacion entre una profundidad de una unidad de codificacion, una herramienta de codificacion, y un modo de operacion puede extraerse desde el flujo de bits en unidades de codificacion maxima, unidades de corte, unidades de fotograma, unidades de GOP, o secuencias de fotogramas de una imagen.

En la operacion 2130, los datos de video codificados se decodifican en unidades de codificacion maxima de acuerdo con un modo de operacion de una herramienta de codificacion que hace coincidir una unidad de codificacion que corresponde a al menos una profundidad codificada, basandose en la informacion con respecto a la codificacion y la informacion con respecto a una relacion entre una profundidad de una unidad de codificacion, una herramienta de codificacion, y un modo de operacion, extrafdos desde el flujo de bits.

Aunque no estan restringidas a lo mismo, una o mas realizaciones ejemplares pueden escribirse como programas informaticos y pueden implementarse en ordenadores digitales de uso general que ejecutan los programas usando un medio de grabacion legible por ordenador. Ejemplos del medio de grabacion legible por ordenador incluyen medio de almacenamiento magnetico (por ejemplo, ROM, discos flexibles, discos duros, etc.) y medio de grabacion optico (por ejemplo, CD-ROM o DVD). Ademas, aunque no se requiere en todas las realizaciones ejemplares, una o mas unidades del aparato 100 o 1400 de codificacion de video, el aparato 200 o 1500 de decodificacion de video, el codificador 400 de imagen, y el decodificador 500 de imagen pueden incluir un procesador o microprocesador que ejecuta un programa informatico almacenado en un medio legible por ordenador.

Claims

REIVINDICACIONES

1. Un aparato de decodificacion de datos (1500) de v^deo, comprendiendo el aparato:

un receptor (1510) que recibe y analiza un flujo de bits que comprende datos de video codificados;

un extractor (1520) que extrae, desde el flujo de bits, los datos de video codificados, informacion acerca de un 5 tamano maximo de una unidad de codificacion, informacion de division de una unidad de codificacion, e informacion sobre una relacion entre una profundidad de una unidad de codificacion y un modo de cuantificacion, en el que el modo de cuantificacion indica si se ha de usar un delta de parametro de cuantificacion; y

un decodificador (1530) que decodifica los datos de video codificados realizando cuantificacion inversa, en el que:

una imagen se divide en una pluralidad de unidades de codificacion maxima usando la informacion acerca de un 10 tamano maximo de una unidad de codificacion,

la unidad de codificacion maxima se divide jerarquicamente en una o mas unidades de codificacion de profundidades que incluyen al menos una de una profundidad actual y una profundidad inferior de acuerdo con la informacion de division de la unidad de codificacion,

que comprende adicionalmente, para una unidad de codificacion de la profundidad actual:

15 el extractor determina adicionalmente si se ha de usar el delta del parametro de cuantificacion en la unidad de codificacion de la profundidad actual, basandose en la informacion sobre dicha relacion,

cuando la informacion de division indica una division para la profundidad actual, la unidad de codificacion de la profundidad actual se divide en cuatro unidades de codificacion de la profundidad inferior, independientemente de las unidades de codificacion vecinas, y

20 cuando la informacion de division indica una no division para la profundidad actual, se determinan unidades de transformacion desde la unidad de codificacion de la profundidad actual, y el decodificador realiza cuantificacion inversa en las unidades de transformacion usando el resultado de la determinacion de si se ha de usar el delta del parametro de cuantificacion en la unidad de codificacion de la profundidad actual.