ES2598106T3

ES2598106T3 - Procedimiento y aparato para codificar vídeo mediante predicción de movimiento usando partición arbitraria, y procedimiento y aparato para decodificar vídeo mediante predicción de movimiento usando partición arbitraria

Info

Publication number: ES2598106T3
Application number: ES13167741.1T
Authority: ES
Inventors: Sun-Il Lee; Min-Su Cheon; Woo-Jin Han
Original assignee: Samsung Electronics Co Ltd
Current assignee: Samsung Electronics Co Ltd
Priority date: 2009-12-08
Filing date: 2010-12-08
Publication date: 2017-01-25
Anticipated expiration: 2030-12-08
Also published as: CN104539960B; US8885723B2; RU2014104111A; CN102771124B; CA2816755A1; CN104581165B; RU2517404C2; WO2011071308A2; HRP20150304T1; RS53897B1; EP2510698B1; CN102771124A; EP2908525A1; PL2629527T3; CA2783786A1; US20140192874A1; EP2899978B1; US20140192875A1; LT2510698T; KR20110064694A

Abstract

Un procedimiento de decodificación de un vídeo, comprendiendo el procedimiento: recibir y analizar un flujo de bits de una imagen codificada; analizar, a partir del flujo de bits, información de división que indica si una unidad de codificación se divide en unidades de codificación más pequeñas e información que indica si se usan particiones asimétricas para inter predicción; determinar una o más unidades de codificación incluidas en una unidad de codificación máxima usando la información de división; determinar particiones para realizar inter predicción en una unidad de codificación entre la una o más unidades de codificación usando la información que indica si se usan particiones asimétricas de una unidad de codificación para inter predicción; y realizar compensación de movimiento usando las particiones para la unidad de codificación, en el que: la determinación de la una o más unidades de codificación incluidas en una unidad de codificación máxima comprende: analizar, a partir del flujo de bits, información para determinar un tamaño máximo de una unidad de codificación y la información de división que indica si una unidad de codificación se divide en unidades de codificación más pequeñas; dividir la imagen en una pluralidad de unidades de codificación máxima de acuerdo con la información para determinar un tamaño máximo de una unidad de codificación; y dividir jerárquicamente la unidad de codificación máxima entre la pluralidad de codificación máxima en la una o más unidades de codificación de profundidades de acuerdo con la información de división, en el que dividir jerárquicamente la unidad de codificación máxima en una o más unidades de codificación de profundidades comprende: cuando la información de división indica una división de una unidad de codificación de una profundidad actual entre la una o más unidades de codificación de profundidades, dividir la unidad de codificación de la profundidad actual en unidades de codificación cuadradas de una profundidad inferior, y cuando la información de división indica una no división de la unidad de codificación de la profundidad actual, dividir la unidad de codificación de la profundidad actual en las particiones de la unidad de codificación de la profundidad actual, en el que determinar las particiones comprende: cuando la información indica que las particiones asimétricas no se usan para inter predicción, determinar particiones simétricas que indican una de una partición obtenida no dividiendo la unidad de codificación de la profundidad actual y particiones obtenidas dividiendo al menos una de una altura y una anchura de la unidad de codificación de la profundidad actual de acuerdo con una proporción simétrica de 1:1, y cuando la información indica que las particiones asimétricas se usan para inter predicción, determinar las particiones asimétricas obtenidas dividiendo una de una altura y una anchura de la unidad de codificación de la profundidad actual de acuerdo con una proporción asimétrica de 1:3 o 3:1 o particiones simétricas que indican una de una partición obtenida no dividiendo la unidad de codificación de la profundidad actual en una o más unidades de codificación y particiones obtenidas dividiendo al menos una de una altura y una anchura de la unidad de codificación de la profundidad actual de acuerdo con una proporción simétrica de 1:1.

Description

imagen1

imagen2

imagen3

imagen4

imagen5

10

15

20

25

30

35

40

45

50

55

realizar la codificación de predicción en los datos de imagen en la unidad de codificación.

Para realizar codificación de predicción en la unidad de codificación máxima, la codificación de predicción puede realizarse basándose en una unidad de codificación que corresponde a una profundidad codificada, es decir, basándose en una unidad de codificación que ya no se divide en unidades de codificación que corresponden a una profundidad inferior. En lo sucesivo, la unidad de codificación que ya no se divide se hace una unidad base para codificación de predicción que se denominará ahora como una ‘unidad de predicción’. Una partición obtenida dividiendo la unidad de predicción puede incluir una unidad de predicción o una unidad de datos obtenida dividiendo al menos una de una altura y una anchura de la unidad de predicción.

Por ejemplo, cuando una unidad de codificación de 2Nx2N (donde N es un entero positivo) ya no se divide y se hace una unidad de predicción de 2Nx2N, y un tamaño de una partición puede ser 2Nx2N, 2NxN, Nx2N, o NxN. Ejemplos de un tipo de partición incluyen particiones simétricas que se obtienen dividiendo simétricamente una altura o anchura de la unidad de predicción, las particiones obtenidas dividiendo asimétricamente la altura o anchura de la unidad de predicción, tales como 1:n o n:-1, particiones que se obtienen dividiendo geométricamente la unidad de predicción, y particiones que tienen formas arbitrarias.

Un modo de predicción de la unidad de predicción puede ser al menos uno de un modo intra, un modo inter, y un modo de salto. Por ejemplo, el modo intra o el modo inter pueden realizarse en la partición de 2Nx2N, 2NxN, Nx2N,

o NxN. También, el modo de salto puede realizarse únicamente en la partición de 2Nx2N. La codificación se realiza independientemente en una unidad de predicción en una unidad de codificación, seleccionando de esta manera un modo de predicción que tiene un menor error de codificación.

El aparato 100 de codificación de vídeo puede realizar también la transformación en los datos de imagen en una unidad de codificación basándose no únicamente en la unidad de codificación para codificar los datos de imagen, sino también basándose en una unidad de datos que es diferente de la unidad de codificación.

Para realizar la transformación en la unidad de codificación, la transformación puede realizarse basándose en una unidad de datos que tiene un tamaño menor que o igual a la unidad de codificación. Por ejemplo, la unidad de datos para la transformación puede incluir una unidad de datos para un modo intra y una unidad de datos para un modo inter.

Una unidad de datos usada como una base de la transformación se denominará ahora como una ‘unidad de transformación’. Puede establecerse también una profundidad de transformación que indica el número de veces de división para alcanzar la unidad de transformación dividiendo la altura y anchura de la unidad de codificación en la unidad de transformación. Por ejemplo, en una unidad de codificación actual de 2Nx2N, una profundidad de transformación puede ser 0 cuando el tamaño de una unidad de transformación es también 2Nx2N, puede ser 1 cuando cada una de la altura y anchura de la unidad de codificación actual se divide en dos partes iguales, dividida totalmente en 4^1 unidades de transformación, y el tamaño de la unidad de transformación es por lo tanto NxN, y puede ser 2 cuando cada una de la altura y anchura de la unidad de codificación actual se divide en cuatro partes iguales, dividida totalmente en 4^2 unidades de transformación y el tamaño de la unidad de transformación es por lo tanto N/2xN/2. Por ejemplo, la unidad de transformación puede establecerse de acuerdo con una estructura de árbol jerárquico, en la que una unidad de transformación de una profundidad de transformación superior se divide en cuatro unidades de transformación de una profundidad de transformación inferior de acuerdo con las características jerárquicas de una profundidad de transformación.

De manera similar a la unidad de codificación, la unidad de transformación en la unidad de codificación puede dividirse recursivamente en regiones con tamaño más pequeño, de modo que la unidad de transformación puede determinarse independientemente en unidades de regiones. Por lo tanto, los datos residuales en la unidad de codificación pueden dividirse de acuerdo con la transformación que tiene la estructura de árbol de acuerdo con las profundidades de transformación.

La información de codificación de acuerdo con las unidades de codificación que corresponden a una profundidad codificada requiere no únicamente información acerca de la profundidad codificada, sino también acerca de información relacionada con codificación de predicción y transformación. Por consiguiente, el determinador 120 de unidad de codificación no determina únicamente una profundidad codificada que tiene un menor error de codificación, sino determina también un tipo de partición en una unidad de predicción, un modo de predicción de acuerdo con unidades de predicción, y un tamaño de una unidad de transformación para transformación.

Las unidades de codificación de acuerdo con una estructura de árbol en una unidad de codificación máxima y un procedimiento de determinación de una partición de acuerdo con realizaciones ejemplares, se describirán en detalle más adelante con referencia a las Figuras 3 a 12.

El determinador 120 de unidad de codificación puede medir un error de codificación de unidades de codificación más profundas de acuerdo con las profundidades usando optimización de tasa-distorsión basándose en multiplicadores de Lagrange.

5

10

15

20

25

30

35

40

45

50

55

La unidad 130 de salida emite los datos de imagen de la unidad de codificación máxima, que se codifica basándose en la al menos una profundidad codificada determinada mediante el determinador 120 de unidad de codificación, y la información acerca del modo de codificación de acuerdo con la profundidad codificada, en flujos de bits.

Los datos de imagen codificados pueden obtenerse codificando datos residuales de una imagen.

La información acerca del modo de codificación de acuerdo con la profundidad codificada puede incluir información acerca de la profundidad codificada, acerca del tipo de partición en la unidad de predicción, el modo de predicción, y el tamaño de la unidad de transformación.

La información acerca de la profundidad codificada puede definirse usando información de división de acuerdo con las profundidades, que indica si se realiza codificación en unidades de codificación de una profundidad inferior en lugar de en una profundidad actual. Si la profundidad actual de la unidad de codificación actual es la profundidad codificada, los datos de imagen en la unidad de codificación actual se codifican y emiten, y por lo tanto la información de división puede definirse para no dividir la unidad de codificación actual a una profundidad inferior. Como alternativa, si la profundidad actual de la unidad de codificación actual no es la profundidad codificada, la codificación se realiza en la unidad de codificación de la profundidad inferior, y por lo tanto la información de división puede definirse para dividir la unidad de codificación actual para obtener las unidades de codificación de la profundidad inferior.

Si la profundidad actual no es la profundidad codificada, se realiza la codificación en la unidad de codificación que se divide en al menos una unidad de codificación de la profundidad inferior. Puesto que al menos existe una unidad de codificación de la profundidad inferior en una unidad de codificación de la profundidad actual, la codificación se realiza repetitivamente en cada unidad de codificación de la profundidad inferior, y por lo tanto la codificación puede realizarse recursivamente para las unidades de codificación que tienen la misma profundidad.

Puesto que las unidades de codificación que tienen una estructura de árbol se determinan para una unidad de codificación máxima, y la información acerca de al menos un modo de codificación se determina para una unidad de codificación de una profundidad codificada, la información acerca de al menos un modo de codificación puede determinarse para una unidad de codificación máxima. También, una profundidad codificada de los datos de imagen de la unidad de codificación máxima puede ser diferente de acuerdo con las localizaciones puesto que los datos de imagen se dividen jerárquicamente de acuerdo con las profundidades, y por lo tanto la información acerca de la profundidad codificada y el modo de codificación pueden establecerse para los datos de imagen.

Por consiguiente, la unidad 130 de salida puede asignar información de codificación acerca de una profundidad codificada correspondiente y un modo de codificación a al menos una de la unidad de codificación, la unidad de predicción, y una unidad mínima incluida en la unidad de codificación máxima.

La unidad mínima de acuerdo con una realización ejemplar, es una unidad de datos rectangular obtenida dividiendo la unidad de codificación mínima que constituye la profundidad más baja por 4. Como alternativa, la unidad mínima puede ser una unidad de datos rectangular máxima que puede incluirse en todas las unidades de codificación, unidades de predicción, unidades de partición, y unidades de transformación incluidas en la unidad de codificación máxima.

Por ejemplo, la información de codificación emitida a través de la unidad 130 de salida puede clasificarse en información de codificación de acuerdo con unidades de codificación, e información de codificación de acuerdo con unidades de predicción. La información de codificación de acuerdo con las unidades de codificación puede incluir la información acerca del modo de predicción y acerca del tamaño de las particiones. La información de codificación de acuerdo con las unidades de predicción puede incluir información acerca de una dirección estimada de un modo inter, acerca de un índice de imagen de referencia del modo inter, acerca de un vector de movimiento, acerca de un componente de crominancia de un modo intra, y acerca de un procedimiento de interpolación del modo intra. También, puede insertarse información acerca de un tamaño máximo de la unidad de codificación definido de acuerdo con las instantáneas, cortes, o GOP, e información acerca de una profundidad máxima en SPS (Conjunto de Parámetros de Secuencia) o un encabezamiento de un flujo de bits.

En el aparato 100 de codificación de vídeo, la unidad de codificación más profunda puede ser una unidad de codificación obtenida dividiendo por dos una altura o anchura de una unidad de codificación de una profundidad superior, que está una capa por encima. En otras palabras, cuando el tamaño de la unidad de codificación de la profundidad actual es 2Nx2N, el tamaño de la unidad de codificación de la profundidad inferior es NxN. También, la unidad de codificación de la profundidad actual que tiene el tamaño de 2Nx2N puede incluir un máximo de 4 unidades de codificación de la profundidad inferior.

Por consiguiente, el aparato 100 de codificación de vídeo puede formar las unidades de codificación que tienen la estructura de árbol determinando unidades de codificación que tienen una forma óptima y un tamaño óptimo para cada unidad de codificación máxima, basándose en el tamaño de la unidad de codificación máxima y la profundidad máxima determinada mientras se consideran las características de la instantánea actual. También, puesto que la codificación puede realizarse en cada unidad de codificación máxima usando uno cualquiera de diversos modos de predicción y transformaciones, puede determinarse un modo de codificación óptimo mientras se consideran las

imagen6

imagen7

10

15

20

25

30

35

40

45

50

55

profundidad máxima de los datos 330 de vídeo es 1, las unidades 335 de codificación de los datos 330 de vídeo pueden incluir una unidad de codificación máxima que tiene un tamaño de eje de longitud de 16, y unidades de codificación que tienen un tamaño de eje de longitud de 8 puesto que las profundidades profundizan en una capa dividiendo la unidad de codificación máxima una vez.

Puesto que la profundidad máxima de los datos 320 de vídeo es 3, las unidades 325 de codificación de los datos 320 de vídeo pueden incluir una unidad de codificación máxima que tiene un tamaño de eje de longitud de 64, y unidades de codificación que tienen tamaños de ejes de longitud de 32, 16, y 8 puesto que las profundidades profundizan a 3 capas dividiendo la unidad de codificación máxima tres veces. A medida que una profundidad se hace profunda, puede expresarse con precisión la información detallada.

La Figura 4 es un diagrama de bloques de un codificador 400 de imagen basándose en unidades de codificación de acuerdo con una realización ejemplar.

El codificador 400 de imagen realiza operaciones del determinador 120 de unidad de codificación del aparato 100 de codificación de vídeo para codificar datos de imagen. En otras palabras, un predictor 410 intra realiza intra predicción en unidades de codificación en un modo intra, de entre un fotograma 405 actual, y un estimador 420 de movimiento y un compensador 425 de movimiento realiza inter estimación y compensación de movimiento en unidades de codificación en un modo inter de entre el fotograma 405 actual usando el fotograma 405 actual, y un fotograma 495 de referencia.

Los datos emitidos desde el predictor 410 intra, el estimador 420 de movimiento, y el compensador 425 de movimiento se emiten como un coeficiente de transformación cuantificado a través de un transformador 430 y un cuantificador 440. El coeficiente de transformación cuantificado se restaura como datos en un dominio espacial a través de un cuantificador 460 inverso y un transformador 470 inverso, y los datos restaurados en el dominio espacial se emiten como el fotograma 495 de referencia después de que se post-procesan a través de una unidad 480 de desbloqueo y una unidad 490 de filtrado en bucle. El coeficiente de transformación cuantificado puede emitirse como un flujo de bits 455 a través de un codificador 450 por entropía.

Para que se aplique el codificador 400 de imagen en el aparato 100 de codificación de vídeo, todos los elementos del codificador 400 de imagen, es decir, el predictor 410 intra, el estimador 420 de movimiento, el compensador 425 de movimiento, el transformador 430, el cuantificador 440, el codificador 450 por entropía, el cuantificador 460 inverso, el transformador 470 inverso, la unidad 480 de desbloqueo, y la unidad 490 de filtrado en bucle realizan operaciones basándose en cada unidad de codificación de entre las unidades de codificación que tienen una estructura de árbol mientras consideran la profundidad máxima de cada unidad de codificación máxima.

Específicamente, el predictor 410 intra, el estimador 420 de movimiento, y el compensador 425 de movimiento determinan particiones y un modo de predicción de cada unidad de codificación de entre las unidades de codificación que tienen una estructura de árbol mientras consideran el tamaño máximo y la profundidad máxima de una unidad de codificación máxima actual, y el transformador 430 determina el tamaño de la unidad de transformación en cada unidad de codificación de entre las unidades de codificación que tienen una estructura de árbol.

La Figura 5 es un diagrama de bloques de un decodificador 500 de imagen basándose en unidades de codificación, de acuerdo con una realización ejemplar.

Un analizador 510 analiza datos de imagen codificados a decodificar e información acerca de la codificación requerida para decodificar desde un flujo de bits 505. Los datos de imagen codificados se emiten como datos cuantificados inversos a través de un decodificador 520 por entropía y un cuantificador 530 inverso, y los datos cuantificados inversos se restauran a datos de imagen en un dominio espacial a través de un transformador 540 inverso.

Un predictor 550 intra realiza intra predicción en unidades de codificación en un modo intra con respecto a los datos de imagen en el dominio espacial, y un compensador 560 de movimiento realiza compensación de movimiento en unidades de codificación en un modo inter usando un fotograma 585 de referencia.

Los datos de imagen en el dominio espacial, que se pasan a través del predictor 550 intra y del compensador 560 de movimiento, pueden emitirse como un fotograma 595 restaurado después de post-procesarse a través de una unidad 570 de desbloqueo y una unidad 580 de filtrado en bucle. También, los datos de imagen que se postprocesan a través de la unidad 570 de desbloqueo y la unidad 580 de filtrado en bucle pueden emitirse como el fotograma 585 de referencia.

Para decodificar los datos de imagen en el decodificador 230 de datos de imagen del aparato 200 de decodificación de vídeo, el decodificador 500 de imagen puede realizar operaciones que se realizan después del analizador 510.

Para que el decodificador 500 de imagen se aplique en el aparato 200 de decodificación de vídeo, todos los elementos del decodificador 500 de imagen, es decir, el analizador 510, el decodificador 520 por entropía, el cuantificador 530 inverso, el transformador 540 inverso, el predictor 550 intra, el compensador 560 de movimiento, la

10

15

20

25

30

35

40

45

50

55

unidad 570 de desbloqueo, y la unidad 580 de filtrado en bucle realizan operaciones basándose en unidades de codificación que tienen una estructura de árbol para cada unidad de codificación máxima.

Específicamente, el predictor 550 intra y el compensador 560 de movimiento realizan operaciones basándose en particiones y un modo de predicción para cada una de las unidades de codificación que tienen una estructura de árbol, y el transformador 540 inverso realiza operaciones basándose en un tamaño de una unidad de transformación para cada unidad de codificación.

La Figura 6 es un diagrama que ilustra unidades de codificación más profundas de acuerdo con las profundidades y particiones, de acuerdo con una realización ejemplar.

El aparato 100 de codificación de vídeo y el aparato 200 de decodificación de vídeo usan unidades de codificación jerárquicas para considerar las características de una imagen. Una altura máxima, una anchura máxima y una profundidad máxima de unidades de codificación pueden determinarse de manera adaptativa de acuerdo con las características de la imagen, o pueden establecerse de manera diferente por un usuario. Los tamaños de las unidades de codificación más profundas de acuerdo con las profundidades pueden determinarse de acuerdo con el tamaño máximo predeterminado de la unidad de codificación.

En una estructura 600 jerárquica de unidades de codificación, de acuerdo con una realización ejemplar, la altura máxima y la anchura máxima de las unidades de codificación son cada una 64, y la profundidad máxima es 4. Puesto que una profundidad se hace profunda a lo largo de un eje vertical de la estructura 600 jerárquica, una altura y una anchura de la unidad de codificación más profunda se dividen ambas. También, una unidad de predicción y las particiones, que son las bases para la codificación de predicción de cada unidad de codificación más profunda, se muestran a lo largo de un eje horizontal de la estructura 600 jerárquica.

En otras palabras, una unidad 610 de codificación es una unidad de codificación máxima en la estructura 600 jerárquica, en la que la una profundidad es 0 y un tamaño, es decir, una altura por anchura, es 64x64. La profundidad se hace profunda a lo largo del eje vertical, y existe una unidad 620 de codificación que tiene un tamaño de 32x32 y una profundidad de 1, una unidad 630 de codificación que tiene un tamaño de 16x16 y una profundidad de 2, una unidad 640 de codificación que tiene un tamaño de 8x8 y una profundidad de 3, y una unidad 650 de codificación que tiene un tamaño de 4x4 y una profundidad de 4. La unidad 650 de codificación que tiene el tamaño de 4x4 y la profundidad de 4 es una unidad de codificación mínima.

La unidad de predicción y las particiones de una unidad de codificación están dispuestas a lo largo del eje horizontal de acuerdo con cada profundidad. En otras palabras, si la unidad 610 de codificación que tiene el tamaño de 64x64 y la profundidad de 0 es una unidad de predicción, la unidad de predicción puede dividirse en particiones incluidas en la unidad 610 de codificación, es decir una partición 610 que tiene un tamaño de 64x64, particiones 612 que tienen el tamaño de 64x32, particiones 614 que tienen el tamaño de 32x64, o particiones 616 que tienen el tamaño de 32x32.

De manera similar, una unidad de predicción de la unidad 620 de codificación que tiene el tamaño de 32x32 y la profundidad de 1 puede dividirse en particiones incluidas en la unidad 620 de codificación, es decir una partición 620 que tiene un tamaño de 32x32, particiones 622 que tienen un tamaño de 32x16, particiones 624 que tienen un tamaño de 16x32, y particiones 626 que tienen un tamaño de 16x16.

De manera similar, una unidad de predicción de la unidad 630 de codificación que tiene el tamaño de 16x16 y la profundidad de 2 puede dividirse en particiones incluidas en la unidad 630 de codificación, es decir, una partición que tiene un tamaño de 16x16 incluida en la unidad 630 de codificación, particiones 632 que tienen un tamaño de 16x8, particiones 634 que tienen un tamaño de 8x16, y particiones 636 que tienen un tamaño de 8x8.

De manera similar, una unidad de predicción de la unidad 640 de codificación que tiene el tamaño de 8x8 y la profundidad de 3 puede dividirse en particiones incluidas en la unidad 640 de codificación, es decir una partición que tiene un tamaño de 8x8 incluida en la unidad 640 de codificación, particiones 642 que tienen un tamaño de 8x4, particiones 644 que tienen un tamaño de 4x8, y particiones 646 que tienen un tamaño de 4x4.

La unidad 650 de codificación que tiene el tamaño de 4x4 y la profundidad de 4 es la unidad de codificación mínima y una unidad de codificación de la profundidad más baja. Una unidad de predicción de la unidad 650 de codificación se asigna únicamente a una partición que tiene un tamaño de 4x4.

Para determinar la al menos una profundidad codificada de las unidades de codificación que constituyen la unidad 610 de codificación máxima, el determinador 120 de unidad de codificación del aparato 100 de codificación de vídeo realiza codificación para unidades de codificación que corresponden a cada profundidad incluida en la unidad 610 de codificación máxima.

Un número de unidades de codificación más profundas de acuerdo con las profundidades que incluyen datos en el mismo intervalo y el mismo tamaño aumenta a medida que la profundidad se hace profunda. Por ejemplo, se requieren cuatro unidades de codificación que corresponden a una profundidad de 2 para cubrir datos que están incluidos en una unidad de codificación que corresponde a una profundidad de 1. Por consiguiente, para comparar

imagen8

10

15

20

25

30

35

40

45

50

55

Una unidad 910 para codificar por predicción una unidad 900 de codificación que tiene una profundidad de 0 y un tamaño de 2N_0x2N_0 puede incluir particiones de un tipo 912 de partición que tiene un tamaño de 2N_0x2N_0, un tipo 914 de partición que tiene un tamaño de 2N_0xN_0, un tipo 916 de partición que tiene un tamaño de N_0x2N_0, y un tipo 918 de partición que tiene un tamaño de N_0xN_0. La Figura 9 ilustra únicamente los tipos 912 a 918 de particiones que se obtienen dividiendo simétricamente la unidad 910 de predicción, pero un tipo de partición no está limitado a las mismas, y las particiones de la unidad 910 de predicción puede incluir particiones asimétricas, particiones que tienen una forma determinada y particiones que tienen una forma geométrica.

La codificación de predicción se realiza repetitivamente en una partición que tiene un tamaño de 2N_0x2N_0, dos particiones que tienen un tamaño de 2N_0xN_0, dos particiones que tienen un tamaño de N_0x2N_0, y cuatro particiones que tienen un tamaño de N_0xN_0, de acuerdo con cada tipo de partición. La codificación de predicción en un modo intra y en un modo inter puede realizarse en las particiones que tienen los tamaños de 2N_0x2N_0, N_0x2N_0, 2N_0xN_0, y N_0xN_0. La codificación de predicción en un modo de salto se realiza únicamente en la partición que tiene el tamaño de 2N_0x2N_0.

Se comparan los errores de codificación que incluyen la codificación de predicción en los tipos 912 a 918 de particiones, y se determina el menor error de codificación entre los tipos de partición. Si un error de codificación es el más pequeño en uno de los tipos de particiones 912 a 916, la unidad 910 de predicción puede no dividirse en una profundidad inferior.

Si el error de codificación es el más pequeño en el tipo 918 de partición, se cambia una profundidad desde 0 a 1 para dividir el tipo 918 de partición en la operación 920, y la codificación se realiza repetitivamente en las unidades 930 de codificación que tienen una profundidad de 2 y un tamaño de N_0xN_0 para buscar un error de codificación mínimo.

Una unidad 940 de predicción para codificar por predicción la unidad 930 de codificación que tiene una profundidad de 1 y un tamaño de 2N_1x2N_1 (=N_0xN_0) puede incluir particiones de un tipo 942 de partición que tiene un tamaño de 2N_1x2N_1, un tipo 944 de partición que tiene un tamaño de 2N_1xN_1, un tipo 946 de partición que tiene un tamaño de N_1x2N_1, y un tipo 948 de partición que tiene un tamaño de N_1xN_1.

Si un error de codificación es el más pequeño en el tipo 948 de partición, se cambia una profundidad desde 1 a 2 para dividir el tipo 948 de partición en la operación 950, y se realiza la codificación repetitivamente en unidades 960 de codificación, que tienen una profundidad de 2 y un tamaño de N_2xN_2 para buscar un error de codificación mínimo.

Cuando una profundidad máxima es d, la operación de división de acuerdo con cada profundidad puede realizarse hasta cuando una profundidad se hace d-1, y la información de división puede codificarse como hasta cuando una profundidad es una de 0 a d-2. En otras palabras, cuando se realiza codificación hasta cuando la profundidad es d-1 después de que se divide una unidad de codificación que corresponde a una profundidad de d-2 en la operación 970, una unidad 990 de predicción para codificar por predicción una unidad 980 de codificación que tiene una profundidad de d-1 y un tamaño de 2N_(d-1)x2N_(d-1) puede incluir particiones de un tipo 992 de partición que tiene un tamaño de 2N_(d-1)x2N_(d-1), un tipo 994 de partición que tiene un tamaño de 2N_(d-1)xN_(d-1), un tipo 996 de partición que tiene un tamaño de N_(d-1)x2N_(d-1), y un tipo 998 de partición que tiene un tamaño de N_(d-1)xN_(d1).

La codificación de predicción puede realizarse repetitivamente en una partición que tiene un tamaño de 2N_(d1)x2N_(d-1), dos particiones que tienen un tamaño de 2N_(d-1)xN_(d-1), dos particiones que tienen un tamaño de N_(d-1)x2N_(d-1), cuatro particiones que tienen un tamaño de N_(d-1)xN_(d-1) de entre los tipos 992 a 998 de particiones para buscar un tipo de partición que tiene un error de codificación mínimo.

Incluso cuando el tipo 998 de partición tiene el error de codificación mínimo, puesto que una profundidad máxima es d, una unidad de codificación CU_(d-1) que tiene una profundidad de d-1 ya no se divide a una profundidad inferior, y una profundidad codificada para las unidades de codificación que constituyen una unidad 900 de codificación máxima actual se determina que es d-1 y un tipo de partición de la unidad 900 de codificación máxima actual puede determinarse que es N_(d-1)xN_(d-1). También, puesto que la profundidad máxima es d y una unidad 980 de codificación mínima que tiene una profundidad más baja de d-1 ya no se divide a una profundidad inferior, no se establece la información de división para la unidad 980 de codificación mínima.

Una unidad 999 de datos puede ser una ‘unidad mínima’ para la unidad de codificación máxima actual. Una unidad mínima, de acuerdo con una realización ejemplar, puede ser una unidad de datos rectangular obtenida dividiendo una unidad 980 de codificación mínima por 4. Realizando la codificación repetitivamente, el aparato 100 de codificación de vídeo puede seleccionar una profundidad que tiene el menor error de codificación comparando errores de codificación de acuerdo con las profundidades de la unidad 900 de codificación para determinar una profundidad codificada, y establecer un tipo de partición correspondiente y un modo de predicción como un modo de codificación de la profundidad codificada.

Como tal, los errores de codificación mínimos de acuerdo con las profundidades se comparan en todas las profundidades de 1 a d, y puede determinarse una profundidad que tiene el menor error de codificación como una

10

15

20

25

30

35

40

profundidad codificada. La profundidad codificada, el tipo de partición de la unidad de predicción, y el modo de predicción pueden codificarse y transmitirse como información acerca de un modo de codificación. También, puesto que una unidad de codificación se divide desde una profundidad de 0 a una profundidad codificada, únicamente la información de división de la profundidad codificada se establece a 0, y la información de división de las profundidades excluyendo la profundidad codificada se establece a 1.

Los datos de imagen y el extractor 220 de información de codificación del aparato 200 de decodificación de vídeo pueden extraer y usar la información acerca de la profundidad codificada y la unidad de predicción de la unidad 900 de codificación para decodificar la partición 912. El aparato 200 de decodificación de vídeo puede determinar una profundidad, en el que la información de división es 0, como una profundidad codificada usando información de división de acuerdo con las profundidades, y usar la información acerca de un modo de codificación de la correspondiente profundidad para decodificar.

Las Figuras 10 a 12 son diagramas para describir una relación entre unidades 1010 de codificación, unidades 1060 de predicción, y unidades 1070 de transformación, de acuerdo con una realización ejemplar.

Las unidades 1010 de codificación son unidades de codificación que tienen una estructura de árbol, que corresponde a profundidades codificadas determinadas por el aparato 100 de codificación de vídeo, en una unidad de codificación máxima. Las unidades 1060 de predicción son particiones de unidades de predicción de cada una de las unidades 1010 de codificación, y las unidades 1070 de transformación son unidades de transformación de cada una de las unidades 1010 de codificación.

Cuando una profundidad de una unidad de codificación máxima es 0 en las unidades 1010 de codificación, las profundidades de las unidades 1012 y 1054 de codificación son 1, las profundidades de las unidades 1014, 1016, 1018, 1028, 1050, y 1052 de codificación son 2, las profundidades de las unidades 1020, 1022, 1024, 1026, 1030, 1032, y 1048 de codificación son 3, y las profundidades de las unidades 1040, 1042, 1044, y 1046 de codificación son 4.

En las unidades 1060 de predicción, se obtienen algunas unidades 1014, 1016, 1022, 1032, 1048, 1050, 1052, y 1054 de codificación dividiendo las unidades de codificación en las unidades 1010 de codificación. En otras palabras, los tipos de partición en las unidades 1014, 1022, 1050, y 1054 de codificación tienen un tamaño de 2NxN, los tipos de partición en las unidades 1016, 1048, y 1052 de codificación tienen un tamaño de Nx2N, y un tipo de partición de la unidad 1032 de codificación tiene un tamaño de NxN. Las unidades de predicción y las particiones de las unidades 1010 de codificación son menores que o iguales a cada unidad de codificación.

Se realiza transformación o transformación inversa en los datos de imagen de la unidad 1052 de codificación en las unidades 1070 de transformación en una unidad de datos que es menor que la unidad 1052 de codificación. También, las unidades 1014, 1016, 1022, 1032, 1048, 1050, y 1052 de codificación en las unidades 1070 de transformación son diferentes de aquellas en las unidades 1060 de predicción en términos de tamaños y formas. En otras palabras, los aparatos 100 y 200 de codificación y decodificación de vídeo pueden realizar intra predicción, estimación de movimiento, compensación de movimiento, transformación y transformación inversa individualmente en una unidad de datos en la misma unidad de codificación.

Por consiguiente, se realiza codificación recursivamente en cada una de las unidades de codificación que tienen una estructura jerárquica en cada región de una unidad de codificación máxima para determinar una unidad de codificación óptima, y por lo tanto pueden obtenerse las unidades de codificación que tienen una estructura de árbol recursiva. La información de codificación puede incluir información de división acerca de una unidad de codificación, información acerca de un tipo de partición, información acerca de un modo de predicción, e información acerca de un tamaño de una unidad de transformación. La Tabla 1 muestra la información de codificación que puede establecerse por los aparatos 100 y 200 de codificación y decodificación de vídeo.

5

10

15

20

25

30

35

[Tabla 1]

Información de división 0 (codificación en unidad de codificación que tiene tamaño de 2Nx2N y profundidad actual de d): Información de división 1

Modo de predicción: Tipo de partición Tamaño de unidad de transformación Codificar repetitivamente unidades de codificación que

Intra lnter: Tipo de partición simétrica Tipo de partición asimétrica Información de división 0 de unidad de transformación Información de división 1 de unidad de transformación

NxN

2Nx2N: 2NxnU (tipo simétrico) tienen profundidad

Salto: 2NxN 2NxnD 2Nx2N inferior de d+1

(únicamente: Nx2N nLx2N

2Nx2N): NxN nRx2N N/2xN/2 (tipo asimétrico)

La unidad 130 de salida del aparato 100 de codificación de vídeo puede emitir la información de codificación acerca de las unidades de codificación que tienen una estructura de árbol, y los datos de imagen y el extractor 220 de información de codificación del aparato 200 de decodificación de vídeo pueden extraer la información de codificación acerca de las unidades de codificación que tienen una estructura de árbol desde un flujo de bits recibido.

La información de división indica si una unidad de codificación actual se divide en unidades de codificación de una profundidad inferior. Si la información de división de una profundidad actual d es 0, una profundidad, en la que una unidad de codificación actual ya no se divide en una profundidad inferior, es una profundidad codificada, y por lo tanto puede definirse la información acerca de un tipo de partición, modo de predicción, y un tamaño de una unidad de transformación para la profundidad codificada. Si la unidad de codificación actual se divide adicionalmente de acuerdo con la información de división, la codificación se realiza independientemente en cuatro unidades de codificación de división de una profundidad inferior.

Un modo de predicción puede ser uno de un modo intra, un modo inter, y un modo de salto. El modo intra y el modo inter pueden definirse en todos los tipos de partición, y el modo de salto se define únicamente en un tipo de partición que tiene un tamaño de 2Nx2N.

La información acerca del tipo de partición puede indicar tipos de partición simétrica que tienen tamaños de 2Nx2N, 2NxN, Nx2N, y NxN, que se obtienen dividiendo simétricamente una altura o una anchura de una unidad de predicción, y tipos de partición asimétrica que tienen tamaños de 2NxnU, 2NxnD, nLx2N, y nRx2N, que se obtienen dividiendo asimétricamente la altura o anchura de la unidad de predicción. Los tipos de partición asimétrica que tienen los tamaños de 2NxnU y 2NxnD pueden obtenerse respectivamente dividiendo la altura de la unidad de predicción en 1:3 y 3:1, y los tipos de partición asimétrica que tienen los tamaños de nLx2N y nRx2N pueden obtenerse respectivamente dividendo la anchura de la unidad de predicción en 1:3 y 3:1

El tamaño de la unidad de transformación puede establecerse para que sea dos tipos en el modo intra y dos tipos en el modo inter. En otras palabras, si la información de división de la unidad de transformación es 0, el tamaño de la unidad de transformación puede ser 2Nx2N, que es el tamaño de la unidad de codificación actual. Si la información de división de la unidad de transformación es 1, las unidades de transformación pueden obtenerse dividiendo la unidad de codificación actual. También, si un tipo de partición de la unidad de codificación actual que tiene el tamaño de 2Nx2N es un tipo de partición simétrica, un tamaño de una unidad de transformación puede ser NxN, y si el tipo de partición de la unidad de codificación actual es un tipo de partición asimétrica, el tamaño de la unidad de transformación puede ser N/2xN/2.

La información de codificación acerca de las unidades de codificación que tienen una estructura de árbol puede incluir al menos uno de una unidad de codificación que corresponde a una profundidad codificada, una unidad de predicción, y una unidad mínima. La unidad de codificación que corresponde a la profundidad codificada puede incluir al menos una de una unidad de predicción y una unidad mínima que contiene la misma información de codificación.

imagen9

10

15

20

25

30

35

40

45

50

Por lo tanto, si se define que la bandera de tamaño TU máximo es ‘MaxTransformSizelndex’, un tamaño de unidad de transformación mínimo es ‘MinTransformSize’, y un tamaño de unidad de transformación es ‘RootTuSize’ cuando la bandera de tamaño TU es 0, entonces un tamaño de unidad de transformación mínimo actual ‘CurrMinTuSize’ que puede determinarse en una unidad de codificación actual, puede definirse mediante la Ecuación (1):

CurrMinTuSize = max(MinTransformSize, RootTuSize/(2^MaxTransformSizelndex))……(1)

En comparación con el tamaño de unidad de transformación mínimo actual ‘CurrMinTuSize’ que puede determinarse en la unidad de codificación actual, un tamaño de unidad de transformación ‘RootTuSize’ cuando la bandera de tamaño TU es 0 puede indicar un tamaño de unidad de transformación máximo que puede seleccionarse en el sistema. En la Ecuación (1), ‘RootTuSize/(2^MaxTransformSizelndex)’ indica un tamaño de unidad de transformación cuando el tamaño de la unidad de transformación ‘RootTuSize’, cuando la bandera de tamaño TU es 0, se divide un número de veces que corresponde a la bandera de tamaño TU máximo, y ‘MinTransformSize’ indica un tamaño de transformación mínimo. Por lo tanto, un valor más pequeño de entre ‘RootTuSize/(2^MaxTransformSizelndex)’ y ‘MinTransformSize’ puede ser el tamaño de unidad de transformación mínimo actual ‘CurrMinTuSize’ que puede determinarse en la unidad de codificación actual.

De acuerdo con una realización ejemplar, el tamaño de unidad de transformación máximo RootTuSize puede variar de acuerdo con el tipo de un modo de predicción.

Por ejemplo, si un modo de predicción actual es un modo inter, entonces ‘RootTuSize’ puede determinarse usando la Ecuación (2) a continuación. En la Ecuación (2), ‘MaxTransformSize’ indica un tamaño de unidad de transformación máximo, y ‘PUSize’ indica un tamaño de unidad de predicción actual.

RootTuSize = min(MaxTransformSize, PUSize) …… (2)

Es decir, si el modo de predicción actual es el modo inter, el tamaño de la unidad de transformación ‘RootTuSize’ cuando la bandera de tamaño TU es 0, puede ser un valor menor de entre el tamaño de unidad de transformación máximo y el tamaño de unidad de predicción actual.

Si un modo de predicción de una unidad de partición actual es un modo intra, ‘RootTuSize’ puede determinarse usando la Ecuación (3) a continuación. En la Ecuación (3), ‘Partitionsize’ indica el tamaño de la unidad de partición actual.

RootTuSize = min(MaxTransformSize, Partitionsize) …… (3)

Es decir, si el modo de predicción actual es el modo intra, el tamaño de la unidad de transformación ‘RootTuSize’ cuando la bandera de tamaño TU es 0 puede ser un valor menor de entre el tamaño de unidad de transformación máximo y el tamaño de la unidad de partición actual.

Sin embargo, el tamaño de unidad de transformación máximo actual ‘RootTuSize’ que varía de acuerdo con el tipo de un modo de predicción en una unidad de partición es solo un ejemplo y no está limitado al mismo.

La Figura 14 es un diagrama de flujo que ilustra un procedimiento de codificación de un vídeo, de acuerdo con una realización ejemplar.

En la operación 1210, una instantánea actual se divide en al menos una unidad de codificación máxima. Puede predeterminarse una profundidad máxima que indica el número total de posibles veces de división.

En la operación 1220, se determina una profundidad codificada para emitir un resultado de codificación final de acuerdo con al menos una región de división, que se obtiene dividiendo una región de cada unidad de codificación máxima de acuerdo con las profundidades, codificando la al menos una región de división, y se determina una unidad de codificación de acuerdo con una estructura de árbol.

La unidad de codificación máxima se divide espacialmente cada vez que la profundidad se hace profunda, y por lo tanto se divide en unidades de codificación de una profundidad inferior. Cada unidad de codificación puede dividirse en unidades de codificación de otra profundidad inferior dividiéndose espacialmente de manera independiente desde unidades de codificación adyacentes. La codificación se realiza repetitivamente en cada unidad de codificación de acuerdo con las profundidades.

También, se determina una unidad de transformación de acuerdo con los tipos de partición que tiene el menor error de codificación para cada unidad de codificación más profunda. Para determinar una profundidad codificada que tiene un error de codificación mínimo en cada unidad de codificación máxima, pueden medirse errores de codificación y compararse en todas las unidades de codificación más profundas de acuerdo con las profundidades.

En la operación 1230, los datos de imagen codificados que constituyen el resultado de codificación final de acuerdo con la profundidad codificada se emiten para cada unidad de codificación máxima, con información de codificación acerca de la profundidad codificada y un modo de codificación. La información acerca del modo de codificación puede incluir información acerca de una profundidad codificada o la información de división, información acerca de

10

15

20

25

30

35

40

45

50

un tipo de partición de una unidad de predicción, un modo de predicción, y un tamaño de una unidad de transformación. La información codificada acerca del modo de codificación puede transmitirse a un decodificador con los datos de imagen codificados.

La Figura 15 es un diagrama de flujo que ilustra un procedimiento de decodificación de un vídeo, de acuerdo con una realización ejemplar.

En la operación 1310, se recibe y analiza un flujo de bits de un vídeo codificado.

En la operación 1320, los datos de imagen codificados de una instantánea actual asignados a una unidad de codificación máxima, y la información acerca de una profundidad codificada y un modo de codificación de acuerdo con unidades de codificación máxima se extraen desde del flujo de bits analizado. La profundidad codificada de cada unidad de codificación máxima es una profundidad que tiene el menor error de codificación en cada unidad de codificación máxima. Al codificar cada unidad de codificación máxima, los datos de imagen se codifican basándose en al menos una unidad de datos obtenida dividiendo jerárquicamente cada unidad de codificación máxima de acuerdo con las profundidades.

De acuerdo con la información acerca de la profundidad codificada y el modo de codificación, la unidad de codificación máxima puede dividirse en unidades de codificación que tienen una estructura de árbol. Cada una de las unidades de codificación que tienen la estructura de árbol se determina como una unidad de codificación que corresponde a una profundidad codificada, y se codifica de manera óptima para emitir el menor error de codificación. Por consiguiente, la eficacia de codificación y decodificación de una imagen puede mejorarse decodificando cada pieza de los datos de imagen codificados en las unidades de codificación después de determinar al menos una profundidad codificada de acuerdo con las unidades de codificación.

En la operación 1330, los datos de imagen de cada unidad de codificación máxima se decodifican basándose en la información acerca de la profundidad codificada y el modo de codificación de acuerdo con las unidades de codificación máxima. Los datos de imagen decodificada pueden reproducirse mediante un aparato de reproducción, almacenarse en un medio de almacenamiento, o transmitirse a través de una red.

La Figura 16 es un diagrama de bloques de un aparato 1400 de codificación de vídeo con respecto a inter predicción usando particiones divididas de acuerdo con proporciones arbitrarias, de acuerdo con otra realización ejemplar.

El aparato 1400 de codificación de vídeo incluye un divisor 1410 de unidad de codificación máxima, un codificador 1420, y una unidad 1430 de salida.

El divisor 1410 de unidad de codificación máxima puede dividir datos de vídeo en una unidad de codificación máxima. Los datos de vídeo máximos divididos en la unidad de codificación máxima se emiten a la unidad 1430 de salida. La unidad de codificación máxima puede establecerse previamente en unidades de datos, tal como una secuencia de fotogramas, un fotograma, un corte, una unidad de codificación, etc.

Los datos de vídeo máximos pueden establecerse de manera selectiva como al menos uno de bloques que tienen tamaños respectivos de 16x16, 32x32, 64x64, 128x128 y 256x256.

El codificador 1420 codifica los datos de vídeo de la unidad de codificación máxima divididos por el divisor 1410 de unidad de codificación máxima. El codificador 1420 codifica los datos de vídeo para al menos una región de división de la unidad de codificación máxima basándose en unidades de codificación más profundas de estructuras jerárquicas. Durante una operación de codificación de las unidades de codificación más profundas, se realiza inter predicción para buscar una región similar usando particiones incluidas en las unidades de codificación más profundas y para estimar información de movimiento de las particiones.

La inter predicción puede usar particiones obtenidas dividiendo una unidad de codificación de acuerdo con proporciones arbitrarias. Ejemplos de la unidad de predicción y particiones mostradas en las Figuras 3 a 13 incluyen particiones que tienen tamaños de 2Nx2N, 2NxN, Nx2N y NxN divididos desde una unidad de codificación que tiene un tamaño de 2Nx2N. El codificador 1420 puede realizar la inter predicción de acuerdo con tipos de partición que incluyen particiones divididas de acuerdo con proporciones arbitrarias o de acuerdo con proporciones asimétricas así como particiones obtenidas dividiendo la anchura o la altura de la unidad de codificación a una proporción de 1:1.

Por ejemplo, las particiones obtenidas dividiendo la unidad de codificación de acuerdo con proporciones arbitrarias pueden obtenerse dividiendo la anchura o la altura de la unidad de codificación a una proporción de 1:3 o 3:1. Las particiones pueden dividirse a diversas proporciones arbitrarias tales como 1:2, 2:1, 1:3, 3:1, 2:3, 3:2, 1:4, 4:1, etc.

Los tipos de partición pueden incluir particiones obtenidas dividiendo asimétricamente la unidad de codificación así como particiones obtenidas dividiendo las unidades de codificación de acuerdo con proporciones arbitrarias. Los tipos de partición para la inter predicción de la unidad de codificación pueden no estar limitados a incluir particiones divididas en una dirección definida de acuerdo con proporciones arbitrarias y pueden incluir particiones que tienen formas arbitrarias.

imagen10

10

15

20

25

30

35

40

45

50

55

El extractor 1520 puede extraer adicionalmente información con respecto a si un tipo de partición para inter predicción incluye particiones obtenidas dividiendo una unidad de codificación de acuerdo con proporciones arbitrarias a partir del flujo de bits. La información con respecto a si el tipo de partición es para inter predicción incluye particiones obtenidas dividiendo la unidad de codificación de acuerdo con proporciones arbitrarias puede extraerse a partir de un conjunto de parámetros de secuencia del flujo de bits, un encabezamiento de corte, información de codificación para unidades de codificación, etc.

El decodificador 1530 recibe los datos de vídeo y la información de codificación extraídos desde el extractor 1520 y decodifica datos de vídeo basándose en la información de codificación. Más específicamente, el decodificador 1530 decodifica los datos de vídeo para una unidad de codificación de al menos una profundidad de codificación de acuerdo con las unidades de codificación máxima basándose en la información con respecto a las profundidades de codificación y modos de codificación de acuerdo con las unidades de codificación máxima.

En particular, el decodificador 1530 puede realizar de manera selectiva compensación de movimiento usando las particiones obtenidas dividiendo la unidad de codificación de acuerdo con proporciones arbitrarias de acuerdo con la información con respecto a si el tipo de partición para inter predicción incluye porciones obtenidas dividiendo la unidad de codificación de acuerdo con proporciones arbitrarias extraídas por el extractor 1520.

Es decir, el decodificador 1530 puede realizar compensación de movimiento usando un vector de movimiento previsto de acuerdo con un tipo de partición que incluye particiones obtenidas dividiendo asimétricamente la unidad de codificación de acuerdo con proporciones arbitrarias tal como 1:2, 2:1, 1:3, 3:1, 2:3, 3:2, 1:4, 4:1, etc. y las particiones obtenidas dividiendo la unidad de codificación en la proporción arbitraria de 1:1 también. Adicionalmente, el decodificador 1530 puede realizar compensación de movimiento usando particiones que tienen formas arbitrarias así como particiones obtenidas dividiendo la unidad de codificación en una dirección.

El decodificador 1530 puede realizar de manera selectiva compensación de movimiento de acuerdo con particiones que tienen alturas y anchuras en proporciones arbitrarias determinando si la inter predicción se codifica usando las particiones obtenidas dividiendo la unidad de codificación de acuerdo con proporciones arbitrarias, restaurando de esta manera con precisión la unidad de codificación distinguida con respecto a regiones que tienen diversas características de una imagen.

El aparato 1500 de decodificación de vídeo puede restaurar y reproducir los datos de vídeo decodificados de acuerdo con las unidades de codificación máxima.

Por lo tanto, si la codificación/decodificación de predicción que usa las particiones divididas de acuerdo con proporciones arbitrarias se realiza como el aparato 1400 de codificación de vídeo y el aparato 1500 de decodificación de vídeo, la inter predicción se realiza usando las particiones que se dividen en un lado a una profundidad actual sin tener que dividir adicionalmente una unidad de codificación más profunda actual en profundidades inferiores. Por lo tanto, las particiones divididas de acuerdo con proporciones arbitrarias pueden usarse para realizar más eficazmente y con precisión codificación o decodificación de predicción en una unidad de codificación con tamaño grande.

La Figura 18 es un diagrama de particiones ejemplares obtenidas dividiendo una unidad de codificación de acuerdo con proporciones arbitrarias, de acuerdo con una realización ejemplar.

Haciendo referencia a la Figura 18, un tipo de partición para codificación de predicción de la unidad de codificación puede incluir particiones obtenidas dividiendo la altura y anchura de la unidad de codificación de acuerdo con proporciones arbitrarias. Por ejemplo, un tipo de partición de una unidad 1600 de codificación que tiene un tamaño de 64x64 puede incluir particiones obtenidas dividiendo la unidad 1600 de codificación de acuerdo con una proporción de 1:3 o 3:1 y particiones que tienen tamaños de 64x32, 32x64 y 32x32 obtenidas dividiendo la altura o la anchura de la unidad 1600 de codificación de acuerdo con una proporción de 1:1 también.

Más específicamente, un tipo de partición de la unidad 1600 de codificación que tiene el tamaño de 64x64 puede incluir las particiones 1610 y 1620 que tienen tamaños de 64x16 y 64x48, respectivamente, obtenidas dividiendo la altura de la unidad 1600 de codificación de acuerdo con la proporción de 1:3 o 3:1. Adicionalmente, el tipo de partición de la unidad 1600 de codificación que tiene el tamaño de 64x64 puede incluir las particiones 1630 y 1640 que tienen tamaños de 64x16 y 64x48 obtenidas dividiendo la anchura de la unidad 1600 de codificación de acuerdo con la proporción de 1:3 o 3:1.

La Figura 19 ilustra una sintaxis de un conjunto 1700 de parámetros de secuencia que incluye información con respecto a si un tipo de partición para inter predicción incluye particiones obtenidas dividiendo una unidad de codificación de acuerdo con proporciones arbitrarias, de acuerdo con una realización ejemplar.

Haciendo referencia a la Figura 19, sequence_parameter_set es la sintaxis del conjunto 1700 de parámetros de secuencia para un corte de imagen actual. La información con respecto a si el tipo de partición para inter predicción incluye particiones obtenidas dividiendo la unidad de codificación de acuerdo con proporciones arbitrarias se inserta en la sintaxis del conjunto 1700 de parámetros de secuencia para el corte de imagen actual.

imagen11

imagen12

imagen13

Claims

imagen1