ES2706486T3

ES2706486T3 - Aparato de codificación de vídeo teniendo en cuenta el orden de exploración de unidades de codificación que tienen estructura jerárquica

Info

Publication number: ES2706486T3
Application number: ES15168669T
Authority: ES
Inventors: Hae-Kyung Jung; Min-Su Cheon; Jung-Hye Kim; Il-Koo Kim
Original assignee: Samsung Electronics Co Ltd
Current assignee: Samsung Electronics Co Ltd
Priority date: 2009-08-14
Filing date: 2010-08-16
Publication date: 2019-03-29
Anticipated expiration: 2030-08-16
Also published as: CY1121131T1; TR201900024T4; CA2768693A1; US8831097B2; HRP20180772T1; HUE043984T2; JP5778368B1; US20140146880A1; CN104780381B; RU2013139143A; SI2950541T1; RU2014108445A; HRP20190019T1; CA2894589A1; CN102474613B; BR122020009702B1; PT2950541T; SI2950539T1; BR112012002244A2; EP2950540A1

Abstract

Un aparato de decodificación de un vídeo, comprendiendo el aparato: un receptor que recibe una secuencia de bits de un vídeo codificado y obtiene información acerca de un tamaño de una unidad de codificación máxima de forma cuadrada en una imagen e, información de división de unidades de codificación de forma cuadrada de profundidades que incluyen al menos una de una profundidad actual y una profundidad inferior en la unidad de codificación máxima, a partir de una secuencia de bits; y un decodificador que determina una pluralidad de división de unidades de codificación máxima a partir de una imagen de acuerdo con la información acerca del tamaño de la unidad de codificación máxima y decodifica la pluralidad de unidades de codificación máxima de acuerdo con una orden de análisis de rasterizado, determina una o varias unidades de codificación de profundidades que incluyen al menos una de la profundidad actual y la profundidad inferior jerárquicamente dividida a partir de la unidad de codificación máxima de acuerdo con la información de división de unidades de codificación máxima en la unidad de codificación máxima, en el que, cuando la información de división de la unidad de codificación de la profundidad actual indica una división, la unidad de codificación de la profundidad actual se divide en cuatro unidades de codificación de la profundidad inferior, en el que cuando la información de división de la unidad de codificación de la profundidad actual indica una no división, la unidad de codificación de la profundidad actual se divide en una o varias particiones para predecir la decodificación mediante el uso de información acerca de un tipo de partición de la unidad de codificación de la profundidad actual obtenida a partir de la secuencia de bits, y la unidad de codificación de la profundidad actual se divide en una o varias unidades de transformación para transformación inversa de acuerdo con la información del tamaño de la una o varias unidades de transformación en relación con la unidad de codificación de la profundidad actual obtenida a partir de la secuencia de bits, en el que, cuando la información de división de la unidad de codificación de la profundidad inferior indica una división, la unidad de codificación de la profundidad inferior se divide en cuatro unidades de codificación de una profundidad que es inferior que la profundidad inferior, y en el que, cuando la información de división de la unidad de codificación de la profundidad inferior indica una no división, la unidad de codificación de la profundidad inferior se divide en una o varias particiones para la predicción de la participación y la inidad de codificación de la profundidad inferior se divide en una o varias unidades de transformación para transformación inversa, decodifica la una o varias unidades de codificación en la unidad de codificación máxima que incluye las cuatro unidades de codificación de la división de la profundidad inferior a partir de la unidad de codificación de la profundidad actual de acuerdo con una orden de análisis en zigzag, en el que, cuando las cuatro unidades de codificación de la división de profundidad inferior a partir de la unidad de codificación de la profundidad actual incluyen un bloque superior izquierdo, un bloque superior derecho, un bloque inferior izquierdo y un bloque inferior derecho, la orden de análisis en zigzag representa una orden del bloque superior izquierdo al bloque superior derecho, al bloque inferior izquierdo al bloque inferior derecho, y en el que, la información acerca del tipo de partición de la unidad de codificación de la profundidad actual indica si la una o varias particiones se obtienen dividiendo simétricamente al menos uno del ancho y la altura de la unidad de codificación de la profundidad actual o se obtiene determinando que la partición sea igual que la unidad de codificación de la profundidad actual, y la información de tamaño de la una o varias unidades de transformación en relación con la unidad de codificación de la profundidad actual indica si la una o varias unidades de transformación se obtienen dividiendo simétricamente la altura y el ancho de la unidad de codificación de la profundidad actual o se obtiene determinando que la unidad de transformación sea igual que la unidad de codificación de la profundidad actual, en el que la unidad de codificación de la profundidad inferior se divide en una o varias particiones usando información acerca de un tipo de partición de la unidad de codificación de la profundidad inferior obtenida a partir de la secuencia de bits, en el que la unidad de codificación de la profundidad inferior se divide en una o varias unidades de transformación para transformación inversa de acuerdo con la información de tamaño de la una o varias unidades de transformación en relación con la unidad de codificación de la profundidad inferior obtenida a partir de la secuencia de bits, en el que la información acerca del tipo de partición de la unidad de codificación de la profundidad inferior indica si la una o varias particiones se obtienen dividiendo simétricamente al menos uno del ancho y la altura de la unidad de codificación de la profundidad inferior, o se obtiene determinando que la partición sea igual que la unidad de codificación de la profundidad inferior, la información de tamaño de la una o varias unidades de transformación en relación con la unidad de codificación de la profundidad inferior indica si la una o varias unidades de transformación se obtienen dividiendo simétricamente la altura y el ancho de la unidad de codificación de la profundidad inferior, o se obtiene determinando que la unidad de transformación sea igual a la unidad de codificación de la profundidad inferior, y la interpredicción o intrapredicción se lleva a cabo sobre la una o varias particiones.

Description

DESCRIPCIÓN

Aparato de codificación de vídeo teniendo en cuenta el orden de exploración de unidades de codificación que tienen estructura jerárquica

rCampo técnico!

La presente invención se refiere a un aparato para decodificar un vídeo.

Antecedentes de la técnica!

A medida que se está desarrollando y suministrando hardware para reproducir y almacenar contenido de vídeo de alta resolución o de alta calidad, aumenta una necesidad de un códec de vídeo para codificar o decodificar eficazmente el contenido de vídeo de alta resolución o alta calidad. En un códec de vídeo de la técnica relacionada, un vídeo se codifica de acuerdo con un procedimiento de codificación limitado basado en un macrobloque que tiene un tamaño predeterminado. Además, en el códec de vídeo de la técnica relacionada, se codifican y decodifican datos de vídeo explorando macrobloques de acuerdo con un procedimiento de rasterización.

El documento “Draft ITU-T Rec. H.264/ISO/IEC 14496-10 Advanced Video coding specification text” (G. Sullivan, H Schwarz) 30. JVT MEETING; GINEBRA; (JOINT VIDEO TEAM OF ISO/IEC JTC1/SC29/WG11 AND ITU-T SG.16), N° JVT-AD205, 7 de julio de 2009 (ISSN: 0000-0079) desvela extensiones de mejora para soportar codificación de vídeo de múltiples vistas.

El documento “Enlarging MB size for high fidelity video coding beyond HD” (Kim J y col), 36. VCEG Meeting 8-10/10/2008, San Diego, US, (VIDEO CODING EXPERTS GROUP OF ITU-T SG.16), N° VCEG-AJ21, 5 de octubre de 2008, (ISSN: 0000-0086) desvela extender la arquitectura del códec H.264 con tamaños de MB ampliados.

[Divulgación!

A continuación, la expresión “realización ejemplar” debería entenderse como que significa "ejemplo".

rProblema técnico!

Los aparatos y procedimientos coherentes con las realizaciones ejemplares proporcionan un orden de exploración asociado con la codificación y decodificación de vídeos, y una relación de cercanía entre los datos.

rSolución técnica!

La presente invención proporciona un aparato para decodificar un vídeo como se indica en la reivindicación adjunta. rEfectos ventajosos!

La usabilidad de información de las cercanías puede comprobarse y la información de las cercanías puede hacerse referencia para decodificar una unidad de codificación predeterminada, teniendo en cuenta un orden de exploración de diversas unidades de datos jerárquicas, tal como un orden de exploración de rasterización para unidades de codificación máxima o unidades de predicción o un orden de exploración en zigzag o un orden de exploración de rasterización para unidades mínimas. La información de las cercanías de acuerdo con una realización ejemplar puede incluir información acerca de una unidad de datos localizada un lado inferior izquierdo de una unidad de datos actual.

[Descripción de los dibujos!

Los anteriores y/u otros aspectos se harán más evidentes describiendo en detalle realizaciones ejemplares de los mismos con referencia a los dibujos adjuntos en los que:

La Figura 1 es un diagrama de bloques de un aparato para codificar un vídeo, de acuerdo con una realización ejemplar;

La Figura 2 es un diagrama de bloques de un aparato para decodificar un vídeo, de acuerdo con una realización ejemplar;

La Figura 3 es un diagrama para describir un concepto de unidades de codificación de acuerdo con una realización ejemplar;

La Figura 4 es un diagrama de bloques de un codificador de imagen basado en unidades de codificación de acuerdo con una realización ejemplar;

La Figura 5 es un diagrama de bloques de un decodificador de imagen basado en unidades de codificación de acuerdo con una realización ejemplar;

La Figura 6 es un diagrama que ilustra unidades de codificación más profundas de acuerdo con las profundidades y unidades de predicción de acuerdo con una realización ejemplar;

La Figura 7 es un diagrama para describir una relación entre una unidad de codificación y unidades de transformación, de acuerdo con una realización ejemplar;

La Figura 8 es un diagrama para describir información de codificación de unidades de codificación que corresponden a una profundidad codificada, de acuerdo con una realización ejemplar;

La Figura 9 es un diagrama de unidades de codificación más profundas de acuerdo con las profundidades, de acuerdo con una realización ejemplar;

Las Figuras 10 a 12 son diagramas para describir una relación entre unidades de codificación, usadas en una realización; unidades de predicción, y unidades de transformación,

La Figura 13 es un diagrama para describir una relación entre una unidad de codificación, una unidad de predicción y una unidad de transformación, de acuerdo con información de modo de codificación de acuerdo con una realización ejemplar;

La Figura 14 ilustra un orden de exploración de rasterización de una unidad de codificación máxima, de acuerdo con una realización ejemplar;

La Figura 15 ilustra un orden de exploración de rasterización de unidades mínimas, de acuerdo con una realización ejemplar;

La Figura 16 ilustra un orden de exploración en zigzag de unidades mínimas, de acuerdo con una realización ejemplar;

La Figura 17 ilustra una relación entre localizaciones e índices de exploración de una unidad de codificación, una unidad de predicción, una partición, y una unidad de transformación, de acuerdo con una realización ejemplar; La Figura 18 ilustra un índice de exploración de una unidad de codificación, de acuerdo con una realización ejemplar;

La Figura 19 ilustra un orden de exploración de unidades de codificación de acuerdo con índices de exploración de las unidades de codificación, de acuerdo con una realización ejemplar;

La Figura 20 ilustra índices de exploración de particiones de acuerdo con tipos de partición, de acuerdo con una realización ejemplar;

La Figura 21 ilustra unidades de datos que pueden usarse como información de las cercanías de una unidad de datos actual, de acuerdo con una realización ejemplar;

La Figura 22 ilustra unidades de codificación máxima adyacentes a una unidad de codificación máxima actual, de acuerdo con una realización ejemplar;

La Figura 23 ilustra macrobloques que cumplen con un procedimiento de exploración de rasterización;

La Figura 24 ilustra una unidad de predicción actual que cumple con un orden de exploración en zigzag, de acuerdo con una realización ejemplar;

La Figura 25 ilustra unidades mínimas adyacentes a una partición actual, de acuerdo con una realización ejemplar; La Figura 26 es un diagrama para explicar un procedimiento de predicción de vector de movimiento que usa información de las cercanías, de acuerdo con una realización ejemplar;

La Figura 27 ilustra un procedimiento de interpolación que usa información de las cercanías, de acuerdo con una realización ejemplar;

La Figura 28 es un diagrama de flujo que ilustra un procedimiento de codificación de un vídeo usando información de las cercanías, de acuerdo con una realización ejemplar; y

La Figura 29 es un diagrama de flujo que ilustra un procedimiento de decodificación de un vídeo usando información de las cercanías, de acuerdo con una realización ejemplar.

[Mejor modo]

De acuerdo con un aspecto de una realización ejemplar, se proporciona un procedimiento de decodificación de un vídeo, incluyendo el procedimiento: recibir y analizar una secuencia de bits de un vídeo codificado; extraer, desde la secuencia de bits, datos de imagen codificados de una instantánea actual del vídeo codificado asignados a una unidad de codificación máxima de la instantánea actual, e información acerca de una profundidad codificada y un modo de codificación de acuerdo con la unidad de codificación máxima, en el que la unidad de codificación máxima es una unidad de codificación de la instantánea actual que tiene un tamaño máximo; y decodificar los datos de imagen codificados para la unidad de codificación máxima basándose en la información acerca de la profundidad codificada y el modo de codificación para la unidad de codificación máxima, teniendo en cuenta un orden de exploración de rasterización para la unidad de codificación máxima y un orden de exploración en zigzag para unidades de codificación de la unidad de codificación máxima de acuerdo con las profundidades, en el que la unidad de codificación máxima se divide espacialmente en al menos una unidad de codificación de acuerdo con al menos una profundidad, y a medida que una profundidad se hace profunda desde una profundidad más superior, la unidad de codificación máxima se divide jerárquicamente desde la unidad de codificación máxima que corresponde a la profundidad más superior a al menos una unidad de codificación mínima que corresponde a una profundidad más inferior de la al menos una profundidad, en el que la al menos una unidad de codificación es una unidad de codificación más profunda.

La decodificación de los datos de imagen codificados puede incluir analizar una estructura jerárquica de al menos una unidad de codificación más profunda para la unidad de codificación máxima usando la información acerca de la profundidad codificada y el modo de codificación para la unidad de codificación máxima.

La decodificación de los datos de imagen codificados puede incluir buscar una localización de la unidad de codificación máxima, basándose en una dirección de la unidad de codificación máxima de acuerdo con el orden de exploración de rasterización.

La decodificación de los datos de imagen codificados puede incluir buscar una localización de una unidad mínima, basándose en un índice de la unidad mínima de acuerdo con un orden de exploración en zigzag para la unidad de codificación máxima.

La decodificación de los datos de imagen codificados puede incluir buscar una localización de una unidad mínima, basándose en un índice de la unidad mínima de acuerdo con un orden de exploración de rasterización para la unidad de codificación máxima.

La decodificación de los datos de imagen codificados puede incluir transformar mutuamente un índice de una unidad mínima de acuerdo con un orden de exploración en zigzag y un índice de la unidad mínima de acuerdo con un orden de exploración de rasterización entre sí, para la unidad de codificación máxima.

Una localización de la unidad de codificación máxima puede expresarse como una localización de un píxel localizado en un extremo superior izquierdo de la unidad de codificación máxima que es relativa a una localización de una muestra localizada en un extremo superior izquierdo de la instantánea actual.

Una localización de una unidad mínima puede expresarse como una localización de un píxel localizado en un extremo superior izquierdo de la unidad mínima que es relativa a una localización de una muestra localizada en un extremo superior izquierdo de la unidad de codificación máxima.

En la decodificación de los datos de imagen codificados, puede hacerse referencia a la información de las cercanías comprobando la usabilidad de la información de las cercanías, teniendo en cuenta un orden de exploración de la unidad de codificación máxima, una unidad de predicción, una partición, y una unidad mínima.

La decodificación de los datos de imagen codificados puede incluir comprobar la usabilidad de la unidad de codificación máxima.

En un caso distinto de un caso donde la unidad de codificación máxima no está incluida en la instantánea actual, un caso donde la unidad de codificación máxima no está incluida en un corte actual, y un caso donde una dirección de la unidad de codificación máxima es posterior a una dirección de una unidad de codificación máxima actual en términos de un orden de exploración, pueden usarse datos que corresponden a la unidad de codificación máxima. La decodificación de los datos de imagen codificados puede incluir comprobar la usabilidad de al menos una unidad de codificación más profunda incluida en la unidad de codificación máxima.

En un caso distinto de un caso donde la unidad de codificación máxima no está incluida en la instantánea actual, un caso donde la unidad de codificación máxima no está incluida en un corte actual, un caso donde una dirección de la unidad de codificación máxima es posterior a una dirección de una unidad de codificación máxima actual en términos de un orden de exploración, y un caso donde un índice de una unidad mínima en un lado superior izquierdo de una unidad de codificación más profunda de acuerdo con un orden de exploración en zigzag es posterior en términos de un orden de exploración que un índice de la unidad mínima de acuerdo con un orden de exploración en zigzag, pueden usarse datos que corresponden a la unidad de codificación más profunda.

La decodificación de los datos de imagen codificados puede incluir comprobar al menos una unidad de codificación máxima adyacente a la unidad de codificación máxima y la usabilidad de la al menos una unidad de codificación máxima adyacente.

La al menos una unidad de codificación máxima adyacente a la unidad de codificación máxima puede incluir al menos una de una unidad de codificación máxima en un lado izquierdo de la unidad de codificación máxima, una unidad de codificación máxima en un lado superior de la unidad de codificación máxima, una unidad de codificación máxima en un lado superior derecho de la unidad de codificación máxima, y una unidad de codificación máxima en un lado superior izquierdo de la unidad de codificación máxima.

La decodificación de los datos de imagen codificados puede incluir adicionalmente comprobar al menos una unidad mínima adyacente a una unidad de predicción actual incluida en la unidad de codificación máxima y la usabilidad de al menos una unidad mínima adyacente.

La al menos una unidad mínima adyacente a la unidad de predicción actual puede incluir al menos una de una unidad mínima en un lado izquierdo de la unidad de predicción actual, una unidad mínima en un lado superior de la unidad de predicción actual, una unidad mínima en un lado superior derecho de la unidad de predicción actual, una unidad mínima en un lado superior izquierdo de la unidad de predicción actual, y una unidad mínima en un lado inferior izquierdo de la unidad de predicción actual.

La decodificación de los datos de imagen codificados puede incluir adicionalmente comprobar una localización y usabilidad de al menos un límite adyacente a la unidad de codificación máxima.

El al menos un límite adyacente a la unidad de codificación máxima puede incluir al menos una de una unidad de codificación máxima en un lado izquierdo de la unidad de codificación máxima, una unidad de codificación máxima en un lado superior de la unidad de codificación máxima, una unidad de codificación máxima en un lado superior derecho de la unidad de codificación máxima, y una unidad de codificación máxima en un lado superior izquierdo de la unidad de codificación máxima.

La unidad mínima puede asignarse con información de codificación que incluye al menos una de información acerca de una correspondiente unidad de codificación más profunda, información acerca de división de la correspondiente unidad de codificación más profunda en una unidad de predicción o una partición, e información acerca de un modo de predicción de la unidad de predicción o la partición.

La decodificación de los datos de imagen codificados puede incluir adicionalmente comprobar la usabilidad de una unidad de codificación más profunda o una unidad de predicción que incluye la unidad mínima, basándose en la información de codificación asignada a la unidad mínima.

La unidad de codificación máxima puede incluir una pluralidad de unidades de codificación, y cuando una primera unidad de codificación, de la pluralidad de unidades de codificación, que es adyacente a una segunda unidad de codificación, de la pluralidad de unidades de codificación, se explora más tarde que la segunda unidad de codificación de acuerdo con un orden de exploración de rasterización y la primera unidad de codificación se explora antes que la segunda unidad de codificación de acuerdo con un orden de exploración en zigzag, puede hacerse referencia a la primera unidad de codificación para decodificar la segunda unidad de codificación.

Cuando la primera unidad de codificación está en un lado inferior izquierdo de la segunda unidad de codificación, puede hacerse referencia a la primera unidad de codificación para decodificar la segunda unidad de codificación. Cuando la primera unidad de codificación está en un lado inferior izquierdo de la segunda unidad de codificación, puede hacerse referencia a un límite derecho de la primera unidad de codificación para decodificar la segunda unidad de codificación.

De acuerdo con un aspecto de otra realización ejemplar, se proporciona un procedimiento de codificación de un vídeo, incluyendo el procedimiento: dividir una instantánea actual del vídeo en una unidad de codificación máxima; determinar una profundidad codificada para emitir un resultado de codificación final de acuerdo con al menos una región de división obtenida dividiendo una región de la unidad de codificación máxima de acuerdo con las profundidades, codificando la al menos una región de división, basándose en al menos una profundidad que se hace profunda en proporción a un número de veces que se divide la región de la unidad de codificación máxima; y codificar y emitir datos de imagen codificados en una profundidad codificada determinada para la unidad de codificación máxima, e información acerca de la profundidad codificada y un modo de codificación, en el que la codificación se realiza teniendo en cuenta un orden de exploración de rasterización para la unidad de codificación máxima y un orden de exploración en zigzag para al menos una unidad de codificación incluida en la unidad de codificación máxima.

En el procedimiento, puede hacerse referencia a la información de las cercanías que incluye una unidad de datos localizada en un lado inferior izquierdo de una unidad de datos actual para codificar datos de imagen que corresponden a la unidad de datos actual.

La información de las cercanías puede incluir una unidad de codificación máxima en un lado izquierdo de la unidad de codificación máxima, una unidad de codificación máxima en un lado superior de la unidad de codificación máxima, una unidad de codificación máxima en un lado superior derecho de la unidad de codificación máxima, y una unidad de codificación máxima en un lado superior izquierdo de la unidad de codificación máxima.

La información de las cercanías puede incluir una unidad mínima en un lado izquierdo de una unidad de predicción actual, una unidad mínima en un lado superior de la unidad de predicción actual, una unidad mínima en un lado superior derecho de la unidad de predicción actual, una unidad mínima en un lado superior izquierdo de la unidad de predicción actual, y una unidad mínima en un lado inferior izquierdo de la unidad de predicción actual.

La información de las cercanías puede incluir un límite derecho de una unidad de codificación localizada en el lado inferior izquierdo de la unidad de predicción actual.

La unidad de codificación máxima puede incluir una pluralidad de unidades de codificación, y cuando una primera unidad de codificación, de la pluralidad de unidades de codificación, que es adyacente a una segunda unidad de codificación, de la pluralidad de unidades de codificación, se explora más tarde que la segunda unidad de codificación de acuerdo con un orden de exploración de rasterización y la primera unidad de codificación se explora antes que la segunda unidad de codificación de acuerdo con un orden de exploración en zigzag, la primera unidad de codificación puede usarse como información de las cercanías que se usa para codificar la segunda unidad de codificación.

La primera unidad de codificación puede estar en un lado inferior izquierdo de la segunda unidad de codificación. De acuerdo con un aspecto de otra realización ejemplar, se proporciona un aparato para decodificar un vídeo, el aparato que incluye: un receptor que recibe y analiza una secuencia de bits de un vídeo codificado; un extractor de datos de imagen e información de codificación que extrae, desde la secuencia de bits, datos de imagen codificados de una instantánea actual del vídeo codificado asignados a una unidad de codificación máxima de la instantánea actual, e información acerca de una profundidad codificada y un modo de codificación de acuerdo con la unidad de codificación máxima, en el que la unidad de codificación máxima es una unidad de codificación de la instantánea actual que tiene un tamaño máximo; y un decodificador de datos de imagen que decodifica los datos de imagen codificados para la unidad de codificación máxima basándose en la información acerca de la profundidad codificada y el modo de codificación para la unidad de codificación máxima, teniendo en cuenta un orden de exploración de rasterización para la unidad de codificación máxima y un orden de exploración en zigzag para unidades de codificación de acuerdo con las profundidades, en el que a medida que una profundidad se hace profunda desde una profundidad más superior, la unidad de codificación máxima se divide jerárquicamente desde la unidad de codificación máxima que corresponde a la profundidad más superior a unidades de codificación mínima que corresponden a una profundidad más inferior.

De acuerdo con un aspecto de otra realización ejemplar, se proporciona un aparato para codificar un vídeo, incluyendo el aparato: un divisor de unidad de codificación máxima que divide una instantánea actual del vídeo en una unidad de codificación máxima; un determinador de unidad de codificación que determina una profundidad codificada para emitir un resultado de codificación final de acuerdo con al menos una región de división obtenida dividiendo una región de la unidad de codificación máxima de acuerdo con las profundidades, codificando la al menos una región de división, basándose en una profundidad que se hace profunda en proporción a un número de veces que se divide la región de la unidad de codificación máxima; y una unidad de salida que codifica y emite datos de imagen codificados en una profundidad codificada determinada para la unidad de codificación máxima, e información acerca de la profundidad codificada y un modo de codificación, en el que la codificación se realiza teniendo en cuenta un orden de exploración de rasterización para la unidad de codificación máxima y un orden de exploración en zigzag para al menos una unidad de codificación incluida en la unidad de codificación máxima.

De acuerdo con un aspecto de otra realización ejemplar, se proporciona un medio de grabación legible por ordenador que tiene grabado en el mismo un programa para ejecutar el procedimiento de decodificación de un vídeo.

De acuerdo con un aspecto de otra realización ejemplar, se proporciona un medio de grabación legible por ordenador que tiene grabado en el mismo un programa para ejecutar el procedimiento de codificación de un vídeo. De acuerdo con un aspecto de otra realización ejemplar, se proporciona un procedimiento de decodificación de un vídeo, incluyendo el procedimiento: extraer, desde una secuencia de bits, datos de imagen codificados de una instantánea actual del vídeo asignados a una unidad de codificación máxima de la instantánea actual, e información acerca de una profundidad codificada de acuerdo con la unidad de codificación máxima, en el que la unidad de codificación máxima es una unidad de codificación de la instantánea actual que tiene un tamaño máximo; y decodificar los datos de imagen codificados para la unidad de codificación máxima basándose en la información acerca de la profundidad codificada, teniendo en cuenta un orden de exploración de rasterización para la unidad de codificación máxima y un orden de exploración en zigzag para unidades de codificación de la unidad de codificación máxima de acuerdo con las profundidades, en el que la unidad de codificación máxima se divide espacialmente en al menos una unidad de codificación de acuerdo con al menos una profundidad, y a medida que una profundidad se hace profunda desde una profundidad más superior, la unidad de codificación máxima se divide jerárquicamente desde la unidad de codificación máxima que corresponde a la profundidad más superior a al menos una unidad de codificación mínima que corresponde a una profundidad más inferior de la al menos una profundidad, en el que la al menos una unidad de codificación es una unidad de codificación más profunda.

rModo para la invención!

En lo sucesivo, se describirán realizaciones ejemplares más completamente con referencia a los dibujos adjuntos, en los que los números de referencia similares hacen referencia a elementos similares a lo largo de todo el presente documento. Expresiones tales como “al menos uno de”, cuando precede una lista de elementos, modifican la lista entera de elementos y no modifican los elementos individuales de la lista.

En lo sucesivo, una unidad de codificación es una unidad de datos de codificación en la que se codifican los datos de imagen en un lado del codificador y una unidad de datos codificados en la que se decodifican los datos de imagen codificados en un lado del decodificador, de acuerdo con las realizaciones ejemplares. También, una profundidad codificada indica una profundidad donde se codifica una unidad de codificación.

En lo sucesivo, una 'imagen' puede indicar una imagen fija para un vídeo o una imagen en movimiento, es decir, el mismo vídeo.

La Figura 1 es un diagrama de bloques de un aparato 100 de codificación de vídeo, de acuerdo con una realización ejemplar. Haciendo referencia a la Figura 1, el aparato 100 de codificación de vídeo incluye un divisor 110 de unidad de codificación máxima, un determinador 120 de unidad de codificación, y una unidad 130 de salida.

El divisor 110 de unidad de codificación máxima puede dividir una instantánea actual basándose en una unidad de codificación máxima para la instantánea actual de una imagen. Si la instantánea actual es mayor que la unidad de codificación máxima, los datos de imagen de la instantánea actual pueden dividirse en al menos una unidad de codificación máxima. La unidad de codificación máxima de acuerdo con una realización ejemplar puede ser una unidad de datos que tiene un tamaño de 32x32, 64x64, 128x128, 256x256, etc., en la que una forma de la unidad de datos es un cuadrado que tiene una anchura y altura en cuadrados de 2. Los datos de imagen pueden emitirse al determinador 120 de unidad de codificación de acuerdo con la al menos una unidad de codificación máxima.

Una unidad de codificación de acuerdo con una realización ejemplar puede estar caracterizada por un tamaño máximo y una profundidad. La profundidad indica un número de veces que la unidad de codificación se divide espacialmente desde la unidad de codificación máxima. Por consiguiente, a medida que la profundidad se hace más profunda, las unidades de codificación más profundas de acuerdo con las profundidades pueden dividirse desde la unidad de codificación máxima a una unidad de codificación mínima. Una profundidad de la unidad de codificación máxima es una profundidad más superior y una profundidad de la unidad de codificación mínima es una profundidad más inferior. Puesto que se reduce un tamaño de una unidad de codificación que corresponde a cada profundidad a medida que la profundidad de la unidad de codificación máxima se hace profunda, una unidad de codificación que corresponde a una profundidad superior puede incluir una pluralidad de unidades de codificación que corresponden a profundidades inferiores.

Como se ha descrito anteriormente, los datos de imagen de la instantánea actual se dividen en una o más unidades de codificación máxima de acuerdo con un tamaño máximo de la unidad de codificación, y cada una de las unidades de codificación máxima puede incluir unidades de codificación más profundas que se dividen de acuerdo con las profundidades. Puesto que la unidad de codificación máxima de acuerdo con una realización ejemplar se divide de acuerdo con las profundidades, los datos de imagen de un dominio espacial incluidos en la unidad de codificación máxima pueden clasificarse jerárquicamente de acuerdo con las profundidades.

Puede predeterminarse una profundidad máxima y un tamaño máximo de una unidad de codificación, que limita el número total de veces que se divide jerárquicamente una altura y una anchura de la unidad de codificación máxima. El determinador 120 de unidad de codificación codifica al menos una región de división obtenida dividiendo una región de la unidad de codificación máxima de acuerdo con las profundidades, y determina una profundidad para emitir unos datos de imagen finalmente codificados de acuerdo con la al menos una región de división. Por ejemplo, el determinador 120 de unidad de codificación determina una profundidad codificada codificando los datos de imagen en las unidades de codificación más profundas de acuerdo con las profundidades, de acuerdo con la unidad de codificación máxima de la instantánea actual, y selecciona una profundidad que tiene los mínimos errores de codificación. Por lo tanto, los datos de imagen codificados de la unidad de codificación que corresponde a la profundidad codificada determinada se emiten por el determinador 120 de unidad de codificación. También, las unidades de codificación que corresponden a la profundidad codificada pueden considerarse como unidades de codificación codificadas.

La profundidad codificada determinada y los datos de imagen codificados de acuerdo con la profundidad codificada determinada se emiten a la unidad 130 de salida.

Los datos de imagen en la unidad de codificación máxima se codifican basándose en las unidades de codificación más profundas que corresponden a al menos una profundidad igual o inferior a la profundidad máxima, y se comparan los resultados de codificar los datos de imagen basándose en cada una de las unidades de codificación más profundas. Una profundidad que tiene los mínimos errores de codificación puede seleccionarse después de comparar errores de codificación de las unidades de codificación más profundas. Al menos una profundidad codificada puede seleccionarse para cada unidad de codificación máxima.

El tamaño de la unidad de codificación máxima se divide a medida que se divide jerárquicamente una unidad de codificación de acuerdo con las profundidades, y a medida que aumenta el número de unidades de codificación. También, incluso si las unidades de codificación corresponden a la misma profundidad en una unidad de codificación máxima, se determina si dividir cada una de las unidades de codificación que corresponden a la misma profundidad a una profundidad inferior midiendo un error de codificación de los datos de imagen de cada unidad de codificación, de manera separada. Por consiguiente, incluso cuando los datos de imagen están incluidos en una unidad de codificación máxima, los datos de imagen se dividen en regiones de acuerdo con las profundidades y los errores de codificación pueden diferenciarse de acuerdo con las regiones en la unidad de codificación máxima. Por lo tanto las profundidades codificadas pueden diferenciarse de acuerdo con las regiones en los datos de imagen. Por lo tanto, puede determinarse una o más profundidades codificadas en una unidad de codificación máxima, y los datos de imagen de la unidad de codificación máxima pueden dividirse de acuerdo con las unidades de codificación de al menos una profundidad codificada.

Por consiguiente, el determinador 120 de unidad de codificación puede determinar unidades de codificación que tienen una estructura de árbol incluida en la unidad de codificación máxima. Las unidades de codificación que tienen una estructura de árbol de acuerdo con una realización ejemplar incluyen unidades de codificación que corresponden a una profundidad determinada para que sea la profundidad codificada, de entre todas las unidades de codificación más profundas incluidas en la unidad de codificación máxima. Una unidad de codificación de una profundidad codificada puede determinarse jerárquicamente de acuerdo con las profundidades en la misma región de la unidad de codificación máxima, y puede determinarse independientemente en diferentes regiones. De manera similar, una profundidad codificada en una región actual puede determinarse independientemente de una profundidad codificada en otra región.

Una profundidad máxima de acuerdo con una realización ejemplar es un índice relacionado con un número de veces de división desde una unidad de codificación máxima a una unidad de codificación mínima. Una primera profundidad máxima de acuerdo con una realización ejemplar puede indicar un número total de veces de división desde la unidad de codificación máxima a la unidad de codificación mínima. Una segunda profundidad máxima de acuerdo con una realización ejemplar puede indicar un número total de niveles de profundidad desde la unidad de codificación máxima a la unidad de codificación mínima. Por ejemplo, cuando una profundidad de la unidad de codificación máxima es 0, una profundidad de una unidad de codificación, en la que la unidad de codificación máxima se divide una vez, puede establecerse a 1, y una profundidad de una unidad de codificación, en la que la unidad de codificación máxima se divide dos veces, puede establecerse a 2. En este punto, si la unidad de codificación mínima es una unidad de codificación en la que la unidad de codificación máxima se divide cuatro veces, existen 5 niveles de profundidad de profundidades 0, 1, 2, 3 y 4. En este caso, la primera profundidad máxima puede establecerse a 4, y la segunda profundidad máxima puede establecerse a 5.

Puede realizarse la codificación de predicción y transformación de acuerdo con la unidad de codificación máxima. La codificación por predicción y la transformación pueden realizare también basándose en las unidades de codificación más profundas de acuerdo con una profundidad igual a, o profundidades menores que, la profundidad máxima, de acuerdo con la unidad de codificación máxima. La transformación puede realizarse de acuerdo con un procedimiento de transformación ortogonal o transformación de números enteros.

Puesto que el número de unidades de codificación más profundas aumenta cada vez que la unidad de codificación máxima se divide de acuerdo con las profundidades, la codificación que incluye la codificación por predicción y la transformación puede realizarse en todas las unidades de codificación más profundas generadas a medida que la profundidad se hace más profunda. Por conveniencia de descripción, la codificación por predicción y la transformación se describirán ahora basándose en una unidad de codificación de una profundidad actual, en una unidad de codificación máxima.

El aparato 100 de codificación de vídeo puede seleccionar de manera diversa un tamaño o forma de una unidad de datos para codificar los datos de imagen. Para codificar los datos de imagen, se realizan operaciones, tales como codificación de predicción, transformación, y codificación por entropía, y en este momento, la misma unidad de datos puede usarse para todas las operaciones o pueden usarse diferentes unidades de datos para cada operación.

Por ejemplo, el aparato 100 de codificación de vídeo puede seleccionar no únicamente una unidad de codificación para codificar los datos de imagen, sino también una unidad de datos diferente de la unidad de codificación para realizar la codificación por predicción en los datos de imagen en la unidad de codificación.

Para realizar la codificación por predicción en la unidad de codificación máxima, la codificación por predicción puede realizarse basándose en una unidad de codificación que corresponde a una profundidad codificada, es decir, basándose en una unidad de codificación que ya no se divide más en unidades de codificación que corresponden a una profundidad inferior. En lo sucesivo, la unidad de codificación que ya no se divide más y se vuelve una unidad de base para la codificación por predicción se denominará ahora como una unidad de predicción. Una partición obtenida dividiendo la unidad de predicción puede incluir una unidad de predicción o una unidad de datos obtenida dividiendo al menos una de una altura y una anchura de la unidad de predicción.

Por ejemplo, cuando una unidad de codificación de un tamaño de 2Nx2N (donde N es un entero positivo) ya no se divide más y se vuelve una unidad de predicción de 2Nx2N, un tamaño de una partición puede ser 2Nx2N, 2NxN, Nx2N, o NxN. Ejemplos de un tipo de partición incluyen particiones simétricas que se obtienen dividiendo simétricamente una altura o una anchura de la unidad de predicción, particiones obtenidas dividiendo asimétricamente la altura o la anchura de la unidad de predicción (tal como 1:n o n:1), particiones que se obtienen dividiendo geométricamente la unidad de predicción, y particiones que tienen formas arbitrarias.

Un modo de predicción de la unidad de predicción puede ser al menos uno de un intra modo, un inter modo, y un modo de salto. Por ejemplo, el intra modo o el inter modo pueden realizarse en la partición de 2Nx2N, 2NxN, Nx2N, o NxN. También, el modo de salto puede realizarse únicamente en la partición de 2Nx2N. La codificación se realiza independientemente en unidades de predicción en una unidad de codificación, seleccionando de esta manera un modo de predicción que tiene un mínimo error de codificación.

El aparato 100 de codificación de vídeo puede realizar también la transformación en los datos de imagen en una unidad de codificación basándose no únicamente en la unidad de codificación para codificar los datos de imagen, sino también basándose en una unidad de datos que es diferente de la unidad de codificación.

Para realizar la transformación en la unidad de codificación, la transformación puede realizarse basándose en una unidad de datos que tiene un tamaño menor o igual que la unidad de codificación. Por ejemplo, la unidad de datos para la transformación puede incluir una unidad de datos para un intra modo y una unidad de datos para un inter modo.

Una unidad de datos usada como una base de la transformación se denominará en lo sucesivo como una unidad de transformación. Una profundidad de transformación que indica un número de veces de división para alcanzar la unidad de transformación dividiendo una altura y una anchura de la unidad de codificación puede establecerse también para la unidad de transformación. Por ejemplo, en una unidad de codificación actual de 2Nx2N, una profundidad de transformación puede ser 0 cuando un tamaño de una unidad de transformación es también 2Nx2N, puede ser 1 cuando cada una de la altura y la anchura de la unidad de codificación actual se divide en dos partes iguales, dividida de manera total en 4A1 unidades de transformación, y el tamaño de la unidad de transformación es por lo tanto NxN, y puede ser 2 cuando cada una de la altura y la anchura de la unidad de codificación actual se divide en cuatro partes iguales, divididas totalmente en 4A2 unidades de transformación, y el tamaño de la unidad de transformación es por lo tanto N/2xN/2. Por ejemplo, la unidad de transformación puede establecerse de acuerdo con una estructura de árbol jerárquica, en la que una unidad de transformación de una profundidad de transformación superior se divide en cuatro unidades de transformación de una profundidad de transformación inferior de acuerdo con características jerárquicas de una profundidad de transformación.

Similar a la unidad de codificación, la unidad de transformación en la unidad de codificación puede dividirse recursivamente en regiones con tamaño más pequeño, de modo que la unidad de transformación puede determinarse independientemente en unidades de regiones. Por lo tanto, los datos residuales en la unidad de codificación pueden dividirse de acuerdo con la transformación que tiene la estructura de árbol de acuerdo con las profundidades de transformación.

La información de codificación de acuerdo con las unidades de codificación que corresponden a una profundidad codificada usa no únicamente información acerca de la profundidad codificada, sino también información acerca de información relacionada con codificación de predicción y transformación. Por consiguiente, el determinador 120 de unidad de codificación no únicamente determina una profundidad codificada que tiene un error de codificación mínimo, sino también determina un tipo de partición en una unidad de predicción, un modo de predicción de acuerdo con las unidades de predicción, y un tamaño de una unidad de transformación para transformación.

Las unidades de codificación de acuerdo con una estructura de árbol en una unidad de codificación máxima y un procedimiento de determinación de una partición, de acuerdo con una o más realizaciones ejemplares, se describirán en detalle a continuación con referencia a las Figuras 3 a 12.

El determinador 120 de unidad de codificación puede medir un error de codificación de unidades de codificación más profundas de acuerdo con las profundidades usando optimización de tasa-distorsión basándose en multiplicadores de Lagrange.

La unidad 130 de salida emite los datos de imagen de la unidad de codificación máxima, que se codifican basándose en la al menos una profundidad codificada determinada por el determinador 120 de unidad de codificación, y la información acerca del modo de codificación de acuerdo con la profundidad codificada, en secuencias de bits. Los datos de imagen codificados pueden obtenerse codificando datos residuales de una imagen. La información acerca del modo de codificación de acuerdo con la profundidad codificada puede incluir al menos una de información acerca de la profundidad codificada, información acerca del tipo de partición en la unidad de predicción, el modo de predicción, y el tamaño de la unidad de transformación.

La información acerca de la profundidad codificada puede definirse usando información de división de acuerdo con las profundidades, que indica si se realiza codificación en unidades de codificación de una profundidad inferior en lugar de una profundidad actual. Si la profundidad actual de la unidad de codificación actual es la profundidad codificada, se codifican y emiten los datos de imagen en la unidad de codificación actual, y por lo tanto la información de división puede definirse para no dividir la unidad de codificación actual a una profundidad inferior. Como alternativa, si la profundidad actual de la unidad de codificación actual no es la profundidad codificada, la codificación se realiza en la unidad de codificación de la profundidad inferior. Por lo tanto, la información de división puede definirse para dividir la unidad de codificación actual para obtener las unidades de codificación de la profundidad inferior.

Si la profundidad actual no es la profundidad codificada, se realiza codificación en la unidad de codificación que se divide en la unidad de codificación de la profundidad inferior. Puesto que existe al menos una unidad de codificación de la profundidad inferior en una unidad de codificación de la profundidad actual, la codificación se realiza de manera repetitiva en cada unidad de codificación de la profundidad inferior. Por lo tanto, la codificación puede realizarse de manera recursiva para las unidades de codificación que tienen la misma profundidad.

Puesto que se determinan las unidades de codificación que tienen una estructura de árbol para una unidad de codificación máxima, y se determina información acerca de al menos un modo de codificación para una unidad de codificación de una profundidad codificada, puede determinarse información acerca de al menos un modo de codificación para una unidad de codificación máxima. También, una profundidad codificada de los datos de imagen de la unidad de codificación máxima puede ser diferente de acuerdo con las localizaciones puesto que los datos de imagen se dividen jerárquicamente de acuerdo con las profundidades. Por lo tanto, puede establecerse información acerca de la profundidad codificada y el modo de codificación para los datos de imagen.

Por consiguiente, la unidad 130 de salida puede asignar información de codificación acerca de una correspondiente profundidad codificada y un modo de codificación a al menos una de la unidad de codificación, la unidad de predicción, y una unidad mínima incluida en la unidad de codificación máxima.

La unidad mínima de acuerdo con una realización ejemplar puede ser una unidad de datos rectangular obtenida dividiendo por 4 la unidad de codificación mínima que tiene la profundidad más inferior. Como alternativa, la unidad mínima puede ser una unidad de datos rectangular de tamaño máximo que puede incluirse en todas las unidades de codificación, unidades de predicción, unidades de partición e unidades de transformación incluidas en la unidad de codificación máxima.

Por ejemplo, la información de codificación emitida a través de la unidad 130 de salida puede clasificarse en información de codificación de acuerdo con las unidades de codificación, e información de codificación de acuerdo con las unidades de predicción. La información de codificación de acuerdo con las unidades de codificación puede incluir al menos una de información acerca del modo de predicción e información acerca de un tamaño de las particiones. La información de codificación de acuerdo con las unidades de predicción puede incluir al menos una de información acerca de una dirección estimada de un inter modo, información acerca de un índice de imagen de referencia del inter modo, información acerca de un vector de movimiento, información acerca de un componente de crominancia de un intra modo, e información acerca de un procedimiento de interpolación del intra modo. También, puede insertarse información acerca de un tamaño máximo de la unidad de codificación definida de acuerdo con instantáneas, cortes, o grupos de instantáneas (GOP), e información acerca de una profundidad máxima en un Conjunto de Parámetros de Secuencia (SPS) o en un encabezamiento de una secuencia de bits.

En el aparato 100 de codificación de vídeo, la unidad de codificación más profunda puede ser una unidad de codificación obtenida dividiendo por dos al menos una de una altura y una anchura de una unidad de codificación de una profundidad superior, que se encuentra una capa por encima. En otras palabras, cuando el tamaño de la unidad de codificación de la profundidad actual es 2Nx2N, el tamaño de la unidad de codificación de la profundidad inferior puede ser NxN. También, la unidad de codificación de la profundidad actual que tiene el tamaño de 2Nx2N puede incluir 4 de las unidades de codificación de la profundidad inferior.

Por consiguiente, el aparato 100 de codificación de vídeo puede formar las unidades de codificación que tienen la estructura de árbol determinando unidades de codificación que tienen una forma óptima y un tamaño óptimo para cada unidad de codificación máxima, basándose en el tamaño de la unidad de codificación máxima y la profundidad máxima ambas determinadas considerando características de la instantánea actual. También, puesto que la codificación puede realizarse en cada unidad de codificación máxima usando cualquiera de diversos modos de predicción y transformaciones, puede determinarse un modo de codificación óptimo considerando características de la unidad de codificación de diversos tamaños de imagen.

Por lo tanto, si se codifica una imagen que tiene una alta resolución o una gran cantidad de datos en unidades de macrobloques de la técnica relacionada, un número de macrobloques por instantánea aumenta excesivamente. Por consiguiente, un número de piezas de información comprimida generadas para cada macrobloque aumenta, y por lo tanto es difícil transmitir la información comprimida y la eficacia de compresión de datos se reduce. Sin embargo, usando el aparato 100 de codificación de vídeo de acuerdo con una realización ejemplar, la eficacia de compresión de imagen puede aumentarse puesto que se ajusta una unidad de codificación mientras se consideran características de una imagen mientras se aumenta un tamaño máximo de una unidad de codificación mientras se considera un tamaño de la imagen.

La Figura 2 es un diagrama de bloques de un aparato 200 de decodificación de vídeo, de acuerdo con una realización ejemplar. Haciendo referencia a la Figura 2, el aparato 200 de decodificación de vídeo incluye un receptor 210, un extractor 220 de datos de imagen e información de codificación, y un decodificador 230 de datos de imagen. Las definiciones de diversos términos, tales como una unidad de codificación, una profundidad, una unidad de predicción, una unidad de transformación, e información acerca de diversos modos de codificación, para diversas operaciones del aparato 200 de decodificación de vídeo son las mismas o similares a aquellas anteriormente descritas con referencia a la Figura 1 y al aparato 100 de codificación de vídeo.

El receptor 210 recibe y analiza una secuencia de bits de un vídeo codificado. El extractor 220 de datos de imagen e información de codificación extrae datos de imagen codificados para cada unidad de codificación desde la secuencia de bits analizada, en el que las unidades de codificación tienen una estructura de árbol de acuerdo con cada unidad de codificación máxima, y emite los datos de imagen extraídos al decodificador 230 de datos de imagen. El extractor 220 de datos de imagen e información de codificación puede extraer información acerca de un tamaño máximo de una unidad de codificación de una instantánea actual desde un encabezamiento que corresponde a la instantánea actual o a un SPS.

También, el extractor 220 de datos de imagen e información de codificación extrae información acerca de una profundidad codificada y un modo de codificación para las unidades de codificación que tienen una estructura de árbol de acuerdo con cada unidad de codificación máxima, desde la secuencia de bits analizada. La información extraída acerca de la profundidad codificada y el modo de codificación se emite al decodificador 230 de datos de imagen. Por lo tanto, los datos de imagen en una secuencia de bits se dividen en la unidad de codificación máxima de modo que el decodificador 230 de datos de imagen decodifica los datos de imagen para cada unidad de codificación máxima.

La información acerca de la profundidad codificada y el modo de codificación de acuerdo con la unidad de codificación máxima puede establecerse para información acerca de al menos una unidad de codificación que corresponde a la profundidad codificada. Adicionalmente, la información acerca del modo de codificación puede incluir al menos una de información acerca de un tipo de partición de una unidad de codificación correspondiente que corresponde a la profundidad codificada, información acerca de un modo de predicción, y un tamaño de una unidad de transformación. También, puede extraerse información de división de acuerdo con las profundidades como la información acerca de la profundidad codificada.

La información acerca de la profundidad codificada y el modo de codificación de acuerdo con cada unidad de codificación máxima extraída por el extractor 220 de datos de imagen y la información de codificación es información acerca de una profundidad codificada y un modo de codificación determinado para generar un error de codificación mínimo cuando un codificador, tal como el aparato 100 de codificación de vídeo, realiza de manera repetitiva codificación para cada unidad de codificación más profunda de acuerdo con las profundidades de acuerdo con cada unidad de codificación máxima. Por consiguiente, el aparato 200 de decodificación de vídeo puede restaurar una imagen decodificando los datos de imagen de acuerdo con una profundidad codificada y un modo de codificación que genera el error de codificación mínimo.

Puesto que la información de codificación acerca de la profundidad codificada y el modo de codificación pueden asignarse a una unidad de datos predeterminada de entre una unidad de codificación correspondiente, una unidad de predicción, y una unidad mínima, el extractor 220 de datos de imagen e información de codificación puede extraer la información acerca de la profundidad codificada y el modo de codificación de acuerdo con las unidades de datos predeterminadas. Las unidades de datos predeterminadas a las que se asigna la misma información acerca de la profundidad codificada y el modo de codificación pueden inferirse para que sean las unidades de datos incluidas en la misma unidad de codificación máxima.

El decodificador 230 de datos de imagen restaura la instantánea actual decodificando los datos de imagen en cada unidad de codificación máxima basándose en la información acerca de la profundidad codificada y el modo de codificación de acuerdo con las unidades de codificación máxima. En otras palabras, el decodificador 230 de datos de imagen puede decodificar los datos de imagen codificados basándose en la información extraída acerca del tipo de partición, el modo de predicción, y la unidad de transformación para cada unidad de codificación de entre las unidades de codificación que tienen la estructura de árbol incluida en cada unidad de codificación máxima. Un procedimiento de decodificación puede incluir al menos una de una predicción que incluye intra predicción y compensación de movimiento, y una transformación inversa. La transformación inversa puede realizarse de acuerdo con el procedimiento de transformación ortogonal inversa o transformación de números enteros inversa.

El decodificador 230 de datos de imagen puede realizar intra predicción o compensación de movimiento de acuerdo con una partición y un modo de predicción de cada unidad de codificación, basándose en la información acerca del tipo de partición y el modo de predicción de la unidad de predicción de la unidad de codificación de acuerdo con profundidades codificadas.

También, el decodificador 230 de datos de imagen puede realizar transformación inversa de acuerdo con cada unidad de transformación en la unidad de codificación, basándose en la información acerca del tamaño de la unidad de transformación de la unidad de codificación de acuerdo con profundidades codificadas, para realizar la transformación inversa de acuerdo con las unidades de codificación máxima.

El decodificador 230 de datos de imagen puede determinar al menos una profundidad codificada de una unidad de codificación máxima actual usando información de división de acuerdo con las profundidades. Si la información de división indica que los datos de imagen ya no se dividen en la profundidad actual, la profundidad actual es una profundidad codificada. Por consiguiente, el decodificador 230 de datos de imagen puede decodificar datos codificados de al menos una unidad de codificación que corresponde a cada profundidad codificada en la unidad de codificación máxima actual usando la información acerca del tipo de partición de la unidad de predicción, el modo de predicción, y el tamaño de la unidad de transformación para cada unidad de codificación que corresponde a la profundidad codificada, y emitir los datos de imagen de la unidad de codificación máxima actual.

En otras palabras, las unidades de datos que incluyen la información de codificación que incluye la misma información de división pueden recopilarse observando la información de codificación establecida asignada para la unidad de datos predeterminada de entre la unidad de codificación, la unidad de predicción, y la unidad mínima. Además, las unidades de datos recopiladas pueden considerarse que son una unidad de datos para decodificarse por el decodificador 230 de datos de imagen en el mismo modo de codificación.

El aparato 200 de decodificación de vídeo puede obtener información acerca de al menos una unidad de codificación que genera el error de codificación mínimo cuando la codificación se realiza recursivamente para cada unidad de codificación máxima, y puede usar la información para decodificar la instantánea actual. En otras palabras, pueden decodificarse las unidades de codificación que tienen la estructura de árbol determinada para que sean las unidades de codificación óptimas en cada unidad de codificación máxima. También, puede determinarse un tamaño máximo de la unidad de codificación considerando la resolución y una cantidad de datos de imagen.

Por consiguiente, incluso si los datos de imagen tienen una alta resolución y una gran cantidad de datos, los datos de imagen pueden decodificarse eficazmente y restaurarse usando un tamaño de una unidad de codificación y un modo de codificación, que se determinan de manera adaptativa de acuerdo con las características de los datos de imagen, usando información acerca de un modo de codificación óptimo recibido desde un codificador.

Un procedimiento de determinación de unidades de codificación que tienen una estructura de árbol, una unidad de predicción, y una unidad de transformación, de acuerdo con una o más realizaciones ejemplares se describirá ahora con referencia a las Figuras 3 a 13.

La Figura 3 es un diagrama para describir un concepto de unidades de codificación de acuerdo con una realización ejemplar. Un tamaño de una unidad de codificación puede expresarse en anchura x altura, y puede ser 64x64, 32x32, 16x16, y 8x8, aunque se entiende que otra realización ejemplar no está limitada a lo mismo. Una unidad de codificación de 64x64 puede dividirse en particiones de 64x64, 64x32, 32x64, o 32x32, una unidad de codificación de 32x32 puede dividirse en particiones de 32x32, 32x16, 16x32, o 16x16, una unidad de codificación de 16x16 puede dividirse en particiones de 16x16, 16x8, 8x16 u 8x8, y una unidad de codificación de 8x8 puede dividirse en particiones de 8x8, 8x4, 4x8 o 4x4.

Haciendo referencia a la Figura 3, los primeros datos 310 de vídeo tienen una resolución de 1920x1080, un tamaño máximo de una unidad de codificación de 64, y una profundidad máxima de 2. Los segundos datos 320 de vídeo tienen una resolución de 1920x1080, un tamaño máximo de una unidad de codificación de 64, y una profundidad máxima de 3. Los terceros datos 330 de vídeo tienen una resolución de 352x288, un tamaño máximo de una unidad de codificación de 16, y una profundidad máxima de 1. La profundidad máxima mostrada en la Figura 3 indica un número total de divisiones desde una unidad de codificación máxima a una unidad de decodificación mínima.

Si una resolución es alta o una cantidad de datos es grande, un tamaño máximo de una unidad de codificación puede ser grande para no únicamente aumentar la eficacia de codificación sino también para reflejar de manera precisa las características de una imagen. Por consiguiente, el tamaño máximo de las unidades de codificación de los primeros y segundos datos 310 y 320 de vídeo que tienen una resolución más alta que los terceros datos 330 de vídeo puede ser 64.

Puesto que la profundidad máxima de los primeros datos 310 de vídeo es 2, las unidades 315 de codificación de los primeros datos 310 de vídeo pueden incluir una unidad de codificación máxima que tiene un tamaño de eje largo de 64, y unidades de codificación que tienen tamaños de eje largo de 32 y 16 puesto que las profundidades se hacen profundas a dos capas dividiendo la unidad de codificación máxima dos veces. Mientras tanto, puesto que la profundidad máxima de los terceros datos 330 de vídeo es 1, las unidades 335 de codificación de los terceros datos 330 de vídeo pueden incluir una unidad de codificación máxima que tiene un tamaño de eje largo de 16, y unidades de codificación que tienen un tamaño de eje largo de 8 puesto que las profundidades se hacen profundas a una capa dividiendo una vez la unidad de codificación máxima.

Puesto que la profundidad máxima de los segundos datos 320 de vídeo es 3, las unidades 325 de codificación de los segundos datos 320 de vídeo pueden incluir una unidad de codificación máxima que tiene un tamaño de eje largo de 64, y unidades de codificación que tienen tamaños de eje largo de 32, 16, y 8 puesto que las profundidades se hacen profundas a 3 capas dividiendo tres veces la unidad de codificación máxima. A medida que una profundidad se hace profunda (es decir, aumenta), puede expresarse de manera precisa información detallada.

La Figura 4 es un diagrama de bloques de un codificador 400 de imagen basado en unidades de codificación, de acuerdo con un ejemplo. Haciendo referencia a la Figura 4, el codificador 400 de imagen realiza operaciones del determinador 120 de unidad de codificación del aparato 100 de codificación de vídeo para codificar datos de imagen. Por ejemplo, un intra predictor 410 realiza intra predicción en unidades de codificación en un intra modo, de entre un fotograma 405 actual, y un estimador 420 de movimiento y un compensador 425 de movimiento realizan inter estimación y compensación de movimiento, respectivamente, en unidades de codificación en un inter modo de entre el fotograma 405 actual usando el fotograma 405 actual, y un fotograma 495 de referencia.

Los datos emitidos desde el intra predictor 410, el estimador 420 de movimiento, y el compensador 425 de movimiento se emiten a un coeficiente de transformación cuantificado a través de un transformador 430 y un cuantificador 440. El coeficiente de transformación cuantificado se restaura como datos en un dominio espacial a través de un cuantificador 460 inverso y un transformador 470 inverso. Los datos restaurados en el dominio espacial se emiten como el fotograma 495 de referencia después de que se post-procesan a través de una unidad 480 de desbloqueo y una unidad 490 de filtración en bucle. El coeficiente de transformación cuantificado puede emitirse como una secuencia de bits 455 a través de un codificador 450 por entropía.

Para que se aplique el codificador 400 de imagen en el aparato 100 de codificación de vídeo, los elementos del codificador 400 de imagen, es decir, el intra predictor 410, el estimador 420 de movimiento, el compensador 425 de movimiento, el transformador 430, el cuantificador 440, el codificador 450 por entropía, el cuantificador 460 inverso, el transformador 470 inverso, la unidad 480 de desbloqueo, y la unidad 490 de filtración en bucle, realizan operaciones basándose en cada unidad de codificación de entre las unidades de codificación que tienen una estructura de árbol mientras se considera la profundidad máxima de cada unidad de codificación máxima.

Específicamente, el intra predictor 410, el estimador 420 de movimiento, y el compensador 425 de movimiento determinan particiones y un modo de predicción de cada unidad de codificación de entre las unidades de codificación que tienen una estructura de árbol mientras se considera un tamaño máximo y una profundidad máxima de una unidad de codificación máxima actual, y el transformador 430 determina un tamaño de la unidad de transformación en cada unidad de codificación de entre las unidades de codificación que tienen una estructura de árbol.

La Figura 5 es un diagrama de bloques de un decodificador 500 de imagen basado en unidades de codificación, de acuerdo con una realización ejemplar. Haciendo referencia a la Figura 5, un analizador 510 analiza datos de imagen codificados a decodificarse e información acerca de la codificación usada para decodificar desde una secuencia de bits 505. Los datos de imagen codificados se emiten como datos cuantificados inversos a través de un decodificador 520 por entropía y un cuantificador 530 inverso, y los datos cuantificados inversos se restauran a datos de imagen en un dominio espacial a través de un transformador 540 inverso.

Un intra predictor 550 realiza intra predicción en unidades de codificación en un intra modo con respecto a los datos de imagen en el dominio espacial, y un compensador 560 de movimiento realiza compensación de movimiento en unidades de codificación en un inter modo usando un fotograma 585 de referencia.

Los datos de imagen en el dominio espacial, que se pasan a través del intra predictor 550 y el compensador 560 de movimiento, puede emitirse como un fotograma 595 restaurado que se post-procesa a través de una unidad 570 de desbloqueo y una unidad 580 de filtración en bucle. También, los datos de imagen que se post-procesan a través de la unidad 570 de desbloqueo y la unidad 580 de filtración en bucle pueden emitirse como el fotograma 585 de referencia.

Para decodificar los datos de imagen en el decodificador 230 de datos de imagen del aparato 200 de decodificación de vídeo, el decodificador 500 de imagen puede realizar operaciones que se realizan después del analizador 510. Para que se aplique el decodificador 500 de imagen en el aparato 200 de decodificación de vídeo, los elementos del decodificador 500 de imagen, es decir, el analizador 510, el decodificador 520 por entropía, el cuantificador 530 inverso, el transformador 540 inverso, el intra predictor 550, el compensador 560 de movimiento, la unidad 570 de desbloqueo, y la unidad 580 de filtración en bucle, realizan operaciones basándose en unidades de codificación que tienen una estructura de árbol para cada unidad de codificación máxima.

Específicamente, la intra predicción 550 y el compensador 560 de movimiento realizan operaciones basándose en particiones y un modo de predicción para cada una de las unidades de codificación que tienen una estructura de árbol, y el transformador 540 inverso realiza operaciones basándose en un tamaño de una unidad de transformación para cada unidad de codificación.

La Figura 6 es un diagrama que ilustra unidades de codificación más profundas de acuerdo con las profundidades, y particiones, de acuerdo con una realización ejemplar. Un aparato 100 de codificación de vídeo de acuerdo con una realización ejemplar y un aparato 200 de decodificación de vídeo de acuerdo con una realización ejemplar usan unidades de codificación jerárquica para considerar características de una imagen. Una altura máxima, una anchura máxima, y una profundidad máxima de unidades de codificación pueden determinarse de manera adaptativa de acuerdo con las características de la imagen, o pueden establecerse de manera diferente por un usuario.

Los tamaños de unidades de codificación más profundas de acuerdo con las profundidades pueden determinarse de acuerdo con un tamaño máximo predeterminado de la unidad de codificación.

Haciendo referencia a la Figura 6, en una estructura 600 jerárquica de unidades de codificación, de acuerdo con una realización ejemplar, la altura máxima y la anchura máxima de las unidades de codificación son cada una 64, y la profundidad máxima es 4. Puesto que una profundidad se hace profunda (es decir, aumenta) a lo largo de un eje vertical de la estructura 600 jerárquica, se divide cada una de una altura y una anchura de las unidades de codificación más profundas. También, una unidad de predicción y las particiones, que son las bases para codificación de predicción de cada unidad de codificación más profunda, se muestran a lo largo de un eje horizontal de la estructura 600 jerárquica.

Por ejemplo, una primera unidad 610 de codificación es una unidad de codificación máxima en la estructura 600 jerárquica, en la que una profundidad de la misma es 0 y un tamaño, es decir, una altura por anchura, de la misma es 64x64. La profundidad se hace profunda a lo largo del eje vertical de manera que la estructura 600 jerárquica incluye una segunda unidad 620 de codificación que tiene un tamaño de 32x32 y una profundidad de 1, una tercera unidad 630 de codificación que tiene un tamaño de 16x16 y una profundidad de 2, una cuarta unidad 640 de codificación que tiene un tamaño de 8x8 y una profundidad de 3, y una quinta unidad 650 de codificación que tiene un tamaño de 4x4 y una profundidad de 4. La quinta unidad 650 de codificación que tiene el tamaño de 4x4 y la profundidad de 4 es una unidad de codificación mínima.

La unidad de predicción y las particiones de las unidades 610, 620, 630, 640, y 650 de codificación se disponen a lo largo del eje horizontal de acuerdo con cada profundidad. En otras palabras, si la primera unidad 610 de codificación que tiene el tamaño de 64x64 y la profundidad de 0 es una unidad de predicción, la unidad de predicción puede dividirse en particiones incluidas en la primera unidad 610 de codificación, es decir una partición 610 que tiene un tamaño de 64x64, particiones 612 que tienen un tamaño de 64x32, particiones 614 que tienen el tamaño de 32x64, o particiones 616 que tienen un tamaño de 32x32.

De manera similar, una unidad de predicción de la segunda unidad 620 de codificación que tiene el tamaño de 32x32 y la profundidad de 1 puede dividirse en particiones incluidas en la segunda unidad 620 de codificación, es decir una partición 620 que tiene un tamaño de 32x32, particiones 622 que tienen un tamaño de 32x16, particiones 624 que tienen un tamaño de 16x32, y particiones 626 que tienen un tamaño de 16x16.

De manera similar, una unidad de predicción de la tercera unidad 630 de codificación que tiene el tamaño de 16x16 y la profundidad de 2 puede dividirse en particiones incluidas en la tercera unidad 630 de codificación, es decir una partición que tiene un tamaño de 16x16 incluida en la tercera unidad 630 de codificación, particiones 632 que tienen un tamaño de 16x8, particiones 634 que tienen un tamaño de 8x16, y particiones 636 que tienen un tamaño de 8x8. De manera similar, una unidad de predicción de la cuarta unidad 640 de codificación que tiene el tamaño de 8x8 y la profundidad de 3 puede dividirse en particiones incluidas en la cuarta unidad 640 de codificación, es decir una partición que tiene un tamaño de 8x8 incluida en la cuarta unidad 640 de codificación, particiones 642 que tiene un tamaño de 8x4, particiones 644 que tienen un tamaño de 4x8, y particiones 646 que tienen un tamaño de 4x4.

La quinta unidad 650 de codificación que tiene el tamaño de 4x4 y la profundidad de 4 es la unidad de codificación mínima y una unidad de codificación de la profundidad más inferior. Una unidad de predicción de la quinta unidad 650 de codificación se asigna a una partición que tiene un tamaño de 4x4.

Para determinar la al menos una profundidad codificada de las unidades de codificación de la unidad 610 de codificación máxima, el determinador 120 de unidad de codificación del aparato 100 de codificación de vídeo realiza la codificación para las unidades de codificación que corresponden a cada profundidad incluida en la unidad 610 de codificación máxima

Un número de unidades de codificación más profundas de acuerdo con las profundidades que incluyen datos en el mismo intervalo y el mismo tamaño aumenta a medida que la profundidad se hace más profunda. Por ejemplo, se requieren cuatro unidades de codificación que corresponden a una profundidad de 2 para cubrir datos que se incluyen en una unidad de codificación que corresponde a una profundidad de 1. Por consiguiente, para comparar resultados de codificación de los mismos datos de acuerdo con las profundidades, se codifica cada una de la unidad de codificación que corresponde a la profundidad de 1 y cuatro unidades de codificación que corresponden a la profundidad de 2.

Para realizar la codificación para una profundidad actual de entre las profundidades, puede seleccionarse un error de codificación mínimo para la profundidad actual realizando la codificación para cada unidad de predicción en las unidades de codificación que corresponden a la profundidad actual, a lo largo del eje horizontal de la estructura 600 jerárquica. Como alternativa, puede buscarse el error de codificación mínimo comparando los errores de codificación mínimos de acuerdo con las profundidades, realizando la codificación para cada profundidad a medida que la profundidad se hace más profunda a lo largo del eje vertical de la estructura 600 jerárquica. Puede seleccionarse una profundidad y una partición que tienen el error de codificación mínimo en la primera unidad 610 de codificación como la profundidad codificada y un tipo de partición de la primera unidad 610 de codificación.

La Figura 7 es un diagrama para describir una relación entre una unidad 710 de codificación y unidades 720 de transformación, de acuerdo con una realización ejemplar. El aparato 100 de codificación de vídeo de acuerdo con una realización ejemplar y un aparato 200 de decodificación de vídeo de acuerdo con una realización ejemplar codifican y decodifican, respectivamente, una imagen de acuerdo con las unidades de codificación que tienen tamaños menores o iguales que una unidad de codificación máxima para cada unidad de codificación máxima. Los tamaños de unidades de transformación para transformación durante la codificación pueden seleccionarse basándose en unidades de datos que no son mayores que una unidad de codificación correspondiente.

Haciendo referencia a la Figura 7, por ejemplo, en el aparato 100 de codificación de vídeo, si un tamaño de la unidad 710 de codificación es 64x64, la transformación puede realizarse usando las unidades 720 de transformación que tienen un tamaño de 32x32.

También, los datos de la unidad 710 de codificación que tienen el tamaño de 64x64 pueden codificarse realizando la transformación en cada una de las unidades de transformación que tienen el tamaño de 32x32, 16x16, 8x8, y 4x4, que son menores que 64x64, y a continuación puede seleccionarse una unidad de transformación que tiene los mínimos errores de codificación.

La Figura 8 es un diagrama para describir información de codificación de unidades de codificación que corresponden a una profundidad codificada, de acuerdo con una realización ejemplar. Haciendo referencia a la Figura 8, la unidad 130 de salida de un aparato 100 de codificación de vídeo de acuerdo con una realización ejemplar puede codificar y transmitir primera información 800 acerca de un tipo de partición, segunda información 810 acerca de un modo de predicción, y tercera información 820 acerca de un tamaño de una unidad de transformación para cada unidad de codificación que corresponde a una profundidad codificada, como información acerca de un modo de codificación. La primera información 800 indica información acerca de una forma de una partición obtenida dividiendo una unidad de predicción de una unidad de codificación actual, en la que la partición es una unidad de datos para codificación de predicción de la unidad de codificación actual. Por ejemplo, una unidad de codificación actual CU_0 que tiene un tamaño de 2Nx2N puede dividirse en una cualquiera de una partición 802 que tiene un tamaño de 2Nx2N, una partición 804 que tiene un tamaño de 2NxN, una partición 806 que tiene un tamaño de Nx2N, y una partición 808 que tiene un tamaño de NxN. En este punto, la primera información 800 acerca de un tipo de partición se establece para indicar una de la partición 804 que tiene un tamaño de 2NxN, la partición 806 que tiene un tamaño de Nx2N, y la partición 808 que tiene un tamaño de NxN.

La segunda información 810 indica un modo de predicción de cada partición. Por ejemplo, la segunda información 810 puede indicar un modo de codificación de predicción realizado en una partición indicado por la primera información 800, es decir, un intra modo 812, un inter modo 814, o un modo de salto 816.

La tercera información 820 indica una unidad de transformación para que esté basada cuando se realiza la transformación en una unidad de codificación actual. Por ejemplo, la unidad de transformación puede ser una primera unidad 822 de intra transformación, una segunda unidad 824 de intra transformación, una primera unidad 826 de inter transformación, o una segunda unidad 828 de intra transformación.

Un extractor 220 de datos de imagen e información de codificación de un aparato 200 de decodificación de vídeo de acuerdo con una realización ejemplar puede extraer y usar la información 800, 810, y 820 para decodificar, de acuerdo con cada unidad de codificación más profunda.

La Figura 9 es un diagrama de unidades de codificación más profundas de acuerdo con las profundidades, de acuerdo con una realización ejemplar. La información de división puede usarse para indicar un cambio de una profundidad. La información de división indica si una unidad de codificación de una profundidad actual se divide en unidades de codificación de una profundidad inferior.

Haciendo referencia a la Figura 9, una unidad 910 de predicción para codificación de predicción de una unidad 900 de codificación que tiene una profundidad de 0 y un tamaño de 2N_0x2N_0 puede incluir particiones de un tipo 912 de partición que tiene un tamaño de 2N_0x2N_0, un tipo 914 de partición que tiene un tamaño de 2N_0xN_0, un tipo 916 de partición que tiene un tamaño de N_0x2N_0, y un tipo 918 de partición que tiene un tamaño de N_0xN_0. La Figura 9 únicamente ilustra los tipos 912 a 918 de partición que se obtienen dividiendo simétricamente la unidad 910 de predicción, pero se entiende que un tipo de partición no está limitado a la misma en otra realización ejemplar. Por ejemplo, de acuerdo con otra realización ejemplar, las particiones de la unidad 910 de predicción pueden incluir particiones asimétricas, particiones que tienen una forma predeterminada, y particiones que tienen una forma geométrica.

La codificación de predicción se realiza de manera repetitiva en una partición que tiene un tamaño de 2N_0x2N_0, dos particiones que tienen un tamaño de 2N_0xN_0, dos particiones que tienen un tamaño de N_0x2N_0, y cuatro particiones que tienen un tamaño de N_0xN_0, de acuerdo con cada tipo de partición.

La codificación por predicción en un intra modo y un inter modo puede realizarse en las particiones que tienen los tamaños de 2N_0x2N_0, N_0x2N_0, 2N_0xN_0, y N_0xN_0. La codificación por predicción en un modo de salto se realiza únicamente en la partición que tiene el tamaño de 2N_0x2N_0.

Se comparan los errores de codificación que incluyen la codificación por predicción en los tipos 912 a 918 de partición, y se determina el error de codificación mínimo entre los tipos de partición. Si un error de codificación es el más pequeño en uno de los tipos 912 a 916 de partición, la unidad 910 de predicción puede no dividirse en una profundidad inferior.

Si el error de codificación es el más pequeño en el tipo 918 de partición, una profundidad se cambia desde 0 a 1 para dividir el tipo 918 de partición en la operación 920, y la codificación se realiza de manera repetitiva en las unidades 930 de codificación que tienen una profundidad de 2 y un tamaño de N_0xN_0 para buscar un error de codificación mínimo.

Una unidad 940 de predicción para codificación de predicción la unidad 930 de codificación que tiene una profundidad de 1 y un tamaño de 2N_1x2N_1 (=N_0xN_0) puede incluir particiones de un tipo 942 de partición que tiene un tamaño de 2N_1x2N_1, un tipo 944 de partición que tiene un tamaño de 2N_1xN_1, un tipo 946 de partición que tiene un tamaño de N_1x2N_1, y un tipo 948 de partición que tiene un tamaño de N_1xN_1.

Si un error de codificación es el más pequeño en el tipo 948 de partición, una profundidad se cambia de 1 a 2 para dividir el tipo 948 de partición en la operación 950, y se realiza de manera repetitiva la codificación en unidades 960 de codificación, que tienen una profundidad de 2 y un tamaño de N_2xN_2 para buscar un error de codificación mínimo.

Cuando una profundidad máxima es d, pueden realizarse operaciones de división de acuerdo con cada profundidad hasta cuando una profundidad se hace d-1, y la información de división puede codificarse hasta cuando una profundidad es una de 0 a d-2. Por ejemplo, cuando se realiza codificación hasta cuando la profundidad es d-1 después de que una unidad de codificación que corresponde a una profundidad de d-2 se divide en la operación 970, una unidad 990 de predicción para codificación de predicción de una unidad 980 de codificación que tiene una profundidad de d-1 y un tamaño de 2N_(d-1 )x2N_(d-1) puede incluir particiones de un tipo 992 de partición que tiene un tamaño de 2N_(d-1 )x2N_(d-1), un tipo de partición 994 que tiene un tamaño de 2N_(d-1 )xN_(d-1), un tipo 996 de partición que tiene un tamaño de N_(d-1)x2N_(d-1), y un tipo 998 de partición que tiene un tamaño de N_(d-1)xN_(d-1).

La codificación de predicción puede realizarse de manera repetitiva en una partición que tiene un tamaño de 2N_(d-1)x2N_(d-1), dos particiones que tienen un tamaño de 2N_(d-1)xN_(d-1), dos particiones que tienen un tamaño de N_(d-1)x2N_(d-1), cuatro particiones que tienen un tamaño de N_(d-1)xN_(d-1) de entre los tipos 992 a 998 de partición para buscar un tipo de partición que tiene un error de codificación mínimo.

Incluso cuando el tipo 998 de partición tiene el error de codificación mínimo, puesto que una profundidad máxima es d, una unidad de codificación CU_(d-1) que tiene una profundidad de d-1 ya no se divide a una profundidad inferior, y una profundidad codificada para las unidades de codificación de una unidad 900 de codificación máxima actual se determina que es d-1 y puede determinarse un tipo de partición de la unidad 900 de codificación máxima actual para que sea N_(d-1)xN (d-1). También, puesto que la profundidad máxima es d y una unidad 980 de codificación mínima que tiene una profundidad más inferior de d-1 ya no se divide a una profundidad inferior, no se establece información de división para la unidad 980 de codificación mínima.

Una unidad 999 de datos puede considerarse una unidad mínima para la unidad de codificación máxima actual. Una unidad mínima de acuerdo con una realización ejemplar puede ser una unidad de datos rectangular obtenida dividiendo por 4 una unidad 980 de codificación mínima. Realizando la codificación de manera repetitiva, un aparato 100 de codificación de vídeo de acuerdo con una realización ejemplar puede seleccionar una profundidad que tiene el error de codificación mínimo comparando errores de codificación de acuerdo con las profundidades de la unidad 900 de codificación para determinar una profundidad codificada, y establecer un correspondiente tipo de partición y un modo de predicción como un modo de codificación de la profundidad codificada.

Como tal, los errores de codificación mínimos de acuerdo con las profundidades se comparan en todas las profundidades de 1 a d, y puede determinarse una profundidad que tiene los mínimos errores de codificación como una profundidad codificada. Al menos uno de la profundidad codificada, el tipo de partición de la unidad de predicción, y el modo de predicción pueden codificarse y transmitirse como información acerca de un modo de codificación. También puesto que una unidad de codificación se divide desde una profundidad de 0 a una profundidad codificada, únicamente se establece información de división de la profundidad codificada a 0, y la información de división de las profundidades que excluyen la profundidad codificada se establecen a 1.

Un extractor 220 de datos de imagen e información de codificación de un aparato 200 de decodificación de vídeo de acuerdo con una realización ejemplar puede extraer y usar la información acerca de la profundidad codificada y la unidad de predicción de la unidad 900 de codificación para decodificar la partición 912. El aparato 200 de decodificación de vídeo puede determinar una profundidad, en la que la información de división es 0, como una profundidad codificada usando información de división de acuerdo con las profundidades, y usar información acerca de un modo de codificación de la profundidad correspondiente para codificación.

Las Figuras 10 a 12 son diagramas para describir una relación entre las unidades 1010 de codificación, las unidades 1060 de predicción, y las unidades 1070 de transformación, de acuerdo con una realización ejemplar.

Haciendo referencia a las Figuras 10 a 12, las unidades 1010 de codificación son unidades de codificación que tienen una estructura de árbol, que corresponde a profundidades codificadas determinadas por un aparato 100 de codificación de vídeo de acuerdo con una realización ejemplar, en una unidad de codificación máxima. Las unidades 1060 de predicción son particiones de unidades de predicción de cada una de las unidades 1010 de codificación, y las unidades 1070 de transformación son unidades de transformación de cada una de las unidades 1010 de codificación.

Cuando una profundidad de una unidad de codificación máxima es 0 en las unidades 1010 de codificación, las profundidades de las unidades 1012 y 1054 de codificación son 1, las profundidades de las unidades 1014, 1016, 1018, 1028, 1050 y 1052 de codificación son 2, las profundidades de las unidades 1020, 1022, 1024, 1026, 1030, 1032 y 1048 de codificación son 3, y las profundidades de las unidades 1040, 1042, 1044, y 1046 de codificación son 4.

En las unidades 1060 de predicción, algunas unidades 1014, 1016, 1022, 1032, 1048, 1050, 1052 y 1054 de codificación se obtienen dividiendo las unidades de codificación de las unidades 1010 de codificación. Por ejemplo, los tipos de partición en las unidades 1014, 1022, 1050 y 1054 de codificación tienen un tamaño de 2NxN, los tipos de partición en las unidades 1016, 1048 y 1052 de codificación tienen un tamaño de Nx2N, y un tipo de partición de la unidad 1032 de codificación tiene un tamaño de NxN. Las unidades de predicción y las particiones de las unidades 1010 de codificación son menores o igual que cada unidad de codificación.

Se realiza transformación o transformación inversa en datos de imagen de la unidad 1052 de codificación en las unidades 1070 de transformación en una unidad de datos que es menor que la unidad 1052 de codificación. También, las unidades 1014, 1016, 1022, 1032, 1048, 1050 y 1052 de codificación en las unidades 1070 de transformación son diferentes de aquellas en las unidades 1060 de predicción en términos de tamaños y formas. Por ejemplo, los aparatos 100 y 200 de codificación y decodificación de vídeo de acuerdo con las realizaciones ejemplares pueden realizar intra predicción, estimación de movimiento, compensación de movimiento, transformación, y transformación inversa de manera individual en una unidad de datos en la misma unidad de codificación.

Por consiguiente, se realiza de manera recursiva decodificación en cada una de las unidades de codificación que tienen una estructura jerárquica en cada región de una unidad de codificación máxima para determinar una unidad de codificación óptima, y por lo tanto pueden obtenerse unidades de codificación que tienen una estructura de árbol recursiva. La información de codificación puede incluir al menos una de información de división acerca de una unidad de codificación, información acerca de un tipo de partición, información acerca de un modo de predicción, e información acerca de un tamaño de una unidad de transformación. La Tabla 1 muestra información ejemplar de la codificación que puede establecerse por los aparatos 100 y 200 de codificación y decodificación de vídeo.

[Tabla 1]

Una unidad 130 de salida del aparato 100 de codificación de vídeo puede emitir la información de codificación acerca de las unidades de codificación que tienen una estructura de árbol, y un extractor 220 de datos de imagen e información de codificación del aparato 200 de decodificación de vídeo puede extraer la información de codificación acerca de las unidades de codificación que tienen una estructura de árbol desde una secuencia de bits recibida. La información de división indica si una unidad de codificación actual se divide en unidades de codificación de una profundidad inferior. Si la información de división de una profundidad actual d es 0, una profundidad en la que una unidad de codificación actual ya no se divide en una profundidad inferior es una profundidad codificada, y por lo tanto puede definirse información acerca de un tipo de partición, modo de predicción, y un tamaño de una unidad de transformación para la profundidad codificada. Si la unidad de codificación actual se divide adicionalmente de acuerdo con la información de división, se realiza codificación de manera independiente en cuatro unidades de codificación de división de una profundidad inferior.

Un modo de predicción puede ser uno de un intra modo, un inter modo, y un modo de salto. El intra modo y el inter modo pueden definirse en todos los tipos de partición, y el modo de salto puede definirse únicamente en un tipo de partición que tiene un tamaño de 2Nx2N.

La información acerca del tipo de partición puede indicar tipos de partición simétrica que tienen tamaños de 2Nx2N, 2NxN, Nx2N y NxN, que se obtienen dividiendo simétricamente al menos una de una altura y una anchura de una unidad de predicción, y tipos de partición asimétrica que tienen tamaños de 2NxnU, 2NxnD, nLx2N y nRx2N, que se obtienen dividiendo asimétricamente al menos una de la altura y la anchura de la unidad de predicción. Los tipos de partición asimétrica que tienen los tamaños de 2NxnU y 2NxnD pueden obtenerse dividiendo respectivamente la altura de la unidad de predicción en 1:3 y 3:1, y los tipos de partición asimétrica que tienen los tamaños de nLx2N y nRx2N pueden obtenerse dividiendo respectivamente la anchura de la unidad de predicción en 1:3 y 3:1.

El tamaño de la unidad de transformación puede establecerse para que sea dos tipos en el intra modo y dos tipos en el inter modo. Por ejemplo, si la información de división de la unidad de transformación es 0, el tamaño de la unidad de transformación puede ser 2Nx2N, que es el tamaño de la unidad de codificación actual. Si la información de división de la unidad de transformación es 1, las unidades de transformación pueden obtenerse dividiendo la unidad de codificación actual. También, si un tipo de partición de la unidad de codificación actual que tiene el tamaño de 2Nx2N es un tipo de partición simétrica, un tamaño de una unidad de transformación puede ser NxN, y si el tipo de partición de la unidad de codificación actual es un tipo de partición asimétrica, el tamaño de la unidad de transformación puede ser N/2xN/2.

La información de codificación acerca de las unidades de codificación que tienen una estructura de árbol puede incluir al menos una de una unidad de codificación que corresponde a una profundidad codificada, una unidad de predicción, y una unidad mínima.

La unidad de codificación que corresponde a la profundidad codificada puede incluir al menos una de una unidad de predicción y una unidad mínima que incluye la misma información de codificación.

Por consiguiente, se determina si se incluyen unidades de datos adyacentes en la misma unidad de codificación que corresponde a la profundidad codificada comparando información de codificación de las unidades de datos adyacentes. También, se determina una unidad de codificación correspondiente que corresponde a una profundidad codificada usando información de codificación de una unidad de datos, y por lo tanto puede determinarse una distribución de profundidades codificadas en una unidad de codificación máxima.

Por lo tanto, si se predice una unidad de codificación actual basándose en información de codificación de unidades de datos adyacentes, puede hacerse referencia directamente a la información de codificación de unidades de datos en unidades de codificación más profundas adyacentes a la unidad de codificación actual y usarse.

Como alternativa, si se predice una unidad de codificación actual basándose en información de codificación de unidades de datos adyacentes, se buscan unidades de datos adyacentes a la unidad de codificación actual usando información codificada de las unidades de datos, y puede hacerse referencia a las unidades de codificación adyacentes buscadas para predecir la unidad de codificación actual.

La Figura 13 es un diagrama para describir una relación entre una unidad de codificación, una unidad de predicción 0 una partición, y una unidad de transformación, de acuerdo con la información de modo de codificación de la Tabla 1 de acuerdo con una realización ejemplar. Haciendo referencia a la Figura 13, una unidad 1300 de codificación máxima incluye las unidades 1302, 1304, 1306, 1312, 1314 1316, y 1318 de codificación de las profundidades codificadas. En este punto, puesto que la unidad 1318 de codificación es una unidad de codificación de una profundidad codificada, la información de división puede establecerse a 0. La información acerca de un tipo de partición de la unidad 1318 de codificación que tiene un tamaño de 2Nx2N puede establecerse para que sea un tipo 1322 de partición que tiene un tamaño de 2Nx2N, un tipo 1324 de partición que tiene un tamaño de 2NxN, un tipo 1326 de partición que tiene un tamaño de Nx2N, un tipo 1328 de partición que tiene un tamaño de NxN, un tipo 1332 de partición que tiene un tamaño de 2NxnU, un tipo 1334 de partición que tiene un tamaño de 2NxnD, un tipo 1336 de partición que tiene un tamaño de nLx2N, o un tipo 1338 de partición que tiene un tamaño de nRx2N.

Cuando el tipo de partición se establece para que sea simétrico, es decir, el tipo 1322, 1324, 1326 o 1328 de partición, se establece una unidad 1342 de transformación que tiene un tamaño de 2Nx2N si la información de división (bandera de tamaño TU) de una unidad de transformación es 0, y se establece una unidad 1344 de transformación que tiene un tamaño de NxN si una bandera de tamaño de TU es 1.

Cuando el tipo de partición se establece para que sea asimétrica, es decir, el tipo 1332, 1334, 1336 o 1338 de partición, se establece una unidad 1352 de transformación que tiene un tamaño de 2Nx2N si una bandera de tamaño de TU es 0, y se establece una unidad 1354 de transformación que tiene un tamaño de N/2xN/2 si una bandera de tamaño de TU es 1.

Haciendo referencia a la Figura 13, la bandera de tamaño de TU es una bandera que tiene un valor o 0 o 1, aunque se entiende que otra realización ejemplar no está limitada a una bandera de 1 bit, y una unidad de transformación puede dividirse jerárquicamente teniendo una estructura de árbol mientras la bandera de tamaño de TU aumenta desde 0 en otra realización ejemplar.

En este caso, el tamaño de una unidad de transformación que se ha usado realmente puede expresarse usando una bandera de tamaño de TU de una unidad de transformación, de acuerdo con una realización ejemplar, junto con un tamaño máximo y tamaño mínimo de la unidad de transformación. De acuerdo con una realización ejemplar, un aparato 100 de codificación de vídeo puede codificar información de tamaño de unidad de transformación máxima, información de tamaño de unidad de transformación mínima, y una bandera de tamaño de TU máxima. El resultado de codificar la información de tamaño de unidad de transformación máxima, la información de tamaño de unidad de transformación mínima, y la bandera de tamaño de TU máxima puede insertarse en un SPS. De acuerdo con una realización ejemplar, un aparato 200 de decodificación de vídeo puede decodificar video usando la información de tamaño de unidad de transformación máxima, la información de tamaño de unidad de transformación mínima, y la bandera de tamaño de TU máxima.

Por ejemplo, si el tamaño de una unidad de codificación actual es 64x64 y un tamaño de unidad de transformación máxima es 32x32, el tamaño de una unidad de transformación puede ser 32x32 cuando una bandera de tamaño de TU es 0, puede ser 16x16 cuando la bandera de tamaño de TU es 1, y puede ser 8x8 cuando la bandera de tamaño de TU es 2.

Como otro ejemplo, si el tamaño de la unidad de codificación actual es 32x32 y un mínimo tamaño de unidad de transformación es 32x32, el tamaño de la unidad de transformación puede ser 32x32 cuando la bandera de tamaño de TU es 0. En este punto, la bandera de tamaño de TU no puede establecerse a un valor distinto de 0, puesto que el tamaño de la unidad de transformación no puede ser menor que 32x32.

Como otro ejemplo, si el tamaño de la unidad de codificación actual es 64x64 y una bandera de tamaño de TU máxima es 1, la bandera de tamaño de TU puede ser 0 o 1. En este punto, la bandera de tamaño de TU no puede establecerse a un valor distinto de 0 o 1.

Por lo tanto, si se define que la bandera de tamaño de TU máxima es MaxTransformSizelndex, un tamaño de unidad de transformación mínima es MinTransformSize, y un tamaño de unidad de transformación es RootTuSize cuando la bandera de tamaño de TU es 0, entonces un tamaño de unidad de transformación mínima actual CurrMinTuSize que puede determinarse en una unidad de codificación actual, puede definirse por la Ecuación (1):

CurrMinTuSize = max(MinTransformSize,

RootTuSize/(2AMaxTransformSizeIndex))... (1).

En comparación con el tamaño de unidad de transformación mínima actual CurrMinTuSize que puede determinarse en la unidad de codificación actual, un tamaño de unidad de transformación 'RootTuSize' cuando la bandera de tamaño de TU es 0 puede indicar un tamaño de unidad de transformación máxima que puede seleccionarse en el sistema. En la ecuación (1), RootTuSize/(2AMaxTransformSizeIndex) indica un tamaño de unidad de transformación cuando el tamaño de unidad de transformación RootTuSize, cuando la bandera de tamaño de TU es 0, se divide un número de veces que corresponde a la bandera de tamaño de TU máxima, y MinTransformSize indica un tamaño de transformación mínimo. Por lo tanto, un valor menor entre RootTuSize/(2AMaxTransformSizeIndex) y MinTransformSize puede ser el tamaño de unidad de transformación mínimo actual CurrMinTuSize que puede determinarse en la unidad de codificación actual.

De acuerdo con una realización ejemplar, el tamaño de unidad de transformación máxima RootTuSize puede variar de acuerdo con el tipo de un modo de predicción. Por ejemplo, si un modo de predicción actual es un inter modo, entonces puede determinarse RootTuSize usando la Ecuación (2) a continuación. En la ecuación (2), MaxTransformSize indica un tamaño de unidad de transformación máxima, y PUSize indica un tamaño de unidad de predicción actual:

RootTuSize = min(MaxTransformSize, PUSize)...(2).

Es decir, si el modo de predicción actual es el inter modo, el tamaño de unidad de transformación RootTuSize cuando la bandera de tamaño de TU es 0 puede ser un valor menor de entre el tamaño de unidad de transformación máxima y el tamaño de la unidad de predicción actual.

Si un modo de predicción de una unidad de partición actual es un intra modo, puede determinarse RootTuSize usando la Ecuación (3) a continuación. En la ecuación (3), PartitionSize indica el tamaño de la unidad de partición actual:

RootTuSize = min(MaxTransformSize, Partit¡onS¡ze)...(3).

Es decir, si el modo de predicción actual es el intra modo, el tamaño de unidad de transformación RootTuSize cuando la bandera de tamaño de TU es 0 puede ser un valor menor de entre el tamaño de unidad de transformación máxima y el tamaño de la unidad de partición actual.

Sin embargo, el tamaño de unidad de transformación máxima actual RootTuSize que varía de acuerdo con el tipo de un modo de predicción en una unidad de partición es simplemente un ejemplo y se entiende que otra realización ejemplar no está limitada a lo mismo.

Un índice y un orden de exploración de una unidad de datos basándose en unidades de codificación que tienen una estructura de árbol una unidad de predicción, y una unidad de transformación, de acuerdo con una o más realizaciones ejemplares se describirá ahora en detalle con referencia a las Figuras 14 a 27.

Un aparato 100 de codificación de vídeo de acuerdo con una realización ejemplar usa un orden de exploración de rasterización como un orden en el que se realiza codificación en unidades de unidades de codificación máxima incluidas en un corte. Las unidades de codificación jerárquica de acuerdo con las profundidades incluidas en una unidad de codificación máxima pueden explorarse de una manera en zigzag entre las unidades de codificación que corresponden a la misma profundidad. La codificación de unidades mínimas de cada unidad de codificación máxima puede realizarse en un orden de exploración de rasterización.

El aparato 100 de codificación de vídeo puede hacer referencia a información acerca de unas cercanías de una unidad de datos actual (en lo sucesivo, denominado como información de las cercanías de una unidad de datos actual) para codificar datos de imagen que corresponden a la unidad de datos actual. Por ejemplo, cuando una unidad de codificación máxima actual, una unidad de codificación actual que corresponde a una profundidad codificada, o una unidad de predicción actual se codifican por predicción, puede hacerse referencia a la información acerca de una unidad de codificación máxima o unidades de codificación actual de acuerdo con las profundidades adyacentes a la unidad de codificación máxima actual, la unidad de codificación actual que corresponde a profundidad codificada o la unidad de predicción actual, y similares.

En detalle, la información de las cercanías puede incluir información acerca de al menos una de una unidad de codificación máxima en un lado izquierdo de la unidad de codificación máxima actual, una unidad de codificación máxima en un lado superior de la misma, una unidad de codificación máxima en un lado superior derecho de la misma, una unidad de codificación máxima en un lado superior izquierdo de la misma, etc. La información de las cercanías puede incluir información acerca de unidades de codificación localizadas en al menos uno del lado izquierdo, el lado superior, el lado superior derecho, y el lado superior izquierdo de la unidad de codificación máxima actual. La información de las cercanías puede incluir también información acerca de unidades de predicción localizadas en el lado izquierdo, el lado superior, el lado superior derecho, el lado superior izquierdo de la unidad de codificación máxima actual, etc.

La información de las cercanías puede incluir también información acerca de particiones localizadas en al menos uno del lado izquierdo, el lado superior, el lado superior derecho, el lado superior izquierdo de la unidad de codificación máxima actual, etc.

La información de las cercanías puede incluir también información acerca de unidades mínimas localizadas en al menos uno del lado izquierdo, el lado superior, el lado superior derecho, el lado superior izquierdo de la unidad de predicción actual, etc.

Adicionalmente puede hacerse referencia a parte de una unidad de datos, a diferencia de una totalidad de la unidad de datos, como la información de las cercanías. Por ejemplo, la información de las cercanías puede incluir un límite derecho de una unidad de codificación máxima localizada en un lado inferior izquierdo de la unidad de predicción actual.

Puesto que una unidad de datos localizada en el lado inferior izquierdo de una unidad de datos actual se explora más tarde que la unidad de datos actual de acuerdo con un orden de exploración de rasterizaciónde rasterización de una realización ejemplar, puede no hacerse referencia a la unidad de datos localizada en el lado inferior izquierdo de la unidad de datos actual cuando se codifica un macrobloque actual, en un procedimiento de codificación de macrobloque que cumple con un orden de exploración de rasterizaciónde rasterización. Sin embargo, en la presente realización ejemplar, incluso cuando las unidades de codificación máxima únicamente cumplen con un orden de exploración de rasterizaciónde rasterización, puesto que las unidades mínimas y las unidades de datos en las unidades de codificación máxima pueden explorarse en una manera en zigzag, las unidades mínimas y las unidades de datos pueden servir como la información de las cercanías.

Un determinador 120 de unidad de codificación del aparato 100 de codificación de vídeo puede comprobar una localización y usabilidad de una unidad de codificación predeterminada. La unidad de codificación comprobada puede ser una unidad de codificación que tiene una estructura de árbol, es decir, una unidad de codificación que corresponde a una profundidad codificada. El determinador 120 de unidad de codificación puede comprobar la localización y usabilidad de una unidad de datos adyacente a una unidad de datos actual. La unidad de datos adyacente a la unidad de datos actual puede incluir al menos una de unidades de datos localizadas en el lado izquierdo, el lado superior, el lado superior derecho, y el lado superior izquierdo de la unidad de datos actual. La unidad de datos adyacentes a comprobarse puede incluir al menos una de una unidad de codificación máxima, una unidad de codificación, una unidad de predicción, una partición, una unidad de transformación, y una unidad mínima. Un decodificador 230 de datos de imagen de un aparato 200 de decodificación de vídeo de acuerdo con una realización ejemplar considera un orden de exploración de rasterizaciónde rasterización para unidades de codificación máxima y un orden de exploración en zigzag para unidades de codificación de acuerdo con las profundidades, para decodificar datos de imagen que corresponden a cada unidad de codificación máxima codificada basándose en información acerca de una profundidad codificada y un modo de codificación para cada unidad de codificación máxima para restaurar una instantánea actual. En lo sucesivo, una unidad de codificación que se explora teniendo en cuenta un orden de exploración de rasterizaciónde rasterización para las unidades de codificación máxima y un orden de exploración en zigzag para unidades de codificación de acuerdo con las profundidades es una unidad de codificación que corresponde a una profundidad codificada de entre las unidades de codificación que tienen una estructura de árbol.

Puede hacerse referencia a la información de las cercanías para decodificar una unidad de datos actual. Por ejemplo, puede realizarse inter predicción en una partición actual haciendo referencia a un vector de movimiento de una partición adyacente a la partición actual. Además, puede realizarse inter predicción en una partición actual haciendo referencia a un valor de píxel de una unidad de datos adyacente a un valor de píxel de la partición actual. El decodificador 230 de datos de imagen puede comprobar la localización, usabilidad y similares de la unidad de datos adyacentes a la que puede hacerse referencia para decodificar la unidad de datos actual.

Por consiguiente, el decodificador 230 de datos de imagen puede hacer referencia a información de las cercanías comprobando la usabilidad de la información de las cercanías, teniendo en cuenta un orden de exploración de rasterizaciónde rasterización para unidades de codificación máxima y particiones y un orden de exploración en zigzag o un orden de exploración de rasterizaciónde rasterización para unidades mínimas.

El decodificador 230 de datos de imagen puede comprobar las localizaciones de unidades de datos basándose en un orden de exploración. Por ejemplo, puede buscarse la localización de cada unidad de codificación máxima, basándose en direcciones de unidades de codificación máxima de acuerdo con un orden de exploración de rasterizaciónde rasterización.

Basándose en índices de unidades mínimas de acuerdo con un orden de exploración en zigzag, pueden buscarse las localizaciones de las unidades mínimas en una unidad de codificación máxima. Como alternativa, basándose en los índices de las unidades mínimas de acuerdo con un orden de exploración de rasterizaciónde rasterización, pueden buscarse las localizaciones de las unidades mínimas en una unidad de codificación máxima. Los índices de las unidades mínimas de acuerdo con un orden de exploración en zigzag y los índices de las unidades mínimas de acuerdo con un orden de exploración de rasterizaciónde rasterización pueden transformarse mutuamente entre sí. Por conveniencia de explicación, un índice basándose en unos órdenes de exploración se denomina en lo sucesivo como un índice de exploración.

Los respectivos índices de exploración de una unidad de codificación, una unidad de predicción, y una unidad de transformación pueden expresarse basándose en un índice de exploración de una unidad mínima en una correspondiente unidad de codificación máxima. Un índice de exploración de una partición de la unidad de predicción puede expresarse también basándose en el índice de exploración de la unidad mínima en la correspondiente unidad de codificación máxima.

Las localizaciones o coordenadas de muestras de la unidad de codificación y la unidad de predicción pueden expresarse como coordenadas en la correspondiente unidad de codificación máxima. Las localizaciones o coordenadas de muestras de la partición de la unidad de predicción y la unidad de transformación pueden expresarse también como coordenadas en la correspondiente unidad de predicción.

Una localización de una unidad de codificación máxima actual puede expresarse como una localización de un píxel localizado en el lado superior izquierdo de la unidad de codificación máxima actual, que es relativa a una localización de una muestra localizada en el lado superior izquierdo de un corte actual. Una localización de una unidad mínima actual puede expresarse como una localización de un píxel localizado en el lado superior izquierdo de la unidad mínima actual, que es relativa a una localización de una muestra localizada en el lado superior izquierdo de una correspondiente unidad de codificación máxima.

El decodificador 230 de datos de imagen puede comprobar una localización y usabilidad de una unidad de codificación predeterminada. La unidad de codificación a comprobarse puede ser una unidad de codificación que tiene una estructura de árbol, es decir, una unidad de codificación que corresponde a una profundidad codificada. El decodificador 230 de datos de imagen puede comprobar la localización y usabilidad de una unidad de codificación máxima adyacente a una unidad de codificación máxima actual.

La unidad de codificación máxima adyacente a la unidad de codificación máxima actual puede incluir al menos una de unidades de codificación máxima localizadas en el lado izquierdo, el lado superior, el lado superior derecho, y el lado superior izquierdo de la unidad de codificación máxima actual.

El decodificador 230 de datos de imagen puede comprobar una localización, un índice y usabilidad de una unidad de codificación adyacente a una unidad de codificación actual. La unidad de codificación adyacente a la unidad de codificación actual puede incluir al menos una de unidades de codificación localizadas en el lado izquierdo y el lado superior de la unidad de codificación actual. La unidad de codificación comprobada puede ser una de las unidades de codificación que tienen una estructura de árbol, es decir, una unidad de codificación que corresponde a una profundidad codificada.

El decodificador 230 de datos de imagen puede comprobar una localización, un índice, y usabilidad de una unidad de predicción adyacente a una unidad de predicción actual. La unidad de predicción adyacente a la unidad de predicción actual puede incluir al menos una de unidades de predicción localizadas en el lado izquierdo, el lado superior, el lado superior derecho, y el lado superior izquierdo de la unidad de predicción actual.

El decodificador 230 de datos de imagen puede comprobar una localización, un índice, y usabilidad de una partición adyacente a una unidad de predicción actual. La partición adyacente a la unidad de predicción actual puede incluir al menos una de particiones localizadas en el lado izquierdo, el lado superior, el lado superior derecho, y el lado superior izquierdo de la unidad de predicción actual.

El decodificador 230 de datos de imagen puede comprobar una localización, un índice, y usabilidad de una unidad mínima adyacente a una unidad de predicción actual incluida en una unidad de codificación máxima actual. La unidad mínima adyacente a la unidad de predicción actual puede incluir al menos una de unidades mínimas localizadas en el lado izquierdo, el lado superior, el lado superior derecho, y el lado superior izquierdo de la unidad de predicción actual.

El decodificador 230 de datos de imagen puede comprobar una localización y usabilidad de un límite adyacente a una unidad de predicción actual. El límite adyacente a la unidad de predicción actual puede incluir un límite de al menos una de las unidades de datos localizadas en el lado izquierdo, el lado superior, el lado superior derecho, el lado superior izquierdo, y el lado inferior izquierdo de la unidad de predicción actual. Las localizaciones de píxeles en el límite pueden expresarse como una coordenada relativa a una localización de un píxel en el lado superior izquierdo de una unidad de codificación actual o pueden expresarse como una coordenada relativa a una localización de una muestra en el lado superior izquierdo de una unidad de codificación máxima actual. Si un píxel adyacente a la unidad de codificación actual se desvía de la unidad de codificación máxima actual, el píxel puede determinarse que no es usable.

El decodificador 230 de datos de imagen puede comprobar la usabilidad de unidades de codificación de acuerdo con las profundidades o una unidad de predicción que incluyen una unidad mínima, basándose en información de codificación de la unidad mínima Por consiguiente, el decodificador 230 de datos de imagen puede comprobar localizaciones o usabilidades de una unidad de predicción, unidades de codificación de acuerdo con las profundidades, una unidad de codificación máxima, y similares, adyacentes a una unidad de datos actual, usando información de codificación de una unidad mínima adyacente a la unidad de datos actual.

De acuerdo con un orden de exploración de rasterizaciónde rasterización, en un punto en el tiempo cuando se explora una unidad de codificación máxima actual, una unidad de codificación máxima localizada en el lado izquierdo o el lado superior de la unidad de codificación máxima actual ya ha sido decodificada, pero una unidad de codificación máxima localizada en el lado derecho o el lado inferior de la unidad de codificación máxima actual no se ha decodificado aún.

Se supone un caso donde una unidad de codificación máxima incluye al menos un macrobloque para comparar a macrobloques existentes con unidades de datos jerárquicas de acuerdo con una realización ejemplar. Se ilustrará ahora un caso donde un primer macrobloque y un segundo macrobloque están incluidos en la misma unidad de codificación máxima y el primer macrobloque está en el lado inferior izquierdo del segundo macrobloque.

De acuerdo con un orden de exploración de rasterizaciónde rasterización, el primer macrobloque se explora más tarde que el segundo macrobloque. De acuerdo con un orden de exploración en zigzag, el primer macrobloque se explora antes que el segundo macrobloque. En un procedimiento de codificación, puesto que el primer macrobloque se explora más tarde que el segundo macrobloque de acuerdo con un orden de exploración de rasterizaciónde rasterización, se codifica y decodifica más tarde que el segundo macrobloque, el segundo macrobloque puede no hacer referencia a la información acerca del primer macrobloque. Sin embargo, el aparato 100 de codificación de vídeo de acuerdo con un ejemplo puede hacer referencia al primer macrobloque como información de las cercanías del segundo macrobloque cuando se codifica el segundo macrobloque.

Puesto que el aparato 100 de codificación de vídeo y el aparato 200 de decodificación de vídeo de acuerdo con las realizaciones ejemplares usan no únicamente un procedimiento de exploración de rasterizaciónde rasterización, sino también un procedimiento de exploración en zigzag para cada una de las unidades de codificación jerárquica que tiene una estructura de árbol, los aparatos 100 y 200 pueden usar una amplia gama de información de las cercanías en comparación con la técnica relacionada.

La Figura 14 ilustra un orden de exploración de rasterizaciónde rasterización de una unidad 1610 de codificación máxima, de acuerdo con una realización ejemplar. Haciendo referencia a la Figura 14, la unidad 1610 de codificación máxima se explora desde un extremo izquierdo de una instantánea 1600 a un extremo derecho de la instantánea 1600, y desde un extremo superior de la instantánea 1600 a un extremo inferior de la instantánea, de acuerdo con el orden de exploración de rasterización. Por consiguiente, de acuerdo con el orden de exploración de rasterización, en un punto en el tiempo cuando se explora una unidad de codificación máxima actual, una unidad de codificación máxima localizada en el lado izquierdo o lado superior de la unidad de codificación máxima actual ya se ha explorado, pero una unidad de codificación máxima localizada en el lado derecho o lado inferior de la unidad de codificación máxima actual no se ha explorado aún.

Un aparato 200 de decodificación de vídeo de acuerdo con una realización ejemplar puede tener conocimiento de la localización de una unidad de codificación máxima actual que cumple con un orden de exploración de rasterización, determinando una dirección de la unidad de codificación máxima actual, un tamaño de una unidad de codificación máxima, y un tamaño de una instantánea. En este punto, una localización de la unidad de codificación máxima actual corresponde a una distancia desde un extremo superior izquierdo de la instantánea a un extremo superior izquierdo de la unidad de codificación máxima actual, y puede expresarse como una localización de un píxel en el lado superior izquierdo de la unidad de codificación máxima actual, que es relativo a una localización de una muestra en el lado superior izquierdo de la instantánea.

Un orden de exploración de particiones de unidades de codificación de acuerdo con las profundidades se describirá ahora con referencia a la Figura 9. De acuerdo con las profundidades 0 a d-1, las particiones de unidades de codificación de acuerdo con las profundidades cumplen con un orden de exploración de rasterización. Por ejemplo, si la profundidad es 0, se explora cada uno de un tipo 914 de partición que tiene un tamaño de 2N_0xN_0 y un tipo 916 de partición que tiene un tamaño de N_0x2N_0 de tal manera que se exploran las particiones que tienen índices de 0 y 1 en un orden de índice. Se explora un tipo 918 de partición que tiene un tamaño de N_0xN_0 de tal manera que las particiones que tienen índices de 0, 1, 2, y 3 se exploran en un orden de índice.

Un decodificador 230 de datos de imagen del aparato 200 de decodificación de vídeo puede buscar una localización de una partición en cada una de las unidades de codificación de acuerdo con las profundidades. En una unidad de codificación actual, cuando el índice de una partición actual, el tamaño de cada partición, y el tamaño de la unidad de codificación actual son conocidos, puede determinarse la localización de la partición actual que cumple con un orden de exploración de rasterización.

En este punto, la localización de la partición actual corresponde a una distancia desde un extremo superior izquierdo de una unidad de datos actual a un extremo superior izquierdo de la partición actual, y puede expresarse como una localización de un píxel en el extremo superior izquierdo de la partición actual, que es relativo a una localización de una muestra en el extremo superior izquierdo de la unidad de datos actual.

De acuerdo con una o más realizaciones ejemplares, puede explorarse las unidades mínimas en una unidad de codificación máxima en un orden de exploración en zigzag o un orden de exploración de rasterización. Por consiguiente, puede definirse un índice basándose en un orden de exploración en zigzag y un índice basándose en un orden de exploración de rasterización para cada unidad mínima. La Figura 15 ilustra las unidades 1710 mínimas que cumplen con un orden de exploración de rasterización de acuerdo con una realización ejemplar, y la Figura 16 ilustra las unidades 1810 mínimas que cumplen con un orden de exploración en zigzag de acuerdo con una realización ejemplar.

Haciendo referencia a la Figura 15, se exploran las unidades 1710 mínimas en un orden de exploración de rasterización, en concreto, desde un extremo izquierdo de una unidad 1700 de codificación máxima a un extremo derecho de la misma y desde un extremo superior de la misma a un extremo inferior de la misma. Por lo tanto, se realiza exploración iniciando desde la unidad 1710 mínima en el extremo superior y en un orden de unidades mínimas que tienen índices de 0, 1, 2, 3, 4, 5, 6 y 7 desde el extremo izquierdo al extremo derecho. A continuación, la exploración se mueve hacia abajo y se realiza en un orden de unidades mínimas que tienen índices de 8, 9, 10, 11, 12, 13, 14 y 15. La exploración se mueve hacia abajo de nuevo y se realiza en un orden de unidades mínimas que tienen índices de 16, 17, 18 y 19.

Un decodificador 230 de datos de imagen de un aparato 200 de decodificación de vídeo de acuerdo con una realización ejemplar puede buscar localizaciones de las unidades mínimas en cada unidad de codificación máxima. Cuando el índice de una unidad mínima actual, el tamaño de cada unidad mínima, y el tamaño de la unidad de codificación máxima actual que cumple con un orden de exploración de rasterización son conocidos, puede determinarse la localización de la unidad mínima actual que cumple con un orden de exploración de rasterización. En este punto, la localización de la unidad mínima actual corresponde a una distancia desde un extremo superior izquierdo de una unidad de codificación máxima actual a un extremo superior izquierdo de la unidad mínima actual, y puede expresarse como una localización de un píxel en el extremo superior izquierdo de la unidad mínima actual, que es relativo a una localización de una muestra en el extremo superior izquierdo de la unidad de codificación máxima actual.

Haciendo referencia a la Figura 16, se realiza exploración en un orden de exploración en zigzag entre unidades de codificación que corresponden a la misma profundidad. Por ejemplo, una unidad 1800 de codificación máxima tiene una profundidad de 0, y las unidades 1810 mínimas tienen una profundidad de 3. Se agrupan cuatro unidades mínimas, y puede realizarse exploración en zigzag en unidades del grupo. En otras palabras, se exploran las unidades 1810 mínimas que tienen índices de 0, 1, 2 y 3 en un orden de exploración en zigzag, y se exploran las unidades 1810 mínimas que tienen índices de 4, 5, 6 y 7 en un orden de exploración en zigzag.

Un grupo de las unidades 1810 mínimas que tienen índices de 0, 1, 2 y 3 es una unidad de codificación que tiene una profundidad de 2. Por consiguiente, un primer grupo que incluye las unidades 1810 mínimas que tienen índices de 0, 1, 2 y 3, un segundo grupo que incluye las unidades 1810 mínimas que tienen índices de 4, 5, 6 y 7, un tercer grupo que incluye las unidades 1810 mínimas que tienen índices de 8, 9, 10 y 11, y un cuarto grupo que incluye las unidades 1810 mínimas que tienen índices de 12, 13, 14 y 15 son respectivamente unidades de codificación que tienen profundidades de 2, y puede cada una explorarse en un orden de exploración en zigzag.

De manera similar, puede realizarse exploración en un orden de exploración en zigzag entre 4 unidades de codificación que corresponden a la profundidad de 1, en el que cada una de las unidades de codificación que corresponden a la profundidad de 1 incluye cuatro unidades de codificación que corresponden a la profundidad de 2. Un decodificador 230 de datos de imagen de un aparato 200 de decodificación de vídeo de acuerdo con una realización ejemplar puede buscar localizaciones de las unidades mínimas en una unidad de codificación máxima. Cuando el índice de una unidad mínima actual, el tamaño de cada unidad mínima, y el tamaño de la unidad de codificación máxima actual que cumplen con un orden de exploración en zigzag son conocidos, puede determinarse la localización de la unidad mínima actual que cumple con un orden de exploración en zigzag.

En este punto, la localización de la unidad mínima actual corresponde a una distancia desde un extremo superior izquierdo de una unidad de codificación máxima actual a un extremo superior izquierdo de la unidad mínima actual, y puede expresarse como una localización de un píxel en el extremo superior izquierdo de la unidad mínima actual, que es relativo a una localización de una muestra en el extremo superior izquierdo de la unidad de codificación máxima actual.

El decodificador 230 de datos de imagen del aparato 200 de decodificación de vídeo puede transformar mutuamente índices de unidades mínimas de acuerdo con un orden de exploración en zigzag e índices de unidades mínimas de acuerdo con un orden de exploración de rasterización entre sí, en una unidad de codificación máxima. La transformación mutua puede realizarse teniendo en cuenta un tamaño de una unidad de codificación máxima, una profundidad actual, y una profundidad máxima.

La Figura 17 ilustra una relación entre localizaciones e índices de exploración de una unidad de codificación, una unidad de predicción, una partición, y una unidad de transformación, de acuerdo con un ejemplo. Haciendo referencia a la Figura 17, una instantánea se divide en cortes, y un corte 1750 incluye una pluralidad de unidades de codificación máxima LCU. Una localización lcuAddr de una unidad 1760 de codificación máxima de entre las unidades de codificación máxima LCU incluidas en el corte 1750 puede expresarse como una localización relativa de una muestra en el extremo superior izquierdo de la unidad 1760 de codificación máxima en comparación con una muestra en el extremo superior izquierdo del corte 1750.

Una localización de una unidad 1770 de codificación de entre las unidades de codificación que tienen una estructura de árbol en la unidad 1760 de codificación máxima puede expresarse como un índice de exploración culdx de la unidad 1770 de codificación en comparación con la muestra en el extremo superior izquierdo de la unidad 1760 de codificación máxima. Si la unidad 1770 de codificación es una unidad de codificación que corresponde a una profundidad codificada, es decir, una unidad de codificación que ya no se divide más en una profundidad inferior, la unidad 1770 de codificación se vuelve una unidad 1770 de predicción, y la localización de la unidad 1770 de predicción puede expresarse como un índice de exploración puldx de la unidad 1770 de predicción en comparación con la muestra en el extremo superior izquierdo de la unidad 1760 de codificación máxima.

La unidad 1770 de predicción puede dividirse en al menos una partición PU. Una partición PU 1790 de entre las particiones PU de la unidad 1770 de predicción puede expresarse como un índice de exploración puPartldx de la partición PU 1790 en comparación con la muestra en el extremo superior izquierdo de la unidad 1770 de predicción. La unidad 1770 de predicción puede incluir al menos unidades de transformación TU. Una unidad 1780 de transformación de entre las unidades de transformación de la unidad 1770 de predicción puede expresarse como un índice de exploración tuldx de la unidad 1780 de transformación en comparación con la muestra en el extremo superior izquierdo de la unidad 1770 de predicción.

Un aparato 100 de codificación de vídeo de acuerdo con una realización ejemplar pueden usar las localizaciones e índices de exploración de una unidad de codificación, una unidad de predicción, una partición, y una unidad de transformación anteriormente descrita con referencia a la Figura 17, para realizar codificación de vídeo. Un aparato 200 de decodificación de vídeo de acuerdo con una realización ejemplar puede decodificar datos codificados de una imagen basándose en unidades de codificación que tienen una estructura de árbol, usando las localizaciones e índices de exploración de una unidad de codificación, una unidad de predicción, una partición, y una unidad de transformación.

La Figura 18 ilustra un índice de exploración de una unidad 1850 de codificación, de acuerdo con una realización ejemplar. Haciendo referencia a la Figura 18, la unidad 1850 de codificación tiene una altura de CUSize y una anchura de CUSize, y a medida que la profundidad de la unidad 1850 de codificación aumenta un nivel, la unidad 1850 de codificación puede dividirse en cuatro unidades de codificación CU⁰, CU¹, CU²y CU³que corresponden a una profundidad inferior. Las unidades de codificación CUq, CU¹, CU², CU³cada una tiene una altura de CUSize/2 y una anchura de CUSize/2.

El índice de exploración de la unidad 1850 de codificación y los índices de exploración de las unidades de codificación CU⁰, CU¹, CU²y CU³se expresan como índices de exploración de unidades mínimas localizadas en los extremos superiores izquierdos de la unidad 1850 de codificación y las unidades de codificación CU⁰, CU¹, CU²y CU³, y un índice de exploración de una unidad mínima representa un orden en el que se escanea la unidad mínima en una unidad de codificación máxima. Por ejemplo, el índice culdx de la unidad 1850 de codificación representa un índice de una unidad mínima en el extremo superior izquierdo de la unidad 1850 de codificación.

El tamaño de una unidad de datos tal como una unidad de codificación máxima, una unidad de codificación, una unidad de predicción, una partición, o una unidad de transformación puede expresarse como un número de unidades mínimas de la misma. Por ejemplo, el número de unidades mínimas dispuestas en una altura (anchura) de una unidad de datos puede indicar la altura (anchura) de la unidad de datos.

Por consiguiente, puesto que los índices de exploración de las unidades de codificación CU⁰, CU¹, CU², y CU³corresponden a localizaciones separadas del extremo superior izquierdo de la unidad 1850 de codificación por las unidades de codificación CU⁰, CU¹, CU², y CU³, los índices de exploración de las unidades de codificación CU⁰, CU¹, CU², y CU³pueden expresarse usando los tamaños de las unidades de codificación CU⁰, CU¹, CU², y CU³que aumentan desde el índice de exploración culdx de la unidad 1850 de codificación en términos del número de unidades mínimas. En detalle, los índices de exploración de las unidades de codificación CU⁰, CU¹, CU², y CU³pueden definirse como sigue:

(1) el índice de exploración de la unidad de codificación CU⁰es culdx. Por lo tanto, el índice de exploración de la unidad de codificación CU⁰es el mismo que el de la unidad 1850 de codificación, que es más alto que el de la unidad de codificación CU⁰en términos de profundidades.

(2) el índice de exploración de la unidad de codificación CU¹aumenta desde el índice de exploración de la unidad 1850 de codificación superior por el número de unidades mínimas, CuSizeInSu/2, dispuestas en una anchura de la unidad de codificación CU⁰. Por lo tanto, el índice de exploración de la unidad de codificación CU¹es culdx CuSizeInSu/2.

(3) el índice de exploración de la unidad de codificación CU²aumenta desde el índice de exploración de la unidad 1850 de codificación superior por un producto del número de unidades mínimas, CuSizeInSu/2, dispuestas en una altura de la unidad de codificación CU⁰y el número de unidades mínimas, LcuSizelnSu, dispuestas en una anchura de una unidad de codificación máxima. Por lo tanto, el índice de exploración de la unidad de codificación CU²es culdx CuSizeInSu/2 * LcuSizelnSu.

(4) el índice de exploración de la unidad de codificación CU³aumenta desde el índice de exploración de la unidad de codificación CU²por un tamaño horizontal CuSizeInSu/2 de la unidad de codificación CU². Por lo tanto, el índice de exploración de la unidad de codificación CU³es culdx CuSizeInSu/2 CuSizeInSu/2 * LcuSizelnSu.

La Figura 19 ilustra un orden de exploración de unidades de codificación de acuerdo con índices de exploración de unidades de codificación, de acuerdo con una realización ejemplar. Haciendo referencia a la Figura 19, las unidades de codificación que tienen una estructura de árbol en una unidad 1900 de codificación máxima puede tener cada una el mismo tamaño que el de una unidad mínima o pueden dividirse de manera repetitiva hasta, por ejemplo, que la división adicional no esté permitida o no sea posible.

Las unidades de codificación que tienen una estructura de árbol en la unidad 1900 de codificación máxima pueden incluir una unidad 1970 de codificación que tiene una profundidad de 1, las unidades 1910, 1912, 1914 y 1916 de codificación que tienen una profundidad de 2, las unidades 1960, 1962, 1964 y 1966 de codificación que tienen una profundidad de 2, y las unidades 1920, 1922, 1924, 1926, 1930, 1932,1934, 1936, 1940, 1942, 1944, 1946, 1950, 1953, 1954 y 1956 de codificación que tienen una profundidad de 3.

De acuerdo con la presente realización ejemplar, se realiza exploración en zigzag entre todas las unidades de codificación que tienen una estructura de árbol, y también se realiza entre las unidades de codificación que tienen la misma profundidad.

Por consiguiente, puede definirse un orden de exploración e índices de exploración de las unidades de codificación que tienen una estructura de árbol en la unidad 1900 de codificación máxima como el orden desde las unidades de codificación que tienen una profundidad de 2 (1910^1912→>1914→>1916), a las unidades de codificación que tienen una profundidad de 3 (1920→1922→1924→1926), a las unidades de codificación que tienen una profundidad de 3 (1930→1932→1934→1936), a las unidades de codificación que tienen una profundidad de 3 (1940→1942→1944→1946), a las unidades de codificación que tienen una profundidad de 3 (1950→1953→1954→1956), a las unidades de codificación que tienen una profundidad de 2 (1960→1962→1964→1966), y a la unidad 1970 de codificación que tiene una profundidad de 1.

La Figura 20 ilustra índices de exploración de particiones de una unidad de predicción de acuerdo con tipos de partición, de acuerdo con una realización ejemplar. Haciendo referencia a la Figura 20, las particiones de la unidad de predicción pueden definirse como los tipos 2050, 2052, 2054 y 2056 de partición simétrica y los tipos 2060, 2062, 2064 y 2066 de partición asimétrica de acuerdo con las relacionas a las que se divide al menos una de una altura y una anchura de la unidad de predicción.

Una localización de la unidad de predicción puede expresarse como un índice de una unidad de predicción que se define de acuerdo con un tamaño de una unidad mínima. Los números 0, 1, 2 y 3 marcados en los tipos 2050, 2052, 2054 y 2056 de partición simétrica y los tipos 2060, 2062, 2064 y 2066 de partición asimétrica son los índices de exploración de particiones de la unidad de predicción.

Un decodificador 230 de datos de imagen de acuerdo con una realización ejemplar puede buscar una localización de una unidad de predicción basándose en un índice de exploración de la unidad de predicción. En detalle, el decodificador 230 de datos de imagen puede buscar una localización relativa de un píxel en el extremo superior izquierdo de la unidad de predicción en comparación con una muestra en el extremo superior izquierdo de una unidad de codificación máxima, usando el índice de exploración de la unidad de predicción, la altura y anchura de una unidad mínima, y el tamaño de la unidad de codificación máxima.

El decodificador 230 de datos de imagen puede buscar una localización de una partición PU basándose en un índice de exploración de la partición PU. En detalle, el decodificador 230 de datos de imagen puede buscar una localización relativa de un píxel en el extremo superior izquierdo de la partición PU en comparación con la muestra en el extremo superior izquierdo de la unidad de predicción, usando el índice de exploración de la partición PU, la altura y anchura de una unidad mínima, y el tamaño de la unidad de predicción.

De manera similar, el decodificador 230 de datos de imagen puede buscar una localización de una unidad de transformación basándose en un índice de exploración de la unidad de transformación. En detalle, el decodificador 230 de datos de imagen puede buscar una localización relativa de un píxel en el extremo superior izquierdo de la unidad de transformación en comparación con la muestra en el extremo superior izquierdo de la unidad de predicción, usando el índice de exploración de la unidad de transformación, la altura y anchura de una unidad mínima, y el tamaño de la unidad de predicción.

La Figura 21 ilustra unidades de datos que pueden usarse como información de las cercanías de una unidad 2170 de datos actual de acuerdo con una realización ejemplar. Haciendo referencia a la Figura 21, un aparato 100 de codificación de vídeo y un aparato 200 de decodificación de vídeo de acuerdo con las realizaciones ejemplares pueden hacer referencia a unidades de datos adyacentes a la unidad 2170 de datos actual cuando se codifica y decodifica la unidad 2170 de datos actual. Una unidad de datos es una unidad de codificación máxima, una unidad de codificación, una unidad de predicción, o una partición.

Las unidades de datos adyacentes a la unidad X(2170) de datos actual pueden ser una unidad A(2180) de datos izquierda, una unidad B(2182) de datos superior, una unidad C(2184) de datos superior derecha, una unidad D(2186) de datos superior izquierda, y una unidad E(2188) de datos inferior izquierda.

La Figura 22 ilustra unidades de codificación máxima adyacentes a una unidad 2270 de codificación máxima actual de acuerdo con una realización ejemplar. Haciendo referencia a la Figura 22, un aparato 100 de codificación de vídeo de acuerdo con una realización ejemplar puede hacer referencia a unidades de codificación máxima adyacentes a la unidad 2270 de codificación máxima actual cuando codifica la unidad 2270 de codificación máxima actual. Un aparato 200 de decodificación de vídeo de acuerdo con una realización ejemplar puede hacer referencia a las unidades de codificación máxima adyacentes a la unidad 2270 de codificación máxima actual cuando decodifica la unidad 2270 de codificación máxima actual.

Las unidades de codificación máxima adyacentes a la unidad 2270 de codificación máxima actual pueden ser una unidad 2280 de codificación máxima izquierda, una unidad 2282 de codificación máxima superior, una unidad 2284 de codificación máxima superior derecha, una unidad 2286 de codificación máxima superior izquierda, y una unidad 2288 de codificación máxima inferior izquierda. El decodificador 230 de datos de imagen del aparato 200 de decodificación de vídeo puede buscar direcciones y usabilidades lcuAddrA, lcuAddrB, lcuAddrC, lcuAddrD, lcuAddrE de las unidades 2280, 2282, 2284, 2286 y 2288 de codificación máxima adyacentes. Las unidades 2280, 2282, 2284, 2286 y 2288 de codificación máxima adyacentes pueden expresarse como localizaciones relativas a una dirección CurrLcuAddr de la unidad 2270 de codificación máxima actual.

Un decodificador 230 de datos de imagen del aparato de decodificación de vídeo puede comprobar la usabilidad de cada unidad de codificación máxima. En un caso distinto del caso (i) cuando una unidad de codificación máxima no está incluida en una instantánea actual, caso (ii) cuando una unidad de codificación máxima no está incluida en un corte actual, y caso (iii) cuando una dirección de una unidad de codificación máxima es posterior a la de una unidad de codificación máxima actual en términos de un orden de exploración, los datos de la unidad de codificación máxima pueden encontrarse usables.

La Figura 23 ilustra macrobloques que cumplen con un procedimiento de exploración de rasterización. Un códec de la técnica relacionada tal como H.264 usa macrobloques que cada uno tiene un tamaño máximo de 16x16 para servir como una unidad en la que se codifican datos. Haciendo referencia a la Figura 23, aunque un macrobloque 2010 actual que existe en una instantánea 2000 puede decodificarse haciendo referencia a macrobloques vecinos que existen en la misma instantánea 2000, puesto que los macrobloques se decodifican en un orden de exploración de rasterización, un macrobloque 2020 localizado en un lado inferior izquierdo del macrobloque 2010 actual no se ha decodificado aún y por lo tanto no puede hacerse referencia por el macrobloque 2010 actual. En lo sucesivo, cuando una unidad de datos adyacente no puede hacerse referencia por una unidad de codificación actual puesto que no se ha decodificado aún, la unidad de datos adyacentes se define que no es usable.

La Figura 24 ilustra una unidad 2156 de predicción actual que cumple con un orden de exploración en zigzag, de acuerdo con una realización ejemplar. En un procedimiento de codificación, puesto que se exploran los macrobloques de acuerdo con un procedimiento de exploración de rasterización, un segundo macrobloque puede no hacer referencia a información acerca de un primer macrobloque explorado más tarde que el segundo macrobloque. Sin embargo, un aparato 100 de codificación de vídeo de acuerdo con una realización ejemplar puede hacer referencia al primer macrobloque como información de las cercanías del segundo macrobloque para codificar el segundo macrobloque.

Haciendo referencia a la Figura 24, tomando una instantánea 2100 como un ejemplo, una unidad de codificación máxima que tiene un tamaño de 64x64 se decodifica en un orden de exploración en zigzag de las unidades 2110, 2120, 2130 y 2140 de codificación que corresponden a una profundidad de 1. Adicionalmente, las unidades 2142, 2144, 2146 y 2148 de codificación que corresponden a una profundidad de 2 en la unidad 2140 de codificación que corresponde a una profundidad de 1 se exploran también en un orden en zigzag.

En el orden de exploración en zigzag, después de que se decodifica la unidad 2140 de codificación de una profundidad de 1, se decodifica una unidad 2150 de codificación de una profundidad de 1. La decodificación de la unidad 2150 de codificación de una profundidad de 1 se realiza en el orden de las unidades 2152, 2154 y 2156 de codificación que corresponden a una profundidad de 2. Puesto que existe la unidad 2144 de codificación de una profundidad de 2 en el lado inferior izquierdo de la unidad 2156 de codificación que tiene una profundidad de 2 y ya se ha decodificado de acuerdo con el orden de exploración en zigzag, puede hacerse referencia a la unidad 2144 de codificación de una profundidad de 2, como información de las cercanías de la unidad 2156 de codificación de una profundidad de 2. Si la unidad 2156 de codificación de una profundidad de 2 ya no se divide a una profundidad inferior, la unidad 2156 de codificación se vuelve una unidad de predicción, y la unidad de predicción 2156 puede decodificarse por predicción haciendo referencia a la unidad 2144 de codificación de una profundidad de 2.

De acuerdo con un procedimiento de exploración de rasterización, la unidad 2144 de codificación se decodifica más tarde que la unidad 2156 de codificación, y por lo tanto no puede hacerse referencia a la información acerca de la unidad 2144 de codificación cuando se decodifica la unidad 2156 de codificación.

La Figura 25 ilustra unidades mínimas adyacentes a una partición actual, de acuerdo con una realización ejemplar. Haciendo referencia a la Figura 25, existen las unidades 2210, 2220 y 2230 de codificación máxima que corresponden a una profundidad de 0, y se establece una unidad 2240 de codificación mínima para que tenga una profundidad de 3. La información de las cercanías de una partición 2250 actual de una unidad 2210 de codificación máxima actual indica una unidad mínima adyacente externa a una unidad mínima en la partición 2250 actual.

Por ejemplo, la información de las cercanías de la parte izquierda, la información de las cercanías de la parte superior, y la información de las cercanías de la parte superior izquierda de la partición 2250 actual indican unidades 2262, ^{2 2 6 0}y 2266 mínimas localizadas en un lado izquierdo, un lado superior, y un lado superior izquierdo de una unidad 2256 mínima localizada en un lado superior izquierdo de la partición 2250 actual.

La información de las cercanías de la partición 2250 actual superior derecha indica una unidad 2264 mínima localizada en un lado superior derecho de una unidad 2254 mínima localizada en un lado superior derecho de la partición 2250 actual. La información de las cercanías inferior izquierda de la partición 2250 actual indica una unidad 2268 mínima localizada en un lado inferior izquierdo de una unidad 2256 mínima localizada en un lado inferior izquierdo de la partición 2250 actual.

El decodificador 230 de datos de imagen de un aparato 200 de decodificación de vídeo de acuerdo con una realización ejemplar puede comprobar una localización y usabilidad de una unidad mínima o una unidad de codificación máxima que es adyacente a una partición actual. La dirección de la unidad mínima adyacente o la localización de la unidad de codificación máxima puede expresarse como un índice de la unidad mínima adyacente a la partición actual o una dirección de una unidad de codificación máxima que incluye la unidad mínima adyacente. En un caso distinto del caso (i) cuando una unidad de codificación máxima no está incluida en una instantánea actual, caso (ii) cuando una unidad de codificación máxima no está incluida en un corte actual, caso (iii) cuando una dirección de una unidad de codificación máxima es posterior a la de una unidad de codificación máxima actual en términos de un orden de exploración, o caso (iv) cuando un índice de una unidad mínima en un lado superior izquierdo de una unidad de codificación más profunda de acuerdo con un orden de exploración en zigzag es posterior a la de una unidad mínima actual de acuerdo con un orden de exploración en zigzag en términos de un orden de exploración, los datos de la unidad de codificación más profunda pueden encontrarse usables.

Para buscar información de las cercanías de una partición actual, puede considerarse un índice de una unidad mínima localizada en un lado superior izquierdo, un lado superior derecho, o un lado inferior izquierdo en la partición actual, y se usa la información de tipo de división y la información acerca de una profundidad actual. Si todas las particiones no están en el mismo tamaño, se usan los índices de las particiones para una unidad de predicción actual.

La Figura 26 es un diagrama para explicar un procedimiento de predicción de vector de movimiento que usa información de las cercanías, de acuerdo con una realización ejemplar. Un aparato 100 de codificación de vídeo y un aparato 200 de decodificación de vídeo de acuerdo con las realizaciones ejemplares pueden hacer referencia a un vector de movimiento de una unidad de predicción adyacente a una unidad de predicción actual cuando se realiza predicción de movimiento basándose en un inter modo.

Es decir, haciendo referencia a la Figura 26, para predecir información de movimiento de una unidad 2300 de predicción actual, puede hacerse referencia a las piezas de información de movimiento MV_A(2310), MV_B(2320), MV_C(2330), MV_D(2340) y MV_E(2350) de las unidades de predicción adyacentes a la unidad 2300 de predicción actual. Las piezas de información de movimiento MV_A(2310), MV_B(2320), MV_C(2330), MV_D(2340) y MV_E(2350) son información de las cercanías de la unidad 2300 de predicción actual, es decir, información acerca de las unidades de predicción localizadas en un lado izquierdo, un lado superior, un lado superior derecho, un lado superior izquierdo y un lado inferior izquierdo de la unidad 2300 de predicción actual. Las piezas de información de movimiento MV_A(2310), MV_B(2320), MV_C(2330), MV_D(2340) y MV_E(2350) pueden buscarse usando respectiva información de codificación de unidades mínimas de correspondientes unidades de predicción.

La Figura 27 ilustra un procedimiento de interpolación usando información de las cercanías, de acuerdo con una realización ejemplar. Un aparato 100 de codificación de vídeo y un aparato 200 de decodificación de vídeo de acuerdo con las realizaciones ejemplares pueden hacer referencia a un valor de píxel de un píxel en un límite de una unidad de predicción adyacente a una unidad de predicción actual cuando se realiza codificación de predicción basándose en un intra modo.

Es decir, haciendo referencia a la Figura 27, un valor de píxel de una unidad 2400 de predicción actual puede predecirse haciendo referencia a valores de píxel de píxeles en un límite de unidades de datos adyacentes a la unidad 2400 de predicción actual, es decir, los píxeles 2410 y 2420 de contenido. El píxel 2430 de contenido es información de las cercanías de la unidad 2400 de predicción actual, es decir, información de píxeles localizados en un lado inferior izquierdo de la unidad 2400 de predicción actual.

En un códec de la técnica relacionada basado en macrobloques que cumple con un orden de exploración de rasterización, la información acerca de unas cercanías localizadas en un lado inferior izquierdo de un macrobloque actual, es decir, la información de movimiento MV_E(2350) o el píxel 2430 de contexto, no puede usarse como la información de las cercanías.

Sin embargo, un aparato 100 de codificación de vídeo y un aparato 200 de decodificación de vídeo de acuerdo con las realizaciones ejemplares pueden hacer referencia a información acerca de unas cercanías localizadas en un lado inferior izquierdo de una unidad de datos actual puesto que las unidades de codificación de acuerdo con las profundidades jerárquicas se codifican y decodifican de acuerdo con un orden de exploración en zigzag. Por lo tanto, si el aparato 100 de codificación de vídeo y el aparato 200 de decodificación de vídeo hallan la información acerca de las cercanías localizadas en el lado inferior izquierdo de la unidad de datos actual usable, el aparato 100 de codificación de vídeo y el aparato 200 de decodificación de vídeo pueden hacer referencia a la información de las cercanías cuando codifican o decodifican la unidad de datos actual.

La Figura 28 es un diagrama de flujo que ilustra un procedimiento de codificación de un vídeo haciendo referencia a información de las cercanías, de acuerdo con una realización ejemplar. Haciendo referencia a la Figura 28, en la operación 2510, una instantánea actual se divide en al menos una unidad de codificación máxima.

En la operación 2520, se determina al menos una profundidad codificada codificando datos de imagen que corresponden a cada unidad de codificación máxima basándose en unidades de codificación divididas jerárquicamente a medida que una profundidad se hace profunda, y se determina una unidad de codificación de acuerdo con una estructura de árbol. La unidad de codificación máxima se divide especialmente cada vez que la profundidad se hace profunda, y por lo tanto se divide en unidades de codificación de una profundidad inferior. Cada unidad de codificación puede dividirse en unidades de codificación de otra profundidad inferior dividiéndose espacialmente de manera independiente de unidades de codificación adyacentes. La codificación se realiza de manera repetitiva en cada unidad de codificación de acuerdo con las profundidades. También, se determinan tipos de partición y unidades de transformación que tienen un error de codificación mínimo para cada unidad de codificación más profunda. Para determinar una profundidad codificada que tiene un error de codificación mínimo en cada unidad de codificación máxima, pueden medirse errores de codificación y compararse en todas las unidades de codificación más profundas de acuerdo con las profundidades.

Los datos de imagen se codifican teniendo en cuenta un orden de exploración de rasterización entre las unidades de codificación máxima y un orden de exploración en zigzag entre unidades de codificación más profundas incluidas en cada una de las unidades de codificación máxima. Los datos de imagen pueden codificarse también haciendo referencia a información de las cercanías usable teniendo en cuenta un orden de exploración entre las unidades de datos.

En la operación 2530, se emiten datos de imagen codificados del resultado de codificación final de acuerdo con la profundidad codificada para cada unidad de codificación máxima, con información codificada acerca de la profundidad codificada y un modo de codificación. La información codificada acerca del modo de codificación puede incluir información acerca de una profundidad codificada o información de división, información acerca de un tipo de partición de una unidad de predicción, un modo de predicción, y un tamaño de una unidad de transformación. La información codificada acerca del modo de codificación puede transmitirse a un decodificador con los datos de imagen codificados.

La Figura 29 es un diagrama de flujo que ilustra un procedimiento de decodificación de un vídeo haciendo referencia a información de las cercanías, de acuerdo con una realización ejemplar. Haciendo referencia a la Figura 29, en la operación 2610, se recibe y analiza una secuencia de bits de un vídeo codificado.

En la operación 2620, se asignan datos de imagen codificados de una instantánea actual a una unidad de codificación máxima que se obtiene desde la secuencia de bits analizada, y se extrae información acerca de una profundidad codificada y un modo de codificación de acuerdo con las unidades de codificación máxima desde la secuencia de bits analizada.

La profundidad codificada de cada unidad de codificación máxima es una profundidad que tiene un error de codificación mínimo en cada unidad de codificación máxima. Al codificar cada unidad de codificación máxima, los datos de imagen se codifican basándose en al menos una unidad de datos obtenida dividiendo jerárquicamente cada unidad de codificación máxima de acuerdo con las profundidades.

De acuerdo con la información acerca de la profundidad codificada y el modo de codificación, la unidad de codificación máxima puede dividirse en unidades de codificación que tienen una estructura de árbol. Cada una de las unidades de codificación que tienen la estructura de árbol se determina como una unidad de codificación que corresponde a una profundidad codificada, y se codifica de manera óptima para emitir el error de codificación mínimo. Por consiguiente, puede mejorarse la eficacia de codificación y decodificación de una imagen decodificando cada pieza de datos de imagen codificados en las unidades de codificación que tienen una estructura de árbol después de determinar al menos una profundidad codificada de acuerdo con las unidades de codificación.

En la operación 2530, los datos de imagen codificados de cada unidad de codificación máxima se decodifican teniendo en cuenta un orden de exploración de rasterización entre las unidades de codificación máxima y un orden de exploración en zigzag entre unidades de codificación más profundas incluidas en cada una de las unidades de codificación máxima. Pueden buscarse las localizaciones de unidades de codificación máxima de acuerdo con un orden de exploración de rasterización y las localizaciones de unidades de codificación más profundas de acuerdo con un orden de exploración en zigzag, y los índices de unidades mínimas de acuerdo con un orden de exploración en zigzag y los índices de unidades mínimas de acuerdo con un orden de exploración de rasterización pueden transformarse mutuamente entre sí.

Puede comprobarse la usabilidad de la información de las cercanías y puede hacerse referencia a la información de las cercanías para decodificar una unidad de codificación predeterminada, teniendo en cuenta un orden de exploración de diversas unidades de datos jerárquicas, tales como un orden de exploración de rasterización para unidades de codificación máxima o unidades de predicción o un orden de exploración en zigzag o un orden de exploración de rasterización para unidades mínimas. La información de las cercanías de acuerdo con una realización ejemplar puede incluir información acerca de una unidad de datos localizada en un lado inferior izquierdo de una unidad de datos actual.

Los datos de imagen decodificados pueden reproducirse por un aparato de reproducción, almacenarse en un medio de almacenamiento, o transmitirse a través de una red de acuerdo con una o más realizaciones ejemplares.

Adicionalmente, una o más realizaciones ejemplares pueden escribirse como programas informáticos y pueden implementarse en ordenadores digitales de uso general que ejecutan los programas usando un medio de grabación legible por ordenador. Ejemplos del medio de grabación legible por ordenador incluyen medio de almacenamiento magnético (por ejemplo, ROM, discos flexibles, discos duros, etc.) y medio de grabación óptico (por ejemplo, CD-ROM, o DVD).

Aunque se han mostrado y descrito realizaciones particularmente ejemplares, se entenderá por los expertos en la materia que pueden realizarse en las mismas diversos cambios en forma y detalles sin alejarse del alcance del presente concepto inventivo como se define por las reivindicaciones adjuntas. Las realizaciones ejemplares deberían considerarse en sentido descriptivo únicamente y no para fines de limitación. Por lo tanto, el alcance del presente concepto inventivo se define no por la descripción detallada de realizaciones ejemplares, sino por las reivindicaciones adjuntas, y todas las diferencias dentro del alcance se interpretarán como que están incluidas en el presente concepto inventivo.

Claims

REIVINDICACIONES

1. Un aparato de decodificación de un vídeo, comprendiendo el aparato:

un receptor que recibe una secuencia de bits de un vídeo codificado y obtiene información acerca de un tamaño de una unidad de codificación máxima de forma cuadrada en una imagen e, información de división de unidades de codificación de forma cuadrada de profundidades que incluyen al menos una de una profundidad actual y una profundidad inferior en la unidad de codificación máxima, a partir de una secuencia de bits; y

un decodificador que determina una pluralidad de división de unidades de codificación máxima a partir de una imagen de acuerdo con la información acerca del tamaño de la unidad de codificación máxima y decodifica la pluralidad de unidades de codificación máxima de acuerdo con una orden de análisis de rasterizado, determina una o varias unidades de codificación de profundidades que incluyen al menos una de la profundidad actual y la profundidad inferior jerárquicamente dividida a partir de la unidad de codificación máxima de acuerdo con la información de división de unidades de codificación máxima en la unidad de codificación máxima,

en el que, cuando la información de división de la unidad de codificación de la profundidad actual indica una división, la unidad de codificación de la profundidad actual se divide en cuatro unidades de codificación de la profundidad inferior, en el que cuando la información de división de la unidad de codificación de la profundidad actual indica una no división, la unidad de codificación de la profundidad actual se divide en una o varias particiones para predecir la decodificación mediante el uso de información acerca de un tipo de partición de la unidad de codificación de la profundidad actual obtenida a partir de la secuencia de bits, y la unidad de codificación de la profundidad actual se divide en una o varias unidades de transformación para transformación inversa de acuerdo con la información del tamaño de la una o varias unidades de transformación en relación con la unidad de codificación de la profundidad actual obtenida a partir de la secuencia de bits, en el que, cuando la información de división de la unidad de codificación de la profundidad inferior indica una división, la unidad de codificación de la profundidad inferior se divide en cuatro unidades de codificación de una profundidad que es inferior que la profundidad inferior, y en el que, cuando la información de división de la unidad de codificación de la profundidad inferior indica una no división, la unidad de codificación de la profundidad inferior se divide en una o varias particiones para la predicción de la participación y la inidad de codificación de la profundidad inferior se divide en una o varias unidades de transformación para transformación inversa,

decodifica la una o varias unidades de codificación en la unidad de codificación máxima que incluye las cuatro unidades de codificación de la división de la profundidad inferior a partir de la unidad de codificación de la profundidad actual de acuerdo con una orden de análisis en zigzag, en el que, cuando las cuatro unidades de codificación de la división de profundidad inferior a partir de la unidad de codificación de la profundidad actual incluyen un bloque superior izquierdo, un bloque superior derecho, un bloque inferior izquierdo y un bloque inferior derecho, la orden de análisis en zigzag representa una orden del bloque superior izquierdo al bloque superior derecho, al bloque inferior izquierdo al bloque inferior derecho, y en el que, la información acerca del tipo de partición de la unidad de codificación de la profundidad actual indica si la una o varias particiones se obtienen dividiendo simétricamente al menos uno del ancho y la altura de la unidad de codificación de la profundidad actual o se obtiene determinando que la partición sea igual que la unidad de codificación de la profundidad actual, y

la información de tamaño de la una o varias unidades de transformación en relación con la unidad de codificación de la profundidad actual indica si la una o varias unidades de transformación se obtienen dividiendo simétricamente la altura y el ancho de la unidad de codificación de la profundidad actual o se obtiene determinando que la unidad de transformación sea igual que la unidad de codificación de la profundidad actual,

en el que la unidad de codificación de la profundidad inferior se divide en una o varias particiones usando información acerca de un tipo de partición de la unidad de codificación de la profundidad inferior obtenida a partir de la secuencia de bits,

en el que la unidad de codificación de la profundidad inferior se divide en una o varias unidades de transformación para transformación inversa de acuerdo con la información de tamaño de la una o varias unidades de transformación en relación con la unidad de codificación de la profundidad inferior obtenida a partir de la secuencia de bits, en el que la información acerca del tipo de partición de la unidad de codificación de la profundidad inferior indica si la una o varias particiones se obtienen dividiendo simétricamente al menos uno del ancho y la altura de la unidad de codificación de la profundidad inferior, o se obtiene determinando que la partición sea igual que la unidad de codificación de la profundidad inferior, la información de tamaño de la una o varias unidades de transformación en relación con la unidad de codificación de la profundidad inferior indica si la una o varias unidades de transformación se obtienen dividiendo simétricamente la altura y el ancho de la unidad de codificación de la profundidad inferior, o se obtiene determinando que la unidad de transformación sea igual a la unidad de codificación de la profundidad inferior, y la interpredicción o intrapredicción se lleva a cabo sobre la una o varias particiones.