ES2691983T3 - Aparato para decodificar imágenes - Google Patents

Aparato para decodificar imágenes Download PDF

Info

Publication number
ES2691983T3
ES2691983T3 ES15161957.4T ES15161957T ES2691983T3 ES 2691983 T3 ES2691983 T3 ES 2691983T3 ES 15161957 T ES15161957 T ES 15161957T ES 2691983 T3 ES2691983 T3 ES 2691983T3
Authority
ES
Spain
Prior art keywords
coding unit
unit
coding
depth
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES15161957.4T
Other languages
English (en)
Inventor
Hae-Kyung Jung
Min-Su Cheon
Jung-Hye Min
Il-Koo Kim
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=43499569&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=ES2691983(T3) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Application granted granted Critical
Publication of ES2691983T3 publication Critical patent/ES2691983T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/115Selection of the code volume for a coding unit prior to coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/53Multi-resolution motion estimation; Hierarchical motion estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

Un aparato para decodificar una imagen, comprendiendo el aparato: un extractor de información de codificación configurado para extraer, de un flujo de bits, información sobre un tamaño máximo de una unidad de codificación, información de división que indica si dividir una unidad de codificación de una profundidad i, donde i es un número entero, en unidades de codificación de una profundidad i+1, información de salto que indica si un modo de predicción de una unidad de codificación actual es un modo de salto, una información de tipo de partición que indica un tamaño de una o más unidades de predicción incluidas en la unidad de codificación actual y una información de tamaño de unidad de transformación; y un descodificador de datos de imagen configurado para determinar una estructura dividida de una unidad de codificación máxima en forma cuadrada según la información de división, cuando la información de salto indica que el modo de predicción de la unidad de codificación actual es el modo de salto, configurado para determinar la unidad de codificación actual como una unidad de predicción cuyo modo de predicción es el modo de salto y cuando la información de salto indica que el modo de predicción de la unidad de codificación actual no es el modo de salto, configurado para obtener una o más unidades de predicción de la unidad de codificación actual dividiendo por igual una anchura o una altura de la unidad de codificación actual por dos, o dividiendo por igual la altura y la anchura de la unidad de codificación actual por dos, o determinando la unidad de codificación actual como la unidad de predicción en base a la información de tipo de partición de la unidad de codificación actual, en el que la imagen se divide en una pluralidad de unidades de codificación máxima de forma cuadrada, de acuerdo con la información sobre el tamaño máximo de la unidad de codificación, una unidad de codificación máxima a partir de la pluralidad de las unidades de codificación máxima se divide jerárquicamente en una o más unidades de codificación de forma cuadrada de profundidades de acuerdo con la información de división, una unidad de codificación de una profundidad actual k, donde k es un número entero, es una de las unidades de datos de igual tamaño y forma cuadrada dividida de una unidad de codificación de una profundidad superior k-1, cuando la información de división indica una división para la unidad de codificación de la profundidad actual k, la unidad de codificación de la profundidad actual k se divide en cuatro unidades de codificación de una profundidad inferior k + 1, dividiendo una altura y una anchura de la unidad de codificación de la profundidad actual k por 2, independientemente de las unidades de codificación vecinas, cuando la información de división indica una no división de la unidad de codificación de la profundidad actual k, la unidad de codificación de la profundidad actual k se determina como la unidad de codificación actual que ya no está dividida, se obtiene la información de salto de la unidad de codificación actual, y una o más unidades de transformación con forma cuadrada utilizadas para realizar la transformación inversa para la unidad de codificación actual se obtienen de la unidad de codificación actual basándose en la información de tamaño de la unidad de transformación, siendo la una o más unidades de transformación de forma cuadrada diferentes de la una o más unidades de predicción utilizadas para realizar la decodificación de predicción para la unidad de codificación actual, y en el que, la información de salto de la unidad de codificación actual se indica por un bit asignado a la unidad de codificación actual.

Description

5
10
15
20
25
30
35
40
45
DESCRIPCION
Aparato para decodificar imagenes Campo tecnico
La presente invencion se refiere a la decodificacion de una imagen.
Tecnica anterior
Ejemplos de un procedimiento de codificacion de prediccion de imagenes incluyen un procedimiento de intra prediccion y un procedimiento de inter prediccion. El procedimiento de intra prediccion es un procedimiento de prediccion basado en una correlacion de pfxeles adyacentes en una sola trama. El procedimiento de inter prediccion es un procedimiento de prediccion de una region similar a los datos codificados a partir de una trama adyacente a traves de prediccion y compensacion de movimiento.
Generalmente, un vector de movimiento de un bloque tiene una estrecha correlacion con un vector de movimiento de un bloque adyacente. Por lo tanto, una cantidad de bits generada durante la codificacion puede reducirse prediciendo un vector de movimiento de un bloque actual desde un bloque adyacente, y codificando solo un vector de movimiento diferencial entre el vector de movimiento del bloque actual y un vector de movimiento de prediccion.
Un modo de salto es un modo seleccionado cuando un vector de movimiento de un macrobloque es identico a un vector de movimiento de prediccion predicho usando un vector de movimiento de un bloque adyacente y cuando un error de prediccion es suficientemente pequeno. Cuando se selecciona el modo de salto como un modo de prediccion de un macrobloque, un codificador solo transmite informacion sobre el modo de salto del macrobloque y no transmite datos residuales. Un decodificador puede restablecer el macrobloque realizando una compensacion de movimiento en el macrobloque codificado en el modo de salto utilizando un vector de movimiento de prediccion predicho desde un bloque adyacente al macrobloque.
Jaeil Kim, y col.: "Enlarging MB size for high fidelity video coding beyond HD"; UIT-Sector de Normalizacion de las Telecomunicaciones ST, Documento: VCEG-AJ21, se refiere a la extension de la arquitectura del codec H.264 con macrobloques ampliados de tamano NxN y presenta una estructura de codificacion jerarquica en la que los diferentes bloques se dividen segun las profundidades en funcion de un elemento de sintaxis "tipo_mb".
La solicitud de patente WO 97/17797 A2 publicada el 15 de mayo de 1997 divulga un procedimiento para la codificacion de video en el que la imagen se divide segun una estructura de codificacion de arbol cuadruple y se codifica utilizando una estructura de codificacion hubrida.
Solucion tecnica
La presente invencion se refiere a un aparato para decodificar una imagen, que extrae eficientemente de un flujo de bits informacion sobre estructuras divididas de una imagen codificada a base de una unidad de codificacion jerarquica en varios tamanos, e informacion sobre un modo de salto de cada unidad de codificacion.
Efectos ventajosos
La presente invencion puede proporcionar un aparato para decodificar una imagen, que extrae eficientemente de un flujo de bits informacion sobre estructuras divididas de una imagen codificada basada en una unidad de codificacion jerarquica en varios tamanos, e informacion sobre un modo de salto de cada unidad de codificacion.
Descripcion de los dibujos
La figura 1 es un diagrama de bloques de un aparato para codificar una imagen;
La figura 2 es un diagrama de bloques de un aparato para decodificar una imagen, de acuerdo con una realizacion de la presente invencion;
La figura 3 es un diagrama para describir un concepto de unidades de codificacion jerarquica;
La figura 4 es un diagrama de bloques de un codificador de imagenes basado en unidades de codificacion;
La figura 5 es un diagrama de bloques de un decodificador de imagenes basado en unidades de codificacion de acuerdo con una realizacion de la presente invencion;
La figura 6 es un diagrama que ilustra unidades de codificacion mas profundas segun profundidades y unidades de prediccion;
La figura 7 es un diagrama para describir una relacion entre una unidad de codificacion y unidades de transformacion;
5
10
15
20
25
30
35
40
45
50
La figura 8 es un diagrama para describir informacion de codificacion de unidades de codificacion correspondientes a una profundidad codificada;
La figura 9 es un diagrama de unidades de codificacion mas profundas de acuerdo con las profundidades;
Las figuras 10 a 12 son diagramas para describir una relacion entre unidades de codificacion, unidades de prediccion y unidades de transformacion, de acuerdo con una realizacion de la presente invencion;
La figura 13 es un diagrama para describir una relacion entre una unidad de codificacion, una unidad de prediccion o una particion, y una unidad de transformacion, segun informacion del modo de codificacion de la Tabla 1;
La figura 14 es un diagrama de estructuras divididas de una unidad de codificacion maxima determinada a base de unidades de codificacion mas profundas;
La figura 15 es un diagrama para describir informacion de division de una unidad de codificacion de la figura 14 que tiene una profundidad de 2;
La figura 16 es un diagrama para describir informacion de division de una unidad de codificacion de la figura 14 que tiene una profundidad de 3;
La figura 17 es un diagrama para describir una orden de procesamiento de unidades de codificacion;
La figura 18 es un diagrama de flujo que ilustra un procedimiento de codificacion de una imagen;
La figura 19 es un diagrama de flujo que ilustra un procedimiento de codificacion de una imagen;
La figura 20 es un diagrama de flujo que ilustra un procedimiento de decodificacion de una imagen, de acuerdo con una realizacion de la presente invencion;
La figura 21 es un diagrama de flujo que ilustra un proceso de division de una unidad de decodificacion maxima y un proceso de decodificacion de informacion de salto, de acuerdo con un procedimiento de decodificacion de una imagen, de acuerdo con una realizacion de la presente invencion;
La figura 22 es un diagrama de flujo que ilustra un procedimiento de decodificacion de una imagen, y
La figura 23 es un diagrama de flujo que ilustra un proceso de division de una unidad de decodificacion maxima y un
proceso de decodificacion de informacion de salto.
Mejor modo
La invencion es como se define en la reivindicacion independiente. La divulgacion de habilitacion para la invencion se encuentra en las realizaciones de las figuras 2, 5, 10-13, 20 y 21. En lo sucesivo, las realizaciones restantes deben entenderse como ejemplos que no describen partes de la presente invencion.
De acuerdo con un ejemplo divulgado en el presente documento, se proporciona un procedimiento para codificar una imagen, comprendiendo el procedimiento: dividir una imagen actual en al menos una unidad de codificacion maxima; determinar una estructura dividida de la al menos una unidad de codificacion maxima y un modo de prediccion de cada unidad de codificacion codificando los datos de imagen de la al menos una unidad de codificacion maxima basada en unidades de codificacion mas profundas segun las profundidades, que se dividen jerarquicamente a medida que se profundiza una profundidad; establecer la informacion de division sobre la division de una unidad de codificacion de una profundidad superior que incluye cada unidad de codificacion, de acuerdo con cada unidad de codificacion; establecer informacion de salto que indica si la informacion de prediccion determinada es un modo de salto, de acuerdo con cada unidad de codificacion; y codificar la informacion de division y la informacion de salto, que se establecen de acuerdo con cada unidad de codificacion.
De acuerdo con otro ejemplo divulgado en el presente documento, se proporciona un procedimiento para codificar una imagen, comprendiendo el procedimiento: dividir una imagen actual en al menos una unidad de codificacion maxima; determinar una estructura dividida de la al menos una unidad de codificacion maxima y un modo de prediccion de cada unidad de codificacion codificando los datos de imagen de la al menos una unidad de codificacion maxima basada en unidades de codificacion mas profundas segun las profundidades, que se dividen jerarquicamente a medida que se profundiza una profundidad; establecer informacion de salto que indica si el modo de prediccion de cada unidad de codificacion y un modo de prediccion de una profundidad superior que incluye cada unidad de codificacion son cada uno un modo de salto, de acuerdo con cada unidad de codificacion; establecer la informacion dividida sobre la division de una unidad de codificacion de una profundidad superior que incluye cada unidad de codificacion, de acuerdo con cada unidad de codificacion; y codificar la informacion de division y la informacion de salto, que se establecen de acuerdo con cada unidad de codificacion.
De acuerdo con otro ejemplo divulgado en el presente documento, se proporciona un procedimiento de decodificacion de una imagen, comprendiendo el procedimiento: extraer informacion de division sobre la division de
5
10
15
20
25
30
35
40
45
50
55
60
unidades de decodificacion de profundidades superiores, incluyendo una unidad de decodificacion actual a decodificar, a partir de datos de imagenes codificados de acuerdo con unidades de codificacion maximas basadas en unidades de codificacion mas profundas de acuerdo con las profundidades, que se dividen jerarquicamente a medida que se profundiza una profundidad; extraer informacion de salto que indica si un modo de prediccion de la unidad de decodificacion actual es un modo de salto, a partir de los datos de imagen; determinar estructuras divididas de una unidad de decodificacion maxima que incluye la unidad de decodificacion actual, segun la informacion de division; determinar si el modo de prediccion de la unidad de decodificacion actual es un modo de salto de acuerdo con la informacion de salto.
De acuerdo con otro ejemplo divulgado en el presente documento, se proporciona un procedimiento de decodificacion de una imagen, comprendiendo el procedimiento: extraer informacion de salto que indica si los modos de prediccion de una unidad de decodificacion actual a decodificar y las unidades de decodificacion de profundidades superiores, incluyendo la unidad de decodificacion actual, son cada uno un modo de salto, a partir de datos de imagenes codificados de acuerdo con unidades de codificacion maximas basadas en unidades de codificacion mas profundas de acuerdo con las profundidades, que se dividen jerarquicamente a medida que se profundiza una profundidad; extraer informacion de division sobre la division de las unidades de decodificacion de profundidades superiores, incluida la unidad de decodificacion actual; determinar si los modos de prediccion de la unidad de decodificacion actual y las unidades de decodificacion de profundidades superiores son cada uno un modo de salto de acuerdo con la informacion de salto extrafda; y determinar estructuras divididas de una unidad de decodificacion maxima que incluye la unidad de decodificacion actual, segun la informacion de division. De acuerdo con otro ejemplo divulgado en el presente documento, se proporciona un aparato para codificar una imagen, comprendiendo el aparato: un divisor de unidad de codificacion maxima para dividir una imagen actual en al menos una unidad de codificacion maxima; un determinador de profundidad codificado para determinar una estructura dividida de la al menos una unidad de codificacion maxima y un modo de prediccion de cada unidad de codificacion codificando los datos de imagen de la al menos una unidad de codificacion maxima basada en unidades de codificacion mas profundas segun las profundidades, que se dividen jerarquicamente a medida que se profundiza una profundidad; y una unidad de codificacion de informacion de codificacion para establecer la informacion de division sobre la division de una unidad de codificacion de una profundidad superior que incluye cada unidad de codificacion, de acuerdo con cada unidad de codificacion e informacion de salto que indica si la informacion de prediccion determinada es un modo de salto, de acuerdo con cada unidad de codificacion, y codificando la informacion de division del conjunto y la informacion de salto. De acuerdo con otro ejemplo divulgado en el presente documento, se proporciona un aparato para codificar una imagen, comprendiendo el aparato: un divisor de unidad de codificacion maxima para dividir una imagen actual en al menos una unidad de codificacion maxima; un determinador de profundidad codificado para determinar una estructura dividida de la al menos una unidad de codificacion maxima y un modo de prediccion de cada unidad de codificacion codificando los datos de imagen de la al menos una unidad de codificacion maxima basada en unidades de codificacion mas profundas segun las profundidades, que se dividen jerarquicamente a medida que se profundiza una profundidad; y una unidad de codificacion de informacion de codificacion para establecer informacion de salto que indica si el modo de prediccion de cada unidad de codificacion y un modo de prediccion de una profundidad superior, incluyendo cada unidad de codificacion, son cada uno un modo de salto e informacion de division sobre division de una unidad de codificacion de una profundidad superior que incluye cada unidad de codificacion, de acuerdo con cada unidad de codificacion, y codificando la informacion de division del conjunto y la informacion de salto. De acuerdo con un aspecto de la presente invencion definido por las reivindicaciones en el presente documento, se proporciona un aparato para decodificar una imagen, comprendiendo el aparato: un extractor de informacion de codificacion para extraer informacion de division sobre division de unidades de decodificacion de profundidades superiores que incluye una unidad de decodificacion actual a decodificar e informacion de salto que indica si un modo de prediccion de la unidad de decodificacion actual es un modo de salto, a partir de datos de imagenes codificados de acuerdo con unidades de codificacion maximas basadas en unidades de codificacion mas profundas de acuerdo con las profundidades, que se dividen jerarquicamente a medida que se profundiza una profundidad; y una unidad de decodificacion para determinar estructuras divididas de una unidad de decodificacion maxima que incluye la unidad de decodificacion actual, de acuerdo con la informacion de division, y determinar si el modo de prediccion de la unidad de decodificacion actual es un modo de salto de acuerdo con la informacion de salto. De acuerdo con otro ejemplo divulgado en el presente documento, se proporciona un aparato para decodificar una imagen, comprendiendo el aparato: un extractor de informacion de codificacion para extraer informacion de salto que indica si los modos de prediccion de una unidad de decodificacion actual a decodificar y las unidades de decodificacion de profundidades superiores incluyendo la unidad de decodificacion actual son cada una un modo de salto e informacion de division sobre division de las unidades de decodificacion de profundidades superiores, incluyendo la unidad de decodificacion actual, a partir de datos de imagen codificados de acuerdo con unidades de codificacion maxima basadas en unidades de codificacion mas profundas de acuerdo con las profundidades, que se dividen jerarquicamente a medida que se profundiza una profundidad; y una unidad de decodificacion para determinar si los modos de prediccion de la unidad de decodificacion actual y las unidades de decodificacion de profundidades superiores son cada una un modo de salto segun la informacion de salto extrafda, y determinar estructuras divididas de una unidad de decodificacion maxima que incluye la unidad de decodificacion actual, segun la informacion de division.
5
10
15
20
25
30
35
40
45
50
55
60
Modo de la invencion
En lo sucesivo en el presente documento, la presente invencion se describira mas completamente con referencia a los dibujos adjuntos. Se enfatiza que la divulgacion habilitante para la invencion se encuentra en las realizaciones de las figuras 2, 5, 10-13, 20 y 21. En lo sucesivo, las realizaciones restantes deben entenderse como ejemplos que no describen partes de la presente invencion.
En referencia a la figura 1, el aparato 100 de codificacion de imagenes de acuerdo con la realizacion actual incluye un divisor 110 de unidades de codificacion maxima, un determinador 120 de profundidad codificada, una unidad 130 de codificacion de datos de imagen y una unidad 140 de codificacion de informacion de codificacion. El divisor 110 de unidad de codificacion maxima puede dividir una imagen actual o un segmento actual en funcion de una unidad de codificacion maxima. La imagen actual o segmento actual se divide en al menos una unidad de codificacion maxima. La unidad de codificacion maxima de acuerdo con una realizacion de la presente invencion puede ser una unidad de datos que tiene un tamano de 32x32, 64x64, 128x128, 256x256, etc., en el que una estructura de la unidad de datos es un cuadrado que tiene una anchura y una longitud en cuadrados de 2, siendo la anchura y la longitud mayores que 8. Los datos de imagen pueden enviarse al determinador 120 de profundidad codificada segun la al menos una unidad de codificacion maxima.
Una unidad de codificacion de acuerdo con una realizacion de la presente invencion puede expresarse mediante una unidad de codificacion maxima y una profundidad. La unidad de codificacion maxima indica una unidad de codificacion que tiene la una unidad de codificacion segun una realizacion de la presente invencion, que puede expresar por una unidad de codificacion maxima y una profundidad. La unidad de codificacion maxima indica una unidad de codificacion que tiene el tamano mas grande entre las unidades de codificacion de una imagen actual, y la profundidad indica un numero de veces que la unidad de codificacion se divide espacialmente de la unidad de codificacion maxima. A medida que la profundidad se profundiza, las unidades de codificacion mas profundas segun las profundidades se pueden dividir desde la unidad de codificacion maxima a una unidad de codificacion minima. Una profundidad de la unidad de codificacion maxima es una profundidad superior y una profundidad de la unidad de codificacion minima es una profundidad inferior. Dado que el tamano de una unidad de codificacion correspondiente a cada profundidad disminuye a medida que se profundiza la profundidad de la unidad de codificacion maxima, una unidad de codificacion correspondiente a una profundidad superior puede incluir una pluralidad de unidades de codificacion correspondientes a profundidades inferiores.
Como se ha descrito anteriormente, los datos de imagen de la imagen actual se dividen en las unidades de codificacion maxima de acuerdo con un tamano maximo de la unidad de codificacion, y cada una de las unidades de codificacion maxima puede incluir unidades de codificacion mas profundas que se dividen segun las profundidades. Dado que la unidad de codificacion maxima de acuerdo con una realizacion de la presente invencion se divide segun las profundidades, los datos de imagen de un dominio espacial incluidos en la unidad de codificacion maxima se pueden clasificar jerarquicamente segun las profundidades.
Una profundidad maxima y un tamano maximo de una unidad de codificacion, que limitan el numero total de veces que una altura y una anchura de la unidad de codificacion maxima estan divididos jerarquicamente, puede predeterminarse. Dicha unidad de codificacion maxima y profundidad maxima pueden establecerse en una unidad de imagen o segmento. En otras palabras, se pueden establecer diferentes unidades de codificacion maxima y diferentes profundidades maximas para cada imagen o division, y un tamano de una unidad de codificacion minima incluida en la unidad de codificacion maxima se puede configurar de forma diversa de acuerdo con la profundidad maxima. Como tal, estableciendo varias veces la unidad de codificacion maxima y la profundidad maxima segun las imagenes o las divisiones, la eficiencia de la codificacion se puede mejorar codificando una imagen de una region plana usando la unidad de codificacion maxima, y la eficiencia de compresion de una imagen se puede mejorar codificando una imagen que tiene alta complejidad usando una unidad de codificacion que tiene un tamano menor que la unidad de codificacion maxima.
El determinador 120 de la unidad de codificacion determina las profundidades segun las unidades de codificacion maximas. La profundidad puede determinarse en funcion de un calculo del coste de tasa-distorsion (RD). Con detalle, el determinador 120 de profundidad codificada codifica al menos una region dividida obtenida dividiendo una region de la unidad maxima de codificacion segun las profundidades, y determina una profundidad para emitir datos de imagen finalmente codificados segun la al menos una region dividida. En otras palabras, el determinador 120 de profundidad codificado determina una profundidad codificada codificando los datos de imagen en las unidades de codificacion mas profundas de acuerdo con las profundidades, de acuerdo con la unidad de codificacion maxima de la imagen actual, y seleccionando una profundidad que tenga el menor error de codificacion. La profundidad maxima determinada se envfa a la unidad 140 de codificacion de informacion de codificacion, y los datos de imagen segun unidades de codificacion maximas se envfan a la unidad 130 de codificacion de datos de imagen.
Los datos de imagen en la unidad de codificacion maxima se codifican basandose en las unidades de codificacion mas profundas correspondientes a al menos una profundidad igual o inferior a la profundidad maxima, y los resultados de codificacion de los datos de imagen se comparan en funcion de cada una de las unidades de codificacion mas profundas. Se puede seleccionar una profundidad que tenga el menor error de codificacion despues de comparar los errores de codificacion de las unidades de codificacion mas profundas. Se puede
5
10
15
20
25
30
35
40
45
50
55
60
seleccionar al menos una profundidad codificada para cada unidad de codificacion maxima.
El tamano de la unidad de codificacion maxima se divide, ya que una unidad de codificacion se divide jerarquicamente de acuerdo con las profundidades, y a medida que aumenta el numero de unidades de codificacion. Ademas, las unidades de codificacion correspondientes a una misma profundidad en una unidad de codificacion maxima se pueden dividir en unidades de codificacion de una profundidad inferior midiendo un error de codificacion de los datos de imagen, por separado. En consecuencia, incluso cuando los datos de imagen se incluyen en una unidad de codificacion maxima, los errores de codificacion pueden diferir segun las regiones en la unidad de codificacion maxima y, por lo tanto, las profundidades codificadas pueden diferir segun las regiones en los datos de imagen. En otras palabras, la unidad de codificacion maxima se puede dividir en unidades de codificacion que tienen diferentes tamanos segun diferentes profundidades. Por lo tanto, se pueden determinar una o mas profundidades codificadas en una unidad de codificacion maxima, y los datos de imagen de la unidad de codificacion maxima se pueden dividir de acuerdo con unidades de codificacion de al menos una profundidad codificada.
En consecuencia, el determinador 120 de la unidad de codificacion de acuerdo con una realizacion de la presente invencion puede determinar unidades de codificacion que tienen una estructura de arbol incluida en la unidad de codificacion maxima. Las "unidades de codificacion que tienen una estructura de arbol" de acuerdo con una realizacion de la presente invencion incluyen unidades de codificacion correspondientes a una profundidad determinada como la profundidad codificada, entre todas las unidades de codificacion mas profundas incluidas en la unidad de codificacion maxima. Una unidad de codificacion de una profundidad codificada se puede determinar jerarquicamente segun las profundidades en la misma region de la unidad de codificacion maxima, y se puede determinar independientemente en diferentes regiones. De forma similar, una profundidad codificada en una region actual puede determinarse independientemente a partir de una profundidad codificada en otra region.
Una profundidad maxima de acuerdo con una realizacion de la presente invencion es un mdice relacionado con el numero de tiempos de division desde una unidad de codificacion maxima a una unidad de codificacion minima. Una primera profundidad maxima de acuerdo con una realizacion de la presente invencion puede indicar el numero total de tiempos de division desde la unidad de codificacion maxima hasta la unidad de codificacion minima. Una segunda profundidad maxima de acuerdo con una realizacion de la presente invencion puede indicar el numero total de niveles de profundidad desde la unidad de codificacion maxima hasta la unidad de codificacion minima. Por ejemplo, cuando la profundidad de la unidad de codificacion maxima es 0, una profundidad de una unidad de codificacion, en el que la unidad de codificacion maxima se divide una vez, puede establecerse en 1, y una profundidad de una unidad de codificacion, en el que la unidad de codificacion maxima se divide dos veces, puede establecerse en 2. En este caso, si la unidad de codificacion minima es una unidad de codificacion en la que la unidad de codificacion maxima se divide cuatro veces, existen 5 niveles de profundidad de profundidades 0, 1, 2, 3 y 4, por lo que la primera profundidad maxima se puede establecer en 4 y la segunda profundidad maxima se puede establecer en 5.
La codificacion de prediccion y la transformacion de la unidad de codificacion maxima tambien se realizan en funcion de las unidades de codificacion mas profundas segun una profundidad igual o inferior a la profundidad maxima, de acuerdo con la unidad de codificacion maxima. En otras palabras, el aparato 100 de codificacion de imagenes puede seleccionar diversamente un tamano o estructura de una unidad de datos para codificar los datos de imagen. Para codificar los datos de imagen, operaciones, tal como prediccion, transformacion y codificacion de entropfa, se realizan, y en este momento, la misma unidad de datos se puede usar para todas las operaciones o se pueden usar diferentes unidades de datos para cada operacion.
Por ejemplo, el aparato 100 de codificacion de imagenes puede seleccionar una unidad de datos que es diferente de la unidad de codificacion, para predecir la unidad de codificacion. Para realizar la codificacion de prediccion en la unidad de codificacion maxima, la codificacion de prediccion se puede realizar a base de una unidad de codificacion correspondiente a una profundidad codificada, es decir, basado en una unidad de codificacion que ya no esta dividida en unidades de codificacion correspondientes a una profundidad mas baja. En lo sucesivo en el presente documento, la unidad de codificacion que se convierte en una unidad base para la prediccion se denominara ahora "unidad de prediccion". Una particion obtenida dividiendo la unidad de prediccion puede incluir una unidad de prediccion o una unidad de datos obtenida dividiendo al menos una entre una altura y una anchura de la unidad de prediccion.
Por ejemplo, cuando una unidad de codificacion de 2Nx2N (donde N es un entero positivo) ya no se divide y se convierte en una unidad de prediccion de 2Nx2N, y el tamano de una particion puede ser 2Nx2N, 2NxN, Nx2N o NxN. Los ejemplos de un tipo de particion incluyen particiones simetricas que se obtienen dividiendo simetricamente una altura o anchura de la unidad de prediccion, particiones obtenidas dividiendo asimetricamente la altura o la anchura de la unidad de prediccion, tal como 1:n o n: 1, particiones que se obtienen dividiendo geometricamente la unidad de prediccion, y particiones que tienen estructuras arbitrarias.
Un modo de prediccion de la unidad de prediccion puede ser al menos uno de un modo intra, un modo inter y un modo de salto. Por ejemplo, el modo intra o el modo inter se puede realizar en la particion de 2Nx2N, 2NxN, Nx2N o NxN. Ademas, el modo de salto solo se puede realizar en la particion de 2Nx2N. Si la unidad de codificacion incluye una pluralidad de unidades de prediccion, la codificacion se realiza independientemente en cada unidad de prediccion en la unidad de codificacion, seleccionando de este modo un modo de prediccion que tiene un error de
5
10
15
20
25
30
35
40
45
50
55
codificacion mmimo.
Como alternativa, el aparato 100 de codificacion de imagenes puede transformar los datos de imagen en funcion de una unidad de datos que tiene un tamano diferente de la unidad de codificacion. Para transformar la unidad de codificacion, la transformacion puede realizarse a base de una unidad de datos que tiene un tamano menor o igual que la unidad de codificacion. En lo sucesivo en el presente documento, una unidad de datos utilizada como base de la transformacion se denominara ahora "unidad de transformacion". De forma similar a la unidad de codificacion, la unidad de transformacion en la unidad de codificacion se puede dividir recursivamente en unidades de transformacion de menor tamano, y por lo tanto, los datos residuales en la unidad de codificacion se pueden dividir de acuerdo con la transformacion que tiene la estructura de arbol de acuerdo con las profundidades de transformacion.
Una profundidad de transformacion segun una realizacion de la presente invencion que indica el numero de tiempos de division para alcanzar la unidad de transformacion dividiendo la altura y la anchura de la unidad de codificacion tambien puede establecerse en la unidad de transformacion. Por ejemplo, en una unidad de codificacion actual de 2Nx2N, una profundidad de transformacion puede ser 0 cuando el tamano de una unidad de transformacion tambien es 2Nx2N, puede ser 1 cuando el tamano de la unidad de transformacion es NxN, y puede ser 2 cuando el tamano de la unidad de transformacion es N/2xN/2. En otras palabras, se puede establecer la unidad de transformacion que tiene una estructura de arbol de acuerdo con profundidades de transformacion. La codificacion de la informacion de acuerdo con las profundidades codificadas no solo requiere informacion sobre la profundidad codificada, sino tambien sobre informacion relacionada con la codificacion y transformacion de prediccion. En consecuencia, el determinador 120 de profundidad codificada no solo determina una profundidad codificada que tiene un error de codificacion minima, pero tambien determina un tipo de particion para dividir la unidad de prediccion en particiones, un modo de prediccion segun unidades de prediccion, y un tamano de una unidad de transformacion para la transformacion.
El determinador 120 de profundidad codificada puede medir un error de codificacion de unidades de codificacion mas profundas de acuerdo con las profundidades mediante el uso de optimizacion de distorsion de frecuencia basada en multiplicadores lagrangianos, para determinar una estructura dividida de la unidad de codificacion maxima que tiene un error de codificacion optimo. En otras palabras, el determinador 120 de profundidad codificada puede determinar estructuras de las unidades de codificacion que van a dividirse desde la unidad de codificacion maxima, en el que los tamanos de las unidades de codificacion son diferentes segun las profundidades.
La unidad 130 de codificacion de datos de imagen emite los datos de imagen de la unidad de codificacion maxima, que esta codificada de base en la al menos una profundidad codificada determinada por el determinador 120 de profundidad codificada, en flujos de bits. Dado que la codificacion ya se realiza mediante el determinador 120 de profundidad codificada para medir el error mmimo de codificacion, una secuencia de datos codificados puede emitirse utilizando el mmimo error de codificacion.
La unidad 140 de codificacion de informacion de codificacion genera informacion sobre el modo de codificacion de acuerdo con la profundidad codificada, que esta codificada de base en la al menos una profundidad codificada determinada por el determinador 120 de profundidad codificada, en flujos de bits. La informacion sobre el modo de codificacion de acuerdo con la profundidad codificada puede incluir informacion sobre la profundidad codificada, sobre el tipo de particion para dividir la unidad de prediccion en particiones, el modo de prediccion segun las unidades de prediccion y el tamano de la unidad de transformacion.
La informacion sobre la profundidad codificada se puede definir mediante el uso de informacion de division de acuerdo con las profundidades, que indica si la codificacion se realiza en unidades de codificacion de una profundidad mas baja en lugar de una profundidad actual. Si la profundidad actual de la unidad de codificacion actual es la profundidad codificada, los datos de imagen en la unidad de codificacion actual se codifican y emiten, y asf la informacion de division puede definirse para no dividir la unidad de codificacion actual a una profundidad menor. Como alternativa, si la profundidad actual de la unidad de codificacion actual no es la profundidad codificada, la codificacion se realiza en la unidad de codificacion de la profundidad mas baja, y asf la informacion de division puede definirse para dividir la unidad de codificacion actual para obtener las unidades de codificacion de la profundidad mas baja.
Si la profundidad actual no es la profundidad codificada, la codificacion se realiza en la unidad de codificacion que se divide en la unidad de codificacion de la profundidad mas baja. Dado que existe al menos una unidad de codificacion de la profundidad mas baja en una unidad de codificacion de la profundidad actual, la codificacion se realiza repetidamente en cada unidad de codificacion de la profundidad mas baja, y asf la codificacion puede realizarse recursivamente para las unidades de codificacion que tienen la misma profundidad.
Dado que las unidades de codificacion que tienen una estructura de arbol se determinan para una unidad de codificacion maxima, y se determina informacion sobre al menos un modo de codificacion para una unidad de codificacion de una profundidad codificada, la informacion sobre al menos un modo de codificacion se puede determinar para una unidad de codificacion maxima. Ademas, una profundidad codificada de los datos de imagen de la unidad de codificacion maxima puede ser diferente segun las ubicaciones, ya que los datos de imagen se dividen
5
10
15
20
25
30
35
40
45
50
55
jerarquicamente segun las profundidades, y as^ puede establecerse informacion sobre la profundidad codificada y el modo de codificacion para los datos de imagen.
En consecuencia, la unidad 140 de codificacion de informacion de codificacion de acuerdo con una realizacion de la presente invencion puede asignar informacion de codificacion acerca de una profundidad codificada correspondiente y un modo de codificacion a al menos una de la unidad de codificacion, la unidad de prediccion y una unidad minima incluida en la unidad de codificacion maxima.
La unidad minima de acuerdo con una realizacion de la presente invencion es una unidad de datos rectangular obtenida dividiendo la unidad de codificacion minima que constituye la profundidad mas baja por 4. Como alternativa, la unidad minima puede ser una unidad de datos rectangular maxima que puede incluirse en todas las unidades de codificacion, unidades de prediccion, unidades de particion y unidades de transformacion incluidas en la unidad de codificacion maxima. Por ejemplo, la informacion de codificacion emitida a traves de la unidad 140 de codificacion de informacion de codificacion puede clasificarse en informacion de codificacion de acuerdo con unidades de codificacion, y la informacion de codificacion de acuerdo con unidades de prediccion. La informacion de codificacion segun las unidades de codificacion puede incluir informacion sobre el modo de prediccion y sobre el tamano de las particiones. La informacion de codificacion segun las unidades de prediccion puede incluir informacion sobre una direccion estimada de un modo inter, sobre un mdice de imagen de referencia del modo inter, sobre un vector de movimiento, sobre un componente de croma de un modo intra, y sobre un procedimiento de interpolacion del modo intra. Ademas, informacion sobre el tamano maximo de la unidad de codificacion definida segun las imagenes, segmentos, o GOP, e informacion sobre una profundidad maxima puede insertarse en SPS (conjunto de parametros de secuencia) o un encabezado de un flujo de bits.
En el aparato 100 de codificacion de imagenes, la unidad de codificacion mas profunda puede ser una unidad de codificacion obtenida dividiendo una altura o anchura de una unidad de codificacion de una profundidad superior, que es una capa superior, en dos. En otras palabras, cuando el tamano de la unidad de codificacion de la profundidad actual k es 2Nx2N, el tamano de la unidad de codificacion de la profundidad mas baja k+1 es NxN. Por lo tanto, la unidad de codificacion de la profundidad actual que tiene el tamano de 2Nx2N puede incluir un maximo de 4 de la unidad de codificacion de la profundidad mas baja de NxN.
En consecuencia, el aparato 100 de codificacion de imagenes de acuerdo con una realizacion de la presente invencion puede formar las unidades de codificacion que tienen la estructura de arbol mediante la determinacion de unidades de codificacion que tienen una estructura optima y un tamano optimo para cada unidad de codificacion maxima, basado en el tamano de la unidad de codificacion maxima y la profundidad maxima determinada teniendo en cuenta las caractensticas de la imagen actual. Ademas, ya que la codificacion se puede realizar en cada unidad de codificacion maxima usando cualquiera de los diversos modos de prediccion y transformaciones, un modo de codificacion optimo se puede determinar considerando las caractensticas de la unidad de codificacion de varios tamanos de imagen.
Si una imagen que tiene alta resolucion o gran cantidad de datos esta codificada en un macrobloque convencional que tiene un tamano de 16x16, una cantidad de macrobloques por imagen aumenta excesivamente. En consecuencia, se incrementan varias piezas de informacion comprimida generadas para cada macrobloque, y por lo tanto es diffcil transmitir la informacion comprimida y la eficacia de compresion de datos disminuye. Sin embargo, utilizando el aparato 100 de codificacion de imagenes, la eficacia de compresion de la imagen puede aumentar, ya que se ajusta una unidad de codificacion al considerar las caractensticas de una imagen al tiempo que se aumenta el tamano maximo de una unidad de codificacion al considerar el tamano de la imagen.
La figura 2 es un diagrama de bloques de un aparato 200 de decodificacion de imagenes, de acuerdo con una realizacion de la presente invencion.
En referencia a la figura 2, el aparato 200 de decodificacion de imagenes incluye un receptor 210 de datos de imagenes, un extractor 220 de informacion de codificacion y una unidad 230 de decodificacion de datos de imagen. Definiciones de varios terminos, tal como una unidad de codificacion, una profundidad, una unidad de prediccion, una unidad de transformacion, e informacion sobre varios modos de codificacion, para diversas operaciones del aparato 200 de decodificacion de imagenes son identicas a las descritas con referencia a la figura 1 y al aparato 100 de codificacion de imagenes. El obtentor 210 de datos de imagen recibe y analiza un flujo de bits recibido por el aparato 200 de decodificacion de imagenes para obtener datos de imagenes de acuerdo con unidades de codificacion maxima, y emite los datos de imagenes a la unidad 230 de decodificacion de datos de imagenes. El obtentor 210 de datos de imagen puede extraer informacion sobre la unidad de codificacion maxima de una imagen o segmento actual a partir de un encabezado sobre la imagen o segmento actual. El aparato 200 de decodificacion de imagenes de acuerdo con una realizacion de la presente invencion decodifica los datos de imagenes de acuerdo con unidades de codificacion maxima.
Ademas, el extractor 220 de informacion de codificacion extrae informacion sobre una profundidad codificada y un modo de codificacion para las unidades de codificacion que tienen una estructura de arbol de acuerdo con cada unidad de codificacion maxima, analizando el flujo de bits recibido por el aparato 200 de decodificacion de imagenes. La informacion extrafda sobre la profundidad codificada y el modo de codificacion se envfa a la unidad 230 de
5
10
15
20
25
30
35
40
45
50
55
decodificacion de datos de imagenes.
La informacion sobre la profundidad codificada y el modo de codificacion segun la unidad de codificacion maxima puede establecerse para informacion sobre al menos una unidad de codificacion correspondiente a la profundidad codificada, y la informacion sobre un modo de codificacion puede incluir informacion sobre un tipo de particion de una unidad de codificacion correspondiente que corresponde a la profundidad codificada, sobre un modo de prediccion, y un tamano de una unidad de transformacion. Ademas, la informacion de division segun profundidades se puede extraer como la informacion sobre la profundidad codificada.
La informacion sobre la profundidad codificada y el modo de codificacion segun cada unidad de codificacion maxima extrafda por el extractor 220 de informacion de codificacion es informacion sobre una profundidad codificada y un modo de codificacion determinado para generar un error de codificacion mmimo cuando un codificador, tal como el aparato 100 de codificacion de imagenes, realiza repetidamente la codificacion para cada unidad de codificacion mas profunda segun las profundidades de acuerdo con cada unidad de codificacion maxima. En consecuencia, el aparato 200 de decodificacion de imagenes puede restaurar una imagen decodificando los datos de imagenes de acuerdo con un modo de codificacion que genera el mmimo error de codificacion.
Dado que la informacion de codificacion sobre la profundidad codificada y el modo de codificacion se puede asignar a una unidad de datos predeterminada entre una unidad de codificacion correspondiente, una unidad de prediccion, y una unidad minima, el extractor 220 de informacion de codificacion puede extraer la informacion sobre la profundidad codificada y el modo de codificacion de acuerdo con las unidades de datos predeterminadas. Si la informacion sobre la profundidad codificada y el modo de codificacion de la unidad de codificacion maxima correspondiente se registra de acuerdo con las unidades de datos predeterminadas, las unidades de datos predeterminadas a las que se les asigna la misma informacion sobre la profundidad codificada y el modo de codificacion pueden inferirse para ser las unidades de datos incluidas en la misma unidad de codificacion maxima.
La unidad 230 de decodificacion de datos de imagen restaura la imagen actual decodificando los datos de imagen en cada unidad de codificacion maxima basandose en la informacion sobre la profundidad codificada y el modo de codificacion segun las unidades de codificacion maximas extrafdas por el extractor 220 de informacion de codificacion. En otras palabras, la unidad 230 de decodificacion de datos de imagen puede decodificar los datos de imagenes codificadas en funcion de la informacion extrafda sobre el tipo de particion, el modo de prediccion y la unidad de transformacion para cada unidad de codificacion entre las unidades de codificacion que tienen la estructura de arbol incluida en cada unidad de codificacion maxima. Un proceso de decodificacion puede incluir un proceso de intra prediccion, un proceso de prediccion de movimiento que incluye compensacion de movimiento y un proceso de transformacion inversa.
La unidad 230 de decodificacion de datos de imagen puede realizar intra prediccion o compensacion de movimiento de acuerdo con una particion y un modo de prediccion de cada unidad de codificacion, basado en la informacion sobre el tipo de particion y el modo de prediccion de la unidad de prediccion de la unidad de codificacion de acuerdo con las profundidades codificadas. Ademas, la unidad 230 de decodificacion de datos de imagen puede realizar una transformacion inversa de acuerdo con cada unidad de transformacion en la unidad de codificacion, a base de la informacion sobre el tamano de la unidad de transformacion de la unidad de codificacion de acuerdo con profundidades codificadas, para realizar la transformacion inversa segun las unidades de codificacion maxima.
El decodificador 230 de datos de imagen puede determinar una profundidad codificada de una unidad de codificacion maxima actual utilizando informacion de division de acuerdo con las profundidades. Si la informacion de division indica que los datos de la imagen ya no se divide en la profundidad actual, la profundidad actual es una profundidad codificada. En consecuencia, la unidad 230 de decodificacion de datos de imagen puede decodificar una unidad de codificacion de la profundidad actual de los datos codificados en la unidad de codificacion maxima actual usando la informacion sobre el tipo de particion de la unidad de prediccion, el modo de prediccion y el tamano de la unidad de transformacion. En otras palabras, las unidades de datos que contienen la informacion de codificacion que incluye la misma informacion de division pueden reunirse observando el conjunto de informacion de codificacion asignado para la unidad de datos predeterminada entre la unidad de codificacion, la unidad de prediccion, y la unidad minima, y las unidades de datos reunidos pueden considerarse como una unidad de datos a decodificar por la unidad 230 de decodificacion de datos de imagen en el mismo modo de codificacion.
El aparato 200 de decodificacion de imagenes puede obtener informacion sobre una unidad de codificacion que genera el mmimo error de codificacion cuando la codificacion se realiza recursivamente para cada unidad de codificacion maxima, y puede usar la informacion para decodificar la imagen actual. En otras palabras, las unidades de codificacion que tienen la estructura de arbol determinada para ser las unidades de codificacion optimas en cada unidad de codificacion maxima pueden decodificarse. En consecuencia, incluso si los datos de imagen tienen alta resolucion y una gran cantidad de datos, los datos de imagen se pueden decodificar y restaurar de manera eficiente usando un tamano de una unidad de codificacion y un modo de codificacion, que se determinan de manera adaptativa segun las caractensticas de los datos de imagen, utilizando informacion sobre un modo de codificacion optimo recibido desde un codificador.
5
10
15
20
25
30
35
40
45
50
55
La figura 3 es un diagrama para describir un concepto de unidades de codificacion jerarquica de acuerdo con una realizacion de la presente invencion.
En referencia a la figura 3, el tamano de una unidad de codificacion puede expresarse en anchura x altura, y puede ser de 64x64, 32x32, 16x16 y 8x8. Una unidad de codificacion de 64x64 se puede dividir en particiones de 64x64, 64x32, 32x64 o 32x32, y una unidad de codificacion de 32x32 se puede dividir en particiones de 32x32, 32x16, 16x32 o 16x16, una unidad de codificacion de 16x16 se puede dividir en particiones de 16x16, 16x8, 8x16 u 8x8, y una unidad de codificacion de 8x8 se puede dividir en particiones de 8x8, 8x4, 4x8 o 4x4.
En datos 310 de video, una resolucion es 1920x1080, un tamano maximo de una unidad de codificacion es 64, y una profundidad maxima es 2. En datos 320 de video, una resolucion es 1920x1080, un tamano maximo de una unidad de codificacion es 64, y una profundidad maxima es 3. En datos 330 de video, una resolucion es 352x288, un tamano maximo de una unidad de codificacion es 16, y una profundidad maxima es 1. La profundidad maxima mostrada en la figura 3 indica un numero total de divisiones desde una unidad de codificacion maxima a una unidad de decodificacion minima.
Si una resolucion es alta o la cantidad de datos es grande, un tamano maximo de una unidad de codificacion puede ser grande para no solo aumentar la eficacia de la codificacion, sino tambien para reflejar con precision las caractensticas de una imagen. En consecuencia, el tamano maximo de la unidad de codificacion de los datos de video 310 y 320 que tiene la resolucion mas alta que los datos de video 330 puede ser 64.
Dado que la profundidad maxima de los datos 310 de video es 2, las unidades 315 de codificacion de los datos de video 310 pueden incluir una unidad de codificacion maxima que tiene un tamano de eje largo de 64 y unidades de codificacion que tienen tamanos de eje largo de 32 y 16, ya que las profundidades se profundizan en dos capas dividiendo la unidad de codificacion maxima dos veces. Paralelamente, dado que la profundidad maxima de los datos 330 de video es 1, las unidades 335 de codificacion de los datos de video 330 pueden incluir una unidad de codificacion maxima que tiene un tamano de eje largo de 16 y unidades de codificacion que tienen un tamano de eje largo de 8, ya que las profundidades se profundizan en una capa dividiendo la unidad de codificacion maxima una vez.
Dado que la profundidad maxima de los datos 320 de video es 3, las unidades 325 de codificacion de los datos de video 320 pueden incluir una unidad de codificacion maxima que tiene un tamano de eje largo de 64 y unidades de codificacion que tienen tamanos de eje largo de 32, 16 y 8 porque las profundidades se profundizan en 3 capas dividiendo la unidad de codificacion maxima tres veces. A medida que se profundiza una profundidad, la informacion detallada se puede expresar con precision.
La figura 4 es un diagrama de bloques de un codificador 400 de imagenes basado en unidades de codificacion de acuerdo con una realizacion de la presente invencion.
El codificador 400 de imagenes de acuerdo con una realizacion de la presente invencion realiza operaciones del determinador 120 de profundidad codificada del aparato 100 de codificacion de imagenes para codificar datos de imagenes.
En referencia a la figura 4, un predictor 410 intra realiza intra prediccion en unidades de prediccion en un modo intra, entre una trama 405 actual, y un estimador 420 de movimiento y un compensador 425 de movimiento realiza una inter estimacion y una compensacion de movimiento en unidades de prediccion en un modo inter utilizando la trama 405 actual, y una trama 495 de referencia.
Los valores residuales se generan a base de las unidades de prediccion emitidas desde el predictor 410 intra, el estimador 420 de movimiento, y el compensador 425 de movimiento, y los valores residuales generados se emiten como un coeficiente de transformacion cuantificado a traves de un transformador 430 y un cuantificador 440.
El coeficiente de transformacion cuantificado se restablece como los valores residuales a traves de un cuantificador 460 inverso y un transformador 470 inverso, y los valores residuales restaurados salen como la trama 495 de referencia despues de ser procesados a traves de una unidad 480 de desbloqueo y una unidad 490 de filtrado de bucle. El coeficiente de transformacion cuantificado puede emitirse como un flujo de bits 455 a traves de un codificador 450 de entropfa.
Para realizar la codificacion de acuerdo con un procedimiento de codificacion de imagenes de acuerdo con una realizacion de la presente invencion, todos los elementos del codificador 400 de imagenes, es decir, el intra predictor 410, el estimador 420 de movimiento, el compensador 425 de movimiento, el transformador 430, el cuantificador 440, el codificador 450 de entropfa, el cuantificador 460 inverso, el transformador 470 inverso, la unidad 480 de desbloqueo y la unidad 490 de filtrado de bucle realizan operaciones de codificacion de imagenes basadas en cada unidad de codificacion entre unidades de codificacion que tienen una estructura en arbol, considerando la profundidad maxima de cada unidad de codificacion maxima. Espedficamente, el intra predictor 410, el estimador 420 de movimiento, y el compensador 425 de movimiento determina particiones y un modo de prediccion de cada unidad de codificacion entre las unidades de codificacion que tienen una estructura de arbol considerando el tamano maximo y la profundidad maxima de una unidad de codificacion maxima actual, y el transformador 430 determina el
5
10
15
20
25
30
35
40
45
50
55
tamano de la unidad de transformacion en cada unidad de codificacion entre las unidades de codificacion que tienen una estructura de arbol.
La figura 5 es un diagrama de bloques de un decodificador 500 de imagenes basado en unidades de codificacion de acuerdo con una realizacion de la presente invencion.
En referencia a la figura 5, un analizador 510 analiza los datos de imagen codificados a decodificar e informacion sobre la codificacion requerida para decodificar desde un flujo de bits 505. Los datos de imagen codificados se emiten como datos cuantificados inversos a traves de un decodificador 520 de entropfa y un cuantificador 530 inverso, y los datos cuantificados inversos se restauran a valores residuales a traves de un transformador 540 inverso. Los valores residuales se restauran de acuerdo con las unidades de codificacion anadiendose a un resultado de intra prediccion de un intra predictor 550 o un resultado de compensacion de movimiento de un compensador 560 de movimiento. Las unidades de codificacion restauradas pasan a traves de una unidad 570 de desbloqueo y una unidad 580 de filtrado de bucle para usarse para predecir una siguiente unidad de codificacion o imagen.
Para realizar la decodificacion de acuerdo con un procedimiento de decodificacion de imagenes de acuerdo con una realizacion de la presente invencion, todos los elementos del decodificador 500 de imagenes, es decir, el analizador 510, el decodificador 520 de entropfa, el cuantificador 530 inverso, el transformador 540 inverso, el intra predictor 550, el compensador 560 de movimiento, la unidad 570 de desbloqueo y la unidad 580 de filtrado de bucle realizan procesos de decodificacion de imagenes basados en la unidad de codificacion maxima, la unidad de codificacion segun las profundidades, la unidad de prediccion y la unidad de transformacion. Espedficamente, la intra prediccion 550 y el compensador 560 de movimiento determinan la unidad de prediccion y el modo de prediccion de la unidad de codificacion considerando el tamano maximo y la profundidad de la unidad de codificacion, y el transformador 540 inverso determina el tamano de la unidad de transformacion considerando el tamano maximo y la profundidad de la unidad de codificacion.
La figura 6 es un diagrama que ilustra unidades de codificacion mas profundas segun las profundidades, y unidades de prediccion de acuerdo con una realizacion de la presente invencion.
El aparato 100 de codificacion de imagenes y el aparato 200 de decodificacion de imagenes usan unidades de codificacion jerarquicas para considerar las caractensticas de una imagen. Una altura maxima, una anchura maxima y una profundidad maxima de unidades de codificacion pueden determinarse de manera adaptativa segun las caractensticas de la imagen, o pueden ser configuradas de manera diferente por un usuario. Los tamanos de las unidades de codificacion mas profundas segun las profundidades se pueden determinar de acuerdo con el tamano maximo predeterminado de la unidad de codificacion.
En una estructura 600 jerarquica de unidades de codificacion, de acuerdo con una realizacion de la presente invencion, la altura maxima y la anchura maxima de las unidades de codificacion son 64 y la profundidad maxima es 4. Dado que una profundidad se profundiza a lo largo de un eje vertical de la estructura 600 jerarquica, una altura y una anchura de la unidad de codificacion mas profunda estan divididas. Ademas, una unidad de prediccion y particiones, que son bases para la codificacion de prediccion de cada unidad de codificacion mas profunda, se muestran a lo largo de un eje horizontal de la estructura 600 jerarquica.
Una unidad 610 de codificacion es una unidad de codificacion maxima en la estructura 600 jerarquica, en la que una profundidad es 0 y un tamano, es decir, una altura por anchura, es 64x64. La profundidad se profundiza a lo largo del eje vertical, y una unidad 620 de codificacion que tiene un tamano de 32x32 y una profundidad de 1, una unidad 630 de codificacion que tiene un tamano de 16x16 y una profundidad de 2, una unidad 640 de codificacion que tiene un tamano de 8x8 y una profundidad de 3, y una unidad 650 de codificacion que tiene un tamano de 4x4 y una profundidad de 4. La unidad 650 de codificacion que tiene el tamano de 4x4 y la profundidad de 4 es una unidad de codificacion minima.
Ademas, con referencia a la figura 6, la unidad de prediccion y las particiones de una unidad de codificacion estan dispuestas a lo largo del eje horizontal de acuerdo con cada profundidad. En otras palabras, si la unidad 610 de codificacion que tiene el tamano de 64x64 y la profundidad de 0 es una unidad de prediccion, la unidad de prediccion puede dividirse en particiones incluidas en la unidad 610 de codificacion, es decir, una particion 610 que tiene un tamano de 64x64, particiones 612 que tienen el tamano de 64x32, las particiones 614 que tienen el tamano de 32x64, o las particiones 616 que tienen el tamano de 32x32.
De forma similar, una unidad de prediccion de la unidad 620 de codificacion que tiene el tamano de 32x32 y la profundidad de 1 puede dividirse en particiones incluidas en la unidad 620 de codificacion, es decir, una particion 620 que tiene un tamano de 32x32, particiones 622 que tienen un tamano de 32x16, las particiones 624 que tienen un tamano de 16x32 y las particiones 626 que tienen un tamano de 16x16.
Una unidad de prediccion de la unidad 630 de codificacion que tiene el tamano de 16x16 y la profundidad de 2 se puede dividir en particiones incluidas en la unidad 630 de codificacion, es decir, una particion que tiene un tamano de 16x16 incluido en la unidad 630 de codificacion, particiones 632 que tienen un tamano de 16x8, las particiones 634 que tienen un tamano de 8x16 y las particiones 636 que tienen un tamano de 8x8.
5
10
15
20
25
30
35
40
45
50
55
Una unidad de prediccion de la unidad 640 de codificacion que tiene el tamano de 8x8 y la profundidad de 3 se puede dividir en particiones incluidas en la unidad 640 de codificacion, es decir, una particion que tiene un tamano de 8x8 incluido en la unidad 640 de codificacion, particiones 642 que tienen un tamano de 8x4, las particiones 644 que tienen un tamano de 4x8 y las particiones 646 que tienen un tamano de 4x4.
La unidad 650 de codificacion que tiene el tamano de 4x4 y la profundidad de 4 es la unidad de codificacion minima y una unidad de codificacion de la profundidad mas baja. Una unidad de prediccion de la unidad 650 de codificacion solo esta asignada a una particion que tiene un tamano de 4x4.
Para determinar la al menos una profundidad codificada de las unidades de codificacion que constituyen la unidad 610 de codificacion maxima, el determinador 120 de profundidad codificada del aparato 100 de codificacion de imagenes realiza la codificacion para las unidades de codificacion correspondientes a cada profundidad incluida en la unidad 610 de codificacion maxima.
Un numero de unidades de codificacion mas profundas de acuerdo con las profundidades, incluyendo los datos en el mismo rango y el mismo tamano aumenta a medida que la profundidad se profundiza. Por ejemplo, se requieren cuatro unidades de codificacion correspondientes a una profundidad de 2 para cubrir los datos que se incluyen en una unidad de codificacion correspondiente a una profundidad de 1. En consecuencia, para comparar los resultados de codificacion de los mismos datos de acuerdo con las profundidades, la unidad de codificacion correspondiente a la profundidad de 1 y cuatro unidades de codificacion correspondientes a la profundidad de 2 estan codificadas.
Para realizar la codificacion de una profundidad actual entre las profundidades, se puede seleccionar un error de codificacion mmimo para la profundidad actual realizando la codificacion para cada unidad de prediccion en las unidades de codificacion correspondientes a la profundidad actual, a lo largo del eje horizontal de la estructura 600 jerarquica. Como alternativa, el mmimo error de codificacion puede buscarse comparando los errores de codificacion minima de acuerdo con las profundidades, realizando la codificacion para cada profundidad a medida que la profundidad se profundiza a lo largo del eje vertical de la estructura 600 jerarquica. Se puede seleccionar una profundidad y una particion que tengan el mmimo error de codificacion en la unidad 610 de codificacion como la profundidad codificada y un tipo de particion de la unidad 610 de codificacion.
La figura 7 es un diagrama para describir una relacion entre una unidad 710 de codificacion y unidades 720 de transformacion, de acuerdo con una realizacion de la presente invencion.
El aparato 100 de codificacion de imagenes o el aparato 200 de decodificacion de imagenes codifica o decodifica una imagen de acuerdo con unidades de codificacion que tienen tamanos menores que o iguales a una unidad de codificacion maxima para cada unidad de codificacion maxima. Los tamanos de las unidades de transformacion para la transformacion durante la codificacion pueden seleccionarse basandose en unidades de datos que no son mas grandes que una unidad de codificacion correspondiente. Por ejemplo, si el tamano de la unidad 710 de codificacion es 64x64, la transformacion puede realizarse usando las unidades 720 de transformacion que tienen un tamano de 32x32. Ademas, los datos de la unidad 710 de codificacion que tienen el tamano de 64x64 pueden codificarse realizando la transformacion en cada una de las unidades de transformacion que tienen el tamano de 32x32, 16x16, 8x8 y 4x4, que son mas pequenos que 64x64, y luego se puede seleccionar una unidad de transformacion que tenga el mmimo error de codificacion.
La figura 8 es un diagrama para describir informacion de codificacion de unidades de codificacion correspondientes a una profundidad codificada, de acuerdo con una realizacion de la presente invencion.
La unidad 130 de codificacion de datos de imagenes del aparato 100 de codificacion de imagenes de acuerdo con una realizacion de la presente invencion puede codificar y transmitir informacion 800 sobre un tipo de particion, informacion 810 sobre un modo de prediccion, e informacion 820 sobre un tamano de una unidad de transformacion para cada unidad de codificacion correspondiente a una profundidad codificada, como informacion sobre un modo de codificacion.
La informacion 800 indica informacion sobre una estructura de una particion obtenida mediante la division de una unidad de prediccion de una unidad de codificacion actual, en el que la particion es una unidad de datos para la codificacion de prediccion de la unidad de codificacion actual. Por ejemplo, una unidad de codificacion actual CU_0 que tiene un tamano de 2Nx2N puede dividirse en una cualquiera de una particion 802 que tiene un tamano de 2Nx2N, una particion 804 que tiene un tamano de 2NxN, una particion 806 que tiene un tamano de Nx2N, y una particion 808 que tiene un tamano de NxN. En este caso, la informacion 800 sobre un tipo de particion se configura para indicar que una de las particiones 804 tiene un tamano de 2NxN, la particion 806 que tiene un tamano de Nx2N, y la particion 808 que tiene un tamano de NxN.
La informacion 810 indica un modo de prediccion de cada particion. Por ejemplo, la informacion 810 puede indicar un modo de codificacion de prediccion realizado en una particion indicada por la informacion 800, es decir, un modo intra 812, un modo inter 814 o un modo de salto 816.
La informacion 820 indica un tamano de una unidad de transformacion en funcion de cuando se realiza la transformacion en una unidad de codificacion actual. Por ejemplo, la unidad de transformacion puede ser una
5
10
15
20
25
30
35
40
45
50
55
primera unidad 822 de transformacion intra, una segunda unidad 824 de transformacion intra, una primera unidad 826 de transformacion inter, o una segunda unidad 828 de transformacion intra.
El extractor 220 de informacion de codificacion del aparato 200 de decodificacion de imagenes puede extraer y usar la informacion 800, 810 y 820 para la decodificacion, de acuerdo con cada unidad de codificacion mas profunda.
La figura 9 es un diagrama de unidades de codificacion mas profundas de acuerdo con las profundidades, de acuerdo con una realizacion de la presente invencion.
La informacion de division se puede usar para indicar un cambio de profundidad. La informacion de division indica si una unidad de codificacion de una profundidad actual se divide en unidades de codificacion de una profundidad inferior.
Una unidad 910 de prediccion para la codificacion de prediccion de una unidad 900 de codificacion que tiene una profundidad de 0 y un tamano de 2N_0x2N_0 puede incluir particiones de un tipo de particion 912 que tiene un tamano de 2N_0x2N_0, un tipo de particion 914 que tiene un tamano de 2N_0xN_0, un tipo de particion 916 que tiene un tamano de N_0x2N_0, y un tipo de particion 918 que tiene un tamano de N_0xN_0. La figura 9 solo ilustra los tipos de particion 912 a 918 que se obtienen dividiendo simetricamente la unidad 910 de prediccion, pero un tipo de particion no esta limitado a esto, y las particiones de la unidad 910 de prediccion pueden incluir particiones asimetricas, particiones que tienen una estructura predeterminada, y particiones que tienen una estructura geometrica.
La codificacion de prediccion se realiza repetidamente en una particion que tiene un tamano de 2N_0x2N_0, dos particiones que tienen un tamano de 2N_0xN_0, dos particiones que tienen un tamano de N_0x2N_0 y cuatro particiones que tienen un tamano de N_0xN_0, de acuerdo con cada tipo de particion. La codificacion de prediccion en un modo intra y un modo inter se puede realizar en las particiones que tienen los tamanos de 2N_0x2N_0, N_0x2N_0, 2N_0xN_0 y N_0xN_0. La codificacion de prediccion en un modo de salto se realiza solo en la particion que tiene el tamano de 2N_0x2N_0. Si un error de codificacion es el mas pequeno en uno de los tipos de particion 912 a 916, la unidad 910 de prediccion no se puede dividir en una profundidad mas baja.
Si el error de codificacion es el mas pequeno en el tipo de particion 918, una profundidad cambia de 0 a 1 para dividir el tipo de particion 918 en la operacion 920, y la codificacion se realiza repetidamente en las unidades 930 de codificacion que tienen una profundidad de 2 y un tamano de N_0xN_0 para buscar un error de codificacion mmimo.
Una unidad 940 de prediccion para la codificacion de prediccion de la unidad 930 de codificacion que tiene una profundidad de 1 y un tamano de 2N_1x2N_1 (= N_0xN_0) puede incluir particiones de un tipo de particion 942 que tiene un tamano de 2N_1x2N_1, un tipo de particion 944 que tiene un tamano de 2N_1xN_1, un tipo de particion 946 que tiene un tamano de N_1x2N_1, y un tipo de particion 948 que tiene un tamano de N_1xN_1.
Si un error de codificacion es el mas pequeno en el tipo de particion 948, una profundidad se cambia de 1a 2 para dividir el tipo de particion 948 en la operacion 950, y la codificacion se realiza repetidamente en las unidades 960 de codificacion, que tienen una profundidad de 2 y un tamano de N_2xN_2 para buscar un error de codificacion mmimo.
Cuando una profundidad maxima es d, la operacion dividida de acuerdo con cada profundidad se puede realizar hasta cuando una profundidad se convierte en d-1, y la informacion de division se puede codificar como hasta cuando una profundidad es de 0 a d-2. En otras palabras, cuando la codificacion se realiza hasta cuando la profundidad es d-1 despues de que una unidad de codificacion correspondiente a una profundidad de d-2 se divide en la operacion 970, una unidad 990 de prediccion para la codificacion de prediccion de una unidad 980 de codificacion que tiene una profundidad de d-1 y un tamano de 2N_ (d-1)x2N_ (d-1) puede incluir particiones de un tipo de particion 992 que tiene un tamano de 2N_ (d- 1)x2N_ (d-1), un tipo de particion 994 que tiene un tamano de 2N_ (d-1)xN_ (d-1), un tipo de particion 996 que tiene un tamano de N_ (d-1)x2N_ (d-1), y un tipo de particion 998 que tiene un tamano de N_ (d-1)xN_(d-1).
La codificacion de prediccion se puede realizar repetidamente en una particion que tiene un tamano de 2N_ (d- 1 )x2N_ (d-1), dos particiones que tienen un tamano de 2N_ (d-1)xN_ (d-1), dos particiones que tienen un tamano de N_ (d-1)x2N_ (d-1), cuatro particiones que tienen un tamano de N_ (d-1)xN_ (d-1) entre los tipos de particion 992 a 998 para buscar un tipo de particion que tenga un error de codificacion mmimo. Incluso cuando el tipo de particion 998 tiene el mmimo error de codificacion, ya que una profundidad maxima es d, una unidad de codificacion CU_ (d- 1) que tiene una profundidad de d-1 ya no se divide a una profundidad menor, y se determina que una profundidad codificada para las unidades de codificacion que constituyen una unidad 900 de codificacion maxima actual es d-1 y una particion el tipo de la unidad 900 de codificacion maxima actual se puede determinar que sea N_ (d-1)xN_ (d-1). Ademas, dado que la profundidad maxima es d y una unidad 980 de codificacion minima que tiene una profundidad mas baja de d-1 ya no se divide a una profundidad mas baja, la informacion de division para la unidad 980 de codificacion minima no esta configurada.
Una unidad 999 de datos puede ser una 'unidad minima' para la unidad de codificacion maxima actual. Una unidad minima de acuerdo con una realizacion de la presente invencion puede ser una unidad de datos rectangular obtenida dividiendo una unidad 980 de codificacion minima por 4. Al realizar la codificacion repetidamente, el
5
10
15
20
25
30
35
40
45
aparato 100 de codificacion de imagenes puede seleccionar una profundidad que tenga el menor error de codificacion comparando errores de codificacion segun las profundidades de la unidad 900 de codificacion para determinar una profundidad codificada, y establecer un tipo de particion correspondiente y un modo de prediccion como un modo de codificacion de la profundidad codificada.
Como tal, los errores de codificacion mmimos segun las profundidades se comparan en todas las profundidades de 1 a d, y una profundidad que tiene el menor error de codificacion se puede determinar como una profundidad codificada. La profundidad codificada, el tipo de particion de la unidad de prediccion y el modo de prediccion pueden codificarse y transmitirse como informacion sobre un modo de codificacion. Ademas, dado que una unidad de codificacion se divide desde una profundidad de 0 a una profundidad codificada, solo la informacion de division de la profundidad codificada se establece en 0, y la informacion de division de profundidades excluyendo la profundidad codificada se establece en 1.
El extractor 220 de informacion de codificacion del aparato 200 de decodificacion de imagenes segun una realizacion de la presente invencion puede extraer y usar la informacion sobre la profundidad codificada y la unidad de prediccion de la unidad 900 de codificacion para decodificar la unidad 900 de codificacion. El aparato 200 de decodificacion de imagenes de acuerdo con una realizacion de la presente invencion puede determinar una profundidad, en que la informacion de division es 0, como una profundidad codificada mediante el uso de informacion de division de acuerdo con las profundidades, y el uso de informacion sobre un modo de codificacion de la profundidad correspondiente para la decodificacion.
Las figuras 10 a 12 son diagramas para describir una relacion entre unidades 1010 de codificacion, unidades 1060 de prediccion, y unidades 1070 de transformacion, de acuerdo con una realizacion de la presente invencion.
Las unidades 1010 de codificacion son unidades de codificacion correspondientes a profundidades codificadas determinadas por el aparato 100 de codificacion de imagenes, en una unidad de codificacion maxima. Las unidades 1060 de prediccion son particiones de unidades de prediccion de cada una de las unidades 1010 de codificacion, y las unidades 1070 de transformacion son unidades de transformacion de cada una de las unidades 1010 de codificacion.
Cuando la profundidad de la unidad de codificacion maxima es 0, las profundidades de las unidades 1012 y 1054 de codificacion son 1, las profundidades de las unidades 1014, 1016, 1018, 1028, 1050 y 1052 de codificacion son 2, las profundidades de las unidades 1020, 1022, 1024, 1026, 1030, 1032 y 1048 de codificacion son 3, y las profundidades de las unidades 1040, 1042, 1044 y 1046 de codificacion son 4.
En las unidades 1060 de prediccion, algunas unidades 1014, 1016, 1022, 1032, 1048, 1050, 1052 y 1054 de codificacion se obtienen dividiendo las unidades de codificacion en las unidades 1010 de codificacion. En otras palabras, los tipos de particion en las unidades 1014, 1022, 1050 y 1054 de codificacion tienen un tamano de 2NxN, los tipos de particion en las unidades 1016, 1048 y 1052 de codificacion tienen un tamano de Nx2N, y un tipo de particion de la unidad 1032 de codificacion tiene un tamano de NxN. Las unidades de prediccion y las particiones de las unidades 1010 de codificacion son mas pequenas que o iguales a cada unidad de codificacion.
La transformacion o transformacion inversa se realiza en datos de imagen de las unidades 1052 y 1054 de codificacion en las unidades 1070 de transformacion en una unidad de datos que es mas pequena que la unidad 1052 y 1054 de codificacion. Ademas, las unidades 1014, 1016, 1022, 1032, 1048, 1050, 1052 y 1054 de codificacion en las unidades 1070 de transformacion son diferentes de las unidades 1060 de prediccion en terminos de tamanos y estructuras. En otras palabras, los aparatos 100 y 200 de codificacion y decodificacion de video pueden realizar prediccion, transformacion y transformacion inversa en la misma unidad de codificacion basada en una unidad de datos individual. En consecuencia, la codificacion se realiza recursivamente en cada una de las unidades de codificacion para determinar una unidad de codificacion optima, y de este modo se pueden obtener unidades de codificacion que tienen una estructura de arbol recursiva.
La informacion de codificacion puede incluir informacion de division sobre una unidad de codificacion, informacion sobre un tipo de particion, informacion sobre un modo de prediccion e informacion sobre el tamano de una unidad de transformacion. La Tabla 1 muestra la informacion de codificacion que puede establecerse mediante los aparatos 100 y 200 de codificacion y decodificacion de imagenes.
5
10
15
20
25
30
35
40
45
[Tabla 11
Informacion dividida 0 (Codificacion en la unidad de codificacion con tamano de 2Nx2N y profundidad actual de d)
Informacion dividida 1
Modo de prediccion
Tipo de particion Tamano de la Unidad de Transformacion Repetidamente codifica unidades de codificacion con profundidad inferior de d + 1
Intra Inter Omision (solo 2Nx2N)
Tipo de particion simetrica Tipo de particion asimetrica Informacion dividida 0 de la unidad de transformacion Informacion dividida 1 de la unidad de transformacion
2Nx2N 2NxN Nx2N NxN
2NxnU 2NxnD nLx2N nRx2N 2Nx2N NxN (Tipo simetrico) N/2xN/2 (Tipo asimetrico)
La unidad 130 de codificacion de datos de imagen del aparato 100 de codificacion de imagenes segun una realizacion de la presente invencion puede generar la informacion de codificacion sobre las unidades de codificacion que tienen una estructura en arbol, y el extractor 220 de informacion de codificacion del aparato 200 de decodificacion de imagenes segun una realizacion de la presente invencion puede extraer la informacion de codificacion sobre las unidades de codificacion que tienen una estructura de arbol a partir de un flujo de bits recibido.
La informacion de division indica si una unidad de codificacion actual se divide en unidades de codificacion de una profundidad mas baja. Si la informacion de division de una profundidad actual d es 0, una profundidad, en el que una unidad de codificacion actual ya no se divide en una profundidad mas baja, es una profundidad codificada, y por lo tanto informacion sobre un tipo de particion, modo de prediccion, y se puede definir un tamano de una unidad de transformacion para la profundidad codificada. Si la unidad de codificacion actual se divide aun mas segun la informacion de division, la codificacion se realiza independientemente en cuatro unidades de codificacion divididas de una profundidad mas baja.
Un modo de prediccion puede ser uno de un modo intra, un modo inter y un modo de salto. El modo intra y el modo inter se pueden definir en todos los tipos de particion, y el modo de salto se define solo en un tipo de particion que tenga un tamano de 2Nx2N.
La informacion sobre el tipo de particion puede indicar tipos de particion simetrica con tamanos de 2Nx2N, 2NxN, Nx2N, y NxN, que se obtienen dividiendo simetricamente una altura o una anchura de una unidad de prediccion, y tipos de particiones asimetricas con tamanos de 2NxnU, 2NxnD, nLx2N y nRx2N, que se obtienen dividiendo asimetricamente la altura o la anchura de la unidad de prediccion. Los tipos de particiones asimetricas que tienen los tamanos de 2NxnU y 2NxnD pueden obtenerse respectivamente dividiendo la altura de la unidad de prediccion en 1:3 y 3:1, y los tipos de particion asimetricos que tienen los tamanos de nLx2N y nRx2N pueden obtenerse respectivamente dividiendo la anchura de la unidad de prediccion en 1:3 y 3:1.
El tamano de la unidad de transformacion puede establecerse para ser dos tipos en el modo intra y dos tipos en el modo inter. En otras palabras, si la informacion de division de la unidad de transformacion es 0, el tamano de la unidad de transformacion puede ser 2Nx2N, que es el tamano de la unidad de codificacion actual. Si la informacion de division de la unidad de transformacion es 1, las unidades de transformacion se pueden obtener dividiendo la unidad de codificacion actual. Ademas, si un tipo de particion de la unidad de codificacion actual que tiene el tamano de 2Nx2N es un tipo de particion simetrica, el tamano de una unidad de transformacion puede ser NxN, y si el tipo de particion de la unidad de codificacion actual es un tipo de particion asimetrica, el tamano de la unidad de transformacion puede ser N/2xN/2.
La informacion de codificacion sobre unidades de codificacion que tienen una estructura de arbol puede incluir al menos una de una unidad de codificacion correspondiente a una profundidad codificada, una unidad de prediccion, y una unidad minima. La unidad de codificacion correspondiente a la profundidad codificada puede incluir al menos una de una unidad de prediccion y una unidad minima que contiene la misma informacion de codificacion.
En consecuencia, se determina si las unidades de datos adyacentes se incluyen en la misma unidad de codificacion que corresponde a la profundidad codificada mediante la comparacion de la informacion de codificacion de las unidades de datos adyacentes. Ademas, una unidad de codificacion correspondiente que corresponde a una profundidad codificada se determina usando informacion de codificacion de una unidad de datos, y asf se puede determinar una distribucion de profundidades codificadas en una unidad de codificacion maxima.
En consecuencia, si se predice una unidad de codificacion actual en funcion de la informacion de codificacion de las unidades de datos adyacentes, la informacion de codificacion de unidades de datos en unidades de codificacion mas profundas adyacentes a la unidad de codificacion actual se puede referir y utilizar directamente.
Como alternativa, si se predice una unidad de codificacion actual en funcion de la informacion de codificacion de las unidades de datos adyacentes, las unidades de datos adyacentes a la unidad de codificacion actual se buscan
5
10
15
20
25
30
35
40
45
50
55
utilizando la informacion de codificacion de las unidades de datos, y las unidades de codificacion adyacentes buscadas pueden referirse para predecir la unidad de codificacion actual.
La figura 13 es un diagrama para describir una relacion entre una unidad de codificacion, una unidad de prediccion o una particion, y una unidad de transformacion, segun informacion del modo de codificacion de la Tabla 1.
Una unidad 1300 de codificacion maxima incluye unidades 1302, 1304, 1306, 1312, 1314, 1316 y 1318 de codificacion de profundidades codificadas. En este caso, dado que la unidad 1318 de codificacion es una unidad de codificacion de una profundidad codificada, la informacion de division puede establecerse en 0. La informacion sobre un tipo de particion de la unidad 1318 de codificacion que tiene un tamano de 2Nx2N se puede configurar para que sea una de un tipo de particion 1322 que tenga un tamano de 2Nx2N, un tipo de particion 1324 que tiene un tamano de 2NxN, un tipo de particion 1326 que tiene un tamano de Nx2N, un tipo de particion 1328 que tiene un tamano de NxN, un tipo de particion 1332 que tiene un tamano de 2NxnU, un tipo de particion 1334 que tiene un tamano de 2NxnD, un tipo de particion 1336 que tiene un tamano de nLx2N, y un tipo de particion 1338 que tiene un tamano de nRx2N.
Cuando el tipo de particion esta configurado para ser simetrico, es decir, el tipo de particion 1322, 1324, 1326 o 1328, se establece una unidad 1342 de transformacion que tiene un tamano de 2Nx2N si la informacion de division (indicador de tamano de TU) de una unidad de transformacion es 0, y se establece una unidad 1344 de transformacion que tiene un tamano de NxN si un indicador de tamano de TU es 1.
Cuando el tipo de particion esta configurado para ser asimetrico, es decir, el tipo de particion 1332, 1334, 1336 o 1338, una unidad 1352 de transformacion que tiene un tamano de 2Nx2N se establece si un indicador de tamano de TU es 0, y se establece una unidad 1354 de transformacion que tiene un tamano de N/2xN/2 si un indicador de tamano de TU es 1.
En lo sucesivo en el presente documento, un procedimiento de codificacion jerarquica de informacion de division (indicador de division) que indica estructuras divididas de una unidad de codificacion maxima codificada a base de las unidades de codificacion segun profundidades e informacion de salto que indica si un modo de prediccion de cada unidad de codificacion incluida en una unidad de codificacion maxima es un modo de salto, de acuerdo con una realizacion de la presente invencion, se describira en detalle. En la siguiente descripcion, una unidad de codificacion es un termino utilizado durante la codificacion de imagenes y una unidad de decodificacion es un termino para la unidad de codificacion en terminos de decodificacion de imagenes. En otras palabras, la unidad de codificacion y la unidad de decodificacion son diferentes solo porque la unidad de codificacion se usa en el proceso de codificacion y la unidad de decodificacion se usa en el proceso de decodificacion. Por la consistencia de los terminos, a excepcion de un caso particular, la unidad de codificacion y la unidad de decodificacion se denominan unidad de codificacion en los procesos de codificacion y decodificacion.
La figura 18 es un diagrama de flujo que ilustra un procedimiento de codificacion de una imagen, de acuerdo con una realizacion de la presente invencion.
Con referencia a las figuras 1 y 18, el divisor 110 de unidades de codificacion maxima divide una imagen actual en al menos una unidad de codificacion maxima, en la operacion 1610.
En la operacion 1620, el determinador 120 de profundidad codificada determina las estructuras divididas de la unidad de codificacion maxima y el modo de prediccion de cada unidad de codificacion codificando los datos de imagen de la unidad de codificacion maxima a base de las unidades de codificacion divididas jerarquicamente a medida que se profundiza la profundidad. Como se ha descrito anteriormente, el determinador 120 de profundidad codificada determina la profundidad codificada codificando los datos de imagen basados en las unidades de codificacion de acuerdo con las profundidades para la unidad de codificacion maxima de la imagen actual, y seleccionando la profundidad que tiene el menor error de codificacion. En detalle, el determinador 120 de profundidad codificada codifica los datos de imagen en la unidad de codificacion maxima basandose en las unidades de codificacion mas profundas correspondientes a al menos una profundidad igual o inferior a la profundidad maxima, y compara los resultados de codificacion de los datos de imagen en funcion de cada una de las unidades de codificacion mas profundas para seleccionar una profundidad que tenga el menor error de codificacion. Ademas, incluso si las unidades de codificacion corresponden a la misma profundidad en una unidad de codificacion maxima, el determinador 120 de profundidad codificado determina la division de cada una de las unidades de codificacion correspondientes a la misma profundidad a una profundidad mas baja midiendo un error de codificacion de los datos de imagen de cada unidad de codificacion, por separado.
En operacion 1630, la unidad 140 de codificacion de informacion de codificacion establece informacion de division sobre division de una unidad de codificacion de profundidad superior que incluye cada unidad de codificacion, para cada unidad de codificacion. A continuacion se describira un proceso de configuracion de la informacion de division con referencia a las figuras 14 a 16.
En la operacion 1640, la unidad 140 de codificacion de informacion de codificacion establece informacion de salto que indica si un modo de prediccion determinado de acuerdo con las unidades de codificacion es un modo de salto. En la operacion 1650, la informacion de division y la informacion de salto configurada de acuerdo con las unidades
5
10
15
20
25
30
35
40
45
50
55
de codificacion estan codificadas.
La figura 14 es un diagrama de estructuras divididas de una unidad de codificacion maxima determinada a base de unidades de codificacion mas profundas, de acuerdo con una realizacion de la presente invencion.
En la figura 14, un bloque mas grande indicado por un numero de referencia 1200 es la unidad de codificacion maxima, y se supone que la unidad 1200 de codificacion maxima tiene una profundidad maxima de 3. En otras palabras, cuando un tamano de la unidad 1200 de codificacion maxima es 2Nx2N, la unidad 1200 de codificacion maxima puede dividirse en una unidad 1210 de codificacion que tiene un tamano de NxN y una profundidad de 1, unidades 1220 de codificacion que tienen un tamano de (N/2)x(N/2) y una profundidad de 2, y unidades de codificacion 1230 que tienen un tamano de (N/4)x(N/4) y una profundidad de 3. Para transmitir las estructuras divididas de la unidad 1200 de codificacion maxima mostrada en la figura 14, la unidad 140 de codificacion de informacion de codificacion de acuerdo con una realizacion de la presente invencion establece la informacion de division que indica la division de la unidad de codificacion de la profundidad superior que incluye cada unidad de codificacion, para cada unidad de codificacion. Por ejemplo, la unidad 1210 de codificacion que tiene el tamano de NxN y la profundidad de 1 incluye informacion de division de 1 bit que indica division de una unidad de codificacion superior, es decir, la unidad 1200 de codificacion maxima que tiene una profundidad de 0. Si una unidad de codificacion de profundidad correspondiente se divide cuando cada bit de informacion de division tiene un valor de "1", y una unidad de codificacion de profundidad correspondiente no se divide cuando cada bit de informacion de division tiene un valor de "0", la unidad 1210 de codificacion que tiene la profundidad de 1 tiene informacion de division que tiene un valor de "1" para tener las estructuras divididas mostradas en la figura 14.
La figura 15 es un diagrama para describir informacion de division de la unidad 1220 de codificacion de la figura 14 que tiene una profundidad de 2. Un numero de referencia 1320 de la figura 15 corresponde a la unidad 1220 de codificacion que tiene la profundidad de 2 en la figura 14.
En referencia a la figura 15, la unidad 140 de codificacion de informacion de codificacion establece informacion de division de 2 bits que indica division de una unidad 1310 de codificacion que tiene una profundidad de 1 que incluye la unidad 1320 de codificacion que tiene una profundidad de 2, y division de la unidad 1300 de codificacion maxima que tiene una profundidad de 0, como informacion de division de la unidad 1320 de codificacion que tiene la profundidad de 2. Si una unidad de codificacion de profundidad correspondiente se divide cuando cada bit de informacion de division tiene un valor de "1", y una unidad de codificacion de profundidad correspondiente no se divide cuando cada bit de informacion de division tiene un valor de "0", la unidad 1320 de codificacion tiene la informacion de division de 2 bits que tiene un valor de "11" ya que la unidad 1320 de codificacion se genera cuando tanto la unidad 1310 de codificacion como la unidad 1300 de codificacion maxima estan divididas.
La figura 16 es un diagrama para describir informacion de division de la unidad 1230 de codificacion de la figura 14 que tiene una profundidad de 3. Un numero de referencia 1430 de la figura 16 corresponde a la unidad 1230 de codificacion de la figura 14 que tiene la profundidad de 3.
En referencia a la figura 16, la unidad 140 de codificacion de informacion de codificacion incluye informacion de division de 3 bits que indica la division de una unidad 1420 de codificacion que tiene una profundidad de 2 y que incluye la unidad 1430 de codificacion que tiene la profundidad de 3, division de una unidad 1410 de codificacion que tiene una profundidad de 1, y division de una unidad 1400 de codificacion maxima, como informacion de division de la unidad 1430 de codificacion que tiene la profundidad de 3. Si una unidad de codificacion de profundidad correspondiente se divide cuando cada bit de informacion de division tiene un valor de "1", y una unidad de codificacion de profundidad correspondiente no se divide cuando cada bit de informacion de division tiene un valor de "0", la unidad 1430 de codificacion tiene la informacion de division de 3 bits que tiene un valor de "111" ya que la unidad 1430 de codificacion se genera cuando toda la unidad 1420 de codificacion, la unidad 1410 de codificacion, y la unidad 1400 de codificacion maxima estan divididas.
Como tal, cuando d indica una profundidad maxima que indica un numero de tiempos de division jerarquica de una altura y una anchura de una unidad de codificacion actual desde una unidad de codificacion maxima a una unidad de codificacion minima y n indica una profundidad de la unidad de codificacion actual, en el que d y n son respectivamente un numero entero y 0 < n < (d-1), la division de una unidad de codificacion de una profundidad superior que incluye la unidad de codificacion actual se puede establecer utilizando informacion de division de n bits. Cada bit de la informacion de division de n bits se configura para indicar la division de las unidades de codificacion que tienen una profundidad superior a la unidad de codificacion actual, desde una profundidad de 0 a una profundidad de (n-1). En este caso, una orden de la informacion de division de n bits que indica division de unidades de codificacion que tienen profundidades superiores desde un bit mas significativo (MSB) o desde un bit menos significativo (LSB) puede variar segun los comandos de ocasion.
Paralelamente, si la informacion de division que indica la division de la unidad de codificacion de la profundidad superior, incluida la unidad de codificacion actual, esta configurada para cada unidad de codificacion, una ubicacion de cada unidad de codificacion en la unidad de codificacion maxima se puede determinar facilmente basandose en la informacion de division cuando las unidades de codificacion se procesan en el mismo orden de procesamiento por un codificador y un decodificador. Por ejemplo, como se muestra en la figura 17, cuando las unidades de codificacion
5
10
15
20
25
30
35
40
45
50
55
60
que tienen la misma profundidad en una unidad 1500 de codificacion maxima segun una realizacion de la presente invencion se procesan en una orden de exploracion en zigzag, y las unidades de decodificacion que tienen la misma profundidad se procesan en el mismo orden de exploracion en zigzag durante la decodificacion, es posible restablecer estructuras separadas de la unidad 1500 de codificacion maxima determinada durante la codificacion a partir de informacion de division que indica division de unidades de codificacion de profundidades superiores que incluyen cada unidad de codificacion. Una orden de procesamiento de bloques de acuerdo con una realizacion de la presente invencion puede establecerse de diversas maneras, incluyendo la orden de exploracion en zigzag, pero las ordenes de procesamiento de las unidades de codificacion pueden ser identicas durante la codificacion y la decodificacion para determinar las estructuras divididas de una unidad de codificacion maxima durante la decodificacion.
La unidad 140 de codificacion de informacion de codificacion establece informacion de salto que indica si un modo de prediccion de cada unidad de codificacion es un modo de salto, asignando 1 bit a cada unidad de codificacion. Por ejemplo, el modo de prediccion de la unidad de codificacion correspondiente es un modo de salto cuando un bit de informacion de salto tiene un valor de "1", y la unidad de codificacion correspondiente se predice de acuerdo con un modo de prediccion distinto de un modo de salto cuando el bit de informacion omitida tiene un valor de "0". La informacion de salto se establece para cada unidad de codificacion porque una unidad de codificacion en un modo de salto se restablece a partir de informacion de movimiento de unidades de codificacion adyacentes sin un proceso de prediccion separado y no se realiza un proceso de division separado en la unidad de codificacion durante la decodificacion, mejorando asf la eficiencia de compresion y el rendimiento de procesamiento de una imagen.
La figura 19 es un diagrama de flujo que ilustra un procedimiento de codificacion de una imagen, de acuerdo con otra realizacion de la presente invencion.
En referencia a la figura 19, el divisor 110 de unidades de codificacion maxima divide una imagen actual en al menos una unidad de codificacion maxima, en la operacion 1710.
En la operacion 1720, el determinador 120 de profundidad codificada determina las estructuras divididas de la unidad de codificacion maxima y el modo de prediccion de cada unidad de codificacion codificando los datos de imagen de la unidad de codificacion maxima a base de las unidades de codificacion divididas jerarquicamente mas profundas a medida que se profundiza la profundidad. Como se ha descrito anteriormente, el determinador 120 de profundidad codificado determina la profundidad codificada codificando los datos de imagen en las unidades de codificacion mas profundas de acuerdo con las profundidades, de acuerdo con la unidad de codificacion maxima de la imagen actual, y seleccionando la profundidad que tenga el menor error de codificacion.
En la operacion 1730, la unidad 140 de codificacion de informacion de codificacion establece informacion de salto que indica si los modos de prediccion de cada unidad de codificacion y una unidad de codificacion de profundidad superior que incluye cada unidad de codificacion son cada uno un modo de salto, para cada unidad de codificacion. En otras palabras, de acuerdo con otra realizacion de la presente invencion, la informacion de salto de cada unidad de codificacion puede incluir no solo un modo de salto de una unidad de codificacion actual, sino tambien un modo de salto de una unidad de codificacion de una profundidad superior que incluye la unidad de codificacion actual. En detalle, cuando d indica una profundidad maxima que indica un numero de tiempos de division jerarquica de una altura y una anchura de una unidad de codificacion actual desde una unidad de codificacion maxima a una unidad de codificacion minima y n indica una profundidad de la unidad de codificacion actual, en el que d y n son respectivamente un numero entero y 0 < n < (d-1), la unidad 140 de codificacion de informacion de codificacion puede establecer informacion de division de n bits que indica si los modos de prediccion de la unidad de codificacion actual y (n-1) unidades de codificacion de las profundidades superiores son cada uno un modo de salto. Cuando n=1, es decir, cuando la unidad de codificacion actual tiene una profundidad de 1, una unidad de codificacion que tiene una profundidad inmediatamente superior es una unidad de codificacion maxima, y por lo tanto, solo se salta informacion de 1 bit que indica si se establece el modo de prediccion de la unidad de codificacion actual como un modo de salto. Por ejemplo, la unidad 1210 de codificacion de la figura 14 que tiene la profundidad de 1 tiene informacion de salto de 1 bit que indica si su modo de prediccion es un modo de salto.
Como alternativa, con referencia a la figura 15, la unidad 140 de informacion de codificacion establece informacion de salto de 2 bits en total, en el que 1 bit indica informacion de salto de la unidad 1320 de codificacion que tiene una profundidad de 2 y 1 bit indica informacion de salto de la unidad 1310 de codificacion que tiene la profundidad de 1 y que incluye la unidad 1320 de codificacion, como la informacion de salto de la unidad 1320 de codificacion. Como alternativa, con referencia a la figura 16, la unidad 140 de codificacion de informacion de codificacion puede establecer informacion de salto de 3 bits en total, que incluye informacion de salto de la unidad 1430 de codificacion que tiene una profundidad de 3, teniendo la informacion de salto de la unidad 1420 de codificacion la profundidad de 2 y que incluye la unidad 1430 de codificacion, e informacion de salto de la unidad 1410 de codificacion que tiene una profundidad de 1, como la informacion de salto de la unidad 1430 de codificacion.
Con referencia de nuevo a la figura 19, la informacion de division sobre la division de una unidad de codificacion de una profundidad superior, incluyendo cada unidad de codificacion, se establece para cada unidad de codificacion, en la operacion 1740. Dado que el establecimiento de la informacion de division en la operacion 1740 es identica a la configuracion descrita anteriormente, sus detalles no se repiten.
5
10
15
20
25
30
35
40
45
50
En operacion 1750, la informacion de division y la informacion de salto, que se establecen segun unidades de codificacion, se codifican.
La figura 20 es un diagrama de flujo que ilustra un procedimiento de decodificacion de una imagen, de acuerdo con una realizacion de la presente invencion. El procedimiento de acuerdo con la realizacion actual decodifica un flujo de bits codificado de acuerdo con el procedimiento de la figura 18.
Con referencia a las figuras 2 y 20, el extractor 220 de informacion de codificacion extrae informacion de division indicando la division de una unidad de decodificacion de una profundidad superior, incluyendo una unidad de decodificacion actual a decodificar, a partir de datos de imagenes codificados de acuerdo con unidades de codificacion maximas basadas en unidades de codificacion mas profundas de acuerdo con las profundidades, que se dividen jerarquicamente a medida que se profundiza una profundidad, en la operacion 1810.
En operacion 1820, el extractor 220 de informacion de codificacion extrae informacion de salto que indica si un modo de prediccion de la unidad de decodificacion actual es un modo de salto, a partir de los datos de imagen.
En la operacion 1830, la unidad 230 de decodificacion de datos de imagen determina estructuras divididas de una unidad de decodificacion maxima que incluye la unidad de decodificacion actual, segun la informacion de division. Como se ha descrito anteriormente, como la informacion de division esta en bits indicando la division de la unidad de decodificacion de la profundidad superior, incluyendo la unidad de decodificacion actual; la unidad de decodificacion maxima se puede dividir en una unidad de codificacion que tiene una profundidad de la unidad de decodificacion actual usando la informacion de division.
En la operacion 1840, la unidad 230 de decodificacion de datos de imagen determina si el modo de prediccion de la unidad de decodificacion actual es un modo de salto, segun la informacion de salto. Si la unidad de decodificacion actual esta en el modo de salto, se detiene un proceso de division y se decodifica otra informacion incluida en la informacion de codificacion.
La figura 21 es un diagrama de flujo que ilustra un proceso de division de una unidad de decodificacion maxima y un proceso de decodificacion de informacion de salto, de acuerdo con un procedimiento de decodificacion de una imagen, de acuerdo con una realizacion de la presente invencion.
En referencia a la figura 21, la informacion de codificacion de las unidades de codificacion incluidas en una unidad de codificacion maxima se extrae en la operacion 1910. Como se ha descrito anteriormente, la informacion de codificacion incluye informacion de division e informacion de salto.
La informacion de division se decodifica en la operacion 1920, y se determina si una unidad de decodificacion maxima se divide de acuerdo con un conjunto de profundidad basado en la informacion de division decodificada a una unidad de decodificacion actual que tiene la profundidad, en la operacion 1930. Por ejemplo, como se ha descrito anteriormente, si la unidad de decodificacion actual es una unidad de decodificacion que tiene una profundidad de 2 y una informacion de division de "11", la unidad de decodificacion actual debena incluirse en las unidades de codificacion obtenidas dividiendo la unidad de decodificacion maxima dos veces.
Si se determina que la unidad de decodificacion maxima no se divide hasta la profundidad de la unidad de decodificacion actual en la operacion 1930, una profundidad aumenta en uno en la operacion 1935.
Si se determina que la unidad de decodificacion maxima se divide hasta la profundidad de la unidad de decodificacion actual en la operacion 1930, la informacion de salto se decodifica en la operacion 1940. Se determina si un modo de prediccion de la unidad de decodificacion actual es un modo de salto en la operacion 1950, si es el modo de salto, se determina si la unidad de decodificacion actual es la ultima unidad 1960 de decodificacion para decodificar una siguiente unidad de decodificacion maxima en la operacion 1970 o decodificar una siguiente unidad de decodificacion aumentando un valor de mdice de una unidad de decodificacion en 1 en la operacion 1980.
Si se determina que el modo de prediccion de la unidad de decodificacion actual no es el modo de salto en la operacion 1950, la informacion sobre los datos de imagen distinta de la informacion de division y salto se decodifica en la operacion 1955.
La figura 22 es un diagrama de flujo que ilustra un procedimiento de decodificacion de una imagen, de acuerdo con otra realizacion de la presente invencion. El procedimiento de acuerdo con la realizacion actual decodifica un flujo de bits codificado de acuerdo con el procedimiento de la figura 19.
Con referencia a las figuras 2 y 22, el extractor 220 de informacion de codificacion extrae informacion de salto que indica si los modos de prediccion de una unidad de decodificacion actual a decodificar y las unidades de decodificacion de profundidades superiores, incluyendo la unidad de decodificacion actual, son cada uno un modo de salto, a partir de datos de imagenes codificados de acuerdo con unidades de codificacion maximas basadas en unidades de codificacion mas profundas de acuerdo con las profundidades, que se dividen jerarquicamente a medida que se profundiza una profundidad, en la operacion 2010.
5
10
15
20
25
30
35
40
45
50
En la operacion 2020, el extractor 220 de informacion de codificacion extrae informacion de division sobre la division de una unidad de decodificacion de profundidad superior, incluyendo la unidad de decodificacion actual, a partir de los datos de imagen.
En la operacion 2030, la unidad 230 de decodificacion de datos de imagen determina si los modos de prediccion de la unidad de decodificacion actual y la unidad de decodificacion de profundidades superiores son cada uno un modo de salto, basado en la informacion de salto extrafda. Como tal, de acuerdo con la realizacion actual, cuando la informacion de salto es decodificada antes de decodificar la informacion de division, el rendimiento del procesamiento de una imagen puede mejorarse, ya que una unidad de decodificacion que se determina que esta en un modo de salto no puede dividirse.
En la operacion 2040, las estructuras divididas de una unidad de decodificacion maxima que incluye la unidad de decodificacion actual se determinan a base de la informacion de division con respecto a la unidad de decodificacion que no esta en un modo de salto.
La figura 23 es un diagrama de flujo que ilustra un proceso de division de una unidad de decodificacion maxima y un proceso de decodificacion de informacion de salto, de acuerdo con un procedimiento de decodificacion de una imagen, de acuerdo con otra realizacion de la presente invencion.
En referencia a la figura 23, la informacion de codificacion de las unidades de codificacion incluidas en una unidad de codificacion maxima se extrae en la operacion 2110. Como se ha descrito anteriormente, la informacion de codificacion incluye informacion de division e informacion de salto.
La informacion de salto se decodifica en la operacion 2120, y se determina si un modo de prediccion de una unidad de decodificacion actual es un modo de salto de acuerdo con la informacion de salto decodificada en la operacion 2130. Si el modo de prediccion de la unidad de decodificacion actual es un modo de salto, se determina si la unidad de decodificacion actual es la ultima unidad de decodificacion en la operacion 2135. Si es la ultima unidad de decodificacion, una siguiente unidad de decodificacion maxima se decodifica en la operacion 2140, y si no es la ultima unidad de decodificacion, una siguiente unidad de decodificacion se decodifica aumentando un mdice de una unidad de decodificacion en una operacion 2145. Si el modo de prediccion de la unidad de decodificacion actual no es un modo de salto, la informacion de division de la unidad de decodificacion actual se decodifica en la operacion 2150.
Se determina si una unidad de decodificacion maxima se divide de acuerdo con un conjunto de profundidad basado en la informacion de division decodificada a una unidad de decodificacion actual que tiene la profundidad, en la operacion 2160. Por ejemplo, como se ha descrito anteriormente, si la unidad de decodificacion actual es una unidad de decodificacion que tiene una profundidad de 2 y una informacion de division de "11", la unidad de decodificacion actual debena ser una unidad de codificacion obtenida dividiendo la unidad de decodificacion maxima dos veces.
Si se determina que la unidad de decodificacion maxima no se divide hasta la profundidad de la unidad de decodificacion actual en la operacion 2160, una profundidad aumenta en uno en la operacion 2180, y si se determina que la unidad de decodificacion maxima se divide hasta la profundidad de la unidad de decodificacion actual en la operacion 2160, la informacion sobre los datos de imagen distinta de la informacion de division y salto se decodifica en la operacion 2170.
Otros aspectos utiles para la comprension, se describen en los siguientes parrafos numerados:
1. Un procedimiento de codificacion de una imagen, comprendiendo el procedimiento: dividir una imagen actual en al menos una unidad de codificacion maxima;
determinar una estructura dividida de la al menos una unidad de codificacion maxima y un modo de prediccion de cada unidad de codificacion codificando los datos de imagen de la al menos una unidad de codificacion maxima basada en unidades de codificacion mas profundas segun las profundidades, que se dividen jerarquicamente a medida que se profundiza una profundidad;
establecer la informacion de division sobre la division de una unidad de codificacion de una profundidad superior que incluye cada unidad de codificacion, de acuerdo con cada unidad de codificacion;
establecer informacion de salto que indica si la informacion de prediccion determinada es un modo de salto, de acuerdo con cada unidad de codificacion; y
codificar la informacion de division y la informacion de salto, que se establecen de acuerdo con cada unidad de codificacion.
2. El procedimiento del parrafo 1, en el que la determinacion de la estructura dividida y el modo de prediccion comprende determinar la estructura dividida y el modo de prediccion usando un modo de profundidad y prediccion que tiene el menor error de codificacion basado en un resultado de codificacion de los datos de imagen de al menos una unidad de codificacion maxima basada en la unidad de codificacion mas profunda.
5
10
15
20
25
30
35
40
45
50
3. El procedimiento del parrafo 1, en el que la configuracion de la informacion de division comprende, cuando d indica una profundidad maxima que indica un numero de tiempos de division jerarquica de una altura y una anchura de una unidad de codificacion actual desde la unidad de codificacion maxima a una unidad de codificacion minima y n indica una profundidad codificada de la unidad de codificacion actual, en el que d y n son respectivamente un numero entero y 0 < n < (d-1), estableciendo la division de unidades de codificacion de profundidad superior que incluye la unidad de codificacion actual usando informacion de division de n bits.
4. El procedimiento del parrafo 3, en el que cada bit de la informacion de division de n bits indica division de unidades de codificacion de profundidades superiores a la unidad de codificacion actual desde una profundidad de 0 a una profundidad de (n-1).
5. El procedimiento del parrafo 1, en el que la configuracion de la informacion de salto comprende establecer la informacion de salto utilizando 1 bit que indica si el modo de prediccion determinado de cada unidad de codificacion es un modo de salto.
6. Un procedimiento de codificacion de una imagen, comprendiendo el procedimiento: dividir una imagen actual en al menos una unidad de codificacion maxima;
determinar una estructura dividida de la al menos una unidad de codificacion maxima y un modo de prediccion de cada unidad de codificacion codificando los datos de imagen de la al menos una unidad de codificacion maxima basada en unidades de codificacion mas profundas segun las profundidades, que se dividen jerarquicamente a medida que se profundiza una profundidad;
establecer informacion de salto que indica si el modo de prediccion de cada unidad de codificacion y un modo de prediccion de una profundidad superior que incluye cada unidad de codificacion son cada uno un modo de salto, de acuerdo con cada unidad de codificacion;
establecer la informacion de division sobre la division de una unidad de codificacion de una profundidad superior que incluye cada unidad de codificacion, de acuerdo con cada unidad de codificacion; y
codificar la informacion de division y la informacion de salto, que se establecen de acuerdo con cada unidad de codificacion.
7. El procedimiento del parrafo 6, en el que la determinacion de la estructura dividida y el modo de prediccion comprende determinar la estructura dividida y el modo de prediccion usando un modo de profundidad y prediccion que tiene el menor error de codificacion basado en un resultado de codificacion de los datos de imagen de al menos una unidad de codificacion maxima basada en la unidad de codificacion mas profunda.
8. El procedimiento del parrafo 6, en el que la configuracion de la informacion de salto comprende, cuando d indica una profundidad maxima que indica un numero de tiempos de division jerarquica de una altura y una anchura de una unidad de codificacion actual desde la unidad de codificacion maxima a una unidad de codificacion minima y n indica una profundidad codificada de la unidad de codificacion actual, en el que d y n son respectivamente un entero y 0 < n < (d-1), estableciendo si el modo de prediccion de la unidad de codificacion actual y los modos de prediccion de unidades de codificacion (n-1) de profundidades superiores son cada uno un modo de salto utilizando informacion de salto de n bits.
9. El procedimiento del parrafo 8, en el que cada bit de la informacion de salto de n bits indica si los modos de prediccion de la unidad de codificacion actual y las unidades de codificacion (n-1) de profundidades superiores desde una profundidad de 1 a una profundidad de (n-1) son cada uno un modo de salto.
10. El procedimiento del parrafo 6, en el que la configuracion de la informacion de division comprende, cuando d indica una profundidad maxima que indica un numero de tiempos de division jerarquica de una altura y una anchura de una unidad de codificacion actual desde la unidad de codificacion maxima a una unidad de codificacion minima y n indica una profundidad codificada de la unidad de codificacion actual, en el que d y n son respectivamente un numero entero y 0 < n < (d-1), estableciendo la division de unidades de codificacion de profundidad superior que incluye la unidad de codificacion actual usando informacion de division de n bits.
11. El procedimiento del parrafo 10, en el que cada bit de la informacion de division de n bits indica division de unidades de codificacion de profundidades superiores a la unidad de codificacion actual desde una profundidad de 0 a una profundidad de (n-1).
12. Un procedimiento de decodificacion de una imagen, comprendiendo el procedimiento:
extraer informacion de division sobre la division de unidades de decodificacion de profundidades superiores, incluyendo una unidad de decodificacion actual a decodificar, a partir de datos de imagenes codificados de acuerdo con unidades de codificacion maximas basadas en unidades de codificacion mas profundas de acuerdo con las profundidades, que se dividen jerarquicamente a medida que se profundiza una profundidad;
5
10
15
20
25
30
35
40
45
50
extraer informacion de salto que indica si un modo de prediccion de la unidad de decodificacion actual es un modo de salto, a partir de los datos de imagen;
determinar estructuras divididas de una unidad de decodificacion maxima que incluye la unidad de decodificacion actual, segun la informacion de division;
determinar si el modo de prediccion de la unidad de decodificacion actual es un modo de salto de acuerdo con la informacion de salto.
13. El procedimiento del parrafo 12, en el que la informacion de division comprende, cuando d indica una profundidad maxima que indica un numero de tiempos de division jerarquica de una altura y una anchura de una unidad de codificacion actual desde la unidad de codificacion maxima a una unidad de codificacion minima y n indica una profundidad codificada de la unidad de codificacion actual, en el que d y n son respectivamente un numero entero y 0 < n < (d-1), informacion de division de n bits que indica la division de unidades de decodificacion de profundidad superior que incluye la unidad de decodificacion actual.
14. El procedimiento del parrafo 13, en el que cada bit de la informacion de division de n bits indica division de unidades de decodificacion de profundidades superiores a la unidad de decodificacion actual desde una profundidad de 0 a una profundidad de (n-1).
15. El procedimiento del parrafo 12, en el que la informacion de salto es informacion de 1 bit que indica si el modo de prediccion de la unidad de decodificacion actual es un modo de salto.
16. Un procedimiento de decodificacion de una imagen, comprendiendo el procedimiento:
extraer informacion de salto que indica si los modos de prediccion de una unidad de decodificacion actual a decodificar y las unidades de decodificacion de profundidades superiores, incluyendo la unidad de decodificacion actual, son cada uno un modo de salto, a partir de datos de imagenes codificados de acuerdo con unidades de codificacion maximas basadas en unidades de codificacion mas profundas de acuerdo con las profundidades, que se dividen jerarquicamente a medida que se profundiza una profundidad;
extraer informacion de division sobre la division de las unidades de decodificacion de profundidades superiores, incluida la unidad de decodificacion actual;
determinar si los modos de prediccion de la unidad de decodificacion actual y las unidades de decodificacion de profundidades superiores son cada uno un modo de salto de acuerdo con la informacion de salto extrafda; y
determinar estructuras divididas de una unidad de decodificacion maxima que incluye la unidad de decodificacion actual, segun la informacion de division.
17. El procedimiento del parrafo 16, en el que la informacion de salto comprende, cuando d indica una profundidad maxima que indica un numero de tiempos de division jerarquica de una altura y una anchura de una unidad de codificacion actual desde la unidad de codificacion maxima a una unidad de codificacion minima y n indica una profundidad codificada de la unidad de codificacion actual, en el que d y n son respectivamente un entero y 0 < n < (d-1), informacion de salto de n bits que indica si los modos de prediccion de la unidad de decodificacion actual y las unidades de decodificacion (n-1) de profundidades superiores son cada uno un modo de salto.
18. El procedimiento del parrafo 17, en el que cada bit de la informacion de salto de n bits indica si los modos de prediccion de la unidad de decodificacion actual y (n-1) decodifican unidades de profundidades superiores que la unidad de decodificacion actual desde una profundidad de 0 a una profundidad de (n-1) son cada uno un modo de salto.
19. El procedimiento del parrafo 16, en el que la informacion de division comprende, cuando d indica una profundidad maxima que indica un numero de tiempos de division jerarquica de una altura y una anchura de una unidad de codificacion actual desde la unidad de codificacion maxima a una unidad de codificacion minima y n indica una profundidad codificada de la unidad de codificacion actual, en el que d y n son respectivamente un numero entero y 0 < n < (d-1), informacion de division de n bits que indica la division de unidades de decodificacion de profundidad superior que incluye la unidad de decodificacion actual.
20. El procedimiento del parrafo 19, en el que cada bit de la informacion de division de n bits indica division de unidades de decodificacion de profundidades superiores a la unidad de decodificacion actual desde una profundidad de 0 a una profundidad de (n-1).
21. Un aparato para codificar una imagen, comprendiendo el aparato:
un divisor de unidad de codificacion maxima para dividir una imagen actual en al menos una unidad de codificacion maxima;
un determinador de profundidad codificado para determinar una estructura dividida de la al menos una unidad de
5
10
15
20
25
30
35
40
45
50
codificacion maxima y un modo de prediccion de cada unidad de codificacion codificando los datos de imagen de la al menos una unidad de codificacion maxima basada en unidades de codificacion mas profundas segun las profundidades, que se dividen jerarquicamente a medida que se profundiza una profundidad; y
una unidad de codificacion de informacion de codificacion para establecer la informacion de division sobre la division de una unidad de codificacion de una profundidad superior que incluye cada unidad de codificacion, de acuerdo con cada unidad de codificacion e informacion de salto que indica si la informacion de prediccion determinada es un modo de salto, de acuerdo con cada unidad de codificacion, y codificando la informacion de division del conjunto y la informacion de salto.
22. Un aparato para codificar una imagen, comprendiendo el aparato:
un divisor de unidad de codificacion maxima para dividir una imagen actual en al menos una unidad de codificacion maxima;
un determinador de profundidad codificado para determinar una estructura dividida de la al menos una unidad de codificacion maxima y un modo de prediccion de cada unidad de codificacion codificando los datos de imagen de la al menos una unidad de codificacion maxima basada en unidades de codificacion mas profundas segun las profundidades, que se dividen jerarquicamente a medida que se profundiza una profundidad; y
una unidad de codificacion de informacion de codificacion para establecer informacion de salto que indica si el modo de prediccion de cada unidad de codificacion y un modo de prediccion de una profundidad superior, incluyendo cada unidad de codificacion un modo de salto y una informacion de division sobre la division de una unidad de codificacion de una profundidad superior que incluye cada unidad de codificacion,
de acuerdo con cada unidad de codificacion, y codificando la informacion de division del conjunto y la informacion de salto.
23. Un aparato para decodificar una imagen, comprendiendo el aparato:
un extractor de informacion de codificacion para extraer informacion de division sobre division de unidades de decodificacion de profundidades superiores que incluye una unidad de decodificacion actual a decodificar e informacion de salto que indica si un modo de prediccion de la unidad de decodificacion actual es un modo de salto, a partir de datos de imagenes codificados de acuerdo con unidades de codificacion maximas basadas en unidades de codificacion mas profundas de acuerdo con las profundidades, que se dividen jerarquicamente a medida que se profundiza una profundidad; y
una unidad de decodificacion para determinar estructuras divididas de una unidad de decodificacion maxima que incluye la unidad de decodificacion actual, de acuerdo con la informacion de division, y determinar si el modo de prediccion de la unidad de decodificacion actual es un modo de salto de acuerdo con la informacion de salto.
24. Un aparato para decodificar una imagen, comprendiendo el aparato:
un extractor de informacion de codificacion para extraer informacion de salto que indica si los modos de prediccion de una unidad de decodificacion actual a decodificar y las unidades de decodificacion de profundidades superiores incluyendo la unidad de decodificacion actual son cada una un modo de salto e informacion de division sobre division de las unidades de decodificacion de profundidades superiores, incluyendo la unidad de decodificacion actual, a partir de datos de imagen codificados de acuerdo con unidades de codificacion maxima basadas en unidades de codificacion mas profundas de acuerdo con las profundidades, que se dividen jerarquicamente a medida que se profundiza una profundidad; y
una unidad de decodificacion para determinar si los modos de prediccion de la unidad de decodificacion actual y las unidades de decodificacion de profundidades superiores son cada una un modo de salto segun la informacion de salto extrafda, y determinar estructuras divididas de una unidad de decodificacion maxima que incluye la unidad de decodificacion actual, segun la informacion de division.
25. Un medio de grabacion legible por ordenador que tiene grabado en el mismo un programa para ejecutar el procedimiento del parrafo 1.
26. Un medio de grabacion legible por ordenador que tiene grabado en el mismo un programa para ejecutar el procedimiento del parrafo 6.
27. Un medio de grabacion legible por ordenador que tiene grabado en el mismo un programa para ejecutar el procedimiento del parrafo 12.
28. Un medio de grabacion legible por ordenador que tiene grabado en el mismo un programa para ejecutar el procedimiento del parrafo 16.
Aunque la presente invencion se ha mostrado y descrito en particular con referencia a realizaciones espedficas de la misma, se entendera que la invencion se define por la siguiente reivindicacion. Las realizaciones de ejemplo deben considerarse en un sentido descriptivo solamente y no por motivos de limitacion. Por lo tanto, el alcance de la invencion no esta definido por la descripcion detallada de la invencion, sino por la siguiente reivindicacion.

Claims (1)

  1. 5
    10
    15
    20
    25
    30
    35
    40
    REIVINDICACIONES
    1. Un aparato para decodificar una imagen, comprendiendo el aparato:
    un extractor de informacion de codificacion configurado para extraer, de un flujo de bits, informacion sobre un tamano maximo de una unidad de codificacion, informacion de division que indica si dividir una unidad de codificacion de una profundidad i, donde i es un numero entero, en unidades de codificacion de una profundidad i+1, informacion de salto que indica si un modo de prediccion de una unidad de codificacion actual es un modo de salto, una informacion de tipo de particion que indica un tamano de una o mas unidades de prediccion incluidas en la unidad de codificacion actual y una informacion de tamano de unidad de transformacion; y
    un descodificador de datos de imagen configurado para determinar una estructura dividida de una unidad de codificacion maxima en forma cuadrada segun la informacion de division, cuando la informacion de salto indica que el modo de prediccion de la unidad de codificacion actual es el modo de salto, configurado para determinar la unidad de codificacion actual como una unidad de prediccion cuyo modo de prediccion es el modo de salto y cuando la informacion de salto indica que el modo de prediccion de la unidad de codificacion actual no es el modo de salto, configurado para obtener una o mas unidades de prediccion de la unidad de codificacion actual dividiendo por igual una anchura o una altura de la unidad de codificacion actual por dos, o dividiendo por igual la altura y la anchura de la unidad de codificacion actual por dos, o determinando la unidad de codificacion actual como la unidad de prediccion en base a la informacion de tipo de particion de la unidad de codificacion actual,
    en el que la imagen se divide en una pluralidad de unidades de codificacion maxima de forma cuadrada, de acuerdo con la informacion sobre el tamano maximo de la unidad de codificacion,
    una unidad de codificacion maxima a partir de la pluralidad de las unidades de codificacion maxima se divide jerarquicamente en una o mas unidades de codificacion de forma cuadrada de profundidades de acuerdo con la informacion de division,
    una unidad de codificacion de una profundidad actual k, donde k es un numero entero, es una de las unidades de datos de igual tamano y forma cuadrada dividida de una unidad de codificacion de una profundidad superior k-1,
    cuando la informacion de division indica una division para la unidad de codificacion de la profundidad actual k, la unidad de codificacion de la profundidad actual k se divide en cuatro unidades de codificacion de una profundidad inferior k + 1, dividiendo una altura y una anchura de la unidad de codificacion de la profundidad actual k por 2, independientemente de las unidades de codificacion vecinas, cuando la informacion de division indica una no division de la unidad de codificacion de la profundidad actual k, la unidad de codificacion de la profundidad actual k se determina como la unidad de codificacion actual que ya no esta dividida, se obtiene la informacion de salto de la unidad de codificacion actual, y una o mas unidades de transformacion con forma cuadrada utilizadas para realizar la transformacion inversa para la unidad de codificacion actual se obtienen de la unidad de codificacion actual basandose en la informacion de tamano de la unidad de transformacion, siendo la una o mas unidades de transformacion de forma cuadrada diferentes de la una o mas unidades de prediccion utilizadas para realizar la decodificacion de prediccion para la unidad de codificacion actual, y
    en el que, la informacion de salto de la unidad de codificacion actual se indica por un bit asignado a la unidad de codificacion actual.
ES15161957.4T 2009-07-24 2010-07-23 Aparato para decodificar imágenes Active ES2691983T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR20090067827 2009-07-24
KR1020090067827A KR101483750B1 (ko) 2009-07-24 2009-07-24 영상의 부호화 방법 및 장치, 영상 복호화 방법 및 장치

Publications (1)

Publication Number Publication Date
ES2691983T3 true ES2691983T3 (es) 2018-11-29

Family

ID=43499569

Family Applications (5)

Application Number Title Priority Date Filing Date
ES15161952.5T Active ES2691979T3 (es) 2009-07-24 2010-07-23 Aparato para decodificar imágenes
ES15161956.6T Active ES2691980T3 (es) 2009-07-24 2010-07-23 Procedimiento de decodificación de imágenes
ES10802493T Active ES2791705T3 (es) 2009-07-24 2010-07-23 Procedimiento de decodificación de una imagen
ES15161957.4T Active ES2691983T3 (es) 2009-07-24 2010-07-23 Aparato para decodificar imágenes
ES15161960.8T Active ES2691984T3 (es) 2009-07-24 2010-07-23 Procedimiento de decodificación de imágenes

Family Applications Before (3)

Application Number Title Priority Date Filing Date
ES15161952.5T Active ES2691979T3 (es) 2009-07-24 2010-07-23 Aparato para decodificar imágenes
ES15161956.6T Active ES2691980T3 (es) 2009-07-24 2010-07-23 Procedimiento de decodificación de imágenes
ES10802493T Active ES2791705T3 (es) 2009-07-24 2010-07-23 Procedimiento de decodificación de una imagen

Family Applications After (1)

Application Number Title Priority Date Filing Date
ES15161960.8T Active ES2691984T3 (es) 2009-07-24 2010-07-23 Procedimiento de decodificación de imágenes

Country Status (16)

Country Link
US (6) US8768081B2 (es)
EP (5) EP2911398B1 (es)
JP (6) JP5912079B2 (es)
KR (1) KR101483750B1 (es)
CN (7) CN104486620B (es)
CY (4) CY1120825T1 (es)
DK (4) DK2911401T3 (es)
ES (5) ES2691979T3 (es)
HR (4) HRP20181640T1 (es)
HU (5) HUE043026T2 (es)
LT (4) LT2911399T (es)
PL (5) PL2911401T3 (es)
PT (4) PT2911398T (es)
SI (4) SI2911401T1 (es)
TR (3) TR201815015T4 (es)
WO (1) WO2011010900A2 (es)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101483750B1 (ko) * 2009-07-24 2015-01-19 삼성전자주식회사 영상의 부호화 방법 및 장치, 영상 복호화 방법 및 장치
KR20110017719A (ko) 2009-08-14 2011-02-22 삼성전자주식회사 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치
KR101456498B1 (ko) * 2009-08-14 2014-10-31 삼성전자주식회사 계층적 부호화 단위의 스캔 순서를 고려한 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치
KR101457894B1 (ko) * 2009-10-28 2014-11-05 삼성전자주식회사 영상 부호화 방법 및 장치, 복호화 방법 및 장치
KR101675118B1 (ko) 2010-01-14 2016-11-10 삼성전자 주식회사 스킵 및 분할 순서를 고려한 비디오 부호화 방법과 그 장치, 및 비디오 복호화 방법과 그 장치
CN106131549B (zh) 2010-04-13 2019-04-05 三星电子株式会社 执行去块滤波的对视频进行解码的设备
KR101813189B1 (ko) * 2010-04-16 2018-01-31 에스케이 텔레콤주식회사 영상 부호화/복호화 장치 및 방법
KR20110123651A (ko) * 2010-05-07 2011-11-15 한국전자통신연구원 생략 부호화를 이용한 영상 부호화 및 복호화 장치 및 그 방법
KR20120035096A (ko) 2010-10-04 2012-04-13 한국전자통신연구원 쿼드 트리 변환 구조에서 부가 정보의 시그널링 방법 및 장치
US10148974B2 (en) * 2011-03-10 2018-12-04 Sharp Kabushiki Kaisha Image decoding device, image encoding device, and data structure of encoded data
AU2012278484B2 (en) 2011-07-01 2016-05-05 Samsung Electronics Co., Ltd. Method and apparatus for entropy encoding using hierarchical data unit, and method and apparatus for decoding
US20130188719A1 (en) * 2012-01-20 2013-07-25 Qualcomm Incorporated Motion prediction in svc using motion vector for intra-coded block
WO2016175334A1 (ja) * 2015-04-30 2016-11-03 真旭 徳山 端末装置およびコンピュータプログラム
WO2016178485A1 (ko) * 2015-05-05 2016-11-10 엘지전자 주식회사 영상 코딩 시스템에서 코딩 유닛 처리 방법 및 장치
US10009620B2 (en) 2015-06-22 2018-06-26 Cisco Technology, Inc. Combined coding of split information and other block-level parameters for video coding/decoding
US10003807B2 (en) 2015-06-22 2018-06-19 Cisco Technology, Inc. Block-based video coding using a mixture of square and rectangular blocks
US10735720B2 (en) * 2016-06-24 2020-08-04 Kt Corporation Method and apparatus for processing video signal
CN113711611B (zh) * 2019-04-19 2024-03-19 字节跳动有限公司 用于变换跳过模式中的系数编解码的方法、装置和介质
CN113906753B (zh) 2019-04-24 2023-12-01 字节跳动有限公司 编解码视频的量化残差差分脉冲编解码调制表示的约束
EP3949387A4 (en) 2019-05-02 2022-05-18 ByteDance Inc. SIGNALING IN A TRANSFORM JUMP MODE

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5347305A (en) 1990-02-21 1994-09-13 Alkanox Corporation Video telephone system
US5021891A (en) * 1990-02-27 1991-06-04 Qualcomm, Inc. Adaptive block size image compression method and system
KR960013055A (ko) * 1994-09-27 1996-04-20 김광호 조건부 퀴드트리 분할방식의 화상압축방법 및 장치
WO1997017797A2 (en) * 1995-10-25 1997-05-15 Sarnoff Corporation Apparatus and method for quadtree based variable block size motion estimation
US6668091B1 (en) * 1998-10-02 2003-12-23 Samsung Electronics Co., Ltd. 3D mesh coding/decoding method
US7302006B2 (en) * 2002-04-30 2007-11-27 Hewlett-Packard Development Company, L.P. Compression of images and image sequences through adaptive partitioning
HUP0301368A3 (en) * 2003-05-20 2005-09-28 Amt Advanced Multimedia Techno Method and equipment for compressing motion picture data
KR100682912B1 (ko) * 2005-01-05 2007-02-15 삼성전자주식회사 화상 데이터 부호화 및 복호화 방법 및 장치
WO2006106039A1 (en) * 2005-04-06 2006-10-12 Thomson Licensing Method and apparatus for encoding enhancement layer video data
KR101276720B1 (ko) 2005-09-29 2013-06-19 삼성전자주식회사 카메라 파라미터를 이용하여 시차 벡터를 예측하는 방법,그 방법을 이용하여 다시점 영상을 부호화 및 복호화하는장치 및 이를 수행하기 위한 프로그램이 기록된 기록 매체
CN101455087B (zh) * 2006-05-24 2011-01-12 松下电器产业株式会社 图像编码装置、图像编码方法及图像编码用集成电路
KR101382101B1 (ko) * 2006-08-25 2014-04-07 톰슨 라이센싱 감소된 해상도의 파티셔닝을 위한 방법 및 장치
KR20080066522A (ko) * 2007-01-11 2008-07-16 삼성전자주식회사 다시점 영상의 부호화, 복호화 방법 및 장치
CN101022555B (zh) * 2007-02-12 2010-12-08 清华大学 帧间预测编码的模式快速选择方法
KR101366241B1 (ko) 2007-03-28 2014-02-21 삼성전자주식회사 영상 부호화, 복호화 방법 및 장치
JP2010524396A (ja) * 2007-04-12 2010-07-15 トムソン ライセンシング ビデオエンコーダにおける高速な幾何学的なモードの判定方法及び装置
KR100771640B1 (ko) 2007-04-24 2007-10-30 주식회사세오 고속 모드 결정 기능을 구비한 h.264 인코더
US8917775B2 (en) 2007-05-02 2014-12-23 Samsung Electronics Co., Ltd. Method and apparatus for encoding and decoding multi-view video data
JP4964689B2 (ja) * 2007-06-25 2012-07-04 日本電信電話株式会社 画像符号化方法,画像復号方法,画像符号化装置,画像復号装置,画像符号化プログラム,画像復号プログラムおよびコンピュータ読み取り可能な記録媒体
CN101415115B (zh) * 2007-10-15 2011-02-02 华为技术有限公司 基于运动跳跃模式的视频编解码方法及其编解码器
CN101217663B (zh) * 2008-01-09 2010-09-08 上海华平信息技术股份有限公司 用于编码器的图像像素块编码模式的快速选择方法
WO2010041855A2 (en) * 2008-10-06 2010-04-15 Lg Electronics Inc. A method and an apparatus for processing a video signal
CN101404774B (zh) 2008-11-13 2010-06-23 四川虹微技术有限公司 运动搜索中宏块划分模式的选择方法
KR101483750B1 (ko) 2009-07-24 2015-01-19 삼성전자주식회사 영상의 부호화 방법 및 장치, 영상 복호화 방법 및 장치
BR112013000556A2 (pt) * 2010-07-09 2019-09-24 Samsung Electronics Co Ltd método para decodificar um vídeo usando um processador de decodificação de vídeo, método para codificar um vídeo usando um processador de codificação de vídeo, aparaleho de decodificação de vídeo em relação a um processador de decodificação de vídeo, aparelho de codificação de vídeo em relação com um processador de codificação de vídeo, e meio de gravação legível por computador
WO2012005520A2 (en) * 2010-07-09 2012-01-12 Samsung Electronics Co., Ltd. Method and apparatus for encoding video by using block merging, and method and apparatus for decoding video by using block merging
WO2012176464A1 (ja) * 2011-06-24 2012-12-27 パナソニック株式会社 画像復号方法、画像符号化方法、画像復号装置、画像符号化装置及び画像符号化復号装置

Also Published As

Publication number Publication date
ES2691984T3 (es) 2018-11-29
CN104486621B (zh) 2016-06-01
US20150139562A1 (en) 2015-05-21
LT2911401T (lt) 2018-11-12
SI2911399T1 (sl) 2018-11-30
CN102474609B (zh) 2015-02-04
CN104506864A (zh) 2015-04-08
CN104486621A (zh) 2015-04-01
HRP20181642T1 (hr) 2018-12-14
US20140254948A1 (en) 2014-09-11
TR201815015T4 (tr) 2018-11-21
EP2458860A2 (en) 2012-05-30
EP2911398A1 (en) 2015-08-26
CN104469363B (zh) 2017-05-03
HUE041711T2 (hu) 2019-05-28
HRP20181643T1 (hr) 2018-12-14
ES2691980T3 (es) 2018-11-29
HRP20181644T1 (hr) 2018-12-14
JP6076414B2 (ja) 2017-02-08
EP2911400A1 (en) 2015-08-26
ES2691979T3 (es) 2018-11-29
HUE043026T2 (hu) 2019-07-29
PT2911399T (pt) 2018-11-07
TR201815012T4 (tr) 2018-11-21
US20120128260A1 (en) 2012-05-24
CN104469364B (zh) 2018-04-20
CN104506865B (zh) 2017-04-05
PT2911400T (pt) 2018-11-07
JP2015233305A (ja) 2015-12-24
PL2458860T3 (pl) 2020-07-13
DK2911398T3 (en) 2018-11-05
LT2911400T (lt) 2018-11-12
EP2911401A1 (en) 2015-08-26
CN104486620B (zh) 2017-12-15
US9131231B2 (en) 2015-09-08
US20150016508A1 (en) 2015-01-15
LT2911398T (lt) 2018-11-12
SI2911401T1 (sl) 2018-11-30
PL2911398T3 (pl) 2018-12-31
JP2015233303A (ja) 2015-12-24
JP2015233306A (ja) 2015-12-24
JP2015233304A (ja) 2015-12-24
HRP20181640T1 (hr) 2018-12-14
EP2458860A4 (en) 2015-05-27
JP2013500622A (ja) 2013-01-07
CN104506865A (zh) 2015-04-08
EP2911398B1 (en) 2018-10-10
EP2911400B1 (en) 2018-10-10
PL2911399T3 (pl) 2019-03-29
US9516317B2 (en) 2016-12-06
DK2911399T3 (en) 2018-10-29
SI2911400T1 (sl) 2018-11-30
KR20110010324A (ko) 2011-02-01
JP6076415B2 (ja) 2017-02-08
EP2911399A1 (en) 2015-08-26
SI2911398T1 (sl) 2018-11-30
CN102474609A (zh) 2012-05-23
KR101483750B1 (ko) 2015-01-19
US20150326854A1 (en) 2015-11-12
JP5912079B2 (ja) 2016-04-27
CN104469364A (zh) 2015-03-25
US9137534B2 (en) 2015-09-15
HUE043030T2 (hu) 2019-07-29
PL2911400T3 (pl) 2018-12-31
EP2911401B1 (en) 2018-10-10
WO2011010900A3 (ko) 2011-05-26
DK2911401T3 (en) 2018-11-05
TR201814997T4 (tr) 2018-11-21
EP2911399B1 (en) 2018-10-10
US8768081B2 (en) 2014-07-01
CY1120823T1 (el) 2019-12-11
DK2911400T3 (en) 2018-11-05
US9131232B2 (en) 2015-09-08
HUE041713T2 (hu) 2019-05-28
CN104506864B (zh) 2018-01-05
LT2911399T (lt) 2018-11-12
WO2011010900A2 (ko) 2011-01-27
US20150139561A1 (en) 2015-05-21
CY1120814T1 (el) 2019-12-11
CN104486620A (zh) 2015-04-01
HUE050282T2 (hu) 2020-11-30
JP2017212751A (ja) 2017-11-30
PT2911398T (pt) 2018-11-07
CY1120825T1 (el) 2019-12-11
JP6646019B2 (ja) 2020-02-14
US8885958B2 (en) 2014-11-11
EP2458860B1 (en) 2020-04-22
ES2791705T3 (es) 2020-11-05
JP6076416B2 (ja) 2017-02-08
CN104469363A (zh) 2015-03-25
PL2911401T3 (pl) 2019-03-29
CY1120858T1 (el) 2019-12-11
PT2911401T (pt) 2018-11-07

Similar Documents

Publication Publication Date Title
ES2691983T3 (es) Aparato para decodificar imágenes
ES2778655T3 (es) Procedimiento para decodificar vídeo considerando un orden de omisión y de división
ES2577116T3 (es) Procedimiento y aparato de codificación de vídeo, y procedimiento y aparato de decodificación de vídeo
RU2676456C1 (ru) Способ кодирования видео и устройство кодирования видео с использованием блоков предсказания на основании блоков кодирования, определенных в соответствии с древовидной структурой, и способ декодирования видео и устройство декодирования видео с использованием блоков предсказания на основании блоков кодирования, определенных в соответствии с древовидной структурой
ES2706573T3 (es) Procedimiento de decodificación de vídeo
ES2657197T3 (es) Aparato de decodificación de video con intra predicción
ES2613647T3 (es) Procedimiento y aparato de codificación de vídeo y procedimiento y aparato de decodificación de vídeo, basándose en estructura jerárquica de unidad de codificación
ES2683595T3 (es) Procedimiento y aparato de decodificación de vídeo mediante predicción de movimiento usando partición arbitraria
ES2647866T3 (es) Procedimiento de codificación de vídeo y aparato que usa unidad de transformación de estructura de árbol variable y procedimiento y aparato de decodificación de vídeo
ES2797423T3 (es) Procedimiento de codificación y decodificación de vídeo usando codificación aritmética con una señalización bidimensional del último coeficiente significativo
ES2733936T3 (es) Procedimiento de decodificación de vídeo en base a información de patrón de bloque codificado jerárquico
ES2793600T3 (es) Codificación de vídeo teniendo en cuenta la orden de exploración de unidades de codificación que tienen estructura jerárquica
ES2673893T3 (es) Procedimiento para decodificación por entropía de un vídeo
BR112012001687B1 (pt) Aparelho de decodificação de imagem