ES2668472T3 - Aparato de decodificación de una imagen usando unidades de transformación grandes - Google Patents

Aparato de decodificación de una imagen usando unidades de transformación grandes Download PDF

Info

Publication number
ES2668472T3
ES2668472T3 ES13167744.5T ES13167744T ES2668472T3 ES 2668472 T3 ES2668472 T3 ES 2668472T3 ES 13167744 T ES13167744 T ES 13167744T ES 2668472 T3 ES2668472 T3 ES 2668472T3
Authority
ES
Spain
Prior art keywords
unit
coding
transformation
prediction
depth
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES13167744.5T
Other languages
English (en)
Inventor
Tammy Lee
Woo-Jin Han
Jianle Chen
Hae-Kyung Jung
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Application granted granted Critical
Publication of ES2668472T3 publication Critical patent/ES2668472T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/24Systems for the transmission of television signals using pulse code modulation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/625Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using discrete cosine transform [DCT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Abstract

Un aparato de decodificación de imagen que comprende: un procesador operable para obtener, de una secuencia de bits recibida, información acerca de un tamaño máximo de una unidad de codificación, información acerca de una unidad de predicción en la unidad de codificación e información acerca de una unidad de transformación para transformación de la unidad de codificación; y un decodificador operable para determinar una pluralidad de unidades de codificación máxima cuadradas en una imagen usando la información acerca de un tamaño máximo de una unidad de codificación, y para determinar unidades de codificación cuadradas de una estructura de árbol que comprende unidades de codificación que ya no se dividen más entre las unidades de codificación divididas de una unidad de codificación máxima usando información acerca de unidades de codificación analizadas a partir de una secuencia de bits, para determinar al menos una unidad de predicción usando la información acerca de una unidad de predicción; y para determinar al menos una unidad de transformación usando la información acerca de una unidad de transformación, en el que: la unidad de codificación máxima entre la pluralidad de las unidades de codificación máxima se divide jerárquicamente en una o más unidades de codificación que incluyen al menos una de una unidad de codificación de una profundidad actual y una unidad de codificación de una profundidad mayor que la profundidad actual, la unidad de codificación de la profundidad actual se divide en cuatro unidades de codificación cuadradas de la profundidad mayor que la profundidad actual, independientemente de las unidades de codificación vecinas de la profundidad actual, y la unidad de codificación de la profundidad mayor que la profundidad actual se predice usando la al menos una unidad de predicción y se transforma a la inversa usando la unidad de transformación, en el que la al menos una unidad de predicción es una entre los bloques que incluyen: un bloque igual en tamaño a la unidad de codificación de la profundidad mayor que la profundidad actual; y un bloque entre una pluralidad de bloques generados dividiendo igualmente al menos una de la altura y anchura de la unidad de codificación de la profundidad mayor que la profundidad actual, en el que la al menos una unidad de transformación es una entre los bloques que incluyen: un bloque igual en tamaño a la unidad de codificación de la profundidad mayor que la profundidad actual; y un bloque entre una pluralidad de bloques generados dividiendo la altura y anchura de la unidad de codificación de la profundidad mayor que la profundidad actual, y caracterizado porque el aparato de decodificación está configurado para soportar una unidad de transformación, entre la al menos una unidad de transformación, que tiene un tamaño de 2Nx2N que incluye cuatro unidades de predicción que tienen un tamaño de NxN.

Description

5
10
15
20
25
30
35
40
45
DESCRIPCION
Aparato de decodificación de una imagen usando unidades de transformación grandes rCampo técnico]
Las realizaciones ejemplares se refieren a un aparato para decodificar una imagen.
Antecedentes de la técnica]
Para realizar compresión de imagen, la mayoría de los procedimientos y aparatos de codificación y decodificación de imágenes codifican una imagen transformando una imagen de un dominio de píxel en coeficientes de un dominio de frecuencia. Una transformada de coseno discreta (DCT), que es una de las técnicas de transformada de frecuencia, es una técnica bien conocida que se usa ampliamente en compresión de imagen o sonido. Un procedimiento de codificación de imagen que usa la DCT implica realizar la DCT en una imagen de un dominio de píxel, generar coeficientes de coseno discretos, cuantificar los coeficientes de coseno discretos generados, y realizar codificación por entropía en los coeficientes de coseno discretos generados.
En la norma de codificación de vídeo H.264/AVC (véase Wiegand y col: “Overview of the H.264/ AVC video coding standard”, IEEE Transactions on Circuits and Systems for Video Technology, vol. 13, n.° 7, 1 de julio 2003, páginas 560-576) una imagen se divide en macrobloques de tamaño 16x16. Para predicción de movimiento compensado se soportan particiones de macrobloques de tamaño 16x16, 16x8, 8x16 y 8x8 y las particiones de 8x8 pueden dividirse adicionalmente en particiones de 8x4, 4x8 o 4x4 si se indican por un elemento de sintaxis. Se aplica la transformada de números enteros de 4x4 de tamaño fijo independientemente del tamaño de las particiones usadas para predicción.
rDivulgación]
A continuación, la expresión “realización ejemplar” debería entenderse como que significa “ejemplo”. rSolución técnica]
Las realizaciones ejemplares proporcionan un aparato para decodificar una imagen. rEfectos ventajosos]
De acuerdo con la una o más realizaciones ejemplares, es posible establecer la unidad de transformación para que sea mayor que la unidad de predicción, y para realizar la DCT, de modo que una imagen pueda comprimirse y codificarse de manera eficaz.
[Descripción de los dibujos]
Las anteriores y otras características de las realizaciones ejemplares se harán más evidentes describiendo en detalle realizaciones ejemplares de las mismas con referencia a los dibujos adjuntos en los que:
La Figura 1 es un diagrama de bloques de un aparato de codificación de imagen de acuerdo con una realización ejemplar;
La Figura 2 es un diagrama de un aparato de decodificación de imagen de acuerdo con otra realización ejemplar;
La Figura 3 es un diagrama de una unidad de codificación jerárquica de acuerdo con otra realización ejemplar;
La Figura 4 es un diagrama de bloques de un codificador de imagen basado en una unidad de codificación de acuerdo con otra realización ejemplar;
La Figura 5 es un diagrama de bloques de un decodificador de imagen basado en una unidad de codificación de acuerdo con otra realización ejemplar;
La Figura 6 ilustra una unidad de codificación máxima, sub-unidades de codificación y unidades de predicción de acuerdo con otra realización ejemplar;
La Figura 7 es un diagrama de una unidad de codificación y una unidad de transformación de acuerdo con otra realización ejemplar;
Las Figuras 8A y 8B ilustran formas de división de una unidad de codificación máxima, una unidad de predicción y una unidad de transformación de acuerdo con otra realización ejemplar;
La Figura 9 es un diagrama de bloques de un aparato de codificación de imagen de acuerdo con otra realización ejemplar;
5
10
15
20
25
30
35
40
45
50
La Figura 10 es un diagrama del transformador;
La Figura 12 ilustra diferentes unidades de transformación de acuerdo con otra realización ejemplar;
La Figura 13 es un diagrama de bloques de un aparato de decodificación de imagen de acuerdo con otra realización ejemplar; y
La Figura 14 es un diagrama de flujo de un procedimiento de codificación de imagen, de acuerdo con una realización ejemplar.
La Figura 15 es un diagrama de flujo de un procedimiento de decodificación de imagen, de acuerdo con otra realización ejemplar.
rMeior modo]
De acuerdo con una realización ejemplar, se proporciona un aparato de decodificación de imagen como se expone en la reivindicación adjunta 1.
rModo para la invención]
En lo sucesivo, las realizaciones ejemplares se describirán en detalle con referencia a los dibujos adjuntos. En las realizaciones ejemplares, “unidad” puede o no hacer referencia a una unidad de tamaño, dependiendo de su contexto e “imagen” puede indicar una imagen fija para un vídeo o una imagen en movimiento, es decir, el mismo vídeo.
La Figura 1 es un diagrama de bloques de un aparato 100 para codificar una imagen, de acuerdo con una realización ejemplar.
Haciendo referencia a la Figura 1, el aparato 100 incluye una unidad 110 de división de unidad de codificación máxima, una unidad 120 de determinación de profundidad de codificación, un codificador 130 de datos de imagen y un codificador 140 de información de codificación.
La unidad 110 de división de unidad de codificación máxima puede dividir una instantánea o corte actual basándose en una unidad de codificación máxima que es una unidad de codificación del tamaño más grande. Es decir, la unidad 110 de división de unidad de codificación máxima puede dividir la instantánea o corte actual para obtener al menos una unidad de codificación máxima.
De acuerdo con una realización ejemplar, una unidad de codificación puede representarse usando una unidad de codificación máxima y una profundidad. Como se ha descrito anteriormente, la unidad de codificación máxima indica una unidad de codificación que tiene el tamaño más grande entre las unidades de codificación de la instantánea actual, y la profundidad indica el tamaño de una subunidad de codificación obtenida reduciendo jerárquicamente la unidad de codificación. A medida que una profundidad se hace profunda, una unidad de codificación puede reducirse en tamaño desde una unidad de codificación máxima a una unidad de codificación mínima, en el que una profundidad de la unidad de codificación máxima se define como una profundidad mínima y una profundidad de la unidad de codificación mínima se define como una profundidad máxima. Puesto que el tamaño de una unidad de codificación se reduce desde una unidad de codificación máxima a medida que una profundidad se hace profunda, una subunidad de codificación de una profundidad de orden k puede incluir una pluralidad de subunidades de codificación de una profundidad de orden (k+n) (k y n son números enteros iguales a o mayores que 1).
De acuerdo con un aumento del tamaño de una instantánea a codificarse, codificar una imagen en una unidad de codificación mayor puede dar como resultado una relación de compresión de imagen superior. Sin embargo, si se fija una unidad de codificación mayor, una imagen no puede codificarse eficazmente teniendo en cuenta las características de la imagen que cambian de manera continua.
Por ejemplo, cuando se codifica un área suave tal como el mar o el cielo, cuanto más grande es una unidad de codificación, puede aumentar la relación de compresión. Sin embargo, cuando se codifica un área compleja tal como personas o edificios, cuanto menor es una unidad de codificación, más puede aumentar una relación de compresión.
Por consiguiente, de acuerdo con una realización ejemplar, una unidad de codificación de imagen máxima diferente y una profundidad máxima diferente se establecen para cada instantánea o corte. Puesto que una profundidad máxima indica el número máximo de veces por las que puede reducirse una unidad de codificación, el tamaño de cada unidad de codificación mínima incluida en una unidad de codificación de imagen máxima puede establecerse de manera variable de acuerdo con una profundidad máxima.
La unidad 120 de determinación de profundidad de codificación determina una profundidad máxima. La profundidad máxima puede determinarse basándose en el cálculo del coste Tasa-Distorsión (R-D). La profundidad máxima puede determinarse de manera diferente para cada instantánea o corte o para cada unidad de codificación máxima.
5
10
15
20
25
30
35
40
45
50
55
La profundidad máxima indica una unidad de codificación que tiene el tamaño más pequeño, que puede incluirse en una unidad de codificación máxima, es decir, una unidad de codificación mínima. En otras palabras, una unidad de codificación máxima puede dividirse en subunidades de codificación que tienen diferentes tamaños de acuerdo con diferentes profundidades. Esto se describe en detalle más adelante con referencia a las Figuras 8A y 8B. Además, las subunidades de codificación que tienen diferentes tamaños, que se incluyen en la unidad de codificación máxima, pueden predecirse o transformarse basándose en unidades de procesamiento que tienen diferentes tamaños. En otras palabras, el aparato 100 puede realizar una pluralidad de operaciones de procesamiento para codificación de imagen basándose en unidades de procesamiento que tienen diversos tamaños y diversas formas. Para codificar datos de imagen, se realizan operaciones de procesamiento tales como predicción, transformación y codificación por entropía, en las que las unidades de procesamiento que tienen el mismo tamaño pueden usarse para cada operación o las unidades de procesamiento que tienen diferentes tamaños pueden usarse para cada operación.
Por ejemplo, el aparato 100 puede seleccionar una unidad de procesamiento que es diferente de una unidad de codificación para predecir la unidad de codificación.
Cuando el tamaño de una unidad de codificación es 2N*2N (donde N es un número entero positivo), las unidades de procesamiento para predicción pueden ser 2N*2N, 2N*N, N*2N y N*N. En otras palabras, puede realizarse predicción de movimiento basándose en una unidad de procesamiento que tiene una forma mediante la cual al menos una de la altura y anchura de una unidad de codificación se divide igualmente en dos. En lo sucesivo, una unidad de procesamiento, que es la base de la predicción, se define como una 'unidad de predicción'.
Un modo de predicción puede ser al menos uno de un intra modo, un inter modo y un modo de salto y un modo de predicción específico puede realizarse para únicamente una unidad de predicción que tiene un tamaño o forma específicos. Por ejemplo, el intra modo puede realizarse para únicamente unidades de predicción que tienen los tamaños de 2N*2N y N*N de los cuales la forma es un cuadrado. Además, el modo de salto puede realizarse para únicamente una unidad de predicción que tiene el tamaño de 2N*2N. Si existe una pluralidad de unidades de predicción en una unidad de codificación, el modo de predicción con los mínimos errores de codificación puede seleccionarse después de realizar la predicción para cada unidad de predicción.
Como alternativa, el aparato 100 puede realizar transformación de frecuencia en datos de imagen basándose en una unidad de procesamiento que tiene un tamaño diferente de una unidad de codificación. Para la transformación de frecuencia en la unidad de codificación, la transformación de frecuencia puede realizarse basándose en una unidad de procesamiento que tiene un tamaño igual a o menor que el de la unidad de codificación. En lo sucesivo, una unidad de procesamiento, que es la base de la transformación de frecuencia, se define como una 'unidad de transformación'. La transformación de frecuencia puede ser una Transformada de Coseno Discreta (DCT) o una Transformada de Karhunen Loeve (KLT).
La unidad 120 de determinación de profundidad de codificación puede determinar subunidades de codificación incluidas en una unidad de codificación máxima usando optimización de RD en un multiplicador Langraniano. En otras palabras, la unidad 120 de determinación de profundidad de codificación puede determinar las formas de una pluralidad de subunidades de codificación divididas desde la unidad de codificación máxima, en las que la pluralidad de subunidades de codificación tienen diferentes tamaños de acuerdo con sus profundidades. El codificador 130 de datos de imagen emite una secuencia de bits codificando la unidad de codificación máxima basándose en las formas de división, es decir, las formas que dividen la unidad de codificación máxima, según se determina por la unidad 120 de determinación de profundidad de codificación.
El codificador 140 de información de codificación codifica información acerca de un modo de codificación de la unidad de codificación máxima determinada por la unidad 120 de determinación de profundidad de codificación. En otras palabras, el codificador 140 de información de codificación emite una secuencia de bits codificando información acerca de una forma de división de la unidad de codificación máxima, información acerca de la profundidad máxima e información acerca de un modo de codificación de una subunidad de codificación para cada profundidad. La información acerca del modo de codificación de la subunidad de codificación puede incluir información acerca de una unidad de predicción de la subunidad de codificación, información acerca de un modo de predicción para cada unidad de predicción e información acerca de una unidad de transformación de la subunidad de codificación.
Puesto que existen subunidades de codificación que tienen diferentes tamaños para cada unidad de codificación máxima y la información acerca de un modo de codificación debe determinarse para cada subunidad de codificación, la información acerca de al menos un modo de codificación puede determinarse para una unidad de codificación máxima.
El aparato 100 puede generar subunidades de codificación dividiendo igualmente tanto la altura como anchura de una unidad de codificación máxima en dos de acuerdo con un aumento de la profundidad. Es decir, cuando el tamaño de una unidad de codificación de una profundidad de orden k es 2N*2N, el tamaño de una unidad de
5
10
15
20
25
30
35
40
45
50
55
codificación de una profundidad de orden (k+1) es NxN.
Por consiguiente, el aparato 100 de acuerdo con una realización ejemplar puede determinar una forma de división óptima para cada unidad de codificación máxima basándose en tamaños de unidades de codificación máxima y una profundidad máxima en consideración de las características de imagen. Ajustando de manera variable el tamaño de una unidad de codificación máxima en consideración de las características de imagen y codificando una imagen a través de la división de una unidad de codificación máxima en subunidades de codificación de diferentes profundidades, pueden codificarse más eficazmente imágenes que tienen diversas resoluciones.
La Figura 2 es un diagrama de bloques de un aparato 200 para decodificar una imagen de acuerdo con una realización ejemplar.
Haciendo referencia a la Figura 2, el aparato 200 incluye una unidad 210 de obtención de datos de imagen, una unidad 220 de extracción de información de codificación y un decodificador 230 de datos de imagen.
La unidad 210 de obtención de datos de imagen obtiene datos de imagen de acuerdo con unidades de codificación máxima analizando una secuencia de bits recibida por el aparato 200 y emite los datos de imagen al decodificador 230 de datos de imagen. La unidad 210 de obtención de datos de imagen puede extraer información acerca de una unidad de codificación máxima de una instantánea o corte actual desde un encabezamiento de la instantánea o corte actual. En otras palabras, la unidad 210 de obtención de datos de imagen divide la secuencia de bits en la unidad de codificación máxima de modo que el decodificador 230 de datos de imagen puede decodificar los datos de imagen de acuerdo con las unidades de codificación máxima.
La unidad 220 de extracción de información de codificación extrae información acerca de una unidad de codificación máxima, una profundidad máxima, una forma de división de la unidad de codificación máxima, un modo de codificación de subunidades de codificación desde el encabezamiento de la instantánea actual analizando la secuencia de bits recibida por el aparato 200. La información acerca de una forma de división y la información acerca de un modo de codificación se proporcionan al decodificador 230 de datos de imagen.
La información acerca de una forma de división de la unidad de codificación máxima puede incluir información acerca de subunidades de codificación que tienen diferentes tamaños de acuerdo con las profundidades incluidas en la unidad de codificación máxima, y la información acerca de un modo de codificación puede incluir información acerca de una unidad de predicción de acuerdo con la subunidad de codificación, información acerca de un modo de predicción e información acerca de unas unidades de transformación.
El decodificador 230 de datos de imagen restaura la instantánea actual decodificando datos de imagen de cada unidad de codificación máxima basándose en la información extraída por la unidad 220 de extracción de información de codificación. El decodificador 230 de datos de imagen puede decodificar subunidades de codificación incluidas en una unidad de codificación máxima basándose en la información acerca de una forma de división de la unidad de codificación máxima. Un procedimiento de decodificación puede incluir un procedimiento de predicción que incluye intra predicción y compensación de movimiento y un procedimiento de transformación inversa.
El decodificador 230 de datos de imagen puede realizar intra predicción o inter predicción basándose en información acerca de una unidad de predicción e información acerca de un modo de predicción para predecir una unidad de predicción. El decodificador 230 de datos de imagen puede realizar también transformación inversa para cada subunidad de codificación basándose en información acerca de una unidad de transformación de una subunidad de codificación.
La Figura 3 ilustra unidades de codificación jerárquica de acuerdo con una realización ejemplar.
Haciendo referencia a la Figura 3, las unidades de codificación jerárquica de acuerdo con una realización ejemplar pueden incluir unidades de codificación cuyas anchuras x alturas son 64x64, 32x32, 16x16, 8x8 y 4x4. Aparte de estas unidades de codificación que tienen formas cuadradas perfectas, pueden existir también unidades de codificación cuyas anchuras x alturas son 64x32, 32x64, 32x16, 16x32, 16x8, 8x16, 8x4 y 4x8.
Haciendo referencia a la Figura 3, para datos 310 de imagen cuya resolución es 1920x1080, el tamaño de una unidad de codificación máxima se establece a 64x64 y una profundidad máxima se establece a 2.
Para datos 320 de imagen cuya resolución es 1920x1080, el tamaño de una unidad de codificación máxima se establece a 64x64, y una profundidad máxima se establece a 4. Para datos 330 de imagen cuya resolución es 352x288, el tamaño de una unidad de codificación máxima se establece a 16x16 y una profundidad máxima se establece a 1.
Cuando la resolución es alta o la cantidad de datos es grande, se proporciona, aunque no es necesario, que un tamaño máximo de una unidad de codificación sea relativamente grande para aumentar una relación de compresión y refleje exactamente las características de imagen. Por consiguiente, para los datos 310 y 320 de imagen que tienen resolución superior a los datos 330 de imagen, puede seleccionarse 64x64 como el tamaño de una unidad de codificación máxima.
5
10
15
20
25
30
35
40
45
50
55
Una profundidad máxima indica el número total de capas en las unidades de codificación jerárquica. Puesto que la profundidad máxima de los datos 310 de imagen es 2, una unidad 315 de codificación de los datos 310 de imagen puede incluir una unidad de codificación máxima cuyo tamaño de eje más largo es 64 y subunidades de codificación cuyos tamaños de eje más largos son 32 y 16, de acuerdo con un aumento de una profundidad.
Por otra parte, puesto que la profundidad máxima de los datos 330 de imagen es 1, una unidad 335 de codificación de los datos 330 de imagen puede incluir una unidad de codificación máxima cuyo tamaño de eje más largo es 16 y unidades de codificación cuyos tamaños de eje más largo son 8, de acuerdo con un aumento de una profundidad.
Sin embargo, puesto que la profundidad máxima de los datos 320 de imagen es 4, una unidad 325 de codificación de los datos 320 de imagen puede incluir una unidad de codificación máxima cuyo tamaño de eje más largo es 64 y subunidades de codificación cuyos tamaños de eje más largos son 32, 16, 8 y 4 de acuerdo con un aumento de una profundidad. Puesto que se codifica una imagen basándose en una subunidad de codificación más pequeña a medida que una profundidad se hace profunda, la realización ejemplar es adecuada para codificar una imagen que incluye más detalles minuciosos en las escenas.
La Figura 4 es un diagrama de bloques de un codificador 400 de imagen basado en una unidad de codificación, de acuerdo con una realización ejemplar.
Un intra predictor 410 realiza intra predicción en unidades de predicción del intra modo en un fotograma 405 actual, y una unidad 420 de estimación de movimiento y una unidad 425 de compensación de movimiento realizan inter predicción y compensación de movimiento en unidades de predicción del inter modo usando el fotograma 405 actual y un fotograma 495 de referencia.
Se generan valores residuales basándose en las unidades de predicción emitidas desde el intra predictor 410, la unidad 420 de estimación de movimiento y la unidad 425 de compensación de movimiento, y los valores residuales generados se emiten como coeficientes de transformada cuantificados pasando a través de un transformador 430 y una unidad 440 de cuantificación.
Los coeficientes de transformada cuantificados se restauran a valores residuales pasando a través de una unidad 460 de cuantificación inversa y un transformador 470 inverso de frecuencia, y los valores residuales restaurados se procesan posteriormente pasando a través de una unidad 480 de desbloqueo y una unidad 490 de filtración de bucle y se emiten como el fotograma 495 de referencia. Los coeficientes de transformada cuantificados pueden emitirse como una secuencia de bits 455 pasando a través de un codificador 450 por entropía.
Para realizar codificación basándose en un procedimiento de codificación de acuerdo con una realización ejemplar, los componentes del codificador 400 de imagen, es decir, el intra predictor 410, la unidad 420 de estimación de movimiento, la unidad 425 de compensación de movimiento, el transformador 430, la unidad 440 de cuantificación, el codificador 450 por entropía, la unidad 460 de cuantificación inversa, el transformador 470 inverso de frecuencia, la unidad 480 de desbloqueo y la unidad 490 de filtración en bucle, realizan procedimientos de codificación de imagen basándose en una unidad de codificación máxima, una subunidad de codificación de acuerdo con las profundidades, una unidad de predicción y una unidad de transformación.
La Figura 5 es un diagrama de bloques de un decodificador 500 de imagen basado en una unidad de codificación, de acuerdo con una realización ejemplar.
Una secuencia de bits 505 pasa a través de una unidad 510 de análisis de modo que se analiza los datos de imagen codificados a decodificarse y la información de codificación necesaria para decodificación. Los datos de imagen codificados se emiten como datos cuantificados a la inversa pasando a través de un decodificador 520 por entropía y una unidad 530 de cuantificación inversa y se restauran a valores residuales pasando a través de un transformador 540 inverso de frecuencia. Los valores residuales se restauran de acuerdo con unidades de codificación añadiéndose a un resultado de intra predicción de un intra predictor 550 o un resultado de compensación de movimiento de una unidad 560 de compensación de movimiento. Las unidades de codificación restauradas se usan para predicción de las siguientes unidades de codificación o de una siguiente instantánea pasando a través de una unidad 570 de desbloqueo y una unidad 580 de filtración de bucle.
Para realizar la decodificación basándose en un procedimiento de decodificación de acuerdo con una realización ejemplar, los componentes del decodificador 500 de imagen, es decir, la unidad 510 de análisis, el decodificador 520 por entropía, la unidad 530 de cuantificación inversa, el transformador 540 inverso de frecuencia, el intra predictor 550, la unidad 560 de compensación de movimiento, la unidad 570 de desbloqueo y la unidad de filtrado en bucle 580, realizan procedimientos de decodificación de imagen basándose en una unidad de codificación máxima, una subunidad de codificación de acuerdo con las profundidades, una unidad de predicción y una unidad de transformación.
En particular, el intra predictor 550 y la unidad 560 de compensación de movimiento determinan una unidad de predicción y un modo de predicción en una subunidad de codificación considerando una unidad de codificación máxima y una profundidad, y el transformador 540 inverso de frecuencia realiza transformación inversa considerando el tamaño de una unidad de transformación.
5
10
15
20
25
30
35
40
45
50
55
El aparato 100 y el aparato 200 de acuerdo con una realización ejemplar usan unidades de codificación jerárquica para realizar codificación y decodificación en consideración de las características de imagen. Una unidad de codificación máxima y una profundidad máxima pueden establecerse de manera adaptativa de acuerdo con las características de imagen o establecerse de manera variable de acuerdo con requisitos de un usuario.
Una estructura 600 de unidad de codificación jerárquica de acuerdo con una realización ejemplar ilustra una unidad 610 de codificación máxima cuya altura y anchura son 64 y la profundidad máxima es 4. Una profundidad aumenta a lo largo de un eje vertical de la estructura 600 de unidad de codificación jerárquica, y a medida que una profundidad se hace profunda, se reducen las alturas y anchuras de las subunidades 620 a 650 de codificación. Las unidades de predicción de la unidad 610 de codificación máxima y las subunidades 620 a 650 de codificación se muestran a lo largo de un eje horizontal de la estructura 600 de unidad de codificación jerárquica.
La unidad 610 de codificación máxima tiene una profundidad de 0 y el tamaño de una unidad de codificación, es decir, altura y anchura, de 64x64. Una profundidad aumenta a lo largo del eje vertical, y existe una subunidad 620 de codificación cuyo tamaño es 32x32 y profundidad es 1, una subunidad 630 de codificación cuyo tamaño es 16x16 y profundidad es 2, una subunidad 640 de codificación cuyo tamaño es 8x8 y profundidad es 3, y una subunidad 650 de codificación cuyo tamaño es 4x4 y profundidad es 4. La subunidad 650 de codificación cuyo tamaño es 4x4 y profundidad es 4 es una unidad de codificación mínima, y la unidad de codificación mínima puede dividirse en unidades de predicción, cada una de las cuales es menor que la unidad de codificación mínima.
Haciendo referencia a la Figura 6, se muestran ejemplos de una unidad de predicción a lo largo del eje horizontal de acuerdo con cada profundidad. Es decir, una unidad de predicción de la unidad 610 de codificación máxima cuya profundidad es 0 puede ser una unidad de predicción cuyo tamaño es igual a la unidad 610 de codificación, es decir, 64x64, o una unidad 612 de predicción cuyo tamaño es 64x32, una unidad 614 de predicción cuyo tamaño es 32x64, o una unidad 616 de predicción cuyo tamaño es 32x32, que tiene un tamaño menor que la unidad 610 de codificación cuyo tamaño es 64x64.
Una unidad de predicción de la unidad 620 de codificación cuya profundidad es 1 y el tamaño es 32x32 puede ser una unidad de predicción cuyo tamaño es igual a la unidad 620 de codificación, es decir, 32x32, o una unidad 622 de predicción cuyo tamaño es 32x16, una unidad 624 de predicción cuyo tamaño es 16x32, o una unidad 626 de predicción cuyo tamaño es 16x16, que tiene un tamaño menor que la unidad 620 de codificación cuyo tamaño es 32x32.
Una unidad de predicción de la unidad 630 de codificación cuya profundidad es 2 y el tamaño es 16x16 puede ser una unidad de predicción cuyo tamaño es igual a la unidad 630 de codificación, es decir, 16x16, o una unidad 632 de predicción cuyo tamaño es 16x8, una unidad 634 de predicción cuyo tamaño es 8x16, o una unidad 636 de predicción cuyo tamaño es 8x8, que tiene un tamaño menor que la unidad 630 de codificación cuyo tamaño es 16x16.
Una unidad de predicción de la unidad 640 de codificación cuya profundidad es 3 y el tamaño es 8x8 puede ser una unidad de predicción cuyo tamaño es igual a la unidad 640 de codificación, es decir, 8x8, o una unidad 642 de predicción cuyo tamaño es 8x4, una unidad 644 de predicción cuyo tamaño es 4x8, o una unidad 646 de predicción cuyo tamaño es 4x4, que tiene un tamaño menor que la unidad 640 de codificación cuyo tamaño es 8x8.
Finalmente, la unidad 650 de codificación cuya profundidad es 4 y el tamaño es 4x4 es una unidad de codificación mínima y una unidad de codificación de una profundidad máxima, y una unidad de predicción de la unidad 650 de codificación puede ser una unidad 650 de predicción cuyo tamaño es 4x4, una unidad 652 de predicción que tiene un tamaño de 4x2, una unidad 654 de predicción que tiene un tamaño de 2x4, o una unidad 656 de predicción que tiene un tamaño de 2x2.
La Figura 7 ilustra una unidad de codificación y una unidad de transformación, de acuerdo con una realización ejemplar.
El aparato 100 y el aparato 200, de acuerdo con una realización ejemplar, realizan codificación con una misma unidad de codificación máxima o con subunidades de codificación, que son iguales a o menores que la unidad de codificación máxima, divididas a partir de la unidad de codificación máxima.
En el procedimiento de codificación, el tamaño de una unidad de transformación para transformación de frecuencia se selecciona para que no sea mayor que el de una unidad de codificación correspondiente. Por ejemplo, cuando una unidad 710 de codificación tiene el tamaño de 64x64, puede realizarse transformación de frecuencia usando una unidad 720 de transformación que tiene el tamaño de 32x32.
Las Figuras 8A y 8B ilustran formas de división de una unidad de codificación, una unidad de predicción y una unidad de transformación, de acuerdo con una realización ejemplar.
5
10
15
20
25
30
35
40
45
50
55
El lado izquierdo de la Figura 8A muestra una forma de división seleccionada por el aparato 100, de acuerdo con una realización ejemplar, para codificar una unidad 810 de codificación máxima. El aparato 100 divide la unidad 810 de codificación máxima en diversas formas, realiza codificación y selecciona una forma de división óptima comparando resultados de codificación de diversas formas de división entre sí basándose en el coste de R-D. Cuando es óptimo codificar la unidad 810 de codificación máxima como está, la unidad 810 de codificación máxima puede codificarse sin dividir la unidad 810 de codificación máxima como se ilustra en las Figuras 8A y 8B.
Haciendo referencia al lado izquierdo de la Figura 8A, la unidad 810 de codificación máxima cuya profundidad es 0 se codifica dividiéndola en subunidades de codificación cuyas profundidades son igual a o mayores que 1. Es decir, la unidad 810 de codificación máxima se divide en 4 subunidades de codificación cuyas profundidades son 1, y todas o algunas de las subunidades de codificación cuyas profundidades son 1 se dividen en subunidades de codificación cuyas profundidades son 2.
Una subunidad de codificación localizada en un lado superior derecha y una subunidad de codificación localizada en un lado inferior izquierda entre las subunidades de codificación cuyas profundidades son 1 se dividen en subunidades de codificación cuyas profundidades son igual a o mayores que 2. Algunas de las subunidades de codificación cuyas profundidades son igual a o mayores que 2 pueden dividirse en subunidades de codificación cuyas profundidades son iguales a o mayores que 3.
El lado derecho de la Figura 8A muestra una forma de división de una unidad de predicción para la unidad 810 de codificación máxima.
Haciendo referencia al lado derecho de la Figura 8A, una unidad 860 de predicción para la unidad 810 de codificación máxima puede dividirse de manera diferente de la unidad 810 de codificación máxima. En otras palabras, una unidad de predicción para cada una de las subunidades de codificación puede ser menor que una correspondiente subunidad de codificación.
Por ejemplo, una unidad de predicción para una subunidad 854 de codificación localizada en un lado derecho inferior entre las subunidades de codificación cuyas profundidades son 1 puede ser menor que la subunidad 854 de codificación. Además, las unidades de predicción para algunas (814, 816, 850 y 852) de las subunidades 814, 816, 818, 828, 850 y 852 de codificación cuyas profundidades son 2 pueden ser menores que las subunidades 814, 816, 850, y 852 de codificación, respectivamente. Además, las unidades de predicción para las subunidades 822, 832 y 848 de codificación cuyas profundidades son 3 pueden ser menores que las subunidades 822, 832 y 848 de codificación, respectivamente. Las unidades de predicción pueden tener una forma mediante la cual las respectivas subunidades de codificación se dividen igualmente en dos en una dirección de altura o anchura o tienen una forma mediante la cual las respectivas subunidades de codificación se dividen igualmente en cuatro en direcciones de altura y anchura.
La Figura 8B ilustra una unidad de predicción y una unidad de transformación, de acuerdo con una realización ejemplar.
Un lado izquierdo de la Figura 8B muestra una forma de división de una unidad de predicción para la unidad 810 de codificación máxima mostrada en el lado derecho de la Figura 8A, y un lado derecho de la Figura 8B muestra una forma de división de una unidad de transformación de la unidad 810 de codificación máxima.
Haciendo referencia al lado derecho de la Figura 8B, una forma de división de una unidad 870 de transformación puede establecerse de manera diferente de la unidad 860 de predicción.
Por ejemplo, incluso aunque una unidad de predicción para la unidad 854 de codificación cuya profundidad es 1 se seleccione con una forma mediante la cual la altura de la unidad 854 de codificación se divide igualmente en dos, una unidad de transformación puede seleccionarse con el mismo tamaño que la unidad 854 de codificación. Análogamente, incluso aunque las unidades de predicción para las unidades 814 y 850 de codificación cuyas profundidades son 2 se seleccionen con una forma mediante la cual la altura de cada una de las unidades 814 y 850 de codificación se divide igualmente en dos, una unidad de transformación puede seleccionarse con el mismo tamaño que el tamaño original de cada una de las unidades 814 y 850 de codificación.
Una unidad de transformación puede seleccionarse con un tamaño menor que una unidad de predicción. Por ejemplo, cuando una unidad de predicción para la unidad 852 de codificación cuya profundidad es 2 se selecciona con una forma mediante la cual la anchura de la unidad 852 de codificación se divide igualmente en dos, una unidad de transformación puede seleccionarse con una forma mediante la cual la unidad 852 de codificación se divide igualmente en cuatro en direcciones de altura y anchura, que tienen un tamaño menor que la forma de la unidad de predicción.
La Figura 9 es un diagrama de bloques de un aparato 900 de codificación de imagen de acuerdo con otra realización ejemplar.
5
10
15
20
25
30
35
40
45
50
55
Haciendo referencia a la Figura 9, el aparato 900 de codificación de imagen de acuerdo con la presente realización ejemplar incluye un transformador 910, una unidad 920 de cuantificación y un codificador 930 por entropía.
El transformador 910 recibe una unidad de procesamiento de imagen de un dominio de píxel, y transforma la unidad de procesamiento de imagen en un dominio de frecuencia. El transformador 910 recibe una pluralidad de unidades de predicción que incluyen valores residuales generados debido a intra-predicción o inter-predicción, y transforma las unidades de predicción en un dominio de frecuencia. Como resultado de la transformada al dominio de la frecuencia, se generan coeficientes de componentes de frecuencia. De acuerdo con la presente realización ejemplar, la transformada al dominio de la frecuencia puede tener lugar mediante una transformada de coseno discreta (DCT) o Transformada de Karhunen Loeve (KLT), y como resultado de la DCT o KLT, se generan coeficientes del dominio de la frecuencia. En lo sucesivo, la transformada al dominio de la frecuencia puede ser la DCT, sin embargo, es evidente para un experto en la materia que la transformada al dominio de la frecuencia puede ser cualquier transformada que implica la transformación de una imagen de un dominio de píxel en un dominio de frecuencia.
También, de acuerdo con la presente realización ejemplar, el transformador 910 establece una unidad de transformación agrupando una pluralidad de unidades de predicción, y realiza la transformación de acuerdo con la unidad de transformación. Este procedimiento se describirá en detalle con referencia a las Figuras 10, 11A, 11B y 12.
La Figura 10 es un diagrama del transformador 910.
Haciendo referencia a la Figura 10, el transformador 910 incluye una unidad 1010 de selección y una unidad 1020 de realización de transformada.
La unidad 1010 de selección establece una unidad de transformación seleccionando una pluralidad de unidades de predicción adyacentes.
Un aparato de codificación de imagen de acuerdo con la técnica relacionada realiza intra-predicción o interpredicción de acuerdo con un bloque que tiene un tamaño predeterminado, es decir, de acuerdo con una unidad de predicción, y realiza la DCT basándose en un tamaño que es menor que o igual al de la unidad de predicción. En otras palabras, el aparato de codificación de imagen de acuerdo con la técnica relacionada realiza la DCT usando unidades de transformación que son menores que o iguales a la unidad de predicción.
Sin embargo, debido a una pluralidad de piezas de información de encabezamiento añadidas a las unidades de transformación, se aumentan taras añadidas a medida que se reducen las unidades de transformación, de manera que se deteriora una tasa de compresión de una operación de codificación de imagen. Para resolver este problema, el aparato 900 de codificación de imagen de acuerdo con la presente realización ejemplar agrupa una pluralidad de unidades de predicción adyacentes en una unidad de transformación, y realiza la transformación de acuerdo con la unidad de transformación que se genera por el agrupamiento. Existe una alta posibilidad de que las unidades de predicción adyacentes puedan incluir valores residuales similares, de modo que, si las unidades de predicción adyacentes se agrupan en una unidad de transformación y a continuación la transformación se realiza en la misma, una tasa de compresión de una operación de codificación puede aumentarse de manera elevada.
Para este aumento, la unidad 1010 de selección selecciona las unidades de predicción adyacentes para que se agrupen en una unidad de transformación. Este procedimiento se describirá en detalle con referencia a las Figuras 11A a 11C y 12.
Las Figuras 11A a 11C ilustran tipos de una unidad de transformación de acuerdo con otra realización ejemplar.
Haciendo referencia a las Figuras 11A a 11C, una unidad 1120 de predicción con respecto a una unidad 1110 de codificación puede tener una forma de división obtenida dividiendo por la mitad una anchura de la unidad 1110 de codificación. La unidad 1110 de codificación puede ser una unidad de codificación máxima, o puede ser una subunidad de codificación que tiene un tamaño menor que la unidad de codificación máxima.
Como se ilustra en la Figura 11A, un tamaño de la unidad 1130 de transformación puede ser menor que la unidad 1120 de predicción, o como se ilustra en la Figura 11B, un tamaño de la unidad 1140 de transformación puede ser igual a la unidad 1120 de predicción. También, como se ilustra en la Figura 11C, un tamaño de la unidad 1150 de transformación pueden ser mayor que la unidad 1120 de predicción. Es decir, las unidades 1130 a 1150 de transformación pueden establecerse mientras que no tengan conexión con la unidad 1120 de predicción.
También, la Figura 11C ilustra un ejemplo en el que la unidad 1120 de predicción se establece agrupando una pluralidad de las unidades 1120 de predicción incluidas en la unidad 1110 de codificación. Sin embargo, una unidad de transformación puede establecerse para que sea mayor que una unidad de codificación de una manera en la que se establece una pluralidad de unidades de predicción, que no están incluidas en una unidad de codificación pero en una pluralidad de unidades de codificación, como una unidad de transformación. En otras palabras, como se describe con referencia a las Figuras 11A a 11C, una unidad de transformación puede establecerse para que sea igual a o menor que un tamaño de una unidad de codificación, o para que sea mayor que el tamaño de la unidad de
5
10
15
20
25
30
35
40
45
50
55
Aunque las Figuras 11A a 11C ilustran ejemplos en los que la unidad de transformación tiene una forma cuadrada. Sin embargo, de acuerdo con un procedimiento de agrupación de unidades de predicción adyacentes, la unidad de transformación puede tener una forma rectangular. Por ejemplo, en un caso donde la unidad de predicción no se establece para que tenga formas rectangulares como se ilustra en las Figuras 11A a 11C pero se establece para que tenga cuatro formas cuadradas obtenidas seccionando en cuatro la unidad 1110 de codificación, se agrupan las unidades de predicción superior e inferior, o las unidades de predicción izquierda y derecha de modo que la unidad de transformación puede tener una forma rectangular cuyo lado horizontal o lado vertical es largo.
Haciendo referencia de vuelta a la Figura 10, no hay límite en un criterio mediante el cual la unidad 1010 de selección seleccione las unidades de predicción adyacentes. Sin embargo, de acuerdo con la realización ejemplar, la unidad 1010 de selección puede seleccionar la unidad de transformación de acuerdo con una profundidad. Como se ha descrito anteriormente, la profundidad indica un nivel de tamaño de reducción que se realiza gradualmente de una unidad de codificación máxima de un corte actual o una instantánea actual a una sub-unidad de codificación. Como se ha descrito con referencia a las Figuras 3 y 6, a medida que se aumenta la profundidad, se reduce un tamaño de una sub-unidad de codificación, y por lo tanto una unidad de predicción incluida en la sub-unidad de codificación también se reduce. En este caso, si la transformación se realiza de acuerdo con una unidad de transformación que es menor que o igual a la unidad de predicción, se deteriora una tasa de compresión de una operación de codificación de imagen puesto que se añade información de encabezamiento a cada unidad de transformación.
Por lo tanto, con respecto a una sub-unidad de codificación a una profundidad de un valor predeterminado, es preferible, pero no necesario, que las unidades de predicción incluidas en la sub-unidad de codificación se agrupen y se establezcan como una unidad de transformación, y a continuación la transformación se realiza en la mismas. Para esto, la unidad 1010 de selección establece la unidad de transformación basándose en la profundidad de la sub-unidad de codificación. Por ejemplo, en el caso donde una profundidad de la unidad 1110 de codificación en la Figura 11C sea mayor que k, la unidad 1010 de selección agrupa las unidades 1120 de predicción y las establece como una unidad 1150 de transformación.
También, de acuerdo con otra realización ejemplar, la unidad 1010 de selección puede agrupar una pluralidad de unidades de predicción adyacentes en las que se realiza predicción de acuerdo con el mismo modo de predicción, y puede establecerlas como una unidad de transformación. La unidad 1010 de selección agrupa las unidades de predicción adyacentes en las que se realiza predicción de acuerdo con intra-predicción o inter-predicción, y a continuación las establece como una unidad de transformación. Puesto que hay una alta posibilidad de que las unidades de predicción adyacentes en las que se realiza predicción de acuerdo con el mismo modo de predicción incluyan valores residuales similares, es posible agrupar las unidades de predicción adyacentes en la unidad de transformación y a continuación realizar la transformación en las unidades de predicción adyacentes.
Cuando la unidad 1010 de selección establece la unidad de transformación, la unidad 1020 de realización de transformada transforma las unidades de predicción adyacentes en un dominio de frecuencia, de acuerdo con la unidad de transformación. La unidad 1020 de realización de transformada realiza la DCT en las unidades de predicción adyacentes de acuerdo con la unidad de transformación, y genera coeficientes de coseno discretos.
Haciendo referencia de vuelta a la Figura 9, la unidad 920 de cuantificación cuantifica coeficientes de componente de frecuencia generados por el transformador 910, por ejemplo, los coeficientes de coseno discretos. La unidad 920 de cuantificación puede cuantificar los coeficientes de coseno discretos que se introducen de acuerdo con una etapa de cuantificación predeterminada.
El codificador 930 por entropía realiza codificación por entropía en los coeficientes de componente de frecuencia que se cuantifican por la unidad 920 de cuantificación. El codificador 930 por entropía puede realizar la codificación por entropía en los coeficientes de coseno discretos usando codificación aritmética variable adaptativa según contexto (CABAC) o codificación de longitud variable adaptativa según contexto (CAVLC).
El aparato 900 de codificación de imagen puede determinar una unidad de transformación óptima realizando de manera repetitiva la DCT, la cuantificación y la codificación por entropía en diferentes unidades de transformación. Un procedimiento para seleccionar las unidades de predicción adyacentes puede repetirse para determinar la unidad de transformación óptima. La unidad de transformación óptima puede determinarse en consideración de un cálculo de coste de RD, y esto se describirá en detalle con referencia a la Figura 12.
La Figura 12 ilustra diferentes unidades de transformación de acuerdo con otra realización ejemplar.
Haciendo referencia a la Figura 12, el aparato 900 de codificación de imagen realiza de manera repetitiva una operación de codificación en las diferentes unidades de transformación.
Como se ilustra en la Figura 12, una unidad 1210 de codificación puede predecirse y codificarse basándose en una unidad 1220 de predicción que tiene un tamaño menor que la unidad 1210 de codificación. Se realiza una
5
10
15
20
25
30
35
40
45
50
transformación en valores residuales que se generan por un resultado de la predicción, y en este punto, como se ilustra en la Figura 12, la DCT puede realizarse en los valores residuales basándose en las diferentes unidades de transformación.
Una primera unidad 1230 de transformación ilustrada tiene el mismo tamaño que la unidad 1210 de codificación, y tiene un tamaño obtenido agrupando todas las unidades de predicción incluidas en la unidad 1210 de codificación.
Una segunda unidad 1240 de transformación ilustrada tiene tamaños obtenidos dividiendo por la mitad una anchura de la unidad 1210 de codificación, y los tamaños se obtienen agrupando cada dos unidades de predicción adyacentes entre sí en una dirección vertical, respectivamente.
Una tercera unidad 1250 de transformación ilustrada tiene tamaños obtenidos dividiendo por la mitad una altura de la unidad 1210 de codificación, y los tamaños se obtienen agrupando cada dos unidades de predicción adyacentes entre sí en una dirección horizontal, respectivamente.
Una cuarta unidad 1260 de transformación ilustrada se usa cuando la transformación se realiza basándose en la cuarta unidad 1260 de transformación ilustrada que tiene el mismo tamaño que la unidad 1220 de predicción.
La Figura 13 es un diagrama de bloques de un aparato 1300 de decodificación de imagen de acuerdo con otra realización ejemplar.
Haciendo referencia a la Figura 13, el aparato 1300 de decodificación de imagen de acuerdo con la presente realización ejemplar incluye un decodificador 1310 por entropía, una unidad 1320 de cuantificación inversa y un transformador 1330 inverso.
El decodificador 1310 por entropía realiza decodificación por entropía en coeficientes de componente de frecuencia con respecto a una unidad de transformación predeterminada. Como se ha descrito con referencia a las Figuras 11A a 11C y 12, la unidad de transformación predeterminada puede ser una unidad de transformación generada agrupando una pluralidad de unidades de predicción adyacentes.
Como se ha descrito con referencia al aparato 900 de codificación de imagen, la unidad de transformación puede generarse agrupando las unidades de predicción adyacentes de acuerdo con una profundidad, o puede generarse agrupando una pluralidad de unidades de predicción adyacentes en las que se realiza predicción de acuerdo con el mismo modo de predicción, es decir, de acuerdo con un intra-modo de predicción o un inter-modo de predicción.
La pluralidad de unidades de predicción pueden no incluirse en una unidad de codificación sino incluirse en una pluralidad de unidades de codificación. En otras palabras, como se ha descrito con referencia a las Figuras 11A a 11C, la unidad de transformación que se decodifica por entropía por el decodificador 1310 por entropía puede establecerse para que sea igual a o menor que un tamaño de una unidad de codificación, o para que sea mayor que el tamaño de la unidad de codificación.
También, como se ha descrito con referencia a la Figura 12, la unidad de transformación puede ser una unidad de transformación óptima seleccionada repitiendo un procedimiento para agrupar una pluralidad de unidades de predicción adyacentes, y realizando de manera repetitiva una transformación, cuantificación y decodificación por entropía en diferentes unidades de transformación.
La unidad 1320 de cuantificación inversa cuantifica a la inversa los coeficientes de componente de frecuencia que están decodificados por entropía por el decodificador 1310 por entropía.
La unidad 1320 de cuantificación inversa cuantifica a la inversa los coeficientes de componente de frecuencia decodificados por entropía de acuerdo con una etapa de cuantificación que se usa en la codificación de la unidad de transformación.
El transformador 1330 inverso transforma a la inversa los coeficientes de componente de frecuencia cuantificados a la inversa en un dominio de píxel. El transformador inverso puede realizar una DCT inversa en coeficientes de coseno discretos cuantificados a la inversa (es decir, los coeficientes de componente de frecuencia cuantificados a la inversa), y a continuación puede reconstruir una unidad de transformación del dominio de píxel. La unidad de transformación reconstruida puede incluir unidades de predicción adyacentes.
La Figura 14 es un diagrama de flujo de un procedimiento de codificación de imagen, de acuerdo con una realización ejemplar.
Haciendo referencia a la Figura 14, en la operación 1410, un aparato de codificación de imagen establece una unidad de transformación seleccionando una pluralidad de unidades de predicción adyacentes. El aparato de codificación de imagen puede seleccionar una pluralidad de unidades de predicción adyacentes de acuerdo con una profundidad, o puede seleccionar una pluralidad de unidades de predicción adyacentes en las que se realiza predicción de acuerdo con el mismo modo de predicción.
5
10
15
20
25
30
35
40
45
50
En la operación 1420, el aparato de codificación de imagen transforma las unidades de predicción adyacentes en un dominio de frecuencia de acuerdo con la unidad de transformación establecida en la operación 1420. El aparato de codificación de imagen agrupa las unidades de predicción adyacentes, realiza una DCT en las unidades de predicción adyacentes, y genera de esta manera coeficientes de coseno discretos.
En la operación 1430, el aparato de codificación de imagen cuantifica coeficientes de componente de frecuencia, generados en la operación 1420, de acuerdo con una etapa de cuantificación.
En la operación 1440, el aparato de codificación de imagen realiza codificación por entropía en los coeficientes de componente de frecuencia cuantificados en la operación 1430. El aparato de codificación de imagen realiza la codificación por entropía en los coeficientes de coseno discretos usando CABAC o CAVLC.
Un procedimiento de codificación de imagen de acuerdo con otra realización ejemplar puede incluir adicionalmente una operación de establecimiento de una unidad de transformación óptima realizando de manera repetitiva las operaciones 1410 a 1440 en diferentes unidades de transformación. Es decir, realizando de manera repetitiva la transformación, la cuantificación y la codificación por entropía en diferentes unidades de transformación como se ilustra en la Figura 12, es posible establecer la unidad de transformación óptima.
La Figura 15 es un diagrama de flujo de un procedimiento de decodificación de imagen, de acuerdo con otra realización ejemplar.
Haciendo referencia a la Figura 15, en la operación 1510, un aparato de decodificación de imagen realiza decodificación por entropía en coeficientes de componente de frecuencia con respecto a una unidad de transformación predeterminada. Los coeficientes de componente de frecuencia pueden ser coeficientes de coseno discretos.
En la operación 1520, el aparato de decodificación de imagen cuantifica a la inversa los coeficientes de componente de frecuencia que están decodificados por entropía en la operación 1510. El aparato de decodificación de imagen cuantifica a la inversa los coeficientes de coseno discretos usando una etapa de cuantificación usada en una operación de codificación.
En la operación 1530, el aparato de decodificación de imagen transforma a la inversa los coeficientes de componente de frecuencia, que se han cuantificado a la inversa en la operación 1520, en un dominio de píxel y a continuación reconstruye la unidad de transformación. La unidad de transformación reconstruida se establece agrupando una pluralidad de unidades de predicción adyacentes. Como se ha descrito anteriormente, la unidad de transformación puede establecerse agrupando las unidades de predicción adyacentes de acuerdo con una profundidad, o puede establecerse agrupando una pluralidad de unidades de predicción adyacentes en las que se realiza predicción de acuerdo con el mismo modo de predicción.
De acuerdo con la una o más realizaciones ejemplares, es posible establecer la unidad de transformación para que sea mayor que la unidad de predicción, y para realizar la DCT, de modo que una imagen puede comprimirse y codificarse de manera eficaz.
Las realizaciones ejemplares pueden realizarse también como códigos legibles por ordenador en un medio de grabación legible por ordenador. El medio de grabación legible por ordenador es cualquier dispositivo de almacenamiento de datos que puede almacenar datos, que pueden leerse posteriormente por un sistema informático. Ejemplos del medio de grabación legible por ordenador incluyen memoria de solo lectura (ROM), memoria de acceso aleatorio (RAM), CD-ROM, cintas magnéticas, discos flexibles y dispositivos de almacenamiento de datos ópticos. El medio de grabación legible por ordenador puede también distribuirse a través de sistemas informáticos acoplados en red de modo que el código legible por ordenador se almacena y se ejecuta de una manera distribuida.
Por ejemplo, cada uno del aparato de codificación de imagen, el aparato de decodificación de imagen, el codificador de imagen y el decodificador de imagen de acuerdo con la una o más realizaciones pueden incluir un bus acoplado a cada unidad en un aparato como se ilustra en las Figuras 1-2, 4-5, 9-10 y 14, y al menos un procesador acoplado al bus. También, cada uno del aparato de codificación de imagen, el aparato de decodificación de imagen, el codificador de imagen y el decodificador de imagen de acuerdo con la una o más realizaciones pueden incluir una memoria acoplada a al menos un procesador que está acoplado al bus para almacenar comandos, mensajes recibidos o mensajes generados y para ejecutar los comandos.
Aunque esta invención se ha mostrado y descrito particularmente con referencia a realizaciones ejemplares de la misma, se entenderá por los expertos en la materia que pueden realizarse en la misma diversos cambios en forma y detalles sin alejarse del alcance de la invención como se define por las reivindicaciones adjuntas.

Claims (1)

  1. 5
    10
    15
    20
    25
    30
    REIVINDICACIONES
    1. Un aparato de decodificación de imagen que comprende:
    un procesador operable para obtener, de una secuencia de bits recibida, información acerca de un tamaño máximo de una unidad de codificación, información acerca de una unidad de predicción en la unidad de codificación e información acerca de una unidad de transformación para transformación de la unidad de codificación; y
    un decodificador operable para determinar una pluralidad de unidades de codificación máxima cuadradas en una imagen usando la información acerca de un tamaño máximo de una unidad de codificación, y para determinar unidades de codificación cuadradas de una estructura de árbol que comprende unidades de codificación que ya no se dividen más entre las unidades de codificación divididas de una unidad de codificación máxima usando información acerca de unidades de codificación analizadas a partir de una secuencia de bits, para determinar al menos una unidad de predicción usando la información acerca de una unidad de predicción; y para determinar al menos una unidad de transformación usando la información acerca de una unidad de transformación,
    en el que:
    la unidad de codificación máxima entre la pluralidad de las unidades de codificación máxima se divide jerárquicamente en una o más unidades de codificación que incluyen al menos una de una unidad de codificación de una profundidad actual y una unidad de codificación de una profundidad mayor que la profundidad actual,
    la unidad de codificación de la profundidad actual se divide en cuatro unidades de codificación cuadradas de la profundidad mayor que la profundidad actual, independientemente de las unidades de codificación vecinas de la profundidad actual, y
    la unidad de codificación de la profundidad mayor que la profundidad actual se predice usando la al menos una unidad de predicción y se transforma a la inversa usando la unidad de transformación,
    en el que la al menos una unidad de predicción es una entre los bloques que incluyen: un bloque igual en tamaño a la unidad de codificación de la profundidad mayor que la profundidad actual; y un bloque entre una pluralidad de bloques generados dividiendo igualmente al menos una de la altura y anchura de la unidad de codificación de la profundidad mayor que la profundidad actual,
    en el que la al menos una unidad de transformación es una entre los bloques que incluyen: un bloque igual en tamaño a la unidad de codificación de la profundidad mayor que la profundidad actual; y un bloque entre una pluralidad de bloques generados dividiendo la altura y anchura de la unidad de codificación de la profundidad mayor que la profundidad actual, y
    caracterizado porque el aparato de decodificación está configurado para soportar una unidad de transformación, entre la al menos una unidad de transformación, que tiene un tamaño de 2Nx2N que incluye cuatro unidades de predicción que tienen un tamaño de NxN.
ES13167744.5T 2009-08-13 2010-08-13 Aparato de decodificación de una imagen usando unidades de transformación grandes Active ES2668472T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR20090074895 2009-08-13
KR1020090074895A KR101474756B1 (ko) 2009-08-13 2009-08-13 큰 크기의 변환 단위를 이용한 영상 부호화, 복호화 방법 및 장치

Publications (1)

Publication Number Publication Date
ES2668472T3 true ES2668472T3 (es) 2018-05-18

Family

ID=43586668

Family Applications (6)

Application Number Title Priority Date Filing Date
ES18200773T Active ES2760475T3 (es) 2009-08-13 2010-08-13 Codificación de imagen usando unidades de transformación grandes
ES15150191.3T Active ES2648089T3 (es) 2009-08-13 2010-08-13 Procedimiento y aparato para codificar y decodificar imágenes usando unidad de transformación grande
ES17193659T Active ES2701979T3 (es) 2009-08-13 2010-08-13 Procedimiento para decodificar y aparato para codificar imágenes usando unidad de transformación grande
ES13167744.5T Active ES2668472T3 (es) 2009-08-13 2010-08-13 Aparato de decodificación de una imagen usando unidades de transformación grandes
ES13167743.7T Active ES2647908T3 (es) 2009-08-13 2010-08-13 Procedimiento y aparato para codificar y decodificar imágenes usando unidad de transformación grande
ES15150192.1T Active ES2648091T3 (es) 2009-08-13 2010-08-13 Procedimiento y aparato para la codificación y decodificación de imagen usando unidad de transformación grande

Family Applications Before (3)

Application Number Title Priority Date Filing Date
ES18200773T Active ES2760475T3 (es) 2009-08-13 2010-08-13 Codificación de imagen usando unidades de transformación grandes
ES15150191.3T Active ES2648089T3 (es) 2009-08-13 2010-08-13 Procedimiento y aparato para codificar y decodificar imágenes usando unidad de transformación grande
ES17193659T Active ES2701979T3 (es) 2009-08-13 2010-08-13 Procedimiento para decodificar y aparato para codificar imágenes usando unidad de transformación grande

Family Applications After (2)

Application Number Title Priority Date Filing Date
ES13167743.7T Active ES2647908T3 (es) 2009-08-13 2010-08-13 Procedimiento y aparato para codificar y decodificar imágenes usando unidad de transformación grande
ES15150192.1T Active ES2648091T3 (es) 2009-08-13 2010-08-13 Procedimiento y aparato para la codificación y decodificación de imagen usando unidad de transformación grande

Country Status (24)

Country Link
US (10) US8792741B2 (es)
EP (7) EP3282696B1 (es)
JP (7) JP5746169B2 (es)
KR (1) KR101474756B1 (es)
CN (6) CN104581162B (es)
AU (1) AU2010283113B2 (es)
BR (3) BR122013019725A2 (es)
CA (5) CA2877241C (es)
CY (5) CY1119836T1 (es)
DK (6) DK2629518T3 (es)
ES (6) ES2760475T3 (es)
HR (5) HRP20171767T1 (es)
HU (6) HUE039342T2 (es)
IN (3) IN2015MN00402A (es)
LT (5) LT2629526T (es)
MX (1) MX2012000614A (es)
MY (3) MY157499A (es)
NO (4) NO2866442T3 (es)
PL (6) PL2890123T3 (es)
PT (5) PT3282696T (es)
RU (4) RU2510945C1 (es)
SI (5) SI2629526T1 (es)
WO (1) WO2011019234A2 (es)
ZA (5) ZA201201157B (es)

Families Citing this family (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7956930B2 (en) 2006-01-06 2011-06-07 Microsoft Corporation Resampling and picture resizing operations for multi-resolution video coding and decoding
US8711948B2 (en) * 2008-03-21 2014-04-29 Microsoft Corporation Motion-compensated prediction of inter-layer residuals
US9571856B2 (en) * 2008-08-25 2017-02-14 Microsoft Technology Licensing, Llc Conversion operations in scalable video encoding and decoding
US8503527B2 (en) 2008-10-03 2013-08-06 Qualcomm Incorporated Video coding with large macroblocks
KR101474756B1 (ko) 2009-08-13 2014-12-19 삼성전자주식회사 큰 크기의 변환 단위를 이용한 영상 부호화, 복호화 방법 및 장치
CN104602013B (zh) * 2009-10-01 2017-10-31 Sk电信有限公司 视频编码装置和方法
WO2011049119A1 (ja) * 2009-10-20 2011-04-28 シャープ株式会社 動画像符号化装置、動画像復号装置、動画像符号化・復号システム、動画像符号化方法および動画像復号方法
KR101487687B1 (ko) 2010-01-14 2015-01-29 삼성전자주식회사 큰 크기의 변환 단위를 이용한 영상 부호화, 복호화 방법 및 장치
CN106686379B (zh) 2010-04-13 2019-10-18 三星电子株式会社 对视频进行解码的方法
SI2955917T1 (sl) * 2010-08-17 2018-09-28 Samsung Electronics Co., Ltd Postopek dekodiranja videa z uporabo transformacijske enote variabilne drevesne strukture
KR20120035096A (ko) * 2010-10-04 2012-04-13 한국전자통신연구원 쿼드 트리 변환 구조에서 부가 정보의 시그널링 방법 및 장치
US9532059B2 (en) 2010-10-05 2016-12-27 Google Technology Holdings LLC Method and apparatus for spatial scalability for video coding
US8605567B2 (en) * 2010-12-02 2013-12-10 Adtran, Inc. Apparatuses and methods for enabling crosstalk vectoring in expandable communication systems
EP3554078A1 (en) 2010-12-13 2019-10-16 Electronics and Telecommunications Research Institute Method and device for determining reference unit
JP5594841B2 (ja) * 2011-01-06 2014-09-24 Kddi株式会社 画像符号化装置及び画像復号装置
US8494290B2 (en) * 2011-05-05 2013-07-23 Mitsubishi Electric Research Laboratories, Inc. Method for coding pictures using hierarchical transform units
MY175434A (en) * 2011-06-30 2020-06-25 Samsung Electronics Co Ltd Video encoding method with bit depth adjustment for fixed-point conversion and apparatus therefor, and video decoding method and apparatus therefor
JP5989772B2 (ja) 2011-07-01 2016-09-07 サムスン エレクトロニクス カンパニー リミテッド 階層的構造のデータ単位を利用したエントロピー符号化方法及び該装置、並びに復号化方法及び該装置
US9807426B2 (en) * 2011-07-01 2017-10-31 Qualcomm Incorporated Applying non-square transforms to video data
JP5899447B2 (ja) * 2011-11-21 2016-04-06 パナソニックIpマネジメント株式会社 画像処理装置および画像処理方法
US9094681B1 (en) 2012-02-28 2015-07-28 Google Inc. Adaptive segmentation
US8396127B1 (en) * 2012-06-27 2013-03-12 Google Inc. Segmentation for video coding using predictive benefit
TWI627857B (zh) * 2012-06-29 2018-06-21 Sony Corp Image processing device and method
MX347473B (es) * 2012-07-02 2017-04-27 Samsung Electronics Co Ltd Metodo y aparato para codificar video por entropia, y metodo y aparato para decodificar video por entropia.
CN111629208B (zh) * 2012-07-02 2021-12-21 韩国电子通信研究院 图像编码/解码方法和非暂时性计算机可读记录介质
US9332276B1 (en) 2012-08-09 2016-05-03 Google Inc. Variable-sized super block based direct prediction mode
US9380298B1 (en) 2012-08-10 2016-06-28 Google Inc. Object-based intra-prediction
US9445124B2 (en) 2013-03-15 2016-09-13 Samsung Electronics Co., Ltd. Electronic system with frequency mechanism and method of operation thereof
WO2014168411A1 (ko) * 2013-04-11 2014-10-16 엘지전자 주식회사 비디오 신호 처리 방법 및 장치
JP6402520B2 (ja) * 2014-07-22 2018-10-10 沖電気工業株式会社 符号化装置、方法、プログラム及び機器
US20160029022A1 (en) * 2014-07-25 2016-01-28 Mediatek Inc. Video processing apparatus with adaptive coding unit splitting/merging and related video processing method
CN109155857B (zh) * 2016-03-11 2023-05-30 数字洞察力有限公司 视频编码方法以及装置
KR102416804B1 (ko) * 2016-10-14 2022-07-05 세종대학교산학협력단 영상 부호화 방법/장치, 영상 복호화 방법/장치 및 비트스트림을 저장한 기록 매체
KR101823533B1 (ko) * 2017-03-21 2018-01-30 삼성전자주식회사 큰 크기의 변환 단위를 이용한 영상 부호화, 복호화 방법 및 장치
CN111602397B (zh) * 2018-01-17 2024-01-23 英迪股份有限公司 使用各种变换技术的视频编码方法和装置
KR101913734B1 (ko) 2018-01-24 2018-10-31 삼성전자주식회사 큰 크기의 변환 단위를 이용한 영상 부호화, 복호화 방법 및 장치
CN116320411A (zh) * 2018-03-29 2023-06-23 日本放送协会 图像编码装置、图像解码装置以及程序
JP7378035B2 (ja) * 2018-09-12 2023-11-13 パナソニックIpマネジメント株式会社 変換装置、復号装置、変換方法および復号方法

Family Cites Families (79)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5842033A (en) * 1992-06-30 1998-11-24 Discovision Associates Padding apparatus for passing an arbitrary number of bits through a buffer in a pipeline system
US6435737B1 (en) * 1992-06-30 2002-08-20 Discovision Associates Data pipeline system and data encoding method
JP3133517B2 (ja) * 1992-10-15 2001-02-13 シャープ株式会社 画像領域検出装置、該画像検出装置を用いた画像符号化装置
US5598514A (en) * 1993-08-09 1997-01-28 C-Cube Microsystems Structure and method for a multistandard video encoder/decoder
US5610657A (en) * 1993-09-14 1997-03-11 Envistech Inc. Video compression using an iterative error data coding method
US5446806A (en) 1993-11-15 1995-08-29 National Semiconductor Corporation Quadtree-structured Walsh transform video/image coding
JP3169783B2 (ja) * 1995-02-15 2001-05-28 日本電気株式会社 動画像の符号化・復号システム
DE69619002T2 (de) 1995-03-10 2002-11-21 Toshiba Kawasaki Kk Bildkodierungs-/-dekodierungsvorrichtung
DE69636150T8 (de) 1995-03-15 2007-07-12 Kabushiki Kaisha Toshiba System zur Kodierung von bewegten Bildern, und System zur variablen Längenkodierung
US5680129A (en) * 1995-07-18 1997-10-21 Hewlett-Packard Company System and method for lossless image compression
EP0857392B1 (en) * 1995-10-25 2004-08-11 Sarnoff Corporation Overlapping block zerotree wavelet image coder
CN1177485C (zh) * 1996-05-17 2004-11-24 松下电器产业株式会社 图像解码装置
EP1085763B1 (en) 1996-05-28 2003-01-22 Matsushita Electric Industrial Co., Ltd. Image predictive coding apparatus and method.
US6101276A (en) * 1996-06-21 2000-08-08 Compaq Computer Corporation Method and apparatus for performing two pass quality video compression through pipelining and buffer management
US5995080A (en) * 1996-06-21 1999-11-30 Digital Equipment Corporation Method and apparatus for interleaving and de-interleaving YUV pixel data
US6292589B1 (en) * 1996-06-21 2001-09-18 Compaq Computer Corporation Method for choosing rate control parameters in motion-compensated transform-based picture coding scheme using non-parametric technique
US6292591B1 (en) * 1996-07-17 2001-09-18 Sony Coporation Image coding and decoding using mapping coefficients corresponding to class information of pixel blocks
FR2755527B1 (fr) 1996-11-07 1999-01-08 Thomson Multimedia Sa Procede de prediction compensee en mouvement et codeur utilisant un tel procede
US6173013B1 (en) * 1996-11-08 2001-01-09 Sony Corporation Method and apparatus for encoding enhancement and base layer image signals using a predicted image signal
US5956467A (en) * 1996-12-17 1999-09-21 Eastman Kodak Company Encoding color image data for multipass color printers
JPH10178639A (ja) 1996-12-19 1998-06-30 Matsushita Electric Ind Co Ltd 画像コーデック部および画像データ符号化方法
US6157746A (en) * 1997-02-12 2000-12-05 Sarnoff Corporation Apparatus and method for encoding wavelet trees generated by a wavelet-based coding method
CN1110963C (zh) * 1997-03-26 2003-06-04 松下电器产业株式会社 图象解码装置
JPH11146367A (ja) 1997-11-06 1999-05-28 Matsushita Electric Ind Co Ltd モバイルビデオフォン
US6393060B1 (en) * 1997-12-31 2002-05-21 Lg Electronics Inc. Video coding and decoding method and its apparatus
US5995150A (en) * 1998-02-20 1999-11-30 Winbond Electronics Corporation America Dual compressed video bitstream camera for universal serial bus connection
JP3132456B2 (ja) * 1998-03-05 2001-02-05 日本電気株式会社 階層的画像符号化方式、及び階層的画像復号方式
IL129203A (en) * 1999-03-28 2002-07-25 Univ Ramot System and method for compressing figures
CN1297148C (zh) 2001-08-28 2007-01-24 株式会社Ntt都科摩 动画图像编码传送系统、动画图像编码传送方法、该系统和方法使用的适合的编码装置、译码装置、编码方法、译码方法以及程序
US6980596B2 (en) 2001-11-27 2005-12-27 General Instrument Corporation Macroblock level adaptive frame/field coding for digital video content
CN101448162B (zh) 2001-12-17 2013-01-02 微软公司 处理视频图像的方法
EP1322121A3 (en) 2001-12-19 2003-07-16 Matsushita Electric Industrial Co., Ltd. Video encoder and decoder with improved motion detection precision
JP2003250161A (ja) * 2001-12-19 2003-09-05 Matsushita Electric Ind Co Ltd 符号化装置及び復号化装置
HUE030635T2 (en) 2002-03-27 2017-06-28 Panasonic Ip Corp America A variable length coding and decoding system and a variable length coding and decoding method
JP2003319394A (ja) * 2002-04-26 2003-11-07 Sony Corp 符号化装置および方法、復号装置および方法、記録媒体、並びにプログラム
KR100491530B1 (ko) * 2002-05-03 2005-05-27 엘지전자 주식회사 모션 벡터 결정 방법
US6795584B2 (en) 2002-10-03 2004-09-21 Nokia Corporation Context-based adaptive variable length coding for adaptive block transforms
WO2004052017A1 (en) * 2002-12-04 2004-06-17 Koninklijke Philips Electronics N.V. Video coding method and device
HUP0301368A3 (en) * 2003-05-20 2005-09-28 Amt Advanced Multimedia Techno Method and equipment for compressing motion picture data
US7580584B2 (en) * 2003-07-18 2009-08-25 Microsoft Corporation Adaptive multiple quantization
ES2767933T3 (es) * 2003-09-07 2020-06-19 Microsoft Technology Licensing Llc Capa de sectores en códec de vídeo
US7317839B2 (en) * 2003-09-07 2008-01-08 Microsoft Corporation Chroma motion vector derivation for interlaced forward-predicted fields
KR20050045746A (ko) 2003-11-12 2005-05-17 삼성전자주식회사 계층 구조의 가변 블록 크기를 이용한 움직임 추정 방법및 장치
CN101695132B (zh) * 2004-01-20 2012-06-27 松下电器产业株式会社 图像编码方法和设备、图像解码方法和设备
KR101136629B1 (ko) 2004-01-30 2012-04-23 파나소닉 주식회사 화상 부호화 방법, 화상 복호화 방법, 화상 부호화 장치,화상 복호화 장치, 및 그 프로그램
US7565020B2 (en) * 2004-07-03 2009-07-21 Microsoft Corp. System and method for image coding employing a hybrid directional prediction and wavelet lifting
JP2006174415A (ja) * 2004-11-19 2006-06-29 Ntt Docomo Inc 画像復号装置、画像復号プログラム、画像復号方法、画像符号化装置、画像符号化プログラム及び画像符号化方法
JP4889231B2 (ja) * 2005-03-31 2012-03-07 三洋電機株式会社 画像符号化方法および装置、画像復号方法
KR101127221B1 (ko) * 2005-07-15 2012-03-29 삼성전자주식회사 주파수 공간에서 컬러 성분간 예측을 이용한 컬러영상부호화/복호화 방법 및 장치
JP4828543B2 (ja) 2005-09-26 2011-11-30 三菱電機株式会社 動画像符号化装置及び動画像復号装置
KR100763196B1 (ko) * 2005-10-19 2007-10-04 삼성전자주식회사 어떤 계층의 플래그를 계층간의 연관성을 이용하여부호화하는 방법, 상기 부호화된 플래그를 복호화하는방법, 및 장치
CN101129063B (zh) 2005-11-18 2010-05-19 索尼株式会社 编码设备和方法、解码设备和方法以及传输系统
JP2007243427A (ja) * 2006-03-07 2007-09-20 Nippon Hoso Kyokai <Nhk> 符号化装置及び復号化装置
KR101200865B1 (ko) 2006-03-23 2012-11-13 삼성전자주식회사 영상의 부호화 방법 및 장치, 복호화 방법 및 장치
WO2007116551A1 (ja) 2006-03-30 2007-10-18 Kabushiki Kaisha Toshiba 画像符号化装置及び画像符号化方法並びに画像復号化装置及び画像復号化方法
KR100745765B1 (ko) * 2006-04-13 2007-08-02 삼성전자주식회사 화상 데이터의 공간상 예측 장치 및 방법과 그를 이용한부호화 장치 및 방법, 화상 데이터의 공간상 예측 보상장치 및 방법과 그를 이용한 복호화 장치 및 방법
WO2008027192A2 (en) * 2006-08-25 2008-03-06 Thomson Licensing Methods and apparatus for reduced resolution partitioning
KR20080045516A (ko) * 2006-11-20 2008-05-23 삼성전자주식회사 Rgb 영상의 부호화 및 복호화 방법과 그 장치
JP5026092B2 (ja) 2007-01-12 2012-09-12 三菱電機株式会社 動画像復号装置および動画像復号方法
JP2008245016A (ja) * 2007-03-28 2008-10-09 Canon Inc 画像符号化装置、画像符号化方法、及びプログラム
US8488668B2 (en) * 2007-06-15 2013-07-16 Qualcomm Incorporated Adaptive coefficient scanning for video coding
US8265144B2 (en) 2007-06-30 2012-09-11 Microsoft Corporation Innovations in video decoder implementations
US8483282B2 (en) 2007-10-12 2013-07-09 Qualcomm, Incorporated Entropy coding of interleaved sub-blocks of a video block
CN101159875B (zh) 2007-10-15 2011-10-05 浙江大学 二重预测视频编解码方法和装置
WO2009051719A2 (en) * 2007-10-16 2009-04-23 Thomson Licensing Methods and apparatus for video encoding and decoding geometically partitioned super blocks
JP2009111691A (ja) 2007-10-30 2009-05-21 Hitachi Ltd 画像符号化装置及び符号化方法、画像復号化装置及び復号化方法
US7444596B1 (en) 2007-11-29 2008-10-28 International Business Machines Corporation Use of template messages to optimize a software messaging system
US8619856B2 (en) 2008-10-03 2013-12-31 Qualcomm Incorporated Video coding with large macroblocks
US8503527B2 (en) * 2008-10-03 2013-08-06 Qualcomm Incorporated Video coding with large macroblocks
KR101474756B1 (ko) * 2009-08-13 2014-12-19 삼성전자주식회사 큰 크기의 변환 단위를 이용한 영상 부호화, 복호화 방법 및 장치
KR101452859B1 (ko) * 2009-08-13 2014-10-23 삼성전자주식회사 움직임 벡터를 부호화 및 복호화하는 방법 및 장치
KR102036118B1 (ko) * 2010-01-12 2019-10-24 엘지전자 주식회사 비디오 신호의 처리 방법 및 장치
KR101487687B1 (ko) * 2010-01-14 2015-01-29 삼성전자주식회사 큰 크기의 변환 단위를 이용한 영상 부호화, 복호화 방법 및 장치
JP6056122B2 (ja) * 2011-01-24 2017-01-11 ソニー株式会社 画像符号化装置と画像復号装置およびその方法とプログラム
EP3849187B1 (en) * 2011-06-24 2023-09-20 Mitsubishi Electric Corporation Moving image encoding apparatus, moving image decoding apparatus, moving image encoding method and moving image decoding method
EP2942961A1 (en) * 2011-11-23 2015-11-11 HUMAX Holdings Co., Ltd. Methods for encoding/decoding of video using common merging candidate set of asymmetric partitions
JP5917127B2 (ja) * 2011-12-19 2016-05-11 株式会社ジャパンディスプレイ 液晶表示装置
JP5887909B2 (ja) * 2011-12-19 2016-03-16 コニカミノルタ株式会社 画像形成装置及びその制御方法
US9332257B2 (en) * 2012-10-01 2016-05-03 Qualcomm Incorporated Coded black flag coding for 4:2:2 sample format in video coding

Also Published As

Publication number Publication date
CN104581162A (zh) 2015-04-29
DK2866442T3 (da) 2017-11-27
EP2629518B1 (en) 2017-11-15
DK3282696T3 (en) 2019-01-07
NO2866442T3 (es) 2018-04-14
PL3282696T3 (pl) 2019-02-28
DK2890123T3 (da) 2017-11-27
JP6023260B2 (ja) 2016-11-09
EP2866442A1 (en) 2015-04-29
AU2010283113A1 (en) 2012-01-12
CA2768181C (en) 2015-04-28
CA2877255C (en) 2015-10-06
CA2815777C (en) 2015-04-28
LT2866442T (lt) 2017-12-11
EP2449778A4 (en) 2013-12-25
WO2011019234A3 (en) 2011-06-23
HRP20182055T1 (hr) 2019-02-08
CN104581161B (zh) 2016-06-01
LT3282696T (lt) 2018-12-27
SI2629526T1 (en) 2018-06-29
HUE038258T2 (hu) 2018-10-29
BR122013019724A2 (pt) 2016-05-10
CN102484703A (zh) 2012-05-30
CY1119803T1 (el) 2018-06-27
RU2013113038A (ru) 2014-04-10
CA2768181A1 (en) 2011-02-17
ES2648091T3 (es) 2017-12-28
IN2015MN00401A (es) 2015-09-04
HUE038255T2 (hu) 2018-10-29
CN102484703B (zh) 2015-02-25
HUE039342T2 (hu) 2018-12-28
US8971650B2 (en) 2015-03-03
US20140286585A1 (en) 2014-09-25
NO2629518T3 (es) 2018-04-14
US8311348B2 (en) 2012-11-13
BR122013019725A2 (pt) 2016-05-10
MX2012000614A (es) 2012-01-27
JP6023261B2 (ja) 2016-11-09
SI3282696T1 (sl) 2019-01-31
EP3448039B1 (en) 2019-11-13
ES2760475T3 (es) 2020-05-14
CA2815893C (en) 2015-02-03
EP2866442B1 (en) 2017-11-15
PL3448039T3 (pl) 2020-02-28
RU2551794C2 (ru) 2015-05-27
CN104581163A (zh) 2015-04-29
US8971649B2 (en) 2015-03-03
CN103220528A (zh) 2013-07-24
DK2629526T3 (en) 2018-05-22
RU2510945C1 (ru) 2014-04-10
CA2815893A1 (en) 2011-02-17
ZA201201157B (en) 2020-02-26
LT2629526T (lt) 2018-05-25
US20130336390A1 (en) 2013-12-19
EP2890123B1 (en) 2017-11-15
US8792737B2 (en) 2014-07-29
SI2866442T1 (sl) 2017-12-29
CY1121001T1 (el) 2019-12-11
MY153787A (en) 2015-03-13
ES2648089T3 (es) 2017-12-28
CY1120725T1 (el) 2019-12-11
EP3282696A1 (en) 2018-02-14
PL2890123T3 (pl) 2018-01-31
EP2629526B1 (en) 2018-05-02
PT3282696T (pt) 2018-12-17
HRP20171769T1 (hr) 2017-12-29
HUE038282T2 (hu) 2018-10-29
US20130064291A1 (en) 2013-03-14
US20130336391A1 (en) 2013-12-19
JP2013214989A (ja) 2013-10-17
ZA201502023B (en) 2017-08-30
PL2629526T3 (pl) 2018-07-31
ZA201502024B (en) 2015-11-25
MY157499A (en) 2016-06-15
US8515190B2 (en) 2013-08-20
HUE043938T2 (hu) 2019-09-30
NO2629526T3 (es) 2018-09-29
CY1119836T1 (el) 2018-06-27
PT2629518T (pt) 2017-11-23
CN104581163B (zh) 2017-05-24
PT2629526T (pt) 2018-05-11
JP2015180086A (ja) 2015-10-08
IN2015MN00400A (es) 2015-09-04
SI2629518T1 (sl) 2017-12-29
US8204320B2 (en) 2012-06-19
JP5579309B2 (ja) 2014-08-27
EP2629526A2 (en) 2013-08-21
SI2890123T1 (sl) 2017-12-29
HRP20171767T1 (hr) 2017-12-29
HUE048402T2 (hu) 2020-08-28
US20140294311A1 (en) 2014-10-02
NO2890123T3 (es) 2018-04-14
EP3448039A1 (en) 2019-02-27
DK2629518T3 (da) 2017-11-27
ZA201304973B (en) 2013-09-25
CA2815777A1 (en) 2011-02-17
JP5753327B2 (ja) 2015-07-22
LT2890123T (lt) 2017-12-11
RU2014104800A (ru) 2015-04-27
ES2701979T3 (es) 2019-02-26
IN2015MN00402A (es) 2015-09-04
RU2012104828A (ru) 2013-08-20
ZA201502025B (en) 2015-12-23
LT2629518T (lt) 2017-12-11
DK3448039T3 (da) 2019-11-25
JP5746169B2 (ja) 2015-07-08
HRP20171768T1 (hr) 2017-12-29
RU2514777C1 (ru) 2014-05-10
US20120236938A1 (en) 2012-09-20
US8842921B2 (en) 2014-09-23
US20150156513A1 (en) 2015-06-04
CN103220525A (zh) 2013-07-24
HRP20180692T1 (hr) 2018-06-29
JP2015109686A (ja) 2015-06-11
CY1119838T1 (el) 2018-06-27
BR112012001757A2 (pt) 2016-04-12
PL2629518T3 (pl) 2018-01-31
PT2890123T (pt) 2017-11-23
KR20110017300A (ko) 2011-02-21
CA2877241A1 (en) 2011-02-17
US8792741B2 (en) 2014-07-29
US20120106637A1 (en) 2012-05-03
KR101474756B1 (ko) 2014-12-19
JP5753328B2 (ja) 2015-07-22
ES2647908T3 (es) 2017-12-27
CN104581161A (zh) 2015-04-29
US9386325B2 (en) 2016-07-05
JP2015109687A (ja) 2015-06-11
JP2013179707A (ja) 2013-09-09
EP2629518A3 (en) 2013-12-18
JP5579310B2 (ja) 2014-08-27
JP2013502138A (ja) 2013-01-17
EP3282696B1 (en) 2018-12-05
EP2449778A2 (en) 2012-05-09
CA2877241C (en) 2016-10-11
JP2015173484A (ja) 2015-10-01
EP2629526A3 (en) 2013-12-18
CN103220528B (zh) 2017-03-01
WO2011019234A2 (en) 2011-02-17
CA2877255A1 (en) 2011-02-17
CN104581162B (zh) 2016-05-04
EP2629518A2 (en) 2013-08-21
MY157501A (en) 2016-06-15
US20130336392A1 (en) 2013-12-19
PT2866442T (pt) 2017-11-23
US8798381B2 (en) 2014-08-05
RU2014104796A (ru) 2015-08-20
US20110038554A1 (en) 2011-02-17
AU2010283113B2 (en) 2014-07-03
PL2866442T3 (pl) 2018-01-31
EP2890123A1 (en) 2015-07-01
RU2543519C2 (ru) 2015-03-10

Similar Documents

Publication Publication Date Title
ES2668472T3 (es) Aparato de decodificación de una imagen usando unidades de transformación grandes
ES2657170T3 (es) Procedimiento y aparato de codificación y decodificación de imagen usando unidad de transformada grande
ES2648061T3 (es) Procedimiento y aparato para codificar/decodificar por entropía un coeficiente de transformación