ES2760475T3 - Codificación de imagen usando unidades de transformación grandes - Google Patents

Codificación de imagen usando unidades de transformación grandes Download PDF

Info

Publication number
ES2760475T3
ES2760475T3 ES18200773T ES18200773T ES2760475T3 ES 2760475 T3 ES2760475 T3 ES 2760475T3 ES 18200773 T ES18200773 T ES 18200773T ES 18200773 T ES18200773 T ES 18200773T ES 2760475 T3 ES2760475 T3 ES 2760475T3
Authority
ES
Spain
Prior art keywords
unit
units
coding
prediction
encoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES18200773T
Other languages
English (en)
Inventor
Tammy Lee
Woo-Jin Han
Jianle Chen
Hae-Kyung Jung
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Application granted granted Critical
Publication of ES2760475T3 publication Critical patent/ES2760475T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/24Systems for the transmission of television signals using pulse code modulation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/625Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using discrete cosine transform [DCT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding

Abstract

Un aparato de codificación de imagen que comprende: un procesador configurado para: generar información acerca de una unidad de codificación máxima, usada para dividir una imagen en una pluralidad de unidades de codificación máximas cuadradas, generar información acerca de unidades de codificación, que tienen diferentes tamaños de acuerdo con las profundidades incluidas en la unidad de codificación máxima, usada para dividir jerárquicamente una unidad de codificación máxima, entre la pluralidad de unidades de codificación máximas, en unidades de codificación cuadradas; realizar intra predicción o inter predicción sobre al menos una unidad de predicción para generar un predictor; y generar coeficientes de transformación basados en el predictor y la imagen, en el que: la unidad de codificación máxima se divide jerárquicamente en las unidades de codificación, incluida una unidad de codificación de una profundidad actual y una unidad de codificación de una profundidad superior que la profundidad actual, la unidad de codificación de la profundidad actual se divide en cuatro unidades de codificación de la profundidad superior a la profundidad actual, independientemente de las unidades de codificación vecinas de la profundidad actual, y la unidad de codificación de la profundidad superior a la profundidad actual se predice usando al menos una unidad de predicción y se transforma usando al menos una unidad de transformación, en el que la al menos una unidad de predicción es una entre bloques que incluye: un bloque de tamaño igual a la unidad de codificación de la profundidad superior a la profundidad actual; y un bloque entre una pluralidad de bloques generados dividiendo igualmente al menos uno de la altura y el ancho de la unidad de codificación de la profundidad superior a la profundidad actual, en el que la al menos una unidad de transformación es una entre bloques que incluye: un bloque de tamaño igual a la unidad de codificación de la profundidad superior a la profundidad actual; y un bloque entre una pluralidad de bloques generados dividiendo igualmente la altura y el ancho de la profundidad superior a la unidad de codificación de la profundidad actual, y caracterizado porque el aparato de codificación está configurado para soportar una unidad de transformación, entre la al menos una unidad de transformación, que tiene un tamaño de 2Nx2N que incluye cuatro unidades de predicción que tienen un tamaño de NxN.

Description

DESCRIPCIÓN
Codificación de imagen usando unidades de transformación grandes
Campo técnico
Las realizaciones ejemplares se refieren a un procedimiento y aparato para codificar y decodificar una imagen, y más particularmente, a un procedimiento y aparato para codificar y decodificar una imagen transformando una imagen de un dominio de píxeles en coeficientes de un dominio de frecuencia.
En esta divulgación, la expresión "realización ejemplar" debe entenderse como que significa "ejemplo".
Antecedentes de la técnica
Para realizar compresión de imagen, la mayoría de procedimientos y aparatos de codificación y decodificación codifican una imagen transformando una imagen de un dominio de píxel en coeficientes de un dominio de frecuencia. Una transformada de coseno discreta (DCT), que es una de las técnicas de transformada de frecuencia, es una técnica bien conocida que se usa ampliamente en compresión de imagen o sonido. Un procedimiento de codificación de imagen usando la DCT implica realizar la DCT en una imagen de un dominio de píxel, generando coeficientes de coseno discretos, cuantificando los coeficientes de coseno discretos generados y realizando codificación de entropía en los coeficientes de coseno discretos generados.
Wiegand T y col.:"Overview of the H.264/AVC video coding standard", IEEE Transactions on Circuits and Systems for Video Technology, Vol. 13, N.° 7, julio de 2003 proporciona una descripción general de las características técnicas de H.264/AVC, describe perfiles y aplicaciones para el estándar, y perfila la historia del proceso de estandarización.
Divulgación
Solución técnica
Las realizaciones ejemplares proporcionan un procedimiento y aparato para codificar y decodificar una imagen mediante el uso de una transformada de coseno discreto (DCT) más eficiente, y también proporciona un medio de grabación legible por ordenador que tiene grabado en el mismo un programa para ejecutar el procedimiento.
Efectos ventajosos
De acuerdo con la una o más realizaciones ejemplares, es posible establecer la unidad de transformación para ser mayor que la unidad de predicción y para realizar la DCT, de modo que una imagen puede comprimirse y codificarse eficientemente.
Descripción de los dibujos
Las anteriores y otras características de las realizaciones ejemplares serán más evidentes describiendo en detalle realizaciones ilustrativas de las mismas con referencia a los dibujos adjuntos en los que:
la Figura 1 es un diagrama de bloques de un aparato de codificación de imagen de acuerdo con una realización ilustrativa;
la Figura 2 es un diagrama de un aparato de decodificación de imagen de acuerdo con otra realización ilustrativa; la Figura 3 es un diagrama de una unidad de codificación jerárquica de acuerdo con otra realización ilustrativa; la Figura 4 es un diagrama de bloques de un codificador de imagen a base de una unidad de codificación de acuerdo con otra realización ilustrativa;
la Figura 5 es un diagrama de bloques de un decodificador de imagen a base de una unidad de codificación de acuerdo con otra realización ilustrativa;
la Figura 6 ilustra una unidad de codificación máxima, unidades de sub-codificación y unidades de predicción de acuerdo con otra realización ilustrativa;
la Figura 7 es un diagrama de una unidad de codificación y una unidad de transformación de acuerdo con otra realización ilustrativa;
las Figuras 8A y 8B ilustran formas de división de una unidad de codificación máxima, una unidad de predicción, y una unidad de transformación de acuerdo con otra realización ilustrativa;
la Figura 9 es un diagrama de bloques de un aparato de codificación de imagen de acuerdo con otra realización ilustrativa;
la Figura 10 es un diagrama del transformador;
las Figuras 11A a 11C ilustran tipos de una unidad de transformación de acuerdo con otra realización ilustrativa; la Figura 12 ilustra unidades de transformación diferentes de acuerdo con otra realización ilustrativa;
la Figura 13 es un diagrama de bloques de un aparato de decodificación de imagen de acuerdo con otra realización ilustrativa;
la Figura 14 es un diagrama de flujo de un procedimiento de codificación de imagen, de acuerdo con una realización ilustrativa; y
la Figura 15 es un diagrama de flujo de un procedimiento de decodificación de imagen, de acuerdo con otra realización ilustrativa.
Mejor modo
De acuerdo con una realización, se proporciona un aparato de codificación de imagen como se establece en la reivindicación 1 adjunta.
De acuerdo con otra realización, se proporciona un medio de grabación legible por ordenador no transitorio para almacenar datos de vídeo como se establece en la reivindicación 2 adjunta.
Modo para la invención
En lo sucesivo, las realizaciones ilustrativas se describirán en detalle con referencia a los dibujos adjuntos. En las realizaciones ilustrativas, "unidad" puede referirse o no a una unidad de tamaño, dependiendo de su contexto, e "imagen" puede representar una imagen fija para un video o una imagen en movimiento, es decir, el propio video.
La Figura 1 es un diagrama de bloques de un aparato 100 para la codificación de una imagen, de acuerdo con una realización ilustrativa.
Haciendo referencia a la Figura 1, el aparato 100 incluye una unidad 110 de división de unidad de codificación máxima, una unidad 120 de determinación de profundidad de codificación, un codificador 130 de datos de imagen y un codificador 140 de información de codificación.
La unidad 110 de división de unidad de codificación máxima puede dividir una instantánea o corte actual a base de una unidad de codificación máxima que es una unidad de codificación del tamaño más grande. Es decir, la unidad 110 de división de unidad de codificación máxima puede dividir la instantánea o corte actual para obtener al menos una unidad de codificación máxima.
De acuerdo con una realización ilustrativa, una unidad de codificación puede representarse usando una unidad de codificación máxima y una profundidad. Como se ha descrito anteriormente, la unidad de codificación máxima indica una unidad de codificación que tiene el tamaño más grande de entre unidades de codificación de la instantánea actual y la profundidad indica el tamaño de una unidad de sub-codificación obtenida disminuyendo jerárquicamente la unidad de codificación. A medida que una profundidad aumenta, una unidad de codificación puede disminuir en tamaño desde una unidad de codificación máxima a una unidad de codificación mínima, en la que una profundidad de la unidad de codificación máxima se define como una profundidad mínima y una profundidad de la unidad de codificación mínima se define como una profundidad máxima. Ya que el tamaño de una unidad de codificación disminuye desde una unidad de codificación máxima a medida que una profundidad aumenta, una unidad de sub-codificación de una k'ésima profundidad puede incluir una pluralidad de unidades de sub-codificación de una (k+n)'ésima profundidad (k y n son enteros iguales o mayores de 1).
De acuerdo con un aumento del tamaño de una fotografía a codificar, codificar una imagen en una unidad de codificación mayor puede resultar en una relación de compresión de imagen más alta. Sin embargo, si se fija una unidad de codificación mayor, una imagen no puede codificarse eficientemente teniendo en cuenta las características de imagen continuamente cambiantes.
Por ejemplo, cuando se codifica un área uniforme tales como el mar o cielo, cuanto mayor es una unidad de codificación, más puede aumentar la relación de compresión. Sin embargo, cuando se codifica un área compleja tales como gente o edificios, cuanto más pequeña es una unidad de codificación, más se puede aumentar una relación de compresión.
Por consiguiente, de acuerdo con una realización ilustrativa, se establecen una unidad de codificación de imagen máxima diferente y una profundidad máxima diferente para cada instantánea o corte. Ya que una profundidad máxima indica el número máximo de veces por las que puede disminuir una unidad de codificación, el tamaño de cada unidad de codificación mínima incluida en una unidad de codificación de imagen máxima puede establecerse de forma variable de acuerdo con una profundidad máxima.
La unidad 120 de determinación de profundidad de codificación determina una profundidad máxima. La profundidad máxima puede determinarse a base de cálculo de coste de Tasa-Distorsión (R-D). La profundidad máxima puede determinarse de forma diferente para cada instantánea o corte o para cada unidad de codificación máxima. La profundidad máxima determinada se proporciona al codificador 140 de información de codificación y datos de imagen de acuerdo con unidades de codificación máxima se proporcionan al codificador 130 de datos de imagen.
La profundidad máxima indica una unidad de codificación que tiene el tamaño más pequeño, que puede incluirse en una unidad de codificación máxima, es decir, una unidad de codificación mínima. En otras palabras, una unidad de codificación máxima puede dividirse en unidades de sub-codificación que tienen diferentes tamaños de acuerdo con profundidades diferentes. Esto se describe en detalle más adelante con referencia a las Figuras 8A y 8B. Además, las unidades de sub-codificación que tienen tamaños diferentes, que se incluyen en la unidad de codificación máxima, pueden predecirse o transformarse a base de unidades de procesamiento que tienen tamaños diferentes. En otras palabras, el aparato 100 puede realizar una pluralidad de operaciones de procesamiento de codificación de imagen a base de unidades de procesamiento que tienen diversos tamaños y diversas formas. Para codificar datos de imagen, se realizan operaciones de procesamiento tales como predicción, transformación y codificación de entropía, en las que unidades de procesamiento que tienen el mismo tamaño pueden usarse para cada operación o unidades de procesamiento que tienen diferentes tamaños pueden usarse para cada operación.
Por ejemplo, el aparato 100 puede seleccionar una unidad de procesamiento que es diferente de una unidad de codificación para predecir la unidad de codificación.
Cuando el tamaño de una unidad de codificación es 2Nx2N (en el que N es un entero positivo), unidades de procesamiento para predicción pueden ser2N x2N, 2Nx N, Nx2N y Nx N. En otras palabras, predicción de movimiento puede realizarse a base de una unidad de procesamiento que tiene una forma con lo que al menos una de altura y anchura de una unidad de codificación se divide equitativamente por dos. En lo sucesivo, una unidad de procesamiento, que es la base de predicción, se define como una 'unidad de predicción'.
Un modo de predicción puede ser al menos uno de un intra modo, un inter modo y un modo de salto, y un modo de predicción específico puede realizarse para únicamente una unidad de predicción que tiene un tamaño o forma específicos. Por ejemplo, el intra modo puede realizarse únicamente para unidades de predicción que tienen los tamaños de 2Nx2N y Nx N de los cuales la forma es un cuadrado. Además, el modo de salto puede realizarse para únicamente una unidad de predicción que tiene el tamaño de 2Nx2N. Si existe una pluralidad de unidades de predicción en una unidad de codificación, el modo de predicción con los últimos errores de codificación puede seleccionarse tras realizar predicción para cada unidad de predicción.
Como alternativa, el aparato 100 puede realizar transformación de frecuencia en datos de imagen a base de una unidad de procesamiento que tiene un tamaño diferente de una unidad de codificación. Para la transformación de frecuencia en la unidad de codificación, la transformación de frecuencia puede realizarse a base de una unidad de procesamiento que tiene un tamaño igual a o más pequeño que el de la unidad de codificación. En lo sucesivo, una unidad de procesamiento, que es la base de transformación de frecuencia, se define como una 'unidad de transformación'. La transformación de frecuencia puede ser una Transformada de Coseno Discreta (DCT) o una Transformada de Karhunen-Loeve (KLT).
La unidad 120 de determinación de profundidad de codificación puede determinar unidades de sub-codificación incluidas en una unidad de codificación máxima usando optimización RD a base de un multiplicador de Lagrangian. En otras palabras, la unidad 120 de determinación de profundidad de codificación puede determinar las formas de una pluralidad de unidades de sub-codificación divididas de la unidad de codificación máxima, en las que la pluralidad de unidades de sub-codificación tienen diferentes tamaños de acuerdo con sus profundidades. El codificador 130 de datos de imagen emite una secuencia de bits codificando la unidad de codificación máxima a base de las formas de división, es decir, las formas que dividen la unidad de codificación máxima, como se determina mediante la unidad 120 de determinación de profundidad de codificación.
El codificador 140 de información de codificación codifica información acerca de un modo de codificación de la unidad de codificación máxima determinada mediante la unidad 120 de determinación de profundidad de codificación. En otras palabras, el codificador 140 de información de codificación emite una secuencia de bits mediante información de codificación a cerca de una forma de división de la unidad de codificación máxima, información acerca de la profundidad máxima e información acerca de un modo de codificación de una unidad de sub-codificación para cada profundidad. La información acerca del modo de codificación de la unidad de sub-codificación puede incluir información acerca de una unidad de predicción de la unidad de sub-codificación, información acerca de un modo de predicción para cada unidad de predicción e información acerca de una unidad de transformación de la unidad de sub­ codificación.
Ya que existen unidades de sub-codificación que tienen diferentes tamaños para cada unidad de codificación máxima y debe determinarse información acerca de un modo de codificación para cada unidad de sub-codificación, puede determinarse información acerca de al menos un modo de codificación para una unidad de codificación máxima.
El aparato 100 puede generar unidades de sub-codificación dividiendo equitativamente en dos tanto altura como anchura de una unidad de codificación máxima de acuerdo con un aumento de profundidad. Es decir, cuando el tamaño de una unidad de codificación de una k'ésima profundidad es 2Nx2N, el tamaño de una unidad de codificación de una (k+1)'ésima profundidad es Nx N.
Por consiguiente, el aparato 100 de acuerdo con una realización ilustrativa puede determinar una forma de división óptima para cada unidad de codificación máxima a base de tamaños de unidades de codificación máxima y una profundidad máxima en consideración de las características de imagen. Ajustando de forma variable el tamaño de una unidad de codificación máxima en consideración de las características de imagen y codificando una imagen a través de la división de una unidad de codificación máxima en unidades de sub-codificación de profundidades diferentes, imágenes que tienen diversas resoluciones pueden codificarse más eficientemente.
La Figura 2 es un diagrama de bloques de un aparato 200 para la decodificación una imagen de acuerdo con una realización ilustrativa.
Haciendo referencia a la Figura 2, el aparato 200 incluye una unidad 210 de obtención de datos de imagen, una unidad 220 de extracción de información de codificación y un decodificador 230 de datos de imagen.
La unidad 210 de obtención de datos de imagen adquiere datos de imagen de acuerdo con unidades de codificación máxima analizando una secuencia de bits recibido por el aparato 200 y emite los datos de imagen al decodificador 230 de datos de imagen. La unidad 210 de obtención de datos de imagen puede extraer información acerca de una unidad de codificación máxima de una instantánea o corte actual de un encabezamiento de la instantánea o corte actual. En otras palabras, la unidad 210 de obtención de datos de imagen divide la secuencia de bits en la unidad de codificación máxima de modo que el decodificador 230 de datos de imagen puede decodificar los datos de imagen de acuerdo con unidades de codificación máxima.
La unidad 220 de extracción de información de codificación extrae información acerca de una unidad de codificación máxima, una profundidad máxima, una forma de división de la unidad de codificación máxima, un modo de codificación de unidades de sub-codificación del encabezamiento de la instantánea actual analizando la secuencia de bits recibido por el aparato 200. La información acerca de una forma de división y la información acerca de un modo de codificación se proporcionan al decodificador 230 de datos de imagen.
La información acerca de una forma de división de la unidad de codificación máxima puede incluir información acerca de unidades de sub-codificación que tienen diferentes tamaños de acuerdo con profundidades incluidas en la unidad de codificación máxima y la información acerca de un modo de codificación puede incluir información acerca de una unidad de predicción de acuerdo con unidad de sub-codificación, información acerca de un modo de predicción e información acerca de una unidad de transformación.
El decodificador 230 de datos de imagen restablece la instantánea actual decodificando datos de imagen de cada unidad de codificación máxima a base de la información extraída por la unidad 220 de extracción de información de codificación. El decodificador 230 de datos de imagen puede decodificar unidades de sub-codificación incluidas en una unidad de codificación máxima a base de la información acerca de una forma de división de la unidad de codificación máxima. Un procedimiento de decodificación puede incluir una predicción procedimiento que incluye intra predicción y compensación de movimiento y un procedimiento de transformación inversa.
El decodificador 230 de datos de imagen puede realizar intra predicción o inter predicción a base de información acerca de una unidad de predicción e información acerca de un modo de predicción para predecir una unidad de predicción. El decodificador 230 de datos de imagen también puede realizar transformación inversa para cada unidad de sub­ codificación a base de información acerca de una unidad de transformación de una unidad de sub-codificación.
La Figura 3 ilustra unidades de codificación jerárquica de acuerdo con una realización ilustrativa.
Haciendo referencia a la Figura 3, las unidades de codificación jerárquica de acuerdo con una realización ilustrativa pueden incluir unidades de codificación cuya anchurax altura son 64x64, 32x 32, 16x 16, 8x 8 y 4x4. Además de estas unidades de codificación que tienen formas cuadradas perfectas, también pueden existir unidades de codificación cuya anchurax altura son 64x 32, 32x64, 32x 16, 16x32, 16x 8, 8x 16, 8x4 y 4x 8.
Haciendo referencia a la Figura 3, para datos 310 de imagen cuya resolución es de 1920x 1080, el tamaño de una unidad de codificación máxima se establece a 64x64, y una profundidad máxima se establece a 2.
Para datos 320 de imagen cuya resolución es de 1920x 1080, el tamaño de una unidad de codificación máxima se establece a 64x64 y una profundidad máxima se establece a 4. Para datos 330 de imagen cuya resolución es de 352x288, el tamaño de una unidad de codificación máxima se establece a 16x 16 y una profundidad máxima se establece a 1.
Cuando la resolución es alta o la cantidad de datos es alta, es preferible, pero no necesariamente, que un tamaño máximo de una unidad de codificación sea relativamente grande para aumentar una relación de compresión y reflejar exactamente características de imagen. Por consiguiente, para los datos 310 y 320 de imagen que tienen resolución más alta que los datos 330 de imagen, puede seleccionarse 64x64 como el tamaño de una unidad de codificación máxima.
Una profundidad máxima indica el número total de capas en las unidades de codificación jerárquica. Ya que la profundidad máxima de los datos 310 de imagen es 2, una unidad 315 de codificación de los datos 310 de imagen puede incluir una unidad de codificación máxima cuyo tamaño de eje más largo es 64 y unidades de sub-codificación cuyos tamaños de eje más largo son 32 y 16, de acuerdo con un aumento de una profundidad.
Por otra parte, ya que la profundidad máxima de los datos 330 de imagen es 1, una unidad 335 de codificación de los datos 330 de imagen puede incluir una unidad de codificación máxima cuyo tamaño de eje más largo es 16 y unidades de codificación cuyos tamaños de eje más largo son 8, de acuerdo con un aumento de una profundidad.
Sin embargo, ya que la profundidad máxima de los datos 320 de imagen es 4, una unidad 325 de codificación de los datos 320 de imagen puede incluir una unidad de codificación máxima cuyo tamaño de eje más largo es 64 y unidades de sub-codificación cuyos tamaños de eje más largo son 32, 16, 8 y 4 de acuerdo con un aumento de una profundidad. Ya que una imagen se codifica a base de una unidad de sub-codificación más pequeña a medida que una profundidad aumenta, la realización ilustrativa es adecuada para la codificación de una imagen que incluye más detalles minuciosos en escenas.
La Figura 4 es un diagrama de bloques de un codificador de imagen 400 a base de una unidad de codificación, de acuerdo con una realización ilustrativa.
Un intra predictor 410 realiza intra predicción en unidades de predicción del intra modo en un fotograma 405 actual, y una unidad 420 de estimación de movimiento y una unidad 425 compensación de movimiento realizan inter predicción y compensación de movimiento en unidades de predicción del inter modo usando el fotograma 405 actual y un fotograma 495 de referencia.
Valores residuales se generan a base de las unidades de predicción emitidas desde el intra predictor 410, la unidad 420 de estimación de movimiento y la unidad 425 compensación de movimiento, y los valores residuales generados se emiten como coeficientes de transformación cuantificados pasando a través de un transformador 430 y una unidad 440 de cuantificación.
Los coeficientes de transformada cuantificados se restauran a valores residuales pasando a través de una unidad 460 de cuantificación inversa y un transformador 470 inverso de frecuencia, y los valores residuales restaurados se post­ procesan pasando a través de una unidad 480 de desbloqueo y una unidad 490 de filtración de bucle y emitidos como el fotograma 495 de referencia. Los coeficientes de transformada cuantificados pueden emitirse como una secuencia 455 de bits pasando a través de un codificador 450 de entropía.
Para realizar codificación a base de un procedimiento de codificación de acuerdo con una realización ilustrativa, componentes del codificador de imagen 400, es decir, el intra predictor 410, la unidad 420 de estimación de movimiento, la unidad 425 compensación de movimiento, el transformador 430, la unidad 440 de cuantificación, el codificador 450 de entropía, la unidad 460 de cuantificación inversa, el transformador 470 inverso de frecuencia, la unidad 480 de desbloqueo y la unidad 490 de filtración de bucle, realizan procedimientos de codificación de imagen a base de una unidad de codificación máxima, una unidad de sub-codificación de acuerdo con profundidades, una unidad de predicción y una unidad de transformación.
La Figura 5 es un diagrama de bloques de un decodificador 500 de imagen a base de una unidad de codificación, de acuerdo con una realización ilustrativa.
Una secuencia 505 de bits pasa a través de una unidad 510 de análisis de modo que se analizan datos de imagen codificados a decodificar e información de codificación necesaria para la decodificación. Los datos de imagen codificados se emiten como datos cuantificados inversamente pasando a través de un decodificador 520 de entropía y una unidad 530 de cuantificación inversa y restauran a valores residuales pasando a través de un transformador 540 inverso de frecuencia. Los valores residuales se restauran de acuerdo con unidades de codificación añadiéndose a un resultado de intra predicción de un intra predictor 550 o un resultado de compensación de movimiento de una unidad 560 de compensación de movimiento. Las unidades de codificación restauradas se usan para predicción de unidades de codificación siguientes o una fotografía siguiente pasando a través de una unidad 570 de desbloqueo y una unidad 580 de filtración de bucle.
Para realizar decodificación a base de un procedimiento de decodificación de acuerdo con una realización ilustrativa, componentes del decodificador 500 de imagen, es decir, la unidad 510 de análisis, el decodificador 520 de entropía, la unidad 530 de cuantificación inversa, el transformador 540 inverso de frecuencia, el intra predictor 550, la unidad 560 de compensación de movimiento, la unidad 570 de desbloqueo y la unidad 580 de filtración de bucle, realizan procedimientos de decodificación de imagen a base de una unidad de codificación máxima, una unidad de sub­ codificación de acuerdo con profundidades, una unidad de predicción y una unidad de transformación.
En particular, el intra predictor 550 y la unidad 560 de compensación de movimiento determina una unidad de predicción y un modo de predicción en una unidad de sub-codificación considerando una unidad de codificación máxima y una profundidad, y el transformador 540 inverso de frecuencia realiza transformación inversa considerando el tamaño de una unidad de transformación.
La Figura 6 ilustra una unidad de codificación máxima, una unidad de sub-codificación y una unidad de predicción, de acuerdo con una realización ilustrativa.
El aparato 100 y el aparato 200 de acuerdo con una realización ilustrativa usa unidades de codificación jerárquica para realizar codificación y decodificación en consideración de las características de imagen. Una unidad de codificación máxima y una profundidad máxima pueden establecerse adaptativamente de acuerdo con la imagen características o establecerse variablemente de acuerdo con requisitos de un usuario.
Una estructura 600 de unidad de codificación jerárquica de acuerdo con una realización ilustrativa ilustra una unidad 610 de codificación máxima cuya altura y anchura son 64 y profundidad máxima es 4. Una profundidad aumenta a lo largo de un eje vertical de la estructura 600 de unidad de codificación jerárquica y a medida que aumenta una profundidad, disminuyen alturas y anchuras de las unidades 620 a 650 de sub-codificación. Unidades de predicción de la unidad 610 de codificación máxima y las unidades 620 a 650 de sub-codificación se muestran a lo largo de un eje horizontal de la estructura 600 de unidad de codificación jerárquica.
La unidad 610 de codificación máxima tiene una profundidad de 0 y el tamaño de una unidad de codificación, es decir, altura y anchura, de 64x64. Una profundidad aumenta a lo largo del eje vertical y existe una unidad 620 de sub­ codificación cuyo tamaño es 32x 32 y profundidad es 1, una unidad 630 de sub-codificación cuyo tamaño es 16x 16 y profundidad es 2, una unidad 640 de sub-codificación cuyo tamaño es 8x 8 y profundidad es 3 y una unidad 650 de sub-codificación cuyo tamaño es 4x4 y profundidad es 4. La unidad 650 de sub-codificación cuyo tamaño es 4x4 y profundidad es 4 es una unidad de codificación mínima y la unidad de codificación mínima puede dividirse en unidades de predicción, cada una de las cuales es menor que la unidad de codificación mínima.
Haciendo referencia a la Figura 6, se muestran ejemplos de una unidad de predicción a lo largo del eje horizontal de acuerdo con cada profundidad. Es decir, una unidad de predicción de la unidad 610 de codificación máxima cuya profundidad es 0 puede ser una unidad de predicción cuyo tamaño es igual a la unidad 610 de codificación, es decir, 64x64 o una unidad 612 de predicción cuyo tamaño es 64x32, una unidad de 614 predicción cuyo tamaño es 32x64 o una unidad 616 de predicción cuyo tamaño es 32x 32, que tiene un tamaño más pequeño que la unidad 610 de codificación cuyo tamaño es 64x64.
Una unidad de predicción de la unidad 620 de codificación cuya profundidad es 1 y tamaño es 32x 32 puede ser una unidad de predicción cuyo tamaño es igual a la unidad 620 de codificación, es decir, 32x32 o una unidad 622 de predicción cuyo tamaño es 32x 16, una unidad 624 de predicción cuyo tamaño es 16x 32 o una unidad 626 de predicción cuyo tamaño es 16x 16, que tiene un tamaño más pequeño que la unidad 620 de codificación cuyo tamaño es 32x32.
Una unidad de predicción de la unidad 630 de codificación cuya profundidad es 2 y tamaño es 16x 16 puede ser una unidad de predicción cuyo tamaño es igual a la unidad 630 de codificación, es decir, 16x 16, o una unidad 632 de predicción cuyo tamaño es 16x 8, una unidad 634 de predicción cuyo tamaño es 8x 16 o una unidad 636 de predicción cuyo tamaño es 8x8, que tiene un tamaño más pequeño que la unidad 630 de codificación cuyo tamaño es 16x 16.
Una unidad de predicción de la unidad 640 de codificación cuya profundidad es 3 y tamaño es 8x8 puede ser una unidad de predicción cuyo tamaño es igual a la unidad 640 de codificación, es decir, 8x 8, o una unidad 642 de predicción cuyo tamaño es 8x4, una unidad 644 de predicción cuyo tamaño es 4x 8 o una unidad 646 de predicción cuyo tamaño es 4x4, que tiene un tamaño más pequeño que la unidad 640 de codificación cuyo tamaño es 8x8.
Finalmente, la unidad 650 de codificación cuya profundidad es 4 y tamaño es 4x4 es una unidad de codificación mínima y una unidad de codificación de una profundidad máxima, y una unidad de predicción de la unidad 650 de codificación puede ser una unidad 650 de predicción cuyo tamaño es 4x4, una unidad 652 de predicción que tiene un tamaño de 4x2, una unidad 654 de predicción que tiene un tamaño de 2x4 o una unidad 656 de predicción que tiene un tamaño de 2x2.
La Figura 7 ilustra una unidad de codificación y una unidad de transformación, de acuerdo con una realización ilustrativa.
El aparato 100 y el aparato 200, de acuerdo con una realización ilustrativa, realizan codificación con una propia unidad de codificación máxima o con unidades de sub-codificación, que son iguales a o más pequeñas que la unidad de codificación máxima, divididas de la unidad de codificación máxima.
En el procedimiento de codificación, se selecciona el tamaño de una unidad de transformación para la transformación de frecuencia para no ser más grande que el de una unidad de codificación correspondiente. Por ejemplo, cuando una unidad 710 de codificación tiene el tamaño de 64x64, puede realizarse transformación de frecuencia usando una unidad 720 de transformación que tiene el tamaño de 32x 32.
Las Figuras 8A y 8B ilustran formas de división de una unidad de codificación, una unidad de predicción y una unidad de transformación, de acuerdo con una realización ilustrativa.
La Figura 8A ilustra una unidad de codificación y una unidad de predicción, de acuerdo con una realización ilustrativa.
Un lado izquierdo de la Figura 8A muestra una forma de división seleccionada por el aparato 100, de acuerdo con una realización ilustrativa, para codificar una unidad 810 de codificación máxima. El aparato 100 divide la unidad 810 de codificación máxima en diversas formas, realiza codificación y selecciona una forma de división óptima comparando resultados de codificación de diversas formas de división entre sí a base de coste R-D. Cuando es óptimo codificar la unidad 810 de codificación máxima tal como está, la unidad 810 de codificación máxima puede codificarse sin dividir la unidad 810 de codificación máxima como se ilustra en las Figuras 8A y 8B.
Haciendo referencia al lado izquierdo de la Figura 8A, la unidad 810 de codificación máxima cuya profundidad es 0 se codifica dividiendo la misma en unidades de sub-codificación cuyas profundidades son iguales a o mayores que 1. Es decir, la unidad 810 de codificación máxima se divide en 4 unidades de sub-codificación cuyas profundidades son 1, y todas o algunas de las unidades de sub-codificación cuyas profundidades son 1 se dividen en unidades de sub­ codificación cuyas profundidades son 2.
Una unidad de sub-codificación ubicada en un lado superior derecho y una unidad de sub-codificación ubicada en un lado inferior izquierdo entre las unidades de sub-codificación cuyas profundidades son 1 se dividen en unidades de sub-codificación cuyas profundidades son iguales a o mayores que 2. Algunas de las unidades de sub-codificación cuyas profundidades son iguales a o mayores que 2 pueden dividirse en unidades de sub-codificación cuyas profundidades son iguales a o mayores que 3.
El lado derecho de la Figura 8A muestra una forma de división de una unidad de predicción para la unidad 810 de codificación máxima.
Haciendo referencia al lado derecho de la Figura 8A, una unidad 860 de predicción para la unidad 810 de codificación máxima puede dividirse de forma diferente que la unidad 810 de codificación máxima. En otras palabras, una unidad de predicción para cada una de las unidades de sub-codificación puede ser más pequeña que una correspondiente unidad de sub-codificación.
Por ejemplo, una unidad de predicción para una unidad 854 de sub-codificación ubicada en un lado inferior derecho entre las unidades de sub-codificación cuyas profundidades son 1 puede ser más pequeña que la unidad 854 de sub­ codificación. Además, unidades de predicción para algunas (814, 816, 850 y 852) unidades 814, 816, 818, 828, 850 y 852 de sub-codificación cuyas profundidades son 2 pueden ser más pequeñas que las unidades 814, 816, 850 y 852 de sub-codificación, respectivamente. Además, unidades de predicción para unidades 822, 832 y 848 de sub­ codificación cuyas profundidades son 3 pueden ser más pequeñas que las unidades 822, 832 y 848 de sub­ codificación, respectivamente. Las unidades de predicción pueden tener una forma con lo que respectivas unidades de sub-codificación se dividen equitativamente por dos en una dirección de altura o anchura o tienen una forma con lo que respectivas unidades de sub-codificación se dividen equitativamente por cuatro en direcciones de altura y anchura.
La Figura 8B ilustra una unidad de predicción y una unidad de transformación, de acuerdo con una realización ilustrativa.
Un lado izquierdo de la Figura 8B muestra una forma de división de una unidad de predicción para la unidad 810 de codificación máxima mostrada en el lado derecho de la Figura 8A y un lado derecho de la Figura 8B muestra una forma de división de una unidad de transformación de la unidad 810 de codificación máxima.
Haciendo referencia al lado derecho de la Figura 8B, una forma de división de una unidad 870 de transformación puede establecerse de forma diferente que la unidad 860 de predicción.
Por ejemplo, incluso aunque una unidad de predicción para la unidad 854 de codificación cuya profundidad es 1 se selecciona con una forma con lo que la altura de la unidad 854 de codificación se divide equitativamente por dos, puede seleccionarse una unidad de transformación con el mismo tamaño que la unidad 854 de codificación. Análogamente, incluso aunque se seleccionan unidades de predicción para unidades 814 y 850 de codificación cuyas profundidades son 2 con una forma con lo que la altura de cada una de las unidades 814 y 850 de codificación se divide equitativamente por dos, puede seleccionarse una unidad de transformación con el mismo tamaño que el tamaño original de cada una de las unidades 814 y 850 de codificación.
Una unidad de transformación puede seleccionarse con un tamaño más pequeño que una unidad de predicción. Por ejemplo, cuando se selecciona una unidad de predicción para la unidad 852 de codificación cuya profundidad es 2 con una forma con lo que la anchura de la unidad 852 de codificación se divide equitativamente por dos, puede seleccionarse una unidad de transformación con una forma con lo que la unidad 852 de codificación se divide equitativamente por cuatro en direcciones de altura y anchura, que tiene un tamaño más pequeño que la forma de la unidad de predicción.
La Figura 9 es un diagrama de bloques de un aparato 900 de codificación de imagen de acuerdo con otra realización ilustrativa.
Haciendo referencia a la Figura 9, el aparato 900 de codificación de imagen de acuerdo con la presente realización ilustrativa incluye un transformador 910, una unidad 920 de cuantificación y un codificador 930 de entropía.
El transformador 910 recibe una imagen unidad de procesamiento de un dominio de píxel y transforma la imagen unidad de procesamiento en un dominio de frecuencia. El transformador 910 recibe una pluralidad de unidades de predicción que incluyen valores residuales generados debido a intra predicción o inter predicción y transforma las unidades de predicción en un dominio de frecuencia. Como resultado de la transformada al dominio de la frecuencia, se generan coeficientes de componentes de frecuencia. De acuerdo con la presente realización ilustrativa, la transformada al dominio de la frecuencia puede producirse a través de una Transformada de Coseno Discreta (DCT) o Transformada de Karhunen-Loeve (KLT), y como resultado de la DCT o KLT, se generan coeficientes de dominio de frecuencia. En lo sucesivo, la transformada al dominio de la frecuencia puede ser la DCT, sin embargo, es obvio para un experto en la técnica que la transformada al dominio de la frecuencia puede ser cualquier transformada que implica transformación de una imagen de un dominio de píxel en un dominio de frecuencia.
También, de acuerdo con la presente realización ilustrativa, el transformador 910 establece una unidad de transformación agrupando una pluralidad de unidades de predicción y realiza la transformación de acuerdo con la unidad de transformación. Este procedimiento se describirá en detalle con referencia a las Figuras 10, 11A, 11B y 12.
La Figura 10 es un diagrama del transformador 910.
Haciendo referencia a la Figura 10, el transformador 910 incluye una unidad 1010 de selección y una unidad 1020 de realización de transformación.
La unidad 1010 de selección establece una unidad de transformación seleccionando una pluralidad de unidades de predicción adyacentes.
Un aparato de codificación de imagen de acuerdo con la técnica relacionada realiza intra predicción o inter predicción de acuerdo con un bloque que tiene un tamaño predeterminado, es decir, de acuerdo con una unidad de predicción, y realiza la DCT a base de un tamaño que es menor que o igual al de la unidad de predicción. En otras palabras, el aparato de codificación de imagen de acuerdo con la técnica relacionada realiza la DCT usando unidades de transformación que son menores que o iguales a la unidad de predicción.
Sin embargo, debido a una pluralidad de piezas de información de encabezamiento añadidas a las unidades de transformación, se aumentan sobrecargas añadidas a medida que se disminuyen las unidades de transformación, de tal forma que se deteriora una tasa de compresión de una operación de codificación de imagen. Para resolver este problema, el aparato 900 de codificación de imagen de acuerdo con la presente realización ilustrativa agrupa una pluralidad de unidades de predicción adyacentes en una unidad de transformación y realiza transformación de acuerdo con la unidad de transformación que se genera mediante el agrupamiento. Existe una alta posibilidad de que las unidades de predicción adyacentes puedan incluir valores residuales similares, de modo que, si las unidades de predicción adyacentes se agrupan en una unidad de transformación y a continuación se realiza la transformación en la misma, puede aumentarse altamente una tasa de compresión de una operación de codificación.
Para este aumento, la unidad 1010 de selección selecciona las unidades de predicción adyacentes a agrupar en una unidad de transformación. Este procedimiento se describirá en detalle con referencia a las Figuras 11A a11C y 12.
Las Figuras 11A a 11C ilustran tipos de una unidad de transformación de acuerdo con otra realización ilustrativa.
Haciendo referencia a las Figuras 11A a 11C, una unidad 1120 de predicción con respecto a una unidad 1110 de codificación puede tener una forma de división obtenida teniendo una anchura de la unidad 1110 de codificación. La unidad 1110 de codificación puede ser una unidad de codificación máxima o puede ser una unidad de sub-codificación que tiene un tamaño más pequeño que la unidad de codificación máxima.
Como se ilustra en la Figura 11A, un tamaño de la unidad 1130 de transformación puede ser menor que la unidad 1120 de predicción, o como se ilustra en la Figura 11B, un tamaño de la unidad 1140 de transformación puede ser igual a la unidad 1120 de predicción. También, como se ilustra en la Figura 11C, un tamaño de la unidad 1150 de transformación puede ser mayor que la unidad 1120 de predicción. Es decir, las unidades 1130 a 1150 de transformación pueden establecerse mientras no tienen conexión con la unidad 1120 de predicción.
También, la Figura 11C ilustra un ejemplo en el que la unidad 1120 de predicción se establece agrupando una pluralidad de las unidades 1120 de predicción incluidas en la unidad 1110 de codificación. Sin embargo, una unidad de transformación puede establecerse para ser mayor que una unidad de codificación de una manera que una pluralidad de unidades de predicción, que se incluyen no en una unidad de codificación sino en una pluralidad de unidades de codificación, se establecen como una unidad de transformación. En otras palabras, como se describe con referencia a las Figuras 11A a 11C, una unidad de transformación puede establecerse para ser igual a o menor que un tamaño de una unidad de codificación o para ser mayor que el tamaño de la unidad de codificación. Es decir, la unidad de transformación puede establecerse mientras no tiene conexión con la unidad de predicción y la unidad de codificación.
Aunque las Figuras 11A a 11C ilustran ejemplos en los que la unidad de transformación tiene una forma cuadrada. Sin embargo, de acuerdo con un procedimiento de agrupamiento de unidades de predicción adyacentes, la unidad de transformación puede tener una forma rectangular. Por ejemplo, en un caso donde la unidad de predicción no se establece para tener formas rectangulares como se ilustra en las Figuras 11A a 11C, pero se establece para tener cuatro formas cuadradas obtenidas seccionando en cuatro la unidad 1110 de codificación, unidades de predicción superiores e inferiores o unidades de predicción izquierdas y derechas se agrupan de modo que la unidad de transformación puede tener una forma rectangular cuyo lado horizontal o lado vertical es largo.
Haciendo referencia de vuelta a la Figura 10, no existe límite en un criterio por el que la unidad 1010 de selección selecciona las unidades de predicción adyacentes. Sin embargo, de acuerdo con la realización ilustrativa, la unidad 1010 de selección puede seleccionar la unidad de transformación de acuerdo con una profundidad. Como se ha descrito anteriormente, la profundidad indica un nivel de reducción de tamaño que se realiza gradualmente desde una unidad de codificación máxima de un corte actual o una instantánea actual a una unidad de sub-codificación. Como se ha descrito anteriormente con referencia a las Figuras 3 y 6, a medida que se aumenta la profundidad, se disminuye un tamaño de una unidad de sub-codificación, y por lo tanto también se disminuye una unidad de predicción incluida en la unidad de sub-codificación. En este caso, si la transformación se realiza de acuerdo con una unidad de transformación que es menor que o igual a la unidad de predicción, se deteriora una tasa de compresión de una operación de codificación de imagen ya que información de encabezamiento se añade a cada unidad de transformación.
Así pues, con respecto a una unidad de sub-codificación en una profundidad de un valor predeterminado, es preferible, pero no necesariamente, que unidades de predicción incluidas en la unidad de sub-codificación se agrupen y establezcan como una unidad de transformación y a continuación se realiza la transformación en la misma. Para esto, la unidad 1010 de selección establece la unidad de transformación a base de la profundidad de la unidad de sub­ codificación. Por ejemplo, en el caso en el que una profundidad de la unidad 1110 de codificación en la Figura 11C es mayor que k, la unidad 1010 de selección agrupa unidades 1120 de predicción y establece las mismas como una unidad 1150 de transformación.
También, de acuerdo con otra realización ilustrativa, la unidad 1010 de selección puede agrupar una pluralidad de unidades de predicción adyacentes en las que se realiza predicción de acuerdo con el mismo modo de predicción y puede establecer las mismas como una unidad de transformación. La unidad 1010 de selección agrupa las unidades de predicción adyacentes en las que se realiza predicción de acuerdo con intra predicción o inter predicción y a continuación establece las mismas como una unidad de transformación. Ya que existe una alta posibilidad de que las unidades de predicción adyacentes en las que se realiza predicción de acuerdo con el mismo modo de predicción incluyan valores residuales similares, es posible agrupar las unidades de predicción adyacentes en la unidad de transformación y a continuación realizar la transformación en las unidades de predicción adyacentes.
Cuando la unidad 1010 de selección establece la unidad de transformación, la unidad 1020 de realización de transformación transforma las unidades de predicción adyacentes en un dominio de frecuencia, de acuerdo con la unidad de transformación. La unidad 1020 de realización de transformación realiza la DCT en las unidades de predicción adyacentes de acuerdo con la unidad de transformación y genera coeficientes de coseno discretos.
Haciendo referencia de vuelta a la Figura 9, la unidad 920 de cuantificación cuantifica coeficientes de componente de frecuencia generados por el transformador 910, por ejemplo, los coeficientes de coseno discretos. La unidad 920 de cuantificación puede cuantificar los coeficientes de coseno discretos que se introducen de acuerdo con una etapa de cuantificación predeterminada.
El codificador 930 de entropía realiza codificación de entropía en los coeficientes de componente de frecuencia que se cuantifican mediante la unidad 920 de cuantificación. El codificador 930 de entropía puede realizar la codificación de entropía en los coeficientes de coseno discretos usando codificación aritmética variable adaptativa según contexto (CABAC) o codificación de longitud variable adaptativa según contexto (CAVLC).
El aparato 900 de codificación de imagen puede determinar una unidad de transformación óptima realizando repetitivamente la DCT, la cuantificación y la codificación de entropía en diferentes unidades de transformación. Un procedimiento para la selección de las unidades de predicción adyacentes puede repetirse para determinar la unidad de transformación óptima. La unidad de transformación óptima puede determinarse en consideración de un cálculo de coste RD y esto se describirá en detalle con referencia a la Figura 12.
La Figura 12 ilustra diferentes unidades de transformación de acuerdo con otra realización ilustrativa.
Haciendo referencia a la Figura 12, el aparato 900 de codificación de imagen realiza repetidamente una operación de codificación en las diferentes unidades de transformación.
Como se ilustra en la Figura 12, puede predecirse y codificarse una unidad 1210 de codificación a base de una unidad 1220 de predicción que tiene un tamaño más pequeño que la unidad 1210 de codificación. Se realiza una transformación en valores residuales que se generan mediante un resultado de la predicción y en este documento, como se ilustra en la Figura 12, la DCT puede realizarse en los valores residuales a base de las diferentes unidades de transformación.
Una primera unidad 1230 de transformación ilustrada tiene el mismo tamaño que la unidad 1210 de codificación y tiene un tamaño obtenido agrupando todas las unidades de predicción incluidas en la unidad 1210 de codificación.
Una segunda unidad 1240 de transformación ilustrada tiene tamaños obtenidos reduciendo a la mitad una anchura de la unidad 1210 de codificación y los tamaños se obtienen agrupando cada dos unidades de predicción adyacentes entre sí en una dirección vertical, respectivamente.
Una tercera unidad 1250 de transformación ilustrada tiene tamaños obtenidos reduciendo a la mitad una altura de la unidad 1210 de codificación y los tamaños se obtienen agrupando cada dos unidades de predicción adyacentes entre sí en una dirección horizontal, respectivamente.
Una cuarta unidad 1260 de transformación ilustrada se usa cuando la transformación se realiza a base de la cuarta unidad 1260 de transformación ilustrada que tienen el mismo tamaño que la unidad 1220 de predicción.
La Figura 13 es un diagrama de bloques de un aparato 1300 de decodificación de imagen de acuerdo con otra realización ilustrativa.
Haciendo referencia a la Figura 13, el aparato 1300 de decodificación de imagen de acuerdo con la presente realización ilustrativa incluye un decodificador 1310 de entropía, una unidad 1320 de cuantificación inversa y un transformador 1330 inverso.
El decodificador 1310 de entropía realiza decodificación de entropía en coeficientes de componente de frecuencia con respecto a una unidad de transformación predeterminada. Como se ha descrito anteriormente con referencia a las Figuras 11A a 11C y 12, la unidad de transformación predeterminada puede ser una unidad de transformación generada agrupando una pluralidad de unidades de predicción adyacentes.
Como se ha descrito anteriormente con referencia al aparato 900 de codificación de imagen, la unidad de transformación puede generarse agrupando las unidades de predicción adyacentes de acuerdo con una profundidad o puede generarse agrupando una pluralidad de unidades de predicción adyacentes en las que se realiza predicción de acuerdo con el mismo modo de predicción, es decir, de acuerdo con un modo de intra predicción o un modo de inter predicción.
La pluralidad de unidades de predicción puede no incluirse en una unidad de codificación sino incluirse en una pluralidad de unidades de codificación. En otras palabras, como se ha descrito anteriormente con referencia a las Figuras 11A a 11C, la unidad de transformación que se decodifica en entropía mediante el decodificador 1310 de entropía puede establecerse para ser igual a o menor que un tamaño de una unidad de codificación o para ser mayor que el tamaño de la unidad de codificación.
También, como se ha descrito anteriormente con referencia a la Figura 12, la unidad de transformación puede ser una unidad de transformación óptima seleccionada repitiendo un procedimiento para la agrupación de una pluralidad de unidades de predicción adyacentes y realizando repetitivamente una transformación, cuantificación y decodificación de entropía en diferentes unidades de transformación.
La unidad 1320 de cuantificación inversa cuantifica inversamente los coeficientes de componente de frecuencia que se decodifican en entropía mediante el decodificador 1310 de entropía.
La unidad 1320 de cuantificación inversa cuantifica inversamente los coeficientes de componente de frecuencia decodificados en entropía de acuerdo con una etapa de cuantificación que se usa en la codificación de la unidad de transformación.
El transformador 1330 inverso transforma inversamente los coeficientes de componente de frecuencia inversamente cuantificados en un dominio de píxel. El transformador inverso puede realizar una DCT inversa en coeficientes de coseno discretos inversamente cuantificados (es decir, los coeficientes de componente de frecuencia inversamente cuantificados) y a continuación puede reconstruir una unidad de transformación del dominio de píxel. La unidad de transformación reconstruida puede incluir unidades de predicción adyacentes.
La Figura 14 es un diagrama de flujo de un procedimiento de codificación de imagen, de acuerdo con una realización ilustrativa.
Haciendo referencia a la Figura 14, en la operación 1410, un aparato de codificación de imagen establece una unidad de transformación seleccionando una pluralidad de unidades de predicción adyacentes. El aparato de codificación de imagen puede seleccionar una pluralidad de unidades de predicción adyacentes de acuerdo con una profundidad o puede seleccionar una pluralidad de unidades de predicción adyacentes en las que se realiza predicción de acuerdo con el mismo modo de predicción.
En la operación 1420, el aparato de codificación de imagen transforma las unidades de predicción adyacentes en un dominio de frecuencia de acuerdo con la unidad de transformación establecida en la operación 1420. El aparato de codificación de imagen agrupa las unidades de predicción adyacentes, realiza una DCT en las unidades de predicción adyacentes, y por lo tanto genera coeficientes de coseno discretos.
En la operación 1430, el aparato de codificación de imagen cuantifica coeficientes de componente de frecuencia, generados en la operación 1420, de acuerdo con una etapa de cuantificación.
En la operación 1440, el aparato de codificación de imagen realiza codificación de entropía en los coeficientes de componente de frecuencia cuantificados en la operación 1430. El aparato de codificación de imagen realiza la codificación de entropía en los coeficientes de coseno discretos usando CABAC o CAVLC.
Un procedimiento de codificación de imagen de acuerdo con otra realización ilustrativa puede adicionalmente incluir una operación de establecimiento de una unidad de transformación óptima realizando repetitivamente operaciones 1410 a 1440 en diferentes unidades de transformación. Es decir, realizando repetitivamente la transformación, la cuantificación y la codificación de entropía en diferentes unidades de transformación como se ilustra en la Figura 12, es posible establecer la unidad de transformación óptima.
La Figura 15 es un diagrama de flujo de un procedimiento de decodificación de imagen, de acuerdo con otra realización ilustrativa.
Haciendo referencia a la Figura 15, en la operación 1510, un aparato de decodificación de imagen realiza decodificación de entropía en coeficientes de componente de frecuencia con respecto a una unidad de transformación predeterminada. Los coeficientes de componente de frecuencia pueden ser coeficientes de coseno discretos.
En la operación 1520, el aparato de decodificación de imagen cuantifica inversamente los coeficientes de componente de frecuencia que se decodifican en entropía en la operación 1510. El aparato de decodificación de imagen cuantifica inversamente los coeficientes de coseno discretos usando una etapa de cuantificación usada en una operación de codificación.
En la operación 1530, el aparato de decodificación de imagen transforma inversamente los coeficientes de componente de frecuencia, que se han cuantificado inversamente en la operación 1520, en un dominio de píxel y a continuación reconstruye la unidad de transformación. La unidad de transformación reconstruida se establece agrupando una pluralidad de unidades de predicción adyacentes. Como se ha descrito anteriormente, la unidad de transformación puede establecerse agrupando las unidades de predicción adyacentes de acuerdo con una profundidad o puede establecerse agrupando una pluralidad de unidades de predicción adyacentes en las que se realiza predicción de acuerdo con el mismo modo de predicción.
De acuerdo con la una o más realizaciones ilustrativas, es posible establecer la unidad de transformación para ser mayor que la unidad de predicción y para realizar la DCT, de modo que una imagen puede comprimirse y codificarse eficientemente.
Las realizaciones ilustrativas también pueden incorporarse como códigos legibles por ordenador en un medio de grabación legible por ordenador. El medio de grabación legible por ordenador es cualquier dispositivo de almacenamiento de datos que puede almacenar datos, que posteriormente pueden leerse mediante un sistema informático. Ejemplos del medio de grabación legible por ordenador incluyen memoria de solo lectura (ROM), memoria de acceso aleatorio (RAM), CD-ROM, cintas magnéticas, discos flexibles y dispositivos de almacenamiento de datos ópticos. El medio de grabación legible por ordenador también puede distribuirse a través de sistemas informáticos acoplados a red de modo que el código legible por ordenador se almacena y ejecuta de una manera distribuida.
Por ejemplo, cada uno del aparato de codificación de imagen, el aparato de decodificación de imagen, el codificador de imagen y el decodificador de imagen de acuerdo con la una o más realizaciones pueden incluir un bus acoplado a cada unidad en un aparato como se ilustra en las Figuras 1-2, 4-5, 9-10 y 14, y al menos un procesador acoplado al bus. También, cada uno del aparato de codificación de imagen, el aparato de decodificación de imagen, el codificador de imagen y el decodificador de imagen de acuerdo con la una o más realizaciones pueden incluir una memoria acoplada al al menos un procesador que se acopla al bus para almacenar órdenes, mensajes recibidos o mensajes generados y para ejecutar las órdenes.
Si bien esta invención se ha mostrado y descrito particularmente con referencia a realizaciones ejemplares de la misma, los expertos en la materia entenderán que se pueden realizar diversos cambios en la forma y los detalles sin apartarse del alcance de la invención tal como se define en las reivindicaciones adjuntas. Las realizaciones ejemplares deberían considerarse solo en un sentido descriptivo y no con fines de limitación. Por lo tanto, el alcance de la invención se define no por la descripción detallada de la invención sino por las reivindicaciones adjuntas.

Claims (2)

REIVINDICACIONES
1. Un aparato de codificación de imagen que comprende: un procesador configurado para:
generar información acerca de una unidad de codificación máxima, usada para dividir una imagen en una pluralidad de unidades de codificación máximas cuadradas, generar información acerca de unidades de codificación, que tienen diferentes tamaños de acuerdo con las profundidades incluidas en la unidad de codificación máxima, usada para dividir jerárquicamente una unidad de codificación máxima, entre la pluralidad de unidades de codificación máximas, en unidades de codificación cuadradas;
realizar intra predicción o inter predicción sobre al menos una unidad de predicción para generar un predictor; y generar coeficientes de transformación basados en el
predictor y la imagen,
en el que:
la unidad de codificación máxima se divide jerárquicamente en las unidades de codificación, incluida una unidad de codificación de una profundidad actual y una unidad de codificación de una profundidad superior que la profundidad actual, la unidad de codificación de la profundidad actual se divide en cuatro unidades de codificación de la profundidad superior a la profundidad actual, independientemente de las unidades de codificación vecinas de la profundidad actual, y
la unidad de codificación de la profundidad superior a la profundidad actual se predice usando al menos una unidad de predicción y se transforma usando al menos una unidad de transformación, en el que la al menos una unidad de predicción es una entre bloques que incluye: un bloque de tamaño igual a la unidad de codificación de la profundidad superior a la profundidad actual; y un bloque entre una pluralidad de bloques generados dividiendo igualmente al menos uno de la altura y el ancho de la unidad de codificación de la profundidad superior a la profundidad actual,
en el que la al menos una unidad de transformación es una entre bloques que incluye: un bloque de tamaño igual a la unidad de codificación de la profundidad superior a la profundidad actual; y un bloque entre una pluralidad de bloques generados dividiendo igualmente la altura y el ancho de la profundidad superior a la unidad de codificación de la profundidad actual, y
caracterizado porque el aparato de codificación está configurado para soportar una unidad de transformación, entre la al menos una unidad de transformación, que tiene un tamaño de 2Nx2N que incluye cuatro unidades de predicción que tienen un tamaño de NxN.
2. Un medio legible por ordenador no transitorio para almacenar datos de vídeo que comprende: una secuencia de datos que comprende información acerca de una unidad de codificación máxima, información acerca de unidades de codificación, y los coeficientes de transformación, la secuencia de datos generada al ejecutar operaciones usando un procesador, incluyendo las operaciones:
generar información acerca de una unidad de codificación máxima, usada para dividir una imagen en una pluralidad de unidades de codificación máximas cuadradas; generar la información acerca de unidades de codificación, que tienen diferentes tamaños de acuerdo con las profundidades incluidas en la unidad de codificación máxima, usada para dividir jerárquicamente una unidad de codificación máxima, entre la pluralidad de unidades de codificación máximas, en unidades de codificación cuadradas;
realizar intra predicción o inter predicción sobre al menos una unidad de predicción para generar un predictor; y generar los coeficientes de transformación basados en
el predictor y la imagen,
en el que:
la unidad de codificación máxima se divide jerárquicamente en las unidades de codificación, incluida una unidad de codificación de una profundidad actual y una unidad de codificación de una profundidad superior que la profundidad actual, la unidad de codificación de la profundidad actual se divide en cuatro unidades de codificación de la profundidad superior a la profundidad actual, independientemente de las unidades de codificación vecinas de la profundidad actual, y
la unidad de codificación de la profundidad superior a la profundidad actual se predice usando al menos una unidad de predicción y se transforma usando al menos una unidad de transformación, en el que la al menos una unidad de predicción es una entre bloques que incluye: un bloque de tamaño igual a la unidad de codificación de la profundidad superior a la profundidad actual; y un bloque entre una pluralidad de bloques generados dividiendo igualmente al menos uno de la altura y el ancho de la unidad de codificación de la profundidad superior a la profundidad actual,
en el que la al menos una unidad de transformación es una entre bloques que incluye: un bloque de tamaño igual a la unidad de codificación de la profundidad superior a la profundidad actual; y un bloque entre una pluralidad de bloques generados dividiendo igualmente la altura y el ancho de la profundidad superior a la unidad de codificación de la profundidad actual, y
caracterizado porque las operaciones soportan una unidad de transformación, entre la al menos una unidad de transformación, que tiene un tamaño de 2Nx2N que incluye cuatro unidades de predicción que tienen un tamaño de NxN.
ES18200773T 2009-08-13 2010-08-13 Codificación de imagen usando unidades de transformación grandes Active ES2760475T3 (es)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020090074895A KR101474756B1 (ko) 2009-08-13 2009-08-13 큰 크기의 변환 단위를 이용한 영상 부호화, 복호화 방법 및 장치

Publications (1)

Publication Number Publication Date
ES2760475T3 true ES2760475T3 (es) 2020-05-14

Family

ID=43586668

Family Applications (6)

Application Number Title Priority Date Filing Date
ES18200773T Active ES2760475T3 (es) 2009-08-13 2010-08-13 Codificación de imagen usando unidades de transformación grandes
ES15150191.3T Active ES2648089T3 (es) 2009-08-13 2010-08-13 Procedimiento y aparato para codificar y decodificar imágenes usando unidad de transformación grande
ES17193659T Active ES2701979T3 (es) 2009-08-13 2010-08-13 Procedimiento para decodificar y aparato para codificar imágenes usando unidad de transformación grande
ES13167744.5T Active ES2668472T3 (es) 2009-08-13 2010-08-13 Aparato de decodificación de una imagen usando unidades de transformación grandes
ES13167743.7T Active ES2647908T3 (es) 2009-08-13 2010-08-13 Procedimiento y aparato para codificar y decodificar imágenes usando unidad de transformación grande
ES15150192.1T Active ES2648091T3 (es) 2009-08-13 2010-08-13 Procedimiento y aparato para la codificación y decodificación de imagen usando unidad de transformación grande

Family Applications After (5)

Application Number Title Priority Date Filing Date
ES15150191.3T Active ES2648089T3 (es) 2009-08-13 2010-08-13 Procedimiento y aparato para codificar y decodificar imágenes usando unidad de transformación grande
ES17193659T Active ES2701979T3 (es) 2009-08-13 2010-08-13 Procedimiento para decodificar y aparato para codificar imágenes usando unidad de transformación grande
ES13167744.5T Active ES2668472T3 (es) 2009-08-13 2010-08-13 Aparato de decodificación de una imagen usando unidades de transformación grandes
ES13167743.7T Active ES2647908T3 (es) 2009-08-13 2010-08-13 Procedimiento y aparato para codificar y decodificar imágenes usando unidad de transformación grande
ES15150192.1T Active ES2648091T3 (es) 2009-08-13 2010-08-13 Procedimiento y aparato para la codificación y decodificación de imagen usando unidad de transformación grande

Country Status (24)

Country Link
US (10) US8792741B2 (es)
EP (7) EP3282696B1 (es)
JP (7) JP5746169B2 (es)
KR (1) KR101474756B1 (es)
CN (6) CN104581162B (es)
AU (1) AU2010283113B2 (es)
BR (3) BR122013019725A2 (es)
CA (5) CA2877241C (es)
CY (5) CY1119836T1 (es)
DK (6) DK2629518T3 (es)
ES (6) ES2760475T3 (es)
HR (5) HRP20171767T1 (es)
HU (6) HUE039342T2 (es)
IN (3) IN2015MN00402A (es)
LT (5) LT2629526T (es)
MX (1) MX2012000614A (es)
MY (3) MY157499A (es)
NO (4) NO2866442T3 (es)
PL (6) PL2890123T3 (es)
PT (5) PT3282696T (es)
RU (4) RU2510945C1 (es)
SI (5) SI2629526T1 (es)
WO (1) WO2011019234A2 (es)
ZA (5) ZA201201157B (es)

Families Citing this family (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7956930B2 (en) 2006-01-06 2011-06-07 Microsoft Corporation Resampling and picture resizing operations for multi-resolution video coding and decoding
US8711948B2 (en) * 2008-03-21 2014-04-29 Microsoft Corporation Motion-compensated prediction of inter-layer residuals
US9571856B2 (en) * 2008-08-25 2017-02-14 Microsoft Technology Licensing, Llc Conversion operations in scalable video encoding and decoding
US8503527B2 (en) 2008-10-03 2013-08-06 Qualcomm Incorporated Video coding with large macroblocks
KR101474756B1 (ko) 2009-08-13 2014-12-19 삼성전자주식회사 큰 크기의 변환 단위를 이용한 영상 부호화, 복호화 방법 및 장치
CN104602013B (zh) * 2009-10-01 2017-10-31 Sk电信有限公司 视频编码装置和方法
WO2011049119A1 (ja) * 2009-10-20 2011-04-28 シャープ株式会社 動画像符号化装置、動画像復号装置、動画像符号化・復号システム、動画像符号化方法および動画像復号方法
KR101487687B1 (ko) 2010-01-14 2015-01-29 삼성전자주식회사 큰 크기의 변환 단위를 이용한 영상 부호화, 복호화 방법 및 장치
CN106686379B (zh) 2010-04-13 2019-10-18 三星电子株式会社 对视频进行解码的方法
SI2955917T1 (sl) * 2010-08-17 2018-09-28 Samsung Electronics Co., Ltd Postopek dekodiranja videa z uporabo transformacijske enote variabilne drevesne strukture
KR20120035096A (ko) * 2010-10-04 2012-04-13 한국전자통신연구원 쿼드 트리 변환 구조에서 부가 정보의 시그널링 방법 및 장치
US9532059B2 (en) 2010-10-05 2016-12-27 Google Technology Holdings LLC Method and apparatus for spatial scalability for video coding
US8605567B2 (en) * 2010-12-02 2013-12-10 Adtran, Inc. Apparatuses and methods for enabling crosstalk vectoring in expandable communication systems
EP3554078A1 (en) 2010-12-13 2019-10-16 Electronics and Telecommunications Research Institute Method and device for determining reference unit
JP5594841B2 (ja) * 2011-01-06 2014-09-24 Kddi株式会社 画像符号化装置及び画像復号装置
US8494290B2 (en) * 2011-05-05 2013-07-23 Mitsubishi Electric Research Laboratories, Inc. Method for coding pictures using hierarchical transform units
MY175434A (en) * 2011-06-30 2020-06-25 Samsung Electronics Co Ltd Video encoding method with bit depth adjustment for fixed-point conversion and apparatus therefor, and video decoding method and apparatus therefor
JP5989772B2 (ja) 2011-07-01 2016-09-07 サムスン エレクトロニクス カンパニー リミテッド 階層的構造のデータ単位を利用したエントロピー符号化方法及び該装置、並びに復号化方法及び該装置
US9807426B2 (en) * 2011-07-01 2017-10-31 Qualcomm Incorporated Applying non-square transforms to video data
JP5899447B2 (ja) * 2011-11-21 2016-04-06 パナソニックIpマネジメント株式会社 画像処理装置および画像処理方法
US9094681B1 (en) 2012-02-28 2015-07-28 Google Inc. Adaptive segmentation
US8396127B1 (en) * 2012-06-27 2013-03-12 Google Inc. Segmentation for video coding using predictive benefit
TWI627857B (zh) * 2012-06-29 2018-06-21 Sony Corp Image processing device and method
MX347473B (es) * 2012-07-02 2017-04-27 Samsung Electronics Co Ltd Metodo y aparato para codificar video por entropia, y metodo y aparato para decodificar video por entropia.
CN111629208B (zh) * 2012-07-02 2021-12-21 韩国电子通信研究院 图像编码/解码方法和非暂时性计算机可读记录介质
US9332276B1 (en) 2012-08-09 2016-05-03 Google Inc. Variable-sized super block based direct prediction mode
US9380298B1 (en) 2012-08-10 2016-06-28 Google Inc. Object-based intra-prediction
US9445124B2 (en) 2013-03-15 2016-09-13 Samsung Electronics Co., Ltd. Electronic system with frequency mechanism and method of operation thereof
WO2014168411A1 (ko) * 2013-04-11 2014-10-16 엘지전자 주식회사 비디오 신호 처리 방법 및 장치
JP6402520B2 (ja) * 2014-07-22 2018-10-10 沖電気工業株式会社 符号化装置、方法、プログラム及び機器
US20160029022A1 (en) * 2014-07-25 2016-01-28 Mediatek Inc. Video processing apparatus with adaptive coding unit splitting/merging and related video processing method
CN109155857B (zh) * 2016-03-11 2023-05-30 数字洞察力有限公司 视频编码方法以及装置
KR102416804B1 (ko) * 2016-10-14 2022-07-05 세종대학교산학협력단 영상 부호화 방법/장치, 영상 복호화 방법/장치 및 비트스트림을 저장한 기록 매체
KR101823533B1 (ko) * 2017-03-21 2018-01-30 삼성전자주식회사 큰 크기의 변환 단위를 이용한 영상 부호화, 복호화 방법 및 장치
CN111602397B (zh) * 2018-01-17 2024-01-23 英迪股份有限公司 使用各种变换技术的视频编码方法和装置
KR101913734B1 (ko) 2018-01-24 2018-10-31 삼성전자주식회사 큰 크기의 변환 단위를 이용한 영상 부호화, 복호화 방법 및 장치
CN116320411A (zh) * 2018-03-29 2023-06-23 日本放送协会 图像编码装置、图像解码装置以及程序
JP7378035B2 (ja) * 2018-09-12 2023-11-13 パナソニックIpマネジメント株式会社 変換装置、復号装置、変換方法および復号方法

Family Cites Families (79)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5842033A (en) * 1992-06-30 1998-11-24 Discovision Associates Padding apparatus for passing an arbitrary number of bits through a buffer in a pipeline system
US6435737B1 (en) * 1992-06-30 2002-08-20 Discovision Associates Data pipeline system and data encoding method
JP3133517B2 (ja) * 1992-10-15 2001-02-13 シャープ株式会社 画像領域検出装置、該画像検出装置を用いた画像符号化装置
US5598514A (en) * 1993-08-09 1997-01-28 C-Cube Microsystems Structure and method for a multistandard video encoder/decoder
US5610657A (en) * 1993-09-14 1997-03-11 Envistech Inc. Video compression using an iterative error data coding method
US5446806A (en) 1993-11-15 1995-08-29 National Semiconductor Corporation Quadtree-structured Walsh transform video/image coding
JP3169783B2 (ja) * 1995-02-15 2001-05-28 日本電気株式会社 動画像の符号化・復号システム
DE69619002T2 (de) 1995-03-10 2002-11-21 Toshiba Kawasaki Kk Bildkodierungs-/-dekodierungsvorrichtung
DE69636150T8 (de) 1995-03-15 2007-07-12 Kabushiki Kaisha Toshiba System zur Kodierung von bewegten Bildern, und System zur variablen Längenkodierung
US5680129A (en) * 1995-07-18 1997-10-21 Hewlett-Packard Company System and method for lossless image compression
EP0857392B1 (en) * 1995-10-25 2004-08-11 Sarnoff Corporation Overlapping block zerotree wavelet image coder
CN1177485C (zh) * 1996-05-17 2004-11-24 松下电器产业株式会社 图像解码装置
EP1085763B1 (en) 1996-05-28 2003-01-22 Matsushita Electric Industrial Co., Ltd. Image predictive coding apparatus and method.
US6101276A (en) * 1996-06-21 2000-08-08 Compaq Computer Corporation Method and apparatus for performing two pass quality video compression through pipelining and buffer management
US5995080A (en) * 1996-06-21 1999-11-30 Digital Equipment Corporation Method and apparatus for interleaving and de-interleaving YUV pixel data
US6292589B1 (en) * 1996-06-21 2001-09-18 Compaq Computer Corporation Method for choosing rate control parameters in motion-compensated transform-based picture coding scheme using non-parametric technique
US6292591B1 (en) * 1996-07-17 2001-09-18 Sony Coporation Image coding and decoding using mapping coefficients corresponding to class information of pixel blocks
FR2755527B1 (fr) 1996-11-07 1999-01-08 Thomson Multimedia Sa Procede de prediction compensee en mouvement et codeur utilisant un tel procede
US6173013B1 (en) * 1996-11-08 2001-01-09 Sony Corporation Method and apparatus for encoding enhancement and base layer image signals using a predicted image signal
US5956467A (en) * 1996-12-17 1999-09-21 Eastman Kodak Company Encoding color image data for multipass color printers
JPH10178639A (ja) 1996-12-19 1998-06-30 Matsushita Electric Ind Co Ltd 画像コーデック部および画像データ符号化方法
US6157746A (en) * 1997-02-12 2000-12-05 Sarnoff Corporation Apparatus and method for encoding wavelet trees generated by a wavelet-based coding method
CN1110963C (zh) * 1997-03-26 2003-06-04 松下电器产业株式会社 图象解码装置
JPH11146367A (ja) 1997-11-06 1999-05-28 Matsushita Electric Ind Co Ltd モバイルビデオフォン
US6393060B1 (en) * 1997-12-31 2002-05-21 Lg Electronics Inc. Video coding and decoding method and its apparatus
US5995150A (en) * 1998-02-20 1999-11-30 Winbond Electronics Corporation America Dual compressed video bitstream camera for universal serial bus connection
JP3132456B2 (ja) * 1998-03-05 2001-02-05 日本電気株式会社 階層的画像符号化方式、及び階層的画像復号方式
IL129203A (en) * 1999-03-28 2002-07-25 Univ Ramot System and method for compressing figures
CN1297148C (zh) 2001-08-28 2007-01-24 株式会社Ntt都科摩 动画图像编码传送系统、动画图像编码传送方法、该系统和方法使用的适合的编码装置、译码装置、编码方法、译码方法以及程序
US6980596B2 (en) 2001-11-27 2005-12-27 General Instrument Corporation Macroblock level adaptive frame/field coding for digital video content
CN101448162B (zh) 2001-12-17 2013-01-02 微软公司 处理视频图像的方法
EP1322121A3 (en) 2001-12-19 2003-07-16 Matsushita Electric Industrial Co., Ltd. Video encoder and decoder with improved motion detection precision
JP2003250161A (ja) * 2001-12-19 2003-09-05 Matsushita Electric Ind Co Ltd 符号化装置及び復号化装置
HUE030635T2 (en) 2002-03-27 2017-06-28 Panasonic Ip Corp America A variable length coding and decoding system and a variable length coding and decoding method
JP2003319394A (ja) * 2002-04-26 2003-11-07 Sony Corp 符号化装置および方法、復号装置および方法、記録媒体、並びにプログラム
KR100491530B1 (ko) * 2002-05-03 2005-05-27 엘지전자 주식회사 모션 벡터 결정 방법
US6795584B2 (en) 2002-10-03 2004-09-21 Nokia Corporation Context-based adaptive variable length coding for adaptive block transforms
WO2004052017A1 (en) * 2002-12-04 2004-06-17 Koninklijke Philips Electronics N.V. Video coding method and device
HUP0301368A3 (en) * 2003-05-20 2005-09-28 Amt Advanced Multimedia Techno Method and equipment for compressing motion picture data
US7580584B2 (en) * 2003-07-18 2009-08-25 Microsoft Corporation Adaptive multiple quantization
ES2767933T3 (es) * 2003-09-07 2020-06-19 Microsoft Technology Licensing Llc Capa de sectores en códec de vídeo
US7317839B2 (en) * 2003-09-07 2008-01-08 Microsoft Corporation Chroma motion vector derivation for interlaced forward-predicted fields
KR20050045746A (ko) 2003-11-12 2005-05-17 삼성전자주식회사 계층 구조의 가변 블록 크기를 이용한 움직임 추정 방법및 장치
CN101695132B (zh) * 2004-01-20 2012-06-27 松下电器产业株式会社 图像编码方法和设备、图像解码方法和设备
KR101136629B1 (ko) 2004-01-30 2012-04-23 파나소닉 주식회사 화상 부호화 방법, 화상 복호화 방법, 화상 부호화 장치,화상 복호화 장치, 및 그 프로그램
US7565020B2 (en) * 2004-07-03 2009-07-21 Microsoft Corp. System and method for image coding employing a hybrid directional prediction and wavelet lifting
JP2006174415A (ja) * 2004-11-19 2006-06-29 Ntt Docomo Inc 画像復号装置、画像復号プログラム、画像復号方法、画像符号化装置、画像符号化プログラム及び画像符号化方法
JP4889231B2 (ja) * 2005-03-31 2012-03-07 三洋電機株式会社 画像符号化方法および装置、画像復号方法
KR101127221B1 (ko) * 2005-07-15 2012-03-29 삼성전자주식회사 주파수 공간에서 컬러 성분간 예측을 이용한 컬러영상부호화/복호화 방법 및 장치
JP4828543B2 (ja) 2005-09-26 2011-11-30 三菱電機株式会社 動画像符号化装置及び動画像復号装置
KR100763196B1 (ko) * 2005-10-19 2007-10-04 삼성전자주식회사 어떤 계층의 플래그를 계층간의 연관성을 이용하여부호화하는 방법, 상기 부호화된 플래그를 복호화하는방법, 및 장치
CN101129063B (zh) 2005-11-18 2010-05-19 索尼株式会社 编码设备和方法、解码设备和方法以及传输系统
JP2007243427A (ja) * 2006-03-07 2007-09-20 Nippon Hoso Kyokai <Nhk> 符号化装置及び復号化装置
KR101200865B1 (ko) 2006-03-23 2012-11-13 삼성전자주식회사 영상의 부호화 방법 및 장치, 복호화 방법 및 장치
WO2007116551A1 (ja) 2006-03-30 2007-10-18 Kabushiki Kaisha Toshiba 画像符号化装置及び画像符号化方法並びに画像復号化装置及び画像復号化方法
KR100745765B1 (ko) * 2006-04-13 2007-08-02 삼성전자주식회사 화상 데이터의 공간상 예측 장치 및 방법과 그를 이용한부호화 장치 및 방법, 화상 데이터의 공간상 예측 보상장치 및 방법과 그를 이용한 복호화 장치 및 방법
WO2008027192A2 (en) * 2006-08-25 2008-03-06 Thomson Licensing Methods and apparatus for reduced resolution partitioning
KR20080045516A (ko) * 2006-11-20 2008-05-23 삼성전자주식회사 Rgb 영상의 부호화 및 복호화 방법과 그 장치
JP5026092B2 (ja) 2007-01-12 2012-09-12 三菱電機株式会社 動画像復号装置および動画像復号方法
JP2008245016A (ja) * 2007-03-28 2008-10-09 Canon Inc 画像符号化装置、画像符号化方法、及びプログラム
US8488668B2 (en) * 2007-06-15 2013-07-16 Qualcomm Incorporated Adaptive coefficient scanning for video coding
US8265144B2 (en) 2007-06-30 2012-09-11 Microsoft Corporation Innovations in video decoder implementations
US8483282B2 (en) 2007-10-12 2013-07-09 Qualcomm, Incorporated Entropy coding of interleaved sub-blocks of a video block
CN101159875B (zh) 2007-10-15 2011-10-05 浙江大学 二重预测视频编解码方法和装置
WO2009051719A2 (en) * 2007-10-16 2009-04-23 Thomson Licensing Methods and apparatus for video encoding and decoding geometically partitioned super blocks
JP2009111691A (ja) 2007-10-30 2009-05-21 Hitachi Ltd 画像符号化装置及び符号化方法、画像復号化装置及び復号化方法
US7444596B1 (en) 2007-11-29 2008-10-28 International Business Machines Corporation Use of template messages to optimize a software messaging system
US8619856B2 (en) 2008-10-03 2013-12-31 Qualcomm Incorporated Video coding with large macroblocks
US8503527B2 (en) * 2008-10-03 2013-08-06 Qualcomm Incorporated Video coding with large macroblocks
KR101474756B1 (ko) * 2009-08-13 2014-12-19 삼성전자주식회사 큰 크기의 변환 단위를 이용한 영상 부호화, 복호화 방법 및 장치
KR101452859B1 (ko) * 2009-08-13 2014-10-23 삼성전자주식회사 움직임 벡터를 부호화 및 복호화하는 방법 및 장치
KR102036118B1 (ko) * 2010-01-12 2019-10-24 엘지전자 주식회사 비디오 신호의 처리 방법 및 장치
KR101487687B1 (ko) * 2010-01-14 2015-01-29 삼성전자주식회사 큰 크기의 변환 단위를 이용한 영상 부호화, 복호화 방법 및 장치
JP6056122B2 (ja) * 2011-01-24 2017-01-11 ソニー株式会社 画像符号化装置と画像復号装置およびその方法とプログラム
EP3849187B1 (en) * 2011-06-24 2023-09-20 Mitsubishi Electric Corporation Moving image encoding apparatus, moving image decoding apparatus, moving image encoding method and moving image decoding method
EP2942961A1 (en) * 2011-11-23 2015-11-11 HUMAX Holdings Co., Ltd. Methods for encoding/decoding of video using common merging candidate set of asymmetric partitions
JP5917127B2 (ja) * 2011-12-19 2016-05-11 株式会社ジャパンディスプレイ 液晶表示装置
JP5887909B2 (ja) * 2011-12-19 2016-03-16 コニカミノルタ株式会社 画像形成装置及びその制御方法
US9332257B2 (en) * 2012-10-01 2016-05-03 Qualcomm Incorporated Coded black flag coding for 4:2:2 sample format in video coding

Also Published As

Publication number Publication date
CN104581162A (zh) 2015-04-29
DK2866442T3 (da) 2017-11-27
EP2629518B1 (en) 2017-11-15
DK3282696T3 (en) 2019-01-07
NO2866442T3 (es) 2018-04-14
PL3282696T3 (pl) 2019-02-28
DK2890123T3 (da) 2017-11-27
JP6023260B2 (ja) 2016-11-09
EP2866442A1 (en) 2015-04-29
AU2010283113A1 (en) 2012-01-12
CA2768181C (en) 2015-04-28
CA2877255C (en) 2015-10-06
CA2815777C (en) 2015-04-28
LT2866442T (lt) 2017-12-11
EP2449778A4 (en) 2013-12-25
WO2011019234A3 (en) 2011-06-23
HRP20182055T1 (hr) 2019-02-08
CN104581161B (zh) 2016-06-01
LT3282696T (lt) 2018-12-27
SI2629526T1 (en) 2018-06-29
HUE038258T2 (hu) 2018-10-29
BR122013019724A2 (pt) 2016-05-10
CN102484703A (zh) 2012-05-30
CY1119803T1 (el) 2018-06-27
RU2013113038A (ru) 2014-04-10
CA2768181A1 (en) 2011-02-17
ES2648091T3 (es) 2017-12-28
IN2015MN00401A (es) 2015-09-04
HUE038255T2 (hu) 2018-10-29
CN102484703B (zh) 2015-02-25
HUE039342T2 (hu) 2018-12-28
US8971650B2 (en) 2015-03-03
US20140286585A1 (en) 2014-09-25
NO2629518T3 (es) 2018-04-14
US8311348B2 (en) 2012-11-13
BR122013019725A2 (pt) 2016-05-10
MX2012000614A (es) 2012-01-27
JP6023261B2 (ja) 2016-11-09
SI3282696T1 (sl) 2019-01-31
EP3448039B1 (en) 2019-11-13
CA2815893C (en) 2015-02-03
EP2866442B1 (en) 2017-11-15
PL3448039T3 (pl) 2020-02-28
RU2551794C2 (ru) 2015-05-27
CN104581163A (zh) 2015-04-29
US8971649B2 (en) 2015-03-03
CN103220528A (zh) 2013-07-24
DK2629526T3 (en) 2018-05-22
RU2510945C1 (ru) 2014-04-10
CA2815893A1 (en) 2011-02-17
ZA201201157B (en) 2020-02-26
LT2629526T (lt) 2018-05-25
US20130336390A1 (en) 2013-12-19
EP2890123B1 (en) 2017-11-15
US8792737B2 (en) 2014-07-29
SI2866442T1 (sl) 2017-12-29
CY1121001T1 (el) 2019-12-11
MY153787A (en) 2015-03-13
ES2648089T3 (es) 2017-12-28
CY1120725T1 (el) 2019-12-11
EP3282696A1 (en) 2018-02-14
PL2890123T3 (pl) 2018-01-31
EP2629526B1 (en) 2018-05-02
PT3282696T (pt) 2018-12-17
HRP20171769T1 (hr) 2017-12-29
HUE038282T2 (hu) 2018-10-29
US20130064291A1 (en) 2013-03-14
US20130336391A1 (en) 2013-12-19
JP2013214989A (ja) 2013-10-17
ZA201502023B (en) 2017-08-30
PL2629526T3 (pl) 2018-07-31
ZA201502024B (en) 2015-11-25
MY157499A (en) 2016-06-15
US8515190B2 (en) 2013-08-20
HUE043938T2 (hu) 2019-09-30
NO2629526T3 (es) 2018-09-29
CY1119836T1 (el) 2018-06-27
PT2629518T (pt) 2017-11-23
CN104581163B (zh) 2017-05-24
PT2629526T (pt) 2018-05-11
JP2015180086A (ja) 2015-10-08
IN2015MN00400A (es) 2015-09-04
SI2629518T1 (sl) 2017-12-29
US8204320B2 (en) 2012-06-19
JP5579309B2 (ja) 2014-08-27
EP2629526A2 (en) 2013-08-21
SI2890123T1 (sl) 2017-12-29
HRP20171767T1 (hr) 2017-12-29
HUE048402T2 (hu) 2020-08-28
US20140294311A1 (en) 2014-10-02
NO2890123T3 (es) 2018-04-14
EP3448039A1 (en) 2019-02-27
DK2629518T3 (da) 2017-11-27
ZA201304973B (en) 2013-09-25
CA2815777A1 (en) 2011-02-17
JP5753327B2 (ja) 2015-07-22
LT2890123T (lt) 2017-12-11
RU2014104800A (ru) 2015-04-27
ES2701979T3 (es) 2019-02-26
IN2015MN00402A (es) 2015-09-04
RU2012104828A (ru) 2013-08-20
ZA201502025B (en) 2015-12-23
LT2629518T (lt) 2017-12-11
DK3448039T3 (da) 2019-11-25
JP5746169B2 (ja) 2015-07-08
HRP20171768T1 (hr) 2017-12-29
RU2514777C1 (ru) 2014-05-10
US20120236938A1 (en) 2012-09-20
US8842921B2 (en) 2014-09-23
US20150156513A1 (en) 2015-06-04
CN103220525A (zh) 2013-07-24
HRP20180692T1 (hr) 2018-06-29
JP2015109686A (ja) 2015-06-11
CY1119838T1 (el) 2018-06-27
BR112012001757A2 (pt) 2016-04-12
PL2629518T3 (pl) 2018-01-31
PT2890123T (pt) 2017-11-23
KR20110017300A (ko) 2011-02-21
CA2877241A1 (en) 2011-02-17
US8792741B2 (en) 2014-07-29
US20120106637A1 (en) 2012-05-03
ES2668472T3 (es) 2018-05-18
KR101474756B1 (ko) 2014-12-19
JP5753328B2 (ja) 2015-07-22
ES2647908T3 (es) 2017-12-27
CN104581161A (zh) 2015-04-29
US9386325B2 (en) 2016-07-05
JP2015109687A (ja) 2015-06-11
JP2013179707A (ja) 2013-09-09
EP2629518A3 (en) 2013-12-18
JP5579310B2 (ja) 2014-08-27
JP2013502138A (ja) 2013-01-17
EP3282696B1 (en) 2018-12-05
EP2449778A2 (en) 2012-05-09
CA2877241C (en) 2016-10-11
JP2015173484A (ja) 2015-10-01
EP2629526A3 (en) 2013-12-18
CN103220528B (zh) 2017-03-01
WO2011019234A2 (en) 2011-02-17
CA2877255A1 (en) 2011-02-17
CN104581162B (zh) 2016-05-04
EP2629518A2 (en) 2013-08-21
MY157501A (en) 2016-06-15
US20130336392A1 (en) 2013-12-19
PT2866442T (pt) 2017-11-23
US8798381B2 (en) 2014-08-05
RU2014104796A (ru) 2015-08-20
US20110038554A1 (en) 2011-02-17
AU2010283113B2 (en) 2014-07-03
PL2866442T3 (pl) 2018-01-31
EP2890123A1 (en) 2015-07-01
RU2543519C2 (ru) 2015-03-10

Similar Documents

Publication Publication Date Title
ES2760475T3 (es) Codificación de imagen usando unidades de transformación grandes
ES2707150T3 (es) Procedimiento para codificar y decodificar y aparato para codificar una imagen usando una unidad de transformación amplia
ES2648315T3 (es) Procedimiento y aparato para codificar/decodificar por entropía un coeficiente de transformación
KR20110112224A (ko) 부호화 모드에 대한 정보를 부호화, 복호화하는 방법 및 장치
KR101525015B1 (ko) 영상의 부호화 방법 및 장치, 영상 복호화 방법 및 장치
KR20140067996A (ko) 영상의 부호화 방법 및 장치, 영상 복호화 방법 및 장치
BR112014007869B1 (pt) Método para gerar um bloco reconstruído