ES2912082T3 - Método de decodificación de vídeo, método de codificación de vídeo y medio de almacenamiento legible por decodificador que almacena información de video codificada - Google Patents

Método de decodificación de vídeo, método de codificación de vídeo y medio de almacenamiento legible por decodificador que almacena información de video codificada Download PDF

Info

Publication number
ES2912082T3
ES2912082T3 ES20200231T ES20200231T ES2912082T3 ES 2912082 T3 ES2912082 T3 ES 2912082T3 ES 20200231 T ES20200231 T ES 20200231T ES 20200231 T ES20200231 T ES 20200231T ES 2912082 T3 ES2912082 T3 ES 2912082T3
Authority
ES
Spain
Prior art keywords
strip
tile
tiles
lcus
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES20200231T
Other languages
English (en)
Inventor
Hendry Hendry
Jungsun Kim
Chulkeun Kim
Byeongmoon Jeon
Sangoh Jeong
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Application granted granted Critical
Publication of ES2912082T3 publication Critical patent/ES2912082T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/112Selection of coding mode or of prediction mode according to a given display mode, e.g. for interlaced or progressive display mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/129Scanning of coding units, e.g. zig-zag scan of transform coefficients or flexible macroblock ordering [FMO]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/167Position within a video image, e.g. region of interest [ROI]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Un método para decodificar vídeo, el método comprendiendo: recibir (S1810) información de video que incluye información relacionada con un modo de predicción, información sobre una tesela (610, 620) e información sobre una tira, en donde la tesela (610, 620) es una región rectangular común de una columna de unidades de codificación más grandes (LCU) y una fila de unidades de codificación más grandes (LCU) y la tira comprende un número entero de unidades de codificación más grandes (LCU); derivar (S1820) la tesela (610, 620) y la tira en una imagen actual (300; 400; 500; 1110; 1210; 1410) en base a la información de video recibida, en donde la imagen actual (300; 400; 500; 1110; 1210; 1410) incluye más de una tesela (610, 620) y más de una tira; y realizar la decodificación (S1830) para la imagen actual (300; 400; 500; 1110; 1210; 1410) en base a más de una tesela (610, 620) y más de una tira, en donde la decodificación (S1830) para la imagen actual (300; 400; 500; 1110; 1210; 1410) incluye: realizar inter predicción o intra predicción para derivar un bloque predicho de un bloque actual en la imagen actual en base a la información relacionada con el modo de predicción; y generar una imagen reconstruida de la imagen actual en base al bloque predicho, caracterizado porque se imponen las siguientes restricciones: las unidades de codificación más grandes (LCU) en la tira se ordenan consecutivamente en orden de escaneo de teselas; en el orden de escaneo de teselas, las unidades de codificación más grandes (LCU) en cada una de las teselas (610, 620) en la tira se ordenan en el orden de escaneo de ráster en cada una de las teselas (610, 620) y las teselas (610, 620) en el tira se ordenan en el orden de escaneo ráster; y las ID de tesela que especifican las teselas (610, 620) ordenadas en la tira son consecutivas.

Description

DESCRIPCIÓN
Método de decodificación de vídeo, método de codificación de vídeo y medio de almacenamiento legible por decodificador que almacena información de video codificada
[Campo técnico]
La presente invención se refiere a una técnica de compresión de vídeo, y más particularmente, a un método para especificar una región de una imagen.
[Antecedentes de la técnica]
Recientemente, la demanda de una imagen de alta resolución y alta calidad ha aumentado en varios campos de aplicaciones. A medida que una imagen tiene mayor resolución y mayor calidad, la cantidad de datos en la imagen aumenta más.
Por consiguiente, cuando se transfieren datos de imágenes usando medios como líneas de banda ancha inalámbricas o por cable existentes o se almacenan datos de imágenes en medios de almacenamiento existentes, el coste de transferencia de información y el coste de almacenamiento de información aumentan.
Pueden usarse técnicas de compresión de imágenes de alta eficiencia para transferir, almacenar y reproducir información de manera eficaz en imágenes de alta resolución y alta calidad.
Pueden usarse inter predicción e intra predicción para mejorar la eficiencia de compresión de la imagen. En la inter predicción, los valores de píxeles de una imagen actual se predicen con referencia a la información de otras imágenes. En la intra predicción, se predicen los valores de píxeles de una imagen actual usando una relación entre píxeles en la misma imagen.
A una unidad de proceso pueden aplicársele varios métodos para elaborar una imagen igual a una imagen original, por ejemplo, un bloque, de una imagen predicha. Por consiguiente, un decodificador puede decodificar una imagen con mayor precisión (más cerca de una imagen original) y un codificador puede codificar una imagen para reconstruir la imagen con mayor precisión.
Por lo tanto, es necesario estudiar cómo definir unidades de proceso en una imagen, por ejemplo, cómo definir una restricción en las unidades de proceso o una restricción en el uso de las unidades de proceso. El documento JCTVC-I1003_d0 con el título "High efficiency vídeo coding (HEVC) text specification draft 7" del Joint Collaborative Team on Vídeo Coding (JCT-VC) de ITU-T SG16 WP3 y la ISO/IEC JTC1/SC29/WG11 divulga características de los preámbulos de las reivindicaciones independientes. Más detalladamente, la sección 6.3 de este documento especifica cómo se divide una imagen en tiras, teselas y bloques de árbol de codificación. Las imágenes se dividen en tiras y teselas. Una tira es una secuencia de bloques de árbol de codificación. De igual manera, una tesela es una secuencia de bloques de árbol de codificación. Las muestras se procesan en unidades de bloques de árbol de codificación. A diferencia de las tiras, las teselas son siempre rectangulares y siempre contienen un número entero de bloques de árbol de codificación en el escaneo de trama de bloques de árbol de codificación. De acuerdo con este documento, una tesela puede consistir de bloques de árbol de codificación contenidos en más de una tira. De manera similar, una tira puede consistir de bloques de árbol de codificación contenidos en más de una tesela.
[Sumario de la invención]
[Problema técnico]
Un objeto de la invención es proporcionar métodos eficientes de codificación y decodificación de vídeo, así como una información de video codificada correspondiente para ser almacenada en un medio de almacenamiento legible por decodificador.
Otro objeto de la invención es proporcionar una configuración de tiras y teselas que puede mejorar la eficiencia de codificación
Otro objeto más de la invención es proporcionar una configuración de teselas y unidades de codificación más grandes que pueden mejorar la eficiencia de codificación
Un aspecto adicional opcional de esta divulgación que no se reivindica es un mecanismo para señalizar información de puntos de entrada para mejorar la eficiencia de la codificación.
[Solución técnica]
Los objetos anteriores se resuelven mediante la combinación de las características de las reivindicaciones independientes. Las realizaciones preferidas se definen en las reivindicaciones dependientes.
Se proporciona un método de codificación de video que incluye los pasos de: configurar una tesela y una tira en una imagen actual de entrada; realizar una operación de codificación en base a la tesela y la tira; y transmitir información de video codificada, en donde la imagen actual incluye una o más teselas y una o más tiras, y en donde las unidades de codificación más grandes (LCU) en la tira se ordenan en un escaneo de teselas. Este método aún no está de acuerdo con las reivindicaciones independientes.
Se proporciona un método de decodificación de video que incluye los pasos de: recibir información de video; especificar una tesela y una tira en una imagen actual en base a la información de video recibida; y realizar una operación de decodificación en base a la tesela y la tira, en donde la imagen actual incluye una o más teselas y una o más tiras, y en donde las unidades de codificación más grandes (LCU) en la tira se ordenan en un escaneo de teselas. Este método aún no está de acuerdo con las reivindicaciones independientes.
[Efectos ventajosos]
De acuerdo con la invención, es posible mejorar la eficiencia de la codificación usando una configuración efectiva de tiras y teselas.
De acuerdo con la invención, es posible mejorar la eficiencia de la codificación usando una configuración eficaz de teselas y unidades de codificación más grandes.
De acuerdo con un aspecto adicional que no se reivindica, es posible indicar con precisión un punto de entrada para el procesamiento en paralelo mediante la señalización de la información de puntos de entrada.
[Descripción de dibujos]
La FIG. 1 es un diagrama de bloques que ilustra esquemáticamente un codificador de vídeo.
La FIG. 2 es un diagrama de bloques que ilustra esquemáticamente un decodificador de vídeo.
La FIG. 3 es un diagrama que ilustra esquemáticamente un ejemplo de una tira.
La FIG. 4 es un diagrama que ilustra un ejemplo de una tesela y una tira.
La FIG. 5 es un diagrama que ilustra otro ejemplo de una tesela y una tira.
La FIG. 6 es un diagrama que ilustra esquemáticamente un ejemplo donde se produce un problema en un proceso paralelo.
La FIG. 7 es un diagrama que ilustra esquemáticamente un ejemplo de un orden de exploración ráster de LCU.
La FIG. 8 es un diagrama que ilustra esquemáticamente un ejemplo de un orden de exploración ráster de LCU.
La FIG. 9 es un diagrama que ilustra esquemáticamente un ejemplo de un problema que puede producirse en un proceso de decodificación dependiendo de una estructura de tiras y teselas.
La FIG. 10 es un diagrama que ilustra esquemáticamente un ejemplo de una estructura de tiras y teselas de acuerdo con la invención.
Las FIGS. 11 a 15 son diagramas que ilustran configuraciones de teselas y tiras.
La FIG. 16 es un diagrama que ilustra esquemáticamente un ejemplo de una configuración de teselas y tiras cuando se aplica la Tabla 1.
La FIG. 17 es un diagrama de flujo que ilustra esquemáticamente un método de codificación de acuerdo con la invención.
La FIG. 18 es un diagrama de flujo que ilustra esquemáticamente un método de decodificación de acuerdo con la invención.
[Modo para la invención]
En los dibujos se describirán y mostraran realizaciones específicas . Sin embargo, no se pretende que las realizaciones limiten la invención como se define en las reivindicaciones. Una expresión de un número singular incluye una expresión del número plural, siempre que se lea claramente de manera diferente. Los términos como "incluir" y "tener" se pretende que indiquen que existen características, números, pasos, operaciones, elementos, componentes o combinaciones de los mismos usados en la siguiente descripción y, por lo tanto, debe entenderse que no se excluye la posibilidad de existencia o adición de una o más características, números, pasos, operaciones, elementos, componentes, o combinaciones de los mismos.
Por otro lado, los elementos de los dibujos descritos en la invención se dibujan de independientemente con el propósito de facilitar la explicación de diferentes funciones específicas en un aparato de codificación/decodificación de imágenes y no significa que los elementos estén incorporados por hardware o software independientes. Por ejemplo, dos o más elementos de los elementos pueden combinarse para formar un único elemento, o un elemento puede dividirse en varios elementos.
En lo sucesivo, se describirán con detalle realizaciones ejemplares de la invención con referencia a los dibujos acompañantes. Los constituyentes similares en los dibujos serán referenciados por números de referencia similares y no se describirán repetidamente.
La FIG. 1 es un diagrama de bloques que ilustra esquemáticamente un codificador de vídeo que no se reivindica. En referencia a la FIG. 1, un codificador de vídeo 100 incluye un módulo de división de imágenes 105, un módulo de predicción 110, un módulo de transformación 115, un módulo de cuantificación 120, un módulo de reordenamiento 125, un módulo de codificación de entropía 130, un módulo de descuantificación 135, un módulo de transformación inversa 140, un módulo de filtrado 145, y una memoria 150.
El módulo de división de imágenes 105 puede dividir una imagen de entrada en por lo menos un bloque de unidad de proceso. Aquí, un bloque como unidad de proceso puede ser una unidad de predicción (en lo sucesivo, denominada "PU"), una unidad de transformación (en lo sucesivo, denominada "TU"), o una unidad de codificación (en lo sucesivo, denominada como una "CU").
Los bloques de unidades de proceso divididos por el módulo de división de imágenes 105 pueden tener una estructura de árbol cuádruple.
El módulo de predicción 110 incluye un módulo de inter predicción que realiza un proceso de inter predicción y un módulo de intra predicción que realiza un proceso de intra predicción, como se describirá más adelante. El módulo de predicción 110 realiza un proceso de predicción en las unidades de procesamiento de una imagen dividida por el módulo de división de imágenes 105 para crear un bloque de predicción. En el módulo de predicción 110, la unidad de procesamiento de una imagen puede ser una CU, una TU o una PU. El módulo de predicción 110 puede determinar si la predicción realizada en la unidad de procesamiento correspondiente es una inter predicción o una intra predicción, y puede determinar detalles específicos (por ejemplo, un modo de predicción) de los métodos de predicción. La unidad de procesamiento sometida al proceso de predicción puede ser diferente de la unidad de procesamiento de la cual se determinan el método de predicción y los detalles específicos. Por ejemplo, el método de predicción y el modo de predicción pueden determinarse en las unidades de PU y el proceso de predicción puede realizarse en las unidades de TU.
En la inter predicción, puede realizarse un proceso de predicción en base a la información de por lo menos una de una imagen anterior y/o una imagen posterior de una imagen actual para crear un bloque de predicción. En la intra predicción, puede realizarse un proceso de predicción en base a la información de píxeles de una imagen actual para crear un bloque de predicción.
En la inter predicción, pueden usarse un modo de omisión, un modo de fusión, un modo MVP (Predicción de vector de movimiento) y similares. En la inter predicción, puede seleccionarse una imagen de referencia para una PU, y puede seleccionarse un bloque de referencia que tiene el mismo tamaño que la PU mediante muestras de píxeles enteros. Luego, se crea un bloque de predicción en el que se minimiza una señal residual de la PU actual y se minimiza la magnitud del vector de movimiento.
El bloque de predicción puede construirse en la unidad de muestras de píxeles enteros o en la unidad de muestras de píxeles menores que un píxel entero. Aquí, el vector de movimiento también puede expresarse en la unidad de muestras de píxeles menores que un píxel entero.
La información como un índice, un vector de movimiento (por ejemplo, un predictor de vector de movimiento) y una señal residual de una imagen de referencia seleccionada a través de la inter predicción se codifica en entropía y se transmite a un decodificador. Cuando se aplica un modo de omisión, puede usarse un bloque de predicción como un bloque reconstruido y, por tanto, puede no crearse, transformarse, cuantificarse ni transmitirse en absoluto la señal residual.
Cuando se realiza intra predicción, el modo de predicción puede determinarse en la unidad de PU y el proceso de predicción puede realizarse en la unidad de PU. Alternativamente, el modo de predicción puede determinarse en la unidad de PU y la inter predicción puede realizarse en la unidad de TU.
Los modos de predicción en la intra predicción pueden incluir 33 modos de predicción direccionales y por lo menos dos modos no direccionales. Los modos no direccionales pueden incluir un modo de predicción de DC y un modo plano.
En la intra predicción, puede construirse un bloque de predicción después de aplicar un filtro a una muestra de referencia. En este momento, puede determinarse si se debe aplicar un filtro a una muestra de referencia dependiendo del modo de intra predicción y/o el tamaño de un bloque actual.
Una PU puede ser un bloque que tiene varios tamaños y formas. Por ejemplo, en caso de inter predicción, una PU puede ser bloques que tengan tamaños como 2Nx2N, 2NxN, Nx2N, y NxN (donde N es un número entero). En el caso de intra predicción, una PU puede ser bloques que tienen tamaños como 2Nx2N y NxN (donde N es un número entero). Una PU con un tamaño de NxN puede configurarse para aplicarse solo a un caso específico. Por ejemplo, la PU con un tamaño de NxN puede configurarse para usarse solo para una CU más pequeña o puede configurarse para usarse solo para la intra predicción. Además de las PU con los tamaños mencionados anteriormente, pueden definirse y usarse adicionalmente las PU como un bloque NxmN, un bloque mNxN, un bloque 2NxmN y un bloque mNx2N (donde m<1).
Los valores residuales (un bloque residual o una señal residual) entre el bloque de predicción construido y el bloque original se introducen en el módulo de transformación 115. La información del modo de predicción, la información del vector de movimiento y similares usados para la predicción se codifican junto con los valores residuales por el módulo de codificación de entropía 130 y se transmiten al decodificador.
El módulo de transformación 115 realiza un proceso de transformación en el bloque residual en la unidad de TU y crea coeficientes de transformación.
Un bloque de transformación es un bloque rectangular de muestras y es un bloque al que se aplica la misma transformación. El bloque de transformación puede ser una TU y puede tener una estructura de árbol cuádruple.
El módulo de transformación 115 puede realizar un proceso de transformación dependiendo del modo de predicción aplicado a un bloque residual y el tamaño del bloque.
Por ejemplo, cuando la intra predicción se aplica a un bloque residual y el bloque residual tiene una matriz de 4x4, el bloque residual se transforma usando la transformada de seno discreta (DST). De lo contrario, el bloque residual puede transformarse usando la transformada de coseno discreta (DCT).
El módulo de transformación 115 puede construir un bloque de transformación de coeficientes de transformación a través de la transformación.
El módulo de cuantificación 120 puede cuantificar los valores residuales, es decir, los coeficientes de transformación, transformados por el módulo de transformación 115 y puede crear coeficientes de cuantificación. Los valores calculados por el módulo de cuantificación 120 pueden suministrarse al módulo de descuantificación 135 y al módulo de reordenamiento 125.
El módulo de reordenamiento 125 puede reordenar los coeficientes de transformación suministrados desde el módulo de cuantificación 120. Al reordenar los coeficientes de cuantificación, es posible mejorar la eficiencia de codificación en el módulo de codificación de entropía 130.
El módulo de reordenamiento 125 puede reordenar los coeficientes de transformación cuantificados en forma de un bloque bidimensional a la forma de un vector unidimensional mediante el uso de un método de escaneo de coeficientes.
El módulo de codificación de entropía 130 puede realizar una operación de codificación de entropía en los coeficientes de cuantificación reordenados por el módulo de reordenamiento 125. Ejemplos del método de codificación de entropía incluyen un método de Golomb exponencial, un método CAVLC (codificación de longitud variable adaptable al contexto) y un CABAC (codificación aritmética binaria adaptativa al contexto). El módulo de codificación de entropía 130 puede codificar una variedad de información como información de coeficiente de cuantificación e información de tipo de bloque de una CU, información de modo de predicción, información de unidad de partición, información de PU, información de unidad de transferencia, información de vector de movimiento, información de imagen de referencia, información de interpolación de bloque y filtrar la información transmitida desde el módulo de reordenamiento 125 y el módulo de predicción 110.
El módulo 130 de codificación de entropía puede dar un cambio predeterminado a un conjunto de parámetros o sintaxis a transmitir, si es necesario.
El módulo de descuantificación 135 descuantifica los valores (coeficientes de transformación) cuantificados por el módulo de cuantificación 120. El módulo de transformación inversa 140 transforma inversamente los valores descuantificados por el módulo de descuantificación 135.
Los valores residuales creados por el módulo de descuantificación 135 y el módulo de transformación inversa 140 pueden fusionarse con el bloque predicho, predicho por el módulo de predicción 110 para construir un bloque reconstruido.
En la FIG. 1, se añaden un bloque residual y un bloque de predicción para crear un bloque reconstruido por un sumador. En este momento, el sumador puede considerarse como un módulo particular (módulo de creación de bloques reconstruidos) que crea un bloque reconstruido.
El módulo de filtrado 145 aplica un filtro de desbloqueo, un ALF (filtro de bucle adaptativo), un SAO (desplazamiento adaptativo de muestra) a la imagen reconstruida.
El filtro de desbloqueo elimina una distorsión de bloque generada en el límite entre bloques en la imagen reconstruida. El ALF realiza un proceso de filtrado en base a los valores de resultado de la comparación de la imagen original con la imagen reconstruida cuyos bloques son filtrados por el filtro de desbloqueo. El ALF puede aplicarse solo cuando es necesaria una alta eficiencia. La SAO reconstruye las diferencias de desplazamiento entre los bloques residuales a los que se les ha aplicado el filtro de desbloqueo y la imagen original y se aplica en forma de desplazamiento de banda, desplazamiento de borde o similar.
Por otro lado, el módulo de filtrado 145 puede no realizar una operación de filtrado en el bloque reconstruido usado en la inter predicción.
La memoria 150 puede almacenar el bloque reconstruido o la imagen calculada por el módulo de filtrado 145. El bloque reconstruido o la imagen almacenada en la memoria 150 puede ser suministrada al módulo de predicción 110 que realiza la inter predicción.
La FIG. 2 es un diagrama de bloques que ilustra esquemáticamente un decodificador de vídeo que no se reivindica. En referencia a la FIG. 2, un decodificador de vídeo 200 puede incluir un módulo de decodificación de entropía 210, un módulo de reordenamiento 215, un módulo de descuantificación 220, un módulo de transformación inversa 225, un módulo de predicción 230, un módulo de filtrado 235, y una memoria 240.
Cuando se introduce un flujo de bits de vídeo desde el codificador de vídeo, el flujo de bits de entrada puede decodificarse en base al orden en el que el codificador de vídeo procesa la información de vídeo.
Por ejemplo, cuando el codificador de vídeo usa un método de codificación de longitud variable (en lo sucesivo, denominado "VLC") como el método CAVLC para realizar la operación de codificación de entropía, el módulo de decodificación de entropía 210 puede implementar la misma tabla VLC que la tabla VLC usada en el codificador de vídeo y puede realizar la operación de decodificación de entropía. Cuando el codificador de vídeo usa el método CABAC para realizar el proceso de codificación de entropía, el módulo 210 de decodificación de entropía puede realizar la operación de decodificación de entropía usando el método CABAC para corresponder a la misma.
La información para construir un bloque predicho a partir de la información decodificada por el módulo de decodificación de entropía 210 puede suministrarse al módulo de predicción 230, y los valores residuales, es decir, los coeficientes de transformación cuantificados, decodificados mediante entropía por el módulo de decodificación de entropía 210 pueden introducirse en el módulo de reordenamiento 215.
El módulo de reordenamiento 215 puede reordenar la información del flujo de bits, es decir, los coeficientes de transformación cuantificados, decodificados por entropía por el módulo de decodificación de entropía 210 sobre la base del método de reordenamiento en el codificador de vídeo.
El módulo de reordenamiento 215 puede reconstruir y reordenar los coeficientes expresados en forma de un vector unidimensional en coeficientes en forma de un bloque bidimensional. El módulo de reordenamiento 215 puede escanear los coeficientes en base al modo de predicción aplicado al bloque actual (bloque de transformación) y el tamaño del bloque de transformación y puede crear una matriz de coeficientes (coeficientes de transformación cuantificados) en forma de bloque bidimensional.
El módulo de descuantificación 220 puede realizar la descuantificación en base a los parámetros de cuantificación suministrados desde el codificador de vídeo y los valores de coeficiente del bloque reordenado.
El módulo de transformación inversa 225 puede realizar la DCT inversa y/o DST inversa de la DCT y/o DST, que ha sido realizada por el módulo de transformación del codificador de vídeo, sobre el resultado de cuantificación del codificador de vídeo. La transformación inversa puede realizarse sobre la base de una unidad de transferencia o una unidad de partición de una imagen determinada por el codificador de vídeo. El módulo de transformación del codificador de vídeo puede realizar selectivamente la DCT y/o DST dependiendo de una pluralidad de piezas de información como el método de predicción, el tamaño de un bloque actual, y la dirección de predicción, y el módulo de transformación inversa 225 del decodificador de vídeo puede realizar la transformación inversa en base a la información de transformación sobre la transformación realizada por el módulo de transformación del codificador de vídeo.
El módulo de predicción 230 puede construir un bloque predicho en base a la información de construcción del bloque de predicción suministrada desde el módulo de decodificación de entropía 210 y el bloque previamente decodificado y/o la información de imagen suministrada desde la memoria 240.
Cuando el modo de predicción de una CU y/o PU actual es un modo de intra predicción, el módulo de predicción 230 puede realizar una operación de intra predicción para construir un bloque predicho en base a la información de píxeles de una imagen actual.
Cuando el modo de predicción de una PU actual es el modo de inter predicción, el módulo de predicción 230 puede realizar la operación de inter predicción en la PU actual en base a la información incluida en por lo menos una de una imagen anterior y una imagen posterior de la imagen actual. En este momento, la información de movimiento para la inter predicción de la PU actual, por ejemplo, información sobre vectores de movimiento e índices de imagen de referencia, suministrada desde el codificador de vídeo, puede inducirse a partir de una marca de omisión, una marca de fusión y similares recibidas desde el codificador de vídeo.
El bloque reconstruido puede construirse usando el bloque predicho construido por el módulo de predicción 230 y el bloque residual suministrado desde el módulo de transformación inversa 225. La FIG. 2 ilustra que el bloque residual y el bloque predicho son añadidos por un sumador para construir un bloque reconstruido. Aquí, el sumador puede considerarse como un módulo particular (módulo de construcción de bloques reconstruidos) que construye un bloque reconstruido.
Cuando se usa el modo de omisión, la señal residual puede no transmitirse y el bloque predicho puede usarse como un bloque reconstruido.
El bloque y/o la imagen reconstruidos pueden suministrarse al módulo de filtrado 235. El módulo de filtrado 235 puede realizar una operación de filtrado de desbloqueo, una operación SAO y/o una operación ALF en el bloque y/o imagen reconstruidos.
La memoria 240 puede almacenar la imagen o el bloque reconstruidos para usarlos como una imagen de referencia o un bloque de referencia y puede suministrar la imagen reconstruida a un módulo de salida.
El codificador de vídeo y el decodificador de vídeo pueden dividir una imagen en unidades predeterminadas y pueden procesar (codificar/decodificar) las unidades divididas. Por ejemplo, una imagen puede dividirse en tiras y teselas.
Una tira puede incluir un número natural de unidades de árbol de codificación (CTU) o bloques de árbol de codificación (CTB) que pertenecen a un segmento de tira independiente y segmentos de tira dependientes posteriores al segmento de tira independiente y antes del siguiente segmento de tira independiente en una única unidad de acceso (AU).
Una unidad de árbol de codificación es una unidad de codificación con una estructura de árbol cuádruple y puede decirse que es una unidad de codificación más grande (LCU) porque es la unidad de codificación más grande.
Una unidad de árbol de codificación puede designarse como un bloque de árbol de codificación de muestras de luma, un bloque de árbol de codificación de dos muestras de croma correspondientes en una imagen que tiene tres matrices de muestras y una estructura de sintaxis usada para codificar/decodificar las muestras. Alternativamente, una unidad de árbol de codificación puede designarse como un bloque de árbol de codificación de muestras en una imagen monocromática y una estructura de sintaxis usada para codificar/decodificar las muestras, o puede designarse como un bloque de árbol de codificación de muestras en una imagen codificada usando tres planos de color separados y una estructura de sintaxis usada para codificar/decodificar las muestras.
Un bloque de árbol de codificación es un bloque de codificación más grande y los bloques de codificación pueden crearse dividiendo el bloque de árbol de codificación.
En esta descripción, con el propósito de facilitar la comprensión de la invención, la unidad de árbol de codificación (CTU), la unidad de codificación más grande (LCU) y el bloque de árbol de codificación (CTB) pueden usarse indistintamente si es necesario.
Un segmento de tira incluye un número entero de CTU (o LCU) que se ordenan consecutivamente en un escaneo de tesela y que se incluyen en una unidad de capa de abstracción de red (NAL) individual.
En un segmento de tira, una parte que incluye elementos de datos del primer bloque de árbol de codificación (unidad de árbol de codificación) o todos los bloques de árbol de codificación (unidades de árbol de codificación) del segmento de tira se denomina encabezado de segmento de tira. Cuando un segmento de tira actual es un segmento de tira independiente, el encabezado del segmento de tira independiente se denomina encabezado de tira. Cuando un segmento de tira actual es un segmento de tira dependiente, el encabezado de segmento de tira del último segmento de tira independiente de los segmentos de tira independientes antes del segmento de tira actual en el orden de decodificación se denomina un encabezado de tira.
Una tira puede ser una unidad de transmisión de una unidad NAL. Por ejemplo, la unidad NAL puede incluir tiras o segmentos de tiras.
La FIG. 3 es un diagrama que ilustra esquemáticamente un ejemplo de una tira.
Una imagen actual puede dividirse en varias tiras por límites de tiras. La FIG. 3 ilustra un ejemplo en el que una imagen actual 300 se divide en dos tiras por un límite de tira 350.
Una tira incluye segmentos de tira que incluyen unidades de árbol de codificación. Los segmentos de tira incluidos en la tira pueden incluir un segmento de tira independiente y también pueden incluir segmentos de tira dependientes cuando los segmentos de tira dependientes están presentes.
En el ejemplo ilustrado en la FIG. 3, la primera tira incluye un segmento de tira independiente 310 que incluye cuatro unidades de árbol de codificación y un primer segmento de tira dependiente 320 que incluye 32 unidades de árbol de codificación y un segundo segmento de tira dependiente 340 que incluye 24 unidades de árbol de codificación antes y después de un límite de segmento de tira 330. En el ejemplo ilustrado en la FIG. 3, un segmento de tira independiente 360 incluye 28 unidades de árbol de codificación.
Una tesela puede ser una secuencia de unidades de árbol de codificación, bloques de árbol de codificación, o unidades de codificación más grandes. La unidad de árbol de codificación puede ser una unidad de codificación con una estructura de árbol cuádruple y puede ser una unidad de codificación más grande (LCU). Como se ha descrito anteriormente, en esta descripción, la unidad de árbol de codificación y la unidad de codificación más grande pueden usarse indistintamente si es necesario con el propósito de facilitar la comprensión de la invención.
Específicamente, una tesela es una región rectangular dentro de una columna de teselas particular y una fila de teselas particular en una imagen. Una columna de teselas es una región rectangular de CTB (o LCU) que tiene la misma altura que la altura de la imagen y una anchura especificada por señalización. Una fila de teselas es una región rectangular que tiene la misma anchura que la anchura de la imagen y que tiene una altura especificada por señalización.
Como se ha descrito anteriormente, la anchura de una columna de teselas y la altura de una fila de teselas pueden especificarse mediante elementos de sintaxis a señalizar. Por ejemplo, la anchura de una columna de teselas y la altura de una fila de teselas en una imagen pueden especificarse mediante elementos de sintaxis que se transmitirán mediante el uso de un conjunto de parámetros de imagen de la imagen.
Un escaneo de teselas es un orden consecutivo específico de CTB (o LCU) que dividen una imagen. En el escaneo de teselas, el orden consecutivo puede significar que los CTB (o LCU) se ordenan consecutivamente en un escaneo ráster de CTB en una tesela y las teselas de una imagen se ordenan consecutivamente en un escaneo ráster.
Una tesela puede ser una unidad de escaneo en una imagen. Por consiguiente, las teselas pueden ordenarse consecutivamente en un orden de escaneo de imágenes, por ejemplo, en un orden de escaneo ráster, en la imagen.
Pueden establecerse ambas o una de las dos condiciones siguientes para las tiras y las teselas. (1) Todas las unidades de árbol de codificación o las unidades de codificación más grandes de una tira pertenecen a la misma tesela. (2) Todas las unidades de árbol de codificación o las unidades de codificación más grandes de una tesela pertenecen a la misma tira.
Por consiguiente, puede estar presente en la misma imagen una tira que incluya múltiples teselas y una tesela que incluya múltiples tiras.
Además, pueden establecerse ambas o una de las dos condiciones siguientes para los segmentos de tiras y las teselas. (1) Todas las unidades de árbol de codificación o las unidades de codificación más grandes de un segmento de tira pertenecen a la misma tesela. (2) Todas las unidades de árbol de codificación o las unidades de codificación más grandes de una tesela pertenecen al mismo segmento de tira.
La FIG. 4 es un diagrama que ilustra esquemáticamente un ejemplo de una tesela y una tira.
Una tesela de una imagen puede dividirse en varias teselas mediante un límite de tesela. En la FIG. 4, una imagen actual 400 incluye sólo una tira y está dividida en dos teselas en los lados derecho e izquierdo por un límite de tesela 410.
Una tesela y una tira pueden estar presentes juntas. En el ejemplo ¡lustrado en la FIG. 4, la tira de la imagen actual 400 incluye un segmento de tira independiente 420 y cuatro segmentos de tira dependientes divididos por límites de segmento de tira 430, 440 y 450.
La FIG. 5 es un diagrama que ilustra esquemáticamente otro ejemplo de tesela y tira.
La FIG. 5 describe una imagen actual 500 dividida en dos teselas en los lados derecho e izquierdo por un límite de tesela 510 como ejemplo.
En el ejemplo ilustrado en la FIG. 5, la tesela izquierda del límite de tesela 510 incluye dos tiras divididas por un límite de tira 550.
Como se ha descrito anteriormente, una tira puede incluir una tira independiente y también puede incluir una tira dependiente cuando la tira dependiente está presente. En la FIG. 5, la tira superior del límite de tira 550 incluye un segmento de tira independiente 520 y un segmento de tira dependiente 540, y la tira inferior del límite de tira 550 incluye un segmento de tira independiente 530 y un segmento de tira dependiente 560.
En el ejemplo ilustrado en la FIG. 5, una tira junto a un límite de tira 590, es decir, la tira en la segunda tesela, incluye un segmento de tira independiente 570 y un segmento de tira dependiente 580.
Una tesela y una tira pueden ser unidades de proceso de decodificación independientes. Por ejemplo, cuando se realiza decodificación en paralelo, cada tesela puede decodificarse mediante un único núcleo de procesamiento y cada tira puede decodificarse mediante un único núcleo de procesamiento.
A este respecto, como puede verse en las FIGS. 4 y 5, una tira y una tesela pueden ser una secuencia de bloques de árbol de codificación consecutivos (unidades de árbol de codificación), pero la loseta puede tener una forma específica. Por ejemplo, una tesela puede ser una región rectangular, a diferencia de la tira.
De esta manera, un proceso de decodificación puede realizarse de manera diferente entre una tira y una tesela.
Por ejemplo, en el caso de una tira, cada segmento de tira incluye un encabezado de segmento de tira que comprende elementos de datos. Como se ha descrito anteriormente, a un encabezado de segmento de tira de un segmento de tira independiente puede hacerse referencia como encabezado de tira.
Por el contrario, una tesela puede no ser una unidad en la que esté presente información de encabezado, pero puede ser una unidad de procesamiento en paralelo (por ejemplo, decodificación en paralelo).
Por lo tanto, en el caso de teselas, la dependencia entre teselas no se produce para una ruptura provocada por los límites de fila o columna de los bloques del árbol de codificación. Por el contrario, en el caso de las tiras, la dependencia en el momento de la decodificación puede provocar un problema con los límites de las filas o columnas de los bloques del árbol de codificación. En otras palabras, cuando una tira se procesa en paralelo con una fila o una columna como límite, puede resultar difícil decodificar una parte que no incluya información de un encabezado de tira.
Por lo tanto, como se ha descrito anteriormente, pueden ser necesarias restricciones predeterminadas sobre teselas y tiras.
Las relaciones o restricciones entre las teselas y las tiras se describirán específicamente a continuación con referencia a los dibujos adjuntos.
No se impone una restricción estricta a la relación entre una tira actual y una tesela actual. La relación entre la tira actual y la tesela actual basada en la premisa de que una o más teselas pueden estar presentes en una tira y uno o más tiras pueden estar presentes en una tesela puede expresarse mediante una relación flexible.
Esta relación flexible puede dar flexibilidad al diseño de un proceso de decodificación, pero puede provocar (1 ) un problema de que se restringe un grado de procesamiento paralelo y (2) un problema de que aumenta la complejidad del cálculo.
La FIG. 6 es un diagrama que ilustra esquemáticamente un ejemplo donde puede producirse un problema en el procesamiento en paralelo.
Se supone que el codificador de vídeo divide una imagen como se ilustra en la FIG. 6. En referencia a la FIG. 6, una región 600 de la imagen incluye la tesela 1610 y la tesela 2620. La región 600 de la imagen incluye dos tiras. La región 600 en la imagen puede ser una región parcial en la imagen o la región completa en la imagen.
La primera tira incluye 10 bloques de árbol de codificación (1, 1) a (1, 10) y la segunda tira incluye 6 bloques de árbol de codificación (2, 1 ) a (2, 6).
Se supone que el núcleo de procesamiento 1 y el núcleo de procesamiento 2 , que son los cuerpos principales del proceso de decodificación, procesan diferentes teselas en paralelo. Por ejemplo, en el ejemplo ilustrado en la FIG. 6, el núcleo de procesamiento 1 procesa la tesela 1610 y el núcleo de procesamiento 2 procesa la tesela 2 620. Un problema que puede producirse en la FIG. 6 es que los núcleos de procesamiento 1 y 2 no pueden realizar un proceso de decodificación en paralelo.
Esto se debe a que la primera LCU (bloque de árbol de codificación) de la tesela 2620 no es una parte inicial de la tira y, por tanto, no incluye información del encabezado de la tira. Por consiguiente, en el ejemplo ilustrado en la FIG. 6, el núcleo de procesamiento tiene dificultades para realizar un proceso de decodificación usando la información del encabezado de la tira.
En el ejemplo ilustrado en la FIG. 6, cuando las teselas son independientes y se decodifican LCU (1, 9) y LCU (1, 10), puede producirse otro problema. Por ejemplo, cuando se usan teselas independientes, no se permite la intra predicción en el límite de la tesela y, por lo tanto, LCU (1, 9) y LCU (1, 10) no pueden referirse a LCU (1, 5) y LCU (1,6).
Sin embargo, como LCU (1, 9), LCU (1, 10), LCU (1, 5) y LCU (1, 6) se incluyen en la misma tira y no hay ninguna restricción aplicable a los píxeles de referencia en la tira del ejemplo ilustrado en la FIG. 6 en la intra predicción, puede producirse una confusión en el proceso de decodificación.
Por lo tanto, para reducir las confusiones y la complejidad que pueden producirse en el proceso en paralelo, pueden imponerse las siguientes restricciones.
En una imagen, una tesela no puede atravesar el límite de una tira y una tira no puede atravesar un límite de tesela. En otras palabras, un número entero de teselas debe estar presente en una tira cuando la tira incluye teselas, y un número entero de tiras debe estar presente en una tesela cuando la tesela incluye tiras.
Específicamente,
(1) Una imagen puede dividirse en una o más tiras y/o una o más teselas.
(2) Cuando una tesela incluye tiras, debe estar presente un número entero de tiras completas en la tesela.
(3) Cuando una tira incluye teselas, debe estar presente un número entero de teselas completas en la tira.
Aquí, una tesela completa es una tesela y significa la región completa de una tesela no dividida en partes. Una tira completa es una tira y significa que la región completa de una tira no está dividida en partes.
La relación entre tiras y teselas puede considerarse a la vista de CTB (o LCU). Por ejemplo, debe cumplirse por lo menos una de las siguientes condiciones para las tiras y las teselas.
(1) Todos los bloques codificados de una tira pertenecen a la misma tesela.
(2) Todos los bloques codificados de una tesela pertenecen a la misma tira.
Pueden estar presentes en la misma imagen tanto una tira que incluye múltiples teselas como una tesela que incluye múltiples tiras.
La ID de tesela (identificación de tesela) puede designarse en un orden de escaneo ráster y las LCU (o CTB) en una tesela pueden ordenarse en el orden de bloque y en el orden de escaneo ráster.
La FIG. 7 es un diagrama que ilustra esquemáticamente un ejemplo del orden de escaneo ráster de las LCU.
En el ejemplo ilustrado en la FIG. 7, una imagen 710 incluye una tira y una tesela. Por consiguiente, en el ejemplo ilustrado en la FIG. 7, la tira y la tesela tienen el mismo tamaño que la imagen 710.
En referencia a la FIG. 7, las LCU se ordenan en el orden de escaneo ráster en la imagen (en la tira o en la tesela).
La FIG. 8 es un diagrama que ilustra esquemáticamente un ejemplo del orden de escaneo ráster de las LCU.
En el ejemplo ilustrado en la FIG. 8, una imagen 810 incluye una tira y 12 teselas, y cada tesela incluye cuatro LCU.
Por consiguiente, en el ejemplo ilustrado en la FIG. 8, la tira tiene el mismo tamaño que la imagen 810 y la tira incluye 12 teselas.
En referencia a la FIG. 8, las teselas se ordenan en el orden de escaneo ráster en la imagen 810 (en la tira), y las LCU se ordenan en el orden de escaneo ráster en cada tesela y se ordenan en el orden de escaneo ráster en la unidad de tesela junto con las teselas.
Por otro lado, cuando la relación entre las teselas y las tiras es flexible, puede producirse un problema en el proceso de decodificación.
La FIG. 9 es un diagrama que ilustra esquemáticamente un ejemplo de un problema que puede producirse dependiendo de la relación entre las tiras y las teselas en el proceso de decodificación.
En el ejemplo ilustrado en la FIG. 9, una imagen 910 incluye dos tiras, cada tira incluye 6 teselas y cada tesela incluye cuatro LCU.
En referencia a la FIG. 9, un número asignado a cada LCU es un índice de LCU para especificar la LCU, y los índices de LCU se designan en el orden de escaneo de teselas. Un número asignado a cada tesela es un ID de tesela (tile_id) para especificar la tesela y los ID de tesela se designan en el orden de exploración de la tesela.
Una LCU que se procesará la próxima vez después de que se complete el proceso en una LCU con índice n es una LCU con índice n+1. Por consiguiente, después de que se procesa (codifica/decodifica) la LCU #7 (es decir, la LCU final de una tesela con un ID de tesela (tile_id) de 1 en la primera tira), una LCU que se procesará la próxima vez es LCU #8 en el ejemplo ilustrado en la FIG. 9. Sin embargo, la LCU #8 es una LCU que pertenece a una tira diferente de la tira que incluye la LCU #7, y las LCU aún no procesadas permanecen en la tira, incluyendo la LCU #7.
En este caso, como la decodificación se realiza en la unidad de tiras, una LCU que se leerá y procesará a partir de un flujo de bits real es LCU #16, que es la siguiente LCU en la misma tira que LCU #7, pero el decodificador de vídeo puede determinar que la LCU #8 que debe determinarse que es una LCU posterior a la LCU #7 en términos de los índices de LCU.
Como el decodificador puede disponer los píxeles reconstruidos de las LCU en posiciones erróneas, esta falta de coincidencia puede provocar un problema grave.
Puede considerarse un método para imponer una restricción predeterminada o señalizar ID de teselas para resolver este problema. Se describirán específicamente a continuación las realizaciones de la invención a este respecto.
I. Aplicación de restricción 1
Para resolver el problema ilustrado en la FIG. 9, el codificador y el decodificador pueden imponer restricciones predeterminadas sobre la estructura de las teselas y las tiras de la siguiente manera en el momento de establecer/especificar teselas y tiras,
Específicamente, (1) cuando una imagen incluye múltiples tiras y múltiples teselas, las teselas que pertenecen a la misma tira se ordenan consecutivamente en el orden de escaneo ráster. (2) cuando una imagen incluye múltiples tiras y múltiples teselas, las ID de tesela de las teselas que pertenecen a la misma tira no se rompen, sino que deben ser consecutivos.
En otras palabras, las teselas presentes en una tira deben ser consecutivas en el orden de escaneo ráster y las ID de tesela (tile_id) no deben ser discontinuos.
La FIG. 10 es un diagrama que ilustra esquemáticamente un ejemplo de estructura de tiras y teselas de acuerdo con la invención.
En el ejemplo ilustrado en la FIG. 10, una imagen 1010 incluye dos tiras y cada tira incluye ocho teselas. En el ejemplo ilustrado en la FIG. 10, la primera tira incluye las teselas 0 a 7 y la segunda tira incluye las teselas 8 a 15. En el ejemplo ilustrado en la FIG. 10, cada tesela incluye cuatro LCU.
Como se ilustra, las teselas que pertenecen a la misma tira se ordenan consecutivamente en el orden de escaneo ráster dependiendo de las limitaciones de la invención, y las ID de tesela de las teselas en la misma tira no son discontinuas.
Por lo tanto, considerando un caso en el que se completa la decodificación de LCU #7, el decodificador puede decodificar LCU #8, que es la primera LCU en una tesela diferente (tile_id=2) en la misma tira, posteriormente a LCU #7.
II. Aplicación de restricción 2
Además de imponer las restricciones mencionadas anteriormente en las teselas y las tiras, el codificador y el decodificador pueden resolver el problema ilustrado en la FIG. 9 configurando/especificando las teselas y las tiras de la siguiente manera.
(A) Una tesela está presente simultáneamente en una fila y una columna e incluye un número entero de CTB que se ordenan consecutivamente en un escaneo ráster de bloque de árbol de codificación de la tesela (en la tesela). Por ejemplo, en una imagen, una región rectangular que es una región común de una columna que tiene una anchura correspondiente a un número predeterminado de LCU y una fila que tiene una altura correspondiente a un número predeterminado de LCU puede establecerse como una tesela.
La división de cada imagen en teselas puede mencionarse como partición. Las teselas en una imagen se ordenan consecutivamente en el escaneo ráster de teselas de la imagen.
(B) El escaneo de teselas es una ordenación secuencial de CTB en la que se divide una imagen. La ordenación de escaneo de teselas atraviesa los CTB (o LCU) en el escaneo ráster del bloque de árbol de codificación en la tesela y atraviesa las teselas en el orden de escaneo ráster en la imagen.
Incluso cuando una tira incluye CTB que están ordenados secuencialmente en el escaneo ráster del bloque de árbol de codificación de una tesela (en la tesela), los CTB no necesitan ordenarse consecutivamente en el escaneo ráster del bloque de árbol de codificación de una imagen (en la imagen).
(C) Una tira incluye un número entero de CTB que se ordenan consecutivamente en el escaneo de teselas. La división de cada imagen en tiras se menciona como partición. Una dirección de bloque de árbol de codificación puede derivarse de la primera dirección de bloque de árbol de codificación en la tira (como se expresa en el encabezado de la tira).
Por lo tanto, como los CTB se ordenan en el escaneo de teselas en una tira, las teselas en la tira se ordenan en el escaneo ráster y los CTB en cada tesela también se ordenan en el escaneo ráster.
Aquí, el escaneo ráster de tesela significa el escaneo ráster de teselas, y el escaneo ráster del bloque del árbol de codificación significa el escaneo ráster de los bloques del árbol de codificación.
De acuerdo con (A), (B) y (C) descritos anteriormente, los CTB en una tira no están ordenados en el orden de escaneo ráster, sino ordenados en el orden de escaneo de tesela. Por consiguiente, la configuración como en el ejemplo ilustrado en la FIG. 9 puede no producirse.
Las FIGS. 11 a 15 son diagramas que ilustran las configuraciones de teselas y tiras permitidas y las configuraciones de teselas y tiras no permitidas dependiendo de las restricciones I y II descritas anteriormente.
La FIG. 11 ilustra un ejemplo en el que una imagen 1110 incluye tres tiras y cada tesela incluye cuatro CTB. En el ejemplo ilustrado en la FIG. 11, la primera tira incluye las teselas 0 a 3, la segunda tira incluye las teselas 4 a 7 y la tercera tira incluye las teselas 8 a 11.
El ejemplo ilustrado en la FIG. 11 es admisible en base a las restricciones I y II, ya que satisface ambas restricciones I y II.
La FIG. 12 ilustra un ejemplo en el que una imagen 1210 incluye cuatro tiras y cada tesela incluye cuatro CTB. En el ejemplo ilustrado en la FIG. 12, la primera tira incluye las teselas 0 y 1, la segunda tira incluye las teselas 2 a 5, la tercera tira incluye las teselas 6 a 9 y la cuarta tira incluye las teselas 10 y 11.
El ejemplo ilustrado en la FIG. 12 es admisible en base a las restricciones I y II, ya que satisface ambas restricciones I y II.
La FIG. 13 ilustra un ejemplo en el que una imagen 1310 incluye dos tiras y cada tesela incluye cuatro CTB. En el ejemplo ilustrado en la FIG. 13, la primera tira incluye las teselas 0, 1, 4, 5, 8 y 9 y la segunda tira incluye las teselas 2, 3, 6, 7, 10 y 11.
El ejemplo ilustrado en la FIG. 13 no es admisible en base a las restricciones I y II ya que no satisface las restricciones I y II. Específicamente, las ID de tesela en cada tira no son consecutivas y los CTB en cada tira no están ordenados en el escaneo de tesela.
La FIG. 14 ilustra un ejemplo en el que una imagen 1410 incluye dos tiras, cada tira incluye una tesela, y cada tesela incluye 24 CTB.
El ejemplo ilustrado en la FIG. 11 es admisible en base a las restricciones I y II, ya que satisface ambas restricciones I y II.
La FIG. 15 ilustra un ejemplo en el que una imagen 1510 incluye cuatro tiras y cada tesela incluye cuatro CTB. En el ejemplo ilustrado en la FIG. 15, la primera tira incluye las teselas 0, 4 y 8, la segunda tira incluye las teselas 2 y 3, la tercera tira incluye las teselas 5, 6 y 7, y la cuarta tira incluye las teselas 9, 10 y 11.
El ejemplo ilustrado en la FIG. 15 no es admisible en base a las restricciones I y II ya que no satisface las restricciones I y II. Específicamente, las ID de tesela en cada tira no son consecutivas y los CTB en cada tira no están ordenados en el escaneo de tesela.
III. Transmisión de ID de tesela (tile_id)
Para resolver el problema ilustrado en la FIG. 9, puede indicarse la ID de tesela (tile_id) para cada LCU. Por ejemplo, junto con los puntos de entrada de teselas en cada encabezado de tira, la información de ID de tesela indica con qué tesela está asociado un desplazamiento de punto de entrada. Por consiguiente, se señaliza qué tesela corresponde a un punto de entrada en el encabezado de la tira.
El número de desplazamientos del punto de entrada puede ser igual al número de teselas en una tira. Alternativamente, considerando un punto en el que el desplazamiento del punto de entrada correspondiente al primer punto de entrada puede ser 0, el número de desplazamiento del punto de entrada puede establecerse para que sea igual al número de teselas en la tira-1.
Aquí, el punto de entrada puede significar un punto en el que se inicia la decodificación en cada tesela o WPP (procesamiento paralelo de frente de onda), y el desplazamiento del punto de entrada puede especificar el número de bits entre dos puntos de entrada. Por ejemplo, el desplazamiento de punto de entrada i indica la diferencia entre el número de bits del punto de entrada i y el número de bits del punto de entrada i-1.
La Tabla 1 muestra esquemáticamente un ejemplo de información de encabezado de tira corregida de acuerdo con la invención.
<Tabla 1>
Figure imgf000013_0001
En la Tabla 1, offset_tile_id[i] especifica un desplazamiento del punto de entrada asociado con el i-ésimo desplazamiento del punto de entrada (entry_point offset[i]).
El valor de offset_t i le_id [ i] varía de 0 a (num_tile_columns_minus1+1)*(num_tile_rows_minus1+1)-1.
offset_tile_id[i] puede expresarse mediante el valor de bit de ceil (log2(((num_tile_columns_minus1+1 )*(num_tile_rows_minus1+1 ))).
Aquí, num_tile_columns_minus1 puede especificar la anchura de la i-ésima columna de tesela en la unidad de CTB (es decir, LCU). Es decir, num_tile_columns_minus1+ 1 para offset_tile_id[i] indica un valor por el cual la anchura de la i-ésima columna de tesela se expresa en la unidad de CTB.
Además, num_tile_rows_minus1 puede especificar la altura de la i-ésima fila de teselas en la unidad de CTB (es decir, LCU). Es decir, num_tile_rows_minus1+1 para offset_tile_id[i] indica un valor mediante el cual se expresa la altura de la i-ésima fila de teselas en la unidad de CTB.
La FIG. 16 es un diagrama que ilustra esquemáticamente un ejemplo de una configuración de teselas y tiras cuando se usa la Tabla 1.
En el ejemplo ilustrado en la FIG. 16, una imagen 1610 incluye dos tiras, la primera tira incluye las teselas 0, 1,4, 5, 8 y 9 y la segunda tira incluye las teselas 2, 3, 6, 7, 10 y 11.
En el ejemplo ilustrado en la FIG. 16, cada tesela incluye cuatro CTB.
Las Tablas 2 y 3 muestran esquemáticamente ejemplos en los que la señalización mostrada en la Tabla 1 se aplica a la FIG. 16.
La Tabla 2 muestra un ejemplo de señalización de la primera tira en la FIG. 16.
<Tabla 2>
Figure imgf000014_0001
En la primera tira ilustrada en la FIG. 16, el número de desplazamientos de punto de entrada es seis, y cada desplazamiento del punto de entrada puede especificar el primer bit de la primera LCU (CTB) en cada tesela. En el ejemplo mostrado en la Tabla 2, el número de desplazamientos de punto de entrada de la primera tira se establece en seis, pero el desplazamiento del punto de entrada puede no ser señalado para cada punto de entrada. Por ejemplo, como el primer punto de entrada es el primer bit de la primera LCU en la tira y el valor de desplazamiento del mismo es 0, el desplazamiento del punto de entrada del primer punto de entrada puede no señalarse, pero el número de desplazamientos de punto de entrada puede establecerse en 5 y sólo pueden señalarse cinco desplazamientos del desplazamiento para el segundo punto de entrada. La Tabla 3 muestra esquemáticamente un ejemplo de señalización de la segundo tira en la FIG. 16.
<Tabla 3>
Figure imgf000015_0001
En la segunda tira ilustrada en la FIG. 16, el número de desplazamientos del punto de entrada es seis, y cada desplazamiento del punto de entrada puede especificar el primer bit de la primera LCU (CTB) en cada tesela. En el ejemplo mostrado en la Tabla 3, el número de desplazamientos del punto de entrada de la segunda tira se establece en seis, pero es posible que el desplazamiento del punto de entrada no se señale para cada punto de entrada. Por ejemplo, como el primer punto de entrada es el primer bit de la primera LCU en la tira y el valor de desplazamiento del mismo es 0, el desplazamiento del punto de entrada del primer punto de entrada puede no señalarse, pero el número de desplazamientos de punto de entrada puede establecerse en 5 y sólo pueden señalarse cinco desplazamientos del desplazamiento del segundo punto de entrada.
Como se muestra en las Tablas 1 a 3, al señalar los puntos de entrada, el decodificador puede especificar con precisión un orden de decodificación y un objetivo de decodificación.
Hasta ahora, I, II y III se describen como realizaciones individuales, pero las realizaciones de la invención no se limitan a I, II y III. Por ejemplo, I, II y III no solo pueden realizarse individualmente sino que también pueden realizarse juntas.
Específicamente, (1) y (2) de I pueden realizarse simultáneamente en base a (A), (B) y/o (C) de II. III puede aplicarse en base a (A), (B) y/o (C) de II para señalar la información en los puntos de entrada. (1) y (2) de I pueden realizarse en base a III para señalar la información en los puntos de entrada. Además, (1) y (2) de I y (A), (B) y/o (C) de II pueden aplicarse en base a III para señalar la información en los puntos de entrada.
La FIG. 17 es un diagrama de flujo que ilustra esquemáticamente un método de codificación de vídeo de acuerdo con la invención.
En referencia a la FIG. 17, el codificador de vídeo puede dividir una imagen de entrada (S1710). El codificador de vídeo puede dividir la imagen de entrada para especificar teselas y tiras. Una imagen puede incluir una o más teselas y una o más tiras. Una tira y una tesela incluyen CTB (LCU). Aquí, las LCU (CTB) en una tira pueden ordenarse en el escaneo de teselas. Los detalles del escaneo de teselas son los mismos que los descritos anteriormente.
Por ejemplo, cuando una tira incluye múltiples teselas, las múltiples teselas pueden ordenarse en el orden de escaneo ráster en la tira. Cada tesela puede incluir múltiples LCU, y las LCU pueden ordenarse en el orden de escaneo ráster en cada tesela.
Pueden aplicarse restricciones para el procesamiento en paralelo a las teselas y las tiras. Por ejemplo, una tesela en la imagen de entrada no debe atravesar un límite de tira, y una tira no debe atravesar un límite de tesela.
Una tesela puede incluir un número natural de tiras completas cuando la tesela incluye tiras, y una tira puede incluir un número natural de teselas completas cuando la tira incluye teselas.
El codificador de vídeo puede realizar un proceso de codificación en base a las teselas y las tiras (S1720). Como una imagen puede dividirse en una o más teselas y una o más tiras y las restricciones para el procesamiento en paralelo se imponen en las teselas y las tiras, el codificador de vídeo puede codificar las teselas y/o tiras en paralelo mediante el uso de núcleos de procesamiento.
En el paso de codificación, las CU en las que se divide una LCU de acuerdo con la estructura de árbol cuádruple pueden establecerse como una unidad de codificación.
El codificador de vídeo puede transmitir información de vídeo codificada (S1730).
Cuando una imagen actual incluye múltiples teselas, el codificador de vídeo puede hacer que la información de vídeo incluya información que indique el primer bit de la primera LCU en cada tesela de la segunda o subsiguientes teselas. En este momento, la información puede ser información que indique un desplazamiento entre el primer bit de la primera LCU en una tesela actual y el primer bit de la primera LCU en una tesela anterior.
La información de vídeo puede incluir información sobre tiras y teselas especificada en base a las restricciones para el procesamiento en paralelo.
Con el propósito de facilitar la explicación, se ha descrito anteriormente con referencia a la FIG. 17 que el codificador de vídeo realiza los pasos, pero la invención no se limita a esta configuración. Por ejemplo, el paso S1710 puede ser realizado por el módulo de partición de imágenes 105 de la FIG. 1, el paso S1720 puede ser realizado por bloques funcionales distintos al módulo de partición de imágenes 105 en la FIG. 1, y el paso Sq730 puede ser realizado por un módulo de transmisión particular o el módulo de codificación de entropía 130. Aquí, el módulo de transmisión puede no proporcionarse por separado, sino que puede estar incluido en el módulo de codificación de entropía 130.
La FIG. 18 es un diagrama de flujo que ilustra esquemáticamente un método de decodificación de vídeo de acuerdo con la invención.
En referencia a la FIG. 18, el decodificador de vídeo puede recibir información de vídeo (S1810). El decodificador de vídeo puede recibir información de vídeo transmitida desde el codificador de vídeo y la información de vídeo puede incluir información para especificar teselas y tiras en una imagen actual.
Cuando una imagen actual incluye múltiples teselas, el codificador de vídeo puede hacer que la información de vídeo incluya información que indique el primer bit de la primera LCU en cada tesela de la segunda o subsiguientes teselas. En este momento, la información puede ser información que indique un desplazamiento entre el primer bit de la primera LCU en una tesela actual y el primer bit de la primera LCU en una tesela anterior.
El decodificador de vídeo puede especificar particiones de la imagen actual en base a la información de vídeo recibida (S1820). El decodificador de vídeo especifica las tiras y las teselas en la imagen actual en base a la información para especificar las teselas y las tiras, que se incluye en la información del vídeo. En este momento, la imagen actual puede dividirse en una o más teselas y una o más tiras, y cada tira y cada tesela pueden incluir CTB (LCU).
Las LCU (CTB) en una tira pueden ordenarse en el escaneo de teselas. Los detalles del escaneo de teselas son los mismos que los descritos anteriormente.
Por ejemplo, cuando una tira incluye múltiples teselas, las múltiples teselas pueden ordenarse en el orden de escaneo ráster en la tira. Cada tesela puede incluir múltiples LCU, y las LCU pueden ordenarse en el orden de escaneo ráster en cada tesela.
Pueden aplicarse restricciones para el procesamiento en paralelo a las teselas y las tiras. Por ejemplo, una tesela en la imagen de entrada no debe atravesar un límite de tira y una tira no debe atravesar un límite de tesela. Una tesela puede incluir un número natural de tiras completas cuando la tesela incluye tiras, y una tira puede incluir un número natural de teselas completas cuando la tira incluye tesela.
El decodificador de vídeo puede realizar un proceso de decodificación en base a las teselas y las tiras especificadas (S1830).
En el paso de decodificación, las CU en las que se divide una LCU en base a la estructura árbol cuádruple pueden establecerse como la unidad de decodificación.
Como una imagen puede dividirse en una o más teselas y una o más tiras y las restricciones para el procesamiento en paralelo se imponen en las teselas y las tiras, el decodificador de vídeo puede codificar las teselas y/o tiras en paralelo mediante el uso de núcleos de procesamiento.
Aquí, se ha descrito anteriormente que el decodificador de vídeo realiza los pasos de la FIG. 18, pero esto tiene el propósito de facilitar la explicación y la invención no se limita a esta configuración. Por ejemplo, el paso S1810 puede ser realizado por un módulo de recepción particular o el módulo de decodificación de entropía. El módulo de recepción puede no proporcionarse por separado, sino que puede incluirse en el módulo de decodificación de entropía. El paso S1820 y el paso S1830 pueden ser realizados por los bloques funcionales de la FIG. 2. Por ejemplo, cuando los módulos que realizan funciones distintas a la función de recepción se denominan módulo de decodificación, los pasos S1820 y S1830 pueden ser realizados por el módulo de decodificación. Cuando el módulo de decodificación de entropía incluye el módulo de recepción, el paso S1810 puede ser realizado por el módulo de recepción en el módulo de decodificación.
Aunque los métodos en el sistema ejemplar mencionado anteriormente se han descrito en base a diagramas de flujo que incluyen una serie de pasos o bloques, la invención no se limita al orden de los pasos y un cierto paso puede realizarse en un paso o en un orden diferente que el descrito anteriormente o al mismo tiempo que el descrito anteriormente. Las realizaciones mencionadas anteriormente pueden incluir varios ejemplos. El alcance de la protección está definido por las reivindicaciones.

Claims (1)

  1. REIVINDICACIONES
    1. Un método para decodificar vídeo, el método comprendiendo:
    recibir (S1810) información de video que incluye información relacionada con un modo de predicción, información sobre una tesela (610, 620) e información sobre una tira, en donde la tesela (610, 620) es una región rectangular común de una columna de unidades de codificación más grandes (LCU) y una fila de unidades de codificación más grandes (LCU) y la tira comprende un número entero de unidades de codificación más grandes (LCU); derivar (S1820) la tesela (610, 620) y la tira en una imagen actual (300; 400; 500; 1110; 1210; 1410) en base a la información de video recibida, en donde la imagen actual (300; 400; 500; 1110; 1210; 1410) incluye más de una tesela (610, 620) y más de una tira; y
    realizar la decodificación (S1830) para la imagen actual (300; 400; 500; 1110; 1210; 1410) en base a más de una tesela (610, 620) y más de una tira,
    en donde la decodificación (S1830) para la imagen actual (300; 400; 500; 1110; 1210; 1410) incluye:
    realizar inter predicción o intra predicción para derivar un bloque predicho de un bloque actual en la imagen actual en base a la información relacionada con el modo de predicción; y
    generar una imagen reconstruida de la imagen actual en base al bloque predicho,
    caracterizado porque se imponen las siguientes restricciones:
    las unidades de codificación más grandes (LCU) en la tira se ordenan consecutivamente en orden de escaneo de teselas;
    en el orden de escaneo de teselas, las unidades de codificación más grandes (LCU) en cada una de las teselas (610, 620) en la tira se ordenan en el orden de escaneo de ráster en cada una de las teselas (610, 620) y las teselas (610, 620) en el tira se ordenan en el orden de escaneo ráster; y
    las ID de tesela que especifican las teselas (610, 620) ordenadas en la tira son consecutivas.
    2. El método de la reivindicación 1, en donde el paso de realizar la decodificación (S1830) incluye realizar la decodificación en la unidad de una unidad de codificación (CU) que se divide de la unidad de codificación más grande (LCU).
    3. El método de la reivindicación 1, en donde la pluralidad de las unidades de codificación más grandes (LCU) en la tesela (610, 620) se recorren en el orden de escaneo de ráster y las teselas (610, 620) en la imagen actual se recorren en el orden de escaneo de ráster.
    4. El método de la reivindicación 1, en donde la información de video recibida se decodifica por entropía en base a la Codificación Aritmética Adaptativa (CABAC).
    5. Un método para codificar video, el método comprendiendo:
    (S1710) dividir una imagen actual en más de una tesela (610, 620) y más de una tira; y
    (S1720) codificar la imagen actual en base a la más de una tesela (610, 620) y la más de una tira para (S1730) generar información de video codificada;
    en donde la información de video codificada incluye información sobre una tesela (610, 620) e información sobre una tira, en donde el tesela (610, 620) es una región rectangular común de una columna de unidades de codificación más grandes (LCU) y una fila de unidades de codificación más grandes (LCU) y la tira comprende un número entero de unidades de codificación más grandes (LCU);
    en donde la codificación en la imagen actual incluye:
    realizar inter predicción o intra predicción para derivar un bloque predicho de un bloque actual en la imagen actual; y
    generar información relacionada con un modo de predicción para la inter predicción o la intra predicción, en donde la información relacionada con el
    modo de predicción está incluida en la información de video codificada,
    caracterizado porque se imponen las siguientes restricciones:
    las unidades de codificación más grandes (LCU) en la tira se ordenan consecutivamente en orden de escaneo de teselas;
    en el orden de escaneo de teselas, las unidades de codificación más grandes (LCU) en cada una de las teselas (610, 620) en la tira se ordenan en el orden de escaneo de ráster en cada una de las teselas (610, 620) y las teselas (610, 620) en la tira se ordenan en el orden de escaneo de ráster; y
    las ID de tesela que especifican las teselas (610, 620) ordenadas en la tira son consecutivas.
    6. El método de la reivindicación 5, en donde el paso de codificación (S1720) incluye realizar la codificación en la unidad de una unidad de codificación (CU) que se divide de la unidad de codificación más grande (LCU).
    7. El método de la reivindicación 5, en donde la pluralidad de las unidades de codificación más grandes (LCU) en la tesela (610, 620) se recorren en el orden de escaneo de ráster y las teselas (610, 620) en la imagen actual se recorren en el orden de escaneo de ráster.
    8. El método de la reivindicación 5, en donde la información de video se codifica por entropía en base a la Codificación Aritmética Adaptativa (CABAC).
    9. Un medio de almacenamiento legible por decodificador que almacena la información de video codificada generada por el método para codificar video de una de las reivindicaciones 5 a 8.
ES20200231T 2012-06-26 2013-06-26 Método de decodificación de vídeo, método de codificación de vídeo y medio de almacenamiento legible por decodificador que almacena información de video codificada Active ES2912082T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201261664701P 2012-06-26 2012-06-26
US201261672750P 2012-07-17 2012-07-17

Publications (1)

Publication Number Publication Date
ES2912082T3 true ES2912082T3 (es) 2022-05-24

Family

ID=49783489

Family Applications (3)

Application Number Title Priority Date Filing Date
ES22150345T Active ES2961943T3 (es) 2012-06-26 2013-06-26 Método de decodificación de vídeo, método de codificación de vídeo y medio de almacenamiento que almacena información de video codificada
ES13808815T Active ES2841995T3 (es) 2012-06-26 2013-06-26 Método de decodificación de vídeo y método de codificación de vídeo
ES20200231T Active ES2912082T3 (es) 2012-06-26 2013-06-26 Método de decodificación de vídeo, método de codificación de vídeo y medio de almacenamiento legible por decodificador que almacena información de video codificada

Family Applications Before (2)

Application Number Title Priority Date Filing Date
ES22150345T Active ES2961943T3 (es) 2012-06-26 2013-06-26 Método de decodificación de vídeo, método de codificación de vídeo y medio de almacenamiento que almacena información de video codificada
ES13808815T Active ES2841995T3 (es) 2012-06-26 2013-06-26 Método de decodificación de vídeo y método de codificación de vídeo

Country Status (12)

Country Link
US (7) US9736482B2 (es)
EP (5) EP3780606B1 (es)
KR (5) KR102249484B1 (es)
CN (3) CN104509112B (es)
DK (1) DK2866439T3 (es)
ES (3) ES2961943T3 (es)
FI (1) FI4002842T3 (es)
HR (2) HRP20231318T1 (es)
HU (2) HUE058244T2 (es)
PL (4) PL2866439T3 (es)
SI (2) SI3780606T1 (es)
WO (1) WO2014003428A1 (es)

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2811742A4 (en) * 2012-02-04 2015-09-02 Lg Electronics Inc VIDEO CODING METHOD, VIDEO DECODING METHOD AND DEVICE THEREFOR
KR102249484B1 (ko) * 2012-06-26 2021-05-12 엘지전자 주식회사 비디오 인코딩 방법, 비디오 디코딩 방법 및 이를 이용하는 장치
PL4033764T3 (pl) * 2012-09-26 2023-12-27 Sun Patent Trust Sposób dekodowania obrazów, sposób kodowania obrazów, urządzenie do dekodowania obrazów, urządzenie do kodowania obrazów oraz urządzenie do kodowania/dekodowania obrazów
WO2014087860A1 (ja) * 2012-12-06 2014-06-12 ソニー株式会社 復号装置、復号方法、およびプログラム
RU2608465C1 (ru) * 2013-01-04 2017-01-18 Самсунг Электроникс Ко., Лтд. Способ энтропийного кодирования сегмента слайса и устройство для него и способ энтропийного декодирования сегмента слайса и устройство для него
CN106716999B (zh) * 2014-06-20 2019-08-09 寰发股份有限公司 用于视频编码的调色板预测器信令的方法
CN113810688B (zh) 2015-05-12 2023-07-18 三星电子株式会社 视频编码方法、视频解码方法以及计算机可读介质
CN106358042B (zh) * 2015-07-17 2020-10-09 恩智浦美国有限公司 使用视频图像的帧间预测的并行解码器
CN113115036A (zh) * 2015-11-24 2021-07-13 三星电子株式会社 视频解码方法和设备及其编码方法和设备
EP3412032A1 (en) 2016-02-02 2018-12-12 Fraunhofer Gesellschaft zur Förderung der Angewand Scene section and region of interest handling in video streaming
KR101895294B1 (ko) * 2017-03-03 2018-09-05 주식회사 칩스앤미디어 프리 스캔을 이용한 블록 기반 동영상 복호화 방법 및 그 장치
KR20190024212A (ko) * 2017-08-31 2019-03-08 세종대학교산학협력단 타일 구조의 구성 방법 및 이의 장치
WO2019225934A1 (ko) * 2018-05-21 2019-11-28 엘지전자 주식회사 영상 코딩 시스템에서 타일 내 ctu 어드레스 관련 영상 디코딩 방법 및 그 장치
WO2019243534A1 (en) 2018-06-21 2019-12-26 Telefonaktiebolaget Lm Ericsson (Publ) Tile shuffling for 360 degree video decoding
MX2020013864A (es) 2018-06-21 2021-03-25 Ericsson Telefon Ab L M Particiones de mosaicos con sub-mosaicos en codificacion de video.
CN112585970B (zh) * 2018-06-21 2024-07-09 瑞典爱立信有限公司 灵活图块分区
CN112703736B (zh) 2018-09-14 2022-11-25 华为技术有限公司 视频译码方法,视频译码设备以及非瞬时性计算机可读介质
CN112823525A (zh) 2018-10-02 2021-05-18 瑞典爱立信有限公司 基于图块组id对图片进行编码和解码
MX2021007926A (es) * 2018-12-28 2021-10-22 Huawei Tech Co Ltd Un codificador de video, un decodificador de video y metodos correspondientes.
EP4373084A2 (en) 2018-12-31 2024-05-22 Huawei Technologies Co., Ltd. An encoder, a decoder and corresponding methods for tile configuration signaling
WO2020209479A1 (ko) * 2019-04-08 2020-10-15 엘지전자 주식회사 시그널링 된 정보에 기반한 픽처 파티셔닝 방법 및 장치
WO2020213963A1 (ko) 2019-04-17 2020-10-22 주식회사 엑스리스 영상 신호 부호화/복호화 방법 및 이를 위한 장치
BR112022009810A2 (pt) * 2019-11-20 2022-08-09 Xris Corp Método para codificação/decodificação de sinal de imagem, e dispositivo para o mesmo
KR20220087514A (ko) * 2019-11-28 2022-06-24 엘지전자 주식회사 영상/비디오 코딩 방법 및 장치
US11412258B2 (en) 2020-02-12 2022-08-09 Tencent America LLC Line graph transforms (LGTs) using 8-bit and 10-bit cores
US11405647B2 (en) * 2020-02-18 2022-08-02 Tencent America LLC Primary transforms using 8-bit and 10-bit cores
CN115552896A (zh) 2020-03-09 2022-12-30 Lg电子株式会社 对矩形切片的大小信息选择性编码的图像编码/解码方法和设备及发送比特流的方法
WO2021185311A1 (en) * 2020-03-20 2021-09-23 Mediatek Inc. Method and apparatus for signaling tile and slice partition information in image and video coding
US11575937B2 (en) * 2020-07-24 2023-02-07 Tencent America LLC Methods for efficient application of LGT

Family Cites Families (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4083302B2 (ja) * 1998-08-12 2008-04-30 株式会社東芝 動画像スクランブル/デスクランブル装置
JP2004140473A (ja) 2002-10-15 2004-05-13 Sony Corp 画像情報符号化装置、復号化装置並びに画像情報符号化方法、復号化方法
US7092576B2 (en) 2003-09-07 2006-08-15 Microsoft Corporation Bitplane coding for macroblock field/frame coding type information
US8125480B2 (en) * 2005-04-12 2012-02-28 Siemens Medical Solutions Usa, Inc. Flat texture volume rendering
TW200806315A (en) 2006-04-26 2008-02-01 Wyeth Corp Novel formulations which stabilize and inhibit precipitation of immunogenic compositions
CN101897190B (zh) * 2007-11-28 2012-06-20 松下电器产业株式会社 图像编码方法和图像编码装置
CN101742300B (zh) * 2008-11-21 2012-05-09 中国科学院空间科学与应用研究中心 一种低比特率星载图像压缩处理系统及方法
US8276128B2 (en) * 2009-07-14 2012-09-25 Unisys Corporation Systems, methods, and computer programs for dynamic binary translation in a master control program interpreter
US8527969B2 (en) * 2009-07-14 2013-09-03 Unisys Corporation Systems, methods, and computer programs for dynamic binary translation in an interpreter
EP2285112A1 (en) * 2009-08-07 2011-02-16 Canon Kabushiki Kaisha Method for sending compressed data representing a digital image and corresponding device
EP2285111A1 (en) * 2009-08-07 2011-02-16 Canon Kabushiki Kaisha Method for sending compressed data representing a digital image and corresponding device
KR101456498B1 (ko) * 2009-08-14 2014-10-31 삼성전자주식회사 계층적 부호화 단위의 스캔 순서를 고려한 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치
JP5263621B2 (ja) * 2009-09-24 2013-08-14 ソニー株式会社 画像処理装置および方法
CN102918840B (zh) 2009-10-01 2016-05-25 Sk电信有限公司 使用分割层进行图像编码/解码的方法和装置
JP5515758B2 (ja) * 2010-01-18 2014-06-11 ソニー株式会社 画像処理装置および方法
KR101495724B1 (ko) * 2010-02-02 2015-02-25 삼성전자주식회사 계층적 데이터 단위의 스캔 순서에 기반한 비디오 부호화 방법과 그 장치, 및 비디오 복호화 방법과 그 장치
US8588536B2 (en) * 2010-02-22 2013-11-19 Texas Instruments Incorporated Guaranteed-rate tiled image data compression
US9094658B2 (en) * 2010-05-10 2015-07-28 Mediatek Inc. Method and apparatus of adaptive loop filtering
CA2799763A1 (en) * 2010-07-13 2012-01-19 Research In Motion Limited Methods and devices for data compression using context-based coding order
EP2599227B1 (en) * 2010-07-28 2020-04-01 BlackBerry Limited Method and device for compression of binary sequences by grouping multiple symbols
US20120082238A1 (en) * 2010-10-01 2012-04-05 General Instrument Corporation Coding and decoding utilizing picture boundary variability in flexible partitioning
KR20130070646A (ko) * 2010-10-01 2013-06-27 제너럴 인스트루먼트 코포레이션 유연한 분할에서 영상 경계 패딩을 활용하는 코딩 및 디코딩
US20120106622A1 (en) * 2010-11-03 2012-05-03 Mediatek Inc. Method and Apparatus of Slice Grouping for High Efficiency Video Coding
GB2486733A (en) * 2010-12-24 2012-06-27 Canon Kk Video encoding using multiple inverse quantizations of the same reference image with different quantization offsets
US9060174B2 (en) * 2010-12-28 2015-06-16 Fish Dive, Inc. Method and system for selectively breaking prediction in video coding
EP2678944B1 (en) * 2011-02-25 2019-11-06 BlackBerry Limited Methods and devices for data compression using offset-based adaptive reconstruction levels
US20120230399A1 (en) * 2011-03-10 2012-09-13 Christopher Andrew Segall Video decoder parallelization including a bitstream signal
US9532058B2 (en) * 2011-06-03 2016-12-27 Qualcomm Incorporated Intra prediction mode coding with directional partitions
US8995523B2 (en) * 2011-06-03 2015-03-31 Qualcomm Incorporated Memory efficient context modeling
US20120314767A1 (en) * 2011-06-13 2012-12-13 Qualcomm Incorporated Border pixel padding for intra prediction in video coding
WO2012175195A1 (en) * 2011-06-20 2012-12-27 Panasonic Corporation Simplified pipeline for filtering
US20130003859A1 (en) * 2011-06-30 2013-01-03 Qualcomm Incorporated Transition between run and level coding modes
US9338465B2 (en) * 2011-06-30 2016-05-10 Sharp Kabushiki Kaisha Context initialization based on decoder picture buffer
US8767824B2 (en) * 2011-07-11 2014-07-01 Sharp Kabushiki Kaisha Video decoder parallelization for tiles
US9398307B2 (en) * 2011-07-11 2016-07-19 Sharp Kabushiki Kaisha Video decoder for tiles
US9838692B2 (en) * 2011-10-18 2017-12-05 Qualcomm Incorporated Detecting availabilities of neighboring video units for video coding
US9584819B2 (en) * 2011-10-24 2017-02-28 Qualcomm Incorporated Grouping of tiles for video coding
US20130107973A1 (en) * 2011-10-28 2013-05-02 Qualcomm Incorporated Loop filtering control over tile boundaries
US9124895B2 (en) * 2011-11-04 2015-09-01 Qualcomm Incorporated Video coding with network abstraction layer units that include multiple encoded picture partitions
US9332259B2 (en) * 2012-01-18 2016-05-03 Qualcomm Incorporated Indication of use of wavefront parallel processing in video coding
US9462275B2 (en) * 2012-01-30 2016-10-04 Qualcomm Incorporated Residual quad tree (RQT) coding for video coding
CN102447907A (zh) * 2012-01-31 2012-05-09 北京工业大学 一种针对hevc的视频序列的编码方法
US10244246B2 (en) * 2012-02-02 2019-03-26 Texas Instruments Incorporated Sub-pictures for pixel rate balancing on multi-core platforms
EP2811742A4 (en) * 2012-02-04 2015-09-02 Lg Electronics Inc VIDEO CODING METHOD, VIDEO DECODING METHOD AND DEVICE THEREFOR
US9578326B2 (en) * 2012-04-04 2017-02-21 Qualcomm Incorporated Low-delay video buffering in video coding
US20130272428A1 (en) * 2012-04-16 2013-10-17 Sharp Laboratories Of America, Inc. Video decoder for copy slices
US8774540B2 (en) * 2012-04-20 2014-07-08 Broadcom Corporation Tile support in decoders
KR102249484B1 (ko) * 2012-06-26 2021-05-12 엘지전자 주식회사 비디오 인코딩 방법, 비디오 디코딩 방법 및 이를 이용하는 장치

Also Published As

Publication number Publication date
KR20150034675A (ko) 2015-04-03
US10085026B2 (en) 2018-09-25
US20220132129A1 (en) 2022-04-28
SI4002842T1 (sl) 2023-12-29
FI4002842T3 (fi) 2023-11-02
EP4236315C0 (en) 2024-06-12
KR102545727B1 (ko) 2023-06-20
EP4236315A2 (en) 2023-08-30
US10863178B2 (en) 2020-12-08
CN108769692A (zh) 2018-11-06
EP2866439A1 (en) 2015-04-29
US12075055B2 (en) 2024-08-27
SI3780606T1 (sl) 2022-06-30
CN104509112B (zh) 2018-08-31
PL4002842T3 (pl) 2024-02-05
PL3780606T3 (pl) 2022-06-20
US20180367796A1 (en) 2018-12-20
US11729392B2 (en) 2023-08-15
US10491901B2 (en) 2019-11-26
CN104509112A (zh) 2015-04-08
HUE058244T2 (hu) 2022-07-28
KR20210054038A (ko) 2021-05-12
EP4443877A1 (en) 2024-10-09
EP2866439B1 (en) 2020-11-04
EP3780606A1 (en) 2021-02-17
HRP20231318T1 (hr) 2024-02-16
DK2866439T3 (da) 2020-12-14
KR102351132B1 (ko) 2022-01-13
CN108718410B (zh) 2022-05-24
HUE063692T2 (hu) 2024-01-28
WO2014003428A1 (ko) 2014-01-03
KR20220092634A (ko) 2022-07-01
US20170318296A1 (en) 2017-11-02
EP2866439A4 (en) 2016-09-21
CN108769692B (zh) 2022-05-24
CN108718410A (zh) 2018-10-30
HRP20240900T1 (hr) 2024-10-11
EP4002842A1 (en) 2022-05-25
US20230353741A1 (en) 2023-11-02
US11245907B2 (en) 2022-02-08
EP4002842B1 (en) 2023-08-02
ES2961943T3 (es) 2024-03-14
EP4236315B1 (en) 2024-06-12
PL2866439T3 (pl) 2021-05-31
US9736482B2 (en) 2017-08-15
US20150341642A1 (en) 2015-11-26
KR102249484B1 (ko) 2021-05-12
EP4236315A3 (en) 2023-09-06
KR20220011209A (ko) 2022-01-27
US20210144382A1 (en) 2021-05-13
EP3780606B1 (en) 2022-02-16
ES2841995T3 (es) 2021-07-12
KR102164572B1 (ko) 2020-10-12
KR20200118241A (ko) 2020-10-14
KR102412470B1 (ko) 2022-06-23
US20200045318A1 (en) 2020-02-06
PL4236315T3 (pl) 2024-08-19

Similar Documents

Publication Publication Date Title
ES2912082T3 (es) Método de decodificación de vídeo, método de codificación de vídeo y medio de almacenamiento legible por decodificador que almacena información de video codificada
US12120332B2 (en) Video encoding method, video decoding method, and device using same
ES2954591T3 (es) Aparato de decodificación de vídeo y aparato de codificación de vídeo
ES2786077B2 (es) Metodo y aparato para procesar una senal de video
ES2913828T3 (es) Método de predicción inter y aparato correspondiente
ES2962504T3 (es) Método de predicción inter llevado a cabo por un aparato de descodificación, método de codificación de imágenes llevado a cabo por un aparato de codificación y método de transmisión de datos para imágenes
ES2711474A2 (es) Metodo y aparato para procesar una senal de video
ES2459890A2 (es) Método de predicción intra, y codificador y descodificador que lo usan