ES2930030T3 - Método y aparato de la transformada alternativa para la codificación de video - Google Patents
Método y aparato de la transformada alternativa para la codificación de video Download PDFInfo
- Publication number
- ES2930030T3 ES2930030T3 ES15862450T ES15862450T ES2930030T3 ES 2930030 T3 ES2930030 T3 ES 2930030T3 ES 15862450 T ES15862450 T ES 15862450T ES 15862450 T ES15862450 T ES 15862450T ES 2930030 T3 ES2930030 T3 ES 2930030T3
- Authority
- ES
- Spain
- Prior art keywords
- limit
- current
- transform
- type
- plus
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 26
- 230000009466 transformation Effects 0.000 abstract description 12
- 238000000844 transformation Methods 0.000 abstract description 6
- 230000001419 dependent effect Effects 0.000 description 10
- 230000006835 compression Effects 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 239000004236 Ponceau SX Substances 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 230000011664 signaling Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000005056 compaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/12—Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/12—Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
- H04N19/122—Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
- H04N19/159—Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/18—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/625—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using discrete cosine transform [DCT]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Discrete Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
Se describen un método y un aparato para transformaciones alternativas en un sistema de codificación de video de acuerdo con una bandera de control. En una realización, se determina el indicador de control para la PU actual. Si el indicador de control está activado, se aplica una primera transformación a cada TU actual (unidad de transformación) en el lado del codificador o se aplica una transformación inversa de la primera transformación a cada TU actual en el lado del decodificador si la TU actual tiene un primer límite escribe. Además, se utiliza una segunda transformada para cada TU actual si la TU actual tiene un segundo tipo de límite. La primera transformación es diferente de la segunda transformación. Por otro lado, si la bandera de control está desactivada, se utiliza una transformada seleccionada para cada TU actual. (Traducción automática con Google Translate, sin valor legal)
Description
DESCRIPCIÓN
Método y aparato de la transformada alternativa para la codificación de video
Referencia cruzada a solicitudes relacionadas
La presente invención reivindica la prioridad de la solicitud de patente provisional de EE. UU., número de serie 62/085,358, presentada el 28 de noviembre de 2014.
Campo técnico
La presente invención se refiere a la codificación de video. En particular, la presente invención se refiere al uso de transformadas alternativas para bloques codificados con predicción Inter en la codificación de video. Más particularmente, la presente invención se refiere a un método, un aparato y un flujo de datos, de acuerdo con las partes caracterizadoras de las reivindicaciones independientes adjuntas, respectivamente. Dicho método, aparato y flujo de datos se muestran en JCTVC-G281.
Antecedentes
El documento US 2014/0140393 A1 divulga un método para decodificar información de video, en el que el método comprende la etapa de recibir información de video asociada con una capa base y una capa de mejora. El método comprende además una etapa para determinar si la información de video asociada con la capa de mejora debe determinarse con base a la información de video asociada con la capa base. El método comprende además una etapa de selección entre una primera transformada y una segunda transformada basada al menos en parte en al menos uno de un tamaño de TU y un tipo de componente de color de la información de video de la capa de mejora en respuesta a la determinación de que la información de video asociada con la capa de mejora debe determinarse con base a la información de video asociada con la capa base. El método comprende además una etapa de decodificación de la información de video asociada con la capa de mejora, utilizando la transformada seleccionada.
El documento US 2014/0056361 A1 revela que solo para una unidad de codificación (CU) codificada como modo de capa intrabase (Intra BL) o modo de predicción residual generalizada (GRP) con ponderación distinta de cero, se transmite un indicador para la CU. Este indicador se transmite para una CU, pero solo puede seleccionar la transformada para el tamaño de la unidad de la transformada (TU) mayor que un umbral en esta CU. Para CU más pequeñas que este umbral, siempre se utiliza la transformada de seno discreta (DST), o la transformada de coseno discreta (DCT).
La codificación de video de alta eficiencia (HEVC) es un nuevo estándar internacional de codificación de video desarrollado por el Equipo Colaborativo Conjunto sobre Codificación de Video (JCT-VC). HEVC se basa en la arquitectura de codificación de la transformada similar a DCT, compensada por movimiento basada en bloques híbridos. La unidad básica para la compresión, denominada unidad de codificación (CU), es un bloque cuadrado de 2Nx2N. Una CU puede comenzar con una CU más grande (LCU), que también se conoce como unidad de árbol codificada (CTU) en HEVC, y cada CU se puede dividir recursivamente en cuatro CU más pequeñas hasta alcanzar el tamaño mínimo predefinido. Una vez que se realiza la división del árbol jerárquico de CU, cada Cu se divide aún más en una o más unidades de predicción (PU) de acuerdo con el tipo de predicción y la partición de PU. Cada CU o el residuo de cada CU se divide en un árbol de unidades de la transformada (TU) para aplicar transformaciones 2D como DCT (transformada de coseno discreta), o DST (transformada de seno discreta).
Al igual que muchos otros estándares precedentes, HEVC adopta la transformada de coseno discreta tipo II (DCT-II) como su transformada central porque tiene una fuerte propiedad de “compactación de energía”. La mayor parte de la información de la señal tiende a concentrarse en unos pocos componentes de baja frecuencia de la DCT-II, que se aproxima a la transformada de Karhunen-Loéve (KLT). Tal como se conoce en la técnica, KLT es la transformada óptima para descorrelacionar señales que pueden modelarse mediante procesos de Markov. El N-punto DCT-II de la señal f[n] se define en la ecuación (1).
Para el residuo Intra predicho, existen otras transformaciones que resultan ser más eficientes que DCT-II. En JCTVC-B024 (Yeo, et al., "KLT separable rápido dependiente del modo para la codificación interna basada en bloques", equipo colaborativo conjunto sobre codificación de video (JCT-VC) de ITU-T SG16 WP3 e ISO/IEC JTC1/SC29/WG11, segunda reunión: Ginebra, CH, 21-28 julio de 2010, documento: JCTVC-B024), JCTVC-C108 (Saxena, et al., “Predicción intra óptima conjunta y transformada primaria adaptativa”, equipo colaborativo conjunto sobre codificación de video (JCT-VC) de ITU-T SG16 W p 3 e ISO/IEC Jt C1/SC29/Wg 11, tercera reunión: Guangzhou, CN, 7-15 octubre de 2010, documento: JCTVC-C108) y JCTVC-E125 (Saxena, et al., “CE7: Modo dependiente DCT/DST sin la multiplicación completa de la
matriz 4*4 para predicción Intra”, equipo colaborativo conjunto sobre codificación de video (JCT-VC) de ITU-T SG16 WP3 e ISO/IEC. JTC1/SC29/WG11, quinta reunión: Ginebra, CH, 16-23 de marzo de 2011, documento: JCTVC-E125), se introdujo la transformada sinusoidal discreta (DST) como alternativa a la DCT para modos Intra oblicuos. Para el residuo Inter predico, DCT-II es la única transformada utilizada en el HEVC actual. Sin embargo, la DCT-II no es la transformada óptima para todos los casos. En JCTVC-G281 (An, et al., “No CE7: límite dependiente de la transformada para residuo inter predicho", equipo colaborativo conjunto sobre codificación de video (JCT-VC) de ITU-T SG16 WP3 e ISO/IEC JTC1/ SC29/WG11, documento: JCTVC-G281), se proponen la transformada de seno discreta tipo VII (DST-VII), y la transformada de coseno discreta tipo IV (DCT-IV) para reemplazar a la DCT-II en algunos casos. Cuando se utiliza la predicción Inter para una PU, el error de predicción (es decir, el residuo o residuo de predicción) suele ser mayor cerca de los límites de la PU que en el medio de la PU. La Figura 1 ilustra un ejemplo de los valores de residuos al cuadrado para una PU 4x4. Tal como se muestra en la Figura 1, el residuo (es decir, el error de predicción) tiende a tener valores cuadrados más grandes en los límites de la PU.
Cuando una PU se divide en múltiples TU, tal como se muestra en la Figura 2, el error de predicción es mayor cerca de los límites de la PU que cerca de los límites interiores de la TU (no PU). En la Figura 2, PU 210 se divide en cuatro TU (es decir, TU0, TU1, TU2 y TU3). El bloque 220 corresponde a los valores de residuos cuadrados de la TU superior izquierda (es decir, TU0), donde los residuos cerca de los límites de PU (indicados por líneas continuas gruesas) son generalmente más grandes que los residuos cerca de los límites interiores de TU (indicados por líneas discontinuas). Para TU0, se puede observar una tendencia de que los valores de residuos cuadrados alcanzan su punto máximo alrededor de la esquina superior izquierda y disminuyen hacia la esquina inferior derecha. De manera similar, para otras TU, los valores de residuos cuadrados también alcanzan su punto máximo aproximadamente alrededor de las esquinas de PU respectivas y disminuyen hacia el centro de la PU.
La razón de este efecto puede deberse a los diferentes vectores de movimiento (MV) entre dos PU vecinas. Para manejar esta distribución desigual de errores, se pueden utilizar transformadas alternativas como DST-VII y DCT-IV. Las ecuaciones (2) y (3) muestran los N puntos DST-VII y DCT-IV de la señal f[n], respectivamente.
Con base en la observación anterior, se describe un método en JCTVC-G281 que usa DST-VII o DCT-IV en lugar de DCT-II si uno y solo uno de los dos límites de TU en la dirección horizontal o vertical es un límite de PU. La Tabla 1 muestra el mapeo del tipo de límite al tipo de transformada utilizando el DST-VII. La Tabla 2 muestra el mapeo del tipo de límite para transformar utilizando el DCT-IV.
Tabla 1.
Tabla 2.
El F(DST-VII) en la Tabla 1 significa invertir la matriz DST de izquierda a derecha. Los casos de uso de F(DST-VII) también se pueden implementar al cambiar primero los datos de entrada y luego utilizar DST-VII. También es el caso de F(DCT-IV). En la Tabla 1 y la Tabla 2, los elementos “no PU” y “PU” significan límite de no PU y límite de PU, respectivamente. En la Tabla 1 y la Tabla 2, cuando ambos límites de TU en la dirección horizontal o vertical son un límite de PU o un límite que no es de PU, se utiliza DCT-II.
De acuerdo con la Tabla 1, las cuatro TU en la Figura 2 utilizarán transformadas, tal como se muestra en la Tabla 3.
Tabla 3.
El método de la transformada dependiente de los límites (BDT) descrito en JCTVC-G281 puede mejorar el rendimiento general del sistema de codificación. Sin embargo, debido a las características de las TU o PU individuales, es posible que el método BDT, de acuerdo con JCTVC-G281 no siempre logre el mejor rendimiento para un bloque determinado. Es deseable desarrollar un método para mejorar aún más el rendimiento.
Breve descripción de la invención
Los objetivos mencionados anteriormente se consiguen mediante un método, un aparato y un flujo de datos, de acuerdo con las reivindicaciones independientes adjuntas, respectivamente.
Se describe un método y un aparato para transformaciones alternativas en un sistema de codificación de video, de acuerdo con un indicador de control. En la presente invención, se determina el indicador de control para la PU actual. Si el indicador de control tiene un primer valor, se aplica una primera transformada a cada TU actual (unidad de la transformada) en el lado del codificador, o se aplica una transformada inversa de la primera transformada a cada TU actual en el lado del decodificador si la TU actual tiene un primer tipo de límite. Además, se aplica una segunda transformada a cada TU actual en el lado del codificador, o se aplica una transformada inversa de la segunda transformada a cada TU actual en el lado del decodificador si la TU actual tiene un segundo tipo de límite. La primera transformada es diferente de la segunda transformada. Por otro lado, si el indicador de control tiene un segundo valor, se aplica una transformada seleccionada a cada TU actual en el lado del codificador, o se aplica una transformada inversa de la transformada seleccionada a cada TU actual en el lado del decodificador, independientemente del tipo de límite de la TU actual.
En la presente invención, el indicador de control puede señalizarse a nivel de TU, PU o CU (unidad de codificación). En la presente invención, el indicador de control puede señalarse explícitamente solo para la PU, TU o CU actual que tiene los primeros tamaños. En la presente invención, el indicador de control puede señalizarse explícitamente dependiendo de otro indicador en un nivel de cabecera de secuencia, imagen o segmento.
En una realización que no cae dentro del alcance de las reivindicaciones adjuntas, el indicador de control se determina implícitamente en función del tipo de límite de la PU actual, y la primera transformada, la segunda transformada, la transformada seleccionada o una combinación de las mismas, se determina dependiendo en otro indicador que se señaliza explícitamente.
En la presente invención, la segunda transformada corresponde a una versión invertida de la primera transformada. La primera transformada puede corresponder a la transformada de seno discreta tipo V-II (DST-VII), o la transformada de coseno discreta tipo IV (DCT-IV). El primer tipo de límite incluye un límite de PU izquierdo más un límite de no PU derecho
y un límite de no PU superior más un límite de PU inferior, y el segundo tipo de límite incluye un límite de no PU izquierdo más un límite de PU derecho y un límite de PU superior límite más un límite inferior no PU. Además, el primer tipo de límite incluye además el límite PU izquierdo más el límite PU derecho, el límite no PU izquierdo más el límite no PU derecho, el límite PU superior más el límite PU inferior, y el límite no PU superior más el límite inferior sin PU.
La primera transformada, la segunda transformada, la transformada seleccionada o una combinación de las mismas, puede depender del tamaño de bloque de la PU actual. Por ejemplo, la primera transformada puede corresponder a DST-VII (transformada senoidal discreta tipo V-II) si el tamaño de bloque de la PU actual es 4x4, y la primera transformada puede corresponder a DCT-IV (transformada de coseno discreta tipo IV) si el tamaño de bloque de la PU actual es 8x8 o 16x16. La transformada seleccionada puede corresponder a la transformada de coseno discreta tipo II (DCT-II).
En otro aspecto que no cae dentro del alcance de las reivindicaciones adjuntas, se describen un método y un aparato para transformaciones alternativas en un sistema de codificación de video de acuerdo con un indicador de control. De acuerdo con una realización que no cae dentro del alcance de las reivindicaciones adjuntas, se determina el indicador de control para la PU actual. Si el indicador de control tiene un primer valor, se aplica una primera transformada a cada TU actual (unidad de la transformada) en un lado del codificador, o se aplica una transformada inversa de la primera transformada a cada TU actual en un lado del decodificador si la TU actual pertenece a un primer tipo. Además, se aplica una segunda transformada a cada TU actual en el lado del codificador o se aplica una transformada inversa de la segunda transformada a cada TU actual en el lado del decodificador si la TU actual pertenece a un segundo tipo. La primera transformada es diferente de la segunda transformada. Por otro lado, si el indicador de control tiene un segundo valor, se aplica una transformada seleccionada a cada TU actual en el lado del codificador, o se aplica una transformada inversa de la transformada seleccionada a cada TU actual en el lado del decodificador independientemente del tipo de límite de la TU actual. En una realización que no cae dentro del alcance de las reivindicaciones adjuntas, si la TU actual pertenece al primer tipo o al segundo tipo, se determina de acuerdo con un tipo de límite, tamaño de bloque, información de modo o una combinación de los mismos.
Breve descripción de las figuras
La Figura 1 ilustra un ejemplo de los valores de residuos al cuadrado para una PU 4x4.
La Figura 2 ilustra un ejemplo en el que el error de predicción es mayor cerca de los límites de PU (unidad de predicción) que cerca de los límites interiores de TU (no PU), en donde la PU se divide en cuatro TU (unidades de la transformada).
La Figura 3 ilustra un diagrama de flujo a modo de ejemplo, de un sistema de codificación que incorpora una transformada dependiente de las características del bloque basadas en un indicador de control, de acuerdo con una realización de la presente invención.
Descripción detallada
La siguiente descripción es del modo mejor contemplado de llevar a cabo la invención. Esta descripción se realiza con el propósito de ilustrar los principios generales de la invención, y no debe tomarse en un sentido limitativo. El alcance de la invención se determina mejor con referencia a las reivindicaciones adjuntas.
Tal como se mencionó anteriormente, se observa que el error de predicción Inter es mayor cerca de los límites de la PU que en el medio de la PU. En consecuencia, en JCTVC-G281 se describe un método de transformada dependiente de los límites (BDT) para adaptar esta distribución desigual de errores en una sola PU. El método BDT selecciona la transformada, de acuerdo con el tipo de límite (es decir, límite no PU o límite de PU), que se resume en la Tabla 1 y la Tabla 2.
Sin embargo, para un tipo de límite determinado, el método BDT siempre aplica una transformada de tipo fijo al bloque, como DST-VII o DCT-II. Sin embargo, las características de los residuos de predicción pueden ser bastante diferentes de un bloque a otro. Es posible que el método BDT no siempre logre el mejor rendimiento. En consecuencia, la presente invención describe un método para utilizar un indicador de control para controlar la operación de BDT con el fin de mejorar aún más el rendimiento de BDT. Con el indicador de control explícito, un codificador puede decidir si encender o apagar el BDT utilizando métodos de decisión de modo como la Optimización de Distorsión de Velocidad (RDO). El codificador luego señala el indicador de control para informar al decodificador. Por ejemplo, el indicador de control puede señalizarse en un nivel TU, PU o CU. En un ejemplo, el indicador de control se señaliza solo para la PU, TU o CU actual que tiene un tamaño específico. Sin embargo, el indicador de control también puede determinarse implícitamente. Por ejemplo, el valor del indicador de control puede depender del tamaño del bloque, de modo que la transformada dependiente de los límites esté activada para algunos tamaños de bloque y desactivada para otros tamaños de bloque. Alternativamente, el valor del indicador de control puede depender de la información del modo, de modo que la transformada dependiente del límite se encuentre activada para algunos modos de predicción y desactivada para otros modos de predicción. Además, el indicador de control se puede señalar explícitamente dependiendo de otro indicador en el nivel de encabezado de secuencia, imagen o segmento. Por ejemplo, el otro indicador puede corresponder a present_flag en un nivel de secuencia. Si present_flag es 1, existe el indicador de control. Si present_flag es 0, el indicador de control no existe y su valor se infiere a 0. Cuando el indicador de control se determina implícitamente, se puede señalar otro indicador explícito
para seleccionar la transformada para las TU asociadas con la PU.
El indicador de control explícito se puede utilizar de la siguiente manera. Si el indicador de control es igual a 0, se utilizará la DCT original en HEVC para la TU. Si el indicador de control es igual a 1, se utilizará BDT para la TU.
En la presente invención, el indicador de control explícito se puede utilizar como de la siguiente manera. Si el indicador de control es igual a 0, se utilizará la DCT original en HEVC para la TU. Si el indicador de control es igual a 1, se utilizará la BDT para la TU. Sin embargo, la BDT se modifica a partir de la de JCTVC-G281, de modo que la BDT modificada solo sigue la decisión de utilizar la versión invertida o no invertida de la transformada (T). La BDT modificada puede utilizar una transformada diferente de la BDT original para cada tipo de límite. La Tabla 4 ilustra un ejemplo de selección de la transformada para cada tipo de límite. La selección de la transformada puede basarse en el tamaño de bloque de la unidad de la transformada actual (o unidad de predicción actual). Por ejemplo, DST-VII se usa para 4 puntos y DCT-IV para 8 puntos y 16 puntos, respectivamente. En la Tabla 4, Flip-T denota una transformada que utiliza una matriz de la transformada invertida de T. En otro ejemplo, la selección de la transformada puede basarse en la información de modo de la unidad de predicción actual.
Tabla 4.
En los ejemplos anteriores, se utilizan transformadas específicas tales como DST-VII y DCT-IV como transformadas a modo de ejemplo, para poner en práctica la presente invención. Sin embargo, la presente invención no se limita a las transformadas específicas utilizadas. El indicador de control se puede utilizar para controlar el uso de la transformada dependiente de los límites, independientemente de las transformaciones utilizadas.
En una realización que no cae dentro del alcance de las reivindicaciones adjuntas, el indicador de control se puede determinar implícitamente en función del tipo de límite, el tamaño del bloque o la información de movimiento del bloque actual, y la selección de la transformada se determina además dependiendo de que se esté seleccionando otro indicador señalado explícitamente. Por ejemplo, un tipo de transformada actual se determina implícitamente para el bloque actual mediante la selección de un primer tipo de transformada, o un tipo de señalización explícita en función del tipo de límite del bloque, el tamaño del bloque o la información de modo. Si se selecciona el tipo de señalización explícita, el tipo de transformada actual se determina aún más mediante un indicador señalado explícitamente.
La Figura 3 ilustra un diagrama de flujo a modo de ejemplo, de un sistema de codificación que incorpora una transformada dependiente de características de bloque basada en un indicador de control, de acuerdo con una realización de la presente invención. El sistema recibe datos de entrada asociados con una PU (unidad de predicción) actual codificada en modo de predicción Inter o Intra, en donde la PU actual se divide en una o más TU (unidades de la transformada) en la etapa 310. Los datos de entrada pueden corresponder a residuos de la PU actual a codificar en el lado del codificador o los residuos codificados de la PU actual en el lado del decodificador. La PU actual puede recuperarse del almacenamiento, como una memoria de computadora o un búfer (RAM o DRAM). El flujo de bits de video también se puede recibir desde un procesador, como una unidad de procesamiento o una señal digital. En la etapa 320 se determina un indicador de control para la PU actual. En la etapa 330 se prueba si el indicador de control tiene un primer valor (por ejemplo, se encuentra activado). Si el resultado es “sí”, se realizan las etapas 340 y 350. Si el resultado es “no”, se realiza la etapa 360. En la etapa 340, se aplica una primera transformada a cada TU actual (unidad de la transformada) en un lado del codificador o una transformada inversa de la primera transformada a cada TU actual en un lado del decodificador si la TU actual pertenece a un primer tipo (es decir, el bloque característico del mismo pertenece al primer tipo). En la etapa 350, se aplica una segunda transformada a cada TU actual en el lado del codificador, o una transformada inversa de la segunda transformada a cada TU actual en el lado del decodificador si la TU actual pertenece a un segundo tipo (es decir, la característica de bloque de la misma pertenece al segundo tipo), donde la primera transformada es diferente de la segunda transformada. En la presente invención, tanto si la TU actual pertenece al primer tipo como si el segundo tipo se encuentra asociado con un tipo límite de la TU actual. En una realización que no cae dentro del alcance de las reivindicaciones adjuntas, si la TU actual pertenece al primer tipo o al segundo tipo se determina de acuerdo con un tipo de límite (por ejemplo, un límite de PU o un límite que no es de PU), bloquear tamaño (por ejemplo, mayor que un tamaño predeterminado o no), información de modo (por ejemplo, información relacionada con un modo de predicción específico), o una combinación de los mismos. En la etapa 360, se aplica una transformada seleccionada a cada TU actual en el lado del codificador o una transformada inversa de la transformada seleccionada a cada TU actual en el lado del decodificador, independientemente del tipo de TU actual.
El diagrama de flujo que se muestra anteriormente pretende ilustrar ejemplos de filtrado de predicción Intra, de acuerdo con una realización de la presente invención. Un experto en la materia puede modificar cada etapa, reorganizar las etapas, dividir una etapa o combinar etapas para practicar la presente invención, sin apartarse del espíritu de la presente invención.
La descripción anterior se presenta para permitir que una persona con experiencia ordinaria en la técnica practique la presente invención tal como se proporciona en el contexto de una aplicación particular y su requisito. Varias modificaciones a las realizaciones descritas serán evidentes para los expertos en la técnica, y los principios generales definidos en este documento pueden aplicarse a otras realizaciones. Por lo tanto, no se pretende que la presente invención se limite a las realizaciones particulares mostradas y descritas, sino que debe otorgarse el alcance más amplio, de acuerdo con las reivindicaciones adjuntas. En la descripción detallada anterior, se ilustran varios detalles específicos para proporcionar una comprensión completa de la presente invención. Sin embargo, los expertos en la materia entenderán que la presente invención puede ponerse en práctica.
La realización de la presente invención tal como se describió anteriormente, puede implementarse en varios códigos de hardware, software, o una combinación de ambos. Por ejemplo, una realización de la presente invención puede ser uno o más circuitos electrónicos integrados en un chip de compresión de video, o un código de programa integrado en un software de compresión de video para realizar el procesamiento descrito en este documento. Una realización de la presente invención también puede ser un código de programa para ser ejecutado en un Procesador de Señal Digital (DSP), para realizar el procesamiento descrito en este documento. La invención también puede implicar una serie de funciones que debe realizar un procesador de ordenador, un procesador de señales digitales, un microprocesador, o una matriz de puertas programables en campo (FPGA). Estos procesadores pueden configurarse para realizar tareas particulares, de acuerdo con la invención, mediante la ejecución de código de software legible por máquina, o código de firmware que define los métodos particulares incorporados por la invención. El código de software o código de firmware puede desarrollarse en diferentes lenguajes de programación y diferentes formatos o estilos. El código de software también se puede compilar para diferentes plataformas de destino.
Claims (3)
1. El método para la codificación de video utilizando transformadas alternativas, que comprende:
recibir datos de entrada asociados con una PU (unidad de predicción) actual codificada en modo de predicción Inter o Intra, en donde la PU actual se divide en una o más TU (unidades de la transformada) actuales, y en el que los datos de entrada corresponden a residuos a codificar de la PU actual en un lado del codificador, o a residuos codificados de la PU actual en un lado del decodificador;
determinar un indicador de control para la PU actual;
cuando el indicador de control tiene un primer valor:
aplicar una primera transformada a una TU actual (unidad de la transformada) en el lado del codificador, o una transformada inversa de la primera transformada a una TU actual en el lado del decodificador si la TU actual tiene un primer tipo de límite; y
aplicar una segunda transformada a la TU actual en el lado del codificador o una transformada inversa de la segunda transformada a la TU actual en el lado del decodificador si la TU actual tiene un segundo tipo de límite; en donde la segunda transformada es una versión invertida de la primera transformada; y
cuando el indicador de control tiene un segundo valor:
aplicar una transformada seleccionada a la TU actual en el lado del codificador o una transformada inversa de la transformada seleccionada a la TU actual en el lado del decodificador, independientemente del tipo de TU actual; caracterizado porque el primer tipo de límite incluye un límite PU izquierdo más un límite no PU derecho, un límite PU superior más un límite no PU inferior, un límite PU izquierdo más un límite PU derecho, un límite no PU izquierdo más un límite no PU derecho, un límite PU superior más un límite PU inferior y un límite no PU superior más un límite no PU inferior, y el segundo tipo de límite incluye un límite no PU izquierdo más un límite PU derecho y un límite superior sin PU más un límite inferior de PU.
2. El aparato para la codificación de video utilizando transformadas alternativas, que comprende uno o más circuitos electrónicos configurados para:
recibir datos de entrada asociados con una PU (unidad de predicción) actual codificada en modo de predicción Inter o Intra, en donde la PU actual se divide en una o más TU actuales (unidades de la transformada), y en donde los datos de entrada corresponden a residuos codificados de la PU actual en un lado del codificador o residuos codificados de la PU actual en un lado del decodificador;
determinar un indicador de control para la PU actual;
cuando el indicador de control tiene un primer valor:
aplicar una primera transformada a una TU actual (unidad de la transformada) en el lado del codificador o una transformada inversa de la primera transformada a una TU actual en el lado del decodificador si la TU actual tiene un primer tipo de límite; y
aplicar una segunda transformada a la TU actual en el lado del codificador o una transformada inversa de la segunda transformada a la TU actual en el lado del decodificador si la TU actual tiene un segundo tipo de límite; en donde la segunda transformada es una versión invertida de la primera transformada; y
cuando el indicador de control tiene un segundo valor:
aplicar una transformada seleccionada a la TU actual en el lado del codificador o una transformada inversa de la transformada seleccionada a la TU actual en el lado del decodificador independientemente del tipo de TU actual; caracterizado porque el primer tipo de límite incluye un límite PU izquierdo más un límite no PU derecho, un límite PU superior más un límite no PU inferior, un límite PU izquierdo más un límite PU derecho, un límite no PU izquierdo más un límite no PU derecho, un límite PU superior más un límite PU inferior y un límite no PU superior más un límite no PU inferior, y el segundo tipo de límite incluye un límite no PU izquierdo más un límite PU derecho y un límite superior sin PU más un límite inferior de PU.
3. El flujo de datos que tiene codificado un indicador de control para una PU (unidad de predicción) actual codificada en modo de predicción Inter o Intra, y coeficientes de la transformada para una o más TU (unidades de la transformada) actuales, en donde la PU actual se divide en una o más TU,
cuando el indicador de control tiene un primer valor:
se aplica una primera transformada a una TU (unidad de la transformada) actual en un lado del codificador para generar los coeficientes de transformada para la TU actual o se aplica una transformada inversa de la primera transformada a una unidad de transformada actual. TU en un lado del decodificador si la TU actual tiene un primer tipo de límite;
se aplica una segunda transformada a la TU actual en el lado del codificador para generar los coeficientes de la transformada para la TU actual o se aplica una transformada inversa de la segunda transformada a la TU actual en el lado del decodificador si la TU actual tiene un segundo tipo de límite; donde la segunda transformada es una versión invertida de la primera transformada;
cuando el indicador de control tiene un segundo valor:
se aplica una transformada seleccionada a la TU actual en el lado del codificador para generar los coeficientes de la transformada para la TU actual o se aplica una transformada inversa de la transformada seleccionada a la TU actual en el lado del decodificador independientemente de tipo de la TU actual;
caracterizado porque el primer tipo de límite incluye un límite PU izquierdo más un límite no PU derecho, un límite PU superior más un límite no PU inferior, un límite PU izquierdo más un límite PU derecho, un límite no PU izquierdo más un límite no PU derecho, un límite PU superior más un límite PU inferior y un límite no PU superior más un límite no PU inferior, y el segundo tipo de límite incluye un límite no PU izquierdo más un límite PU derecho y un límite superior sin PU más un límite inferior de PU.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201462085358P | 2014-11-28 | 2014-11-28 | |
PCT/CN2015/095645 WO2016082774A1 (en) | 2014-11-28 | 2015-11-26 | Method and apparatus of alternative transform for video coding |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2930030T3 true ES2930030T3 (es) | 2022-12-05 |
Family
ID=56073628
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES15862450T Active ES2930030T3 (es) | 2014-11-28 | 2015-11-26 | Método y aparato de la transformada alternativa para la codificación de video |
Country Status (7)
Country | Link |
---|---|
US (2) | US10390045B2 (es) |
EP (2) | EP3202146B1 (es) |
CN (2) | CN107005695B (es) |
CA (1) | CA2966862C (es) |
ES (1) | ES2930030T3 (es) |
MY (1) | MY190919A (es) |
WO (1) | WO2016082774A1 (es) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108605135A (zh) * | 2016-02-04 | 2018-09-28 | 三星电子株式会社 | 依据色度多变换的视频解码方法和设备、以及依据色度多变换的视频编码方法和设备 |
KR20170102806A (ko) * | 2016-03-02 | 2017-09-12 | 한국전자통신연구원 | 비디오 신호 부호화/복호화 방법 및 이를 위한 장치 |
EP3661214B1 (en) | 2017-08-04 | 2022-07-20 | LG Electronics Inc. | Method and apparatus for configuring transform for video compression |
WO2019076138A1 (en) * | 2017-10-16 | 2019-04-25 | Huawei Technologies Co., Ltd. | METHOD AND APPARATUS FOR ENCODING |
WO2019102888A1 (ja) * | 2017-11-24 | 2019-05-31 | ソニー株式会社 | 画像処理装置および方法 |
SG11202008036TA (en) * | 2018-02-23 | 2020-09-29 | Huawei Technologes Co Ltd | Position dependent spatial varying transform for video coding |
US11297348B2 (en) * | 2018-04-13 | 2022-04-05 | Mediatek Inc. | Implicit transform settings for coding a block of pixels |
EP3782361B1 (en) | 2018-05-31 | 2023-09-20 | Huawei Technologies Co., Ltd. | Spatially varying transform with adaptive transform type |
AU2018204786A1 (en) * | 2018-06-29 | 2020-01-16 | Canon Kabushiki Kaisha | Method, apparatus and system for encoding and decoding a transformed block of video samples |
CN113545090A (zh) * | 2019-02-01 | 2021-10-22 | 北京达佳互联信息技术有限公司 | 用于帧内子分区编解码模式的方法和设备 |
WO2020167841A1 (en) * | 2019-02-11 | 2020-08-20 | Beijing Dajia Internet Information Technology Co., Ltd. | Methods and devices for intra sub-partition coding mode |
CN109788291A (zh) * | 2019-02-12 | 2019-05-21 | 北京大学 | 一种数字视频变换方法、装置、设备及存储介质 |
WO2020210489A1 (en) * | 2019-04-10 | 2020-10-15 | Beijing Dajia Internet Information Technology Co., Ltd. | Methods and apparatus of video coding using improved matrix-based intra prediction coding mode |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100612850B1 (ko) * | 2004-07-14 | 2006-08-21 | 삼성전자주식회사 | 이산 코사인 변환 계수의 예측 방법 및 장치 |
KR20100017453A (ko) * | 2007-05-29 | 2010-02-16 | 엘지전자 주식회사 | 비디오 신호 처리 방법 및 장치 |
US8631060B2 (en) | 2007-12-13 | 2014-01-14 | Qualcomm Incorporated | Fast algorithms for computation of 5-point DCT-II, DCT-IV, and DST-IV, and architectures |
US8259808B2 (en) | 2010-03-25 | 2012-09-04 | Mediatek Inc. | Low complexity video decoder |
US20120082225A1 (en) * | 2010-10-01 | 2012-04-05 | Qualcomm Incorporated | Selective indication of transform sizes |
WO2013003819A1 (en) * | 2011-06-30 | 2013-01-03 | Huawei Technologies Co., Ltd. | Encoding of prediction residuals for lossless video coding |
US8929455B2 (en) | 2011-07-01 | 2015-01-06 | Mitsubishi Electric Research Laboratories, Inc. | Method for selecting transform types from mapping table for prediction modes |
KR101362696B1 (ko) | 2011-10-19 | 2014-02-17 | 전북대학교산학협력단 | 하이브리드 아키텍쳐가 적용된 신호 변환 장치, 신호 변환 방법 및 기록매체 |
WO2013064047A1 (en) * | 2011-10-31 | 2013-05-10 | Mediatek Singapore Pte. Ltd. | Method and apparatus of deblocking filter with simplified boundary strength decision |
US10390046B2 (en) | 2011-11-07 | 2019-08-20 | Qualcomm Incorporated | Coding significant coefficient information in transform skip mode |
CN102857756B (zh) | 2012-07-19 | 2015-04-08 | 西安电子科技大学 | 适于hevc标准的变换编码器 |
US9319684B2 (en) * | 2012-08-21 | 2016-04-19 | Qualcomm Incorporated | Alternative transform in scalable video coding |
CN104813667B (zh) | 2012-11-15 | 2018-03-16 | 联发科技股份有限公司 | 用于可伸缩视频编码的帧间层预测方法及装置 |
US9380307B2 (en) * | 2012-11-19 | 2016-06-28 | Qualcomm Incorporated | Method and system for intra base layer (BL) transform in video coding |
US10129550B2 (en) | 2013-02-01 | 2018-11-13 | Qualcomm Incorporated | Inter-layer syntax prediction control |
US20140376611A1 (en) * | 2013-06-21 | 2014-12-25 | Qualcomm Incorporated | Adaptive color transforms for video coding |
CN103491372B (zh) * | 2013-09-05 | 2018-04-27 | 复旦大学 | 一种适用于hevc标准的去方块滤波器的滤波方法 |
CN103841419B (zh) | 2014-01-28 | 2017-01-25 | 福州大学 | 基于人眼视觉特性的hevc量化矩阵设计 |
AU2014202921B2 (en) * | 2014-05-29 | 2017-02-02 | Canon Kabushiki Kaisha | Method, apparatus and system for de-blocking a block of video samples |
-
2015
- 2015-11-26 EP EP15862450.2A patent/EP3202146B1/en active Active
- 2015-11-26 WO PCT/CN2015/095645 patent/WO2016082774A1/en active Application Filing
- 2015-11-26 EP EP22183581.2A patent/EP4090018A1/en active Pending
- 2015-11-26 MY MYPI2017701496A patent/MY190919A/en unknown
- 2015-11-26 CN CN201580064516.5A patent/CN107005695B/zh active Active
- 2015-11-26 US US15/525,369 patent/US10390045B2/en active Active
- 2015-11-26 ES ES15862450T patent/ES2930030T3/es active Active
- 2015-11-26 CA CA2966862A patent/CA2966862C/en active Active
- 2015-11-26 CN CN201911271582.6A patent/CN110855988B/zh active Active
-
2019
- 2019-07-03 US US16/502,535 patent/US11089332B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
CN110855988B (zh) | 2021-09-07 |
WO2016082774A1 (en) | 2016-06-02 |
US11089332B2 (en) | 2021-08-10 |
MY190919A (en) | 2022-05-19 |
EP4090018A1 (en) | 2022-11-16 |
US20190327491A1 (en) | 2019-10-24 |
EP3202146B1 (en) | 2022-08-17 |
CN107005695B (zh) | 2020-01-07 |
US10390045B2 (en) | 2019-08-20 |
CN110855988A (zh) | 2020-02-28 |
CA2966862A1 (en) | 2016-06-02 |
EP3202146A4 (en) | 2018-04-18 |
CN107005695A (zh) | 2017-08-01 |
US20170366824A1 (en) | 2017-12-21 |
CA2966862C (en) | 2021-03-30 |
EP3202146A1 (en) | 2017-08-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2930030T3 (es) | Método y aparato de la transformada alternativa para la codificación de video | |
US10638160B2 (en) | Method and apparatus for a low complexity transform unit partitioning structure for HEVC | |
US11770556B2 (en) | Method and apparatus for processing intra prediction mode | |
ES2913828T3 (es) | Método de predicción inter y aparato correspondiente | |
JP6415472B2 (ja) | ビデオエンコーダおよびデコーダについての大きなブロックにつきイントラ予測を信号伝達する方法および装置 | |
ES2674163T3 (es) | Procedimiento de codificación de una unidad de codificación en un límite de instantánea | |
ES2710782T3 (es) | Codificación y descodificación de video | |
ES2612494B1 (es) | Método para inducir un bloque candidato de fusión y dispositivo que usa el mismo | |
JP5815853B2 (ja) | ビデオコーディングにおける量子化マトリクスに従うトランスフォームブロック処理の方法及びシステム | |
KR20170139104A (ko) | 임의의 시야각을 위한 부분 디코딩 및 가상 현실 비디오를 위한 라인 버퍼 감소 | |
RU2016125260A (ru) | Предсказание вектора блока в кодировании/декодировании видео и изображений | |
CN112585970B (zh) | 灵活图块分区 | |
CN112640455B (zh) | 视频编码中具有子图块的图块分区 | |
JP7246449B2 (ja) | 符号化装置、復号装置及びプログラム | |
JP7093152B2 (ja) | 符号化装置、復号装置及びプログラム | |
JP2017204842A (ja) | 符号化装置、復号装置及びプログラム | |
JP7092455B2 (ja) | 符号化装置、復号装置及びプログラム | |
ES2974947T3 (es) | Método y aparato para la predicción inter en un sistema de procesamiento de video | |
JP2022017254A (ja) | 符号化装置、復号装置及びプログラム | |
JP2021090221A (ja) | 符号化装置、復号装置及びプログラム | |
JP2020511082A (ja) | 画像をエンコーディング及びデコーディングする方法、エンコーディング及びデコーディング装置、並びに、対応するコンピュータプログラム |