ES2574278T3 - Codificación y decodificación de video usando transformadas - Google Patents

Codificación y decodificación de video usando transformadas Download PDF

Info

Publication number
ES2574278T3
ES2574278T3 ES12729698.6T ES12729698T ES2574278T3 ES 2574278 T3 ES2574278 T3 ES 2574278T3 ES 12729698 T ES12729698 T ES 12729698T ES 2574278 T3 ES2574278 T3 ES 2574278T3
Authority
ES
Spain
Prior art keywords
transform
block
blocks
row
column
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES12729698.6T
Other languages
English (en)
Inventor
Marta Mrak
Andrea GABRIELLINI
Nikola Sprljan
David Flynn
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
British Broadcasting Corp
Original Assignee
British Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by British Broadcasting Corp filed Critical British Broadcasting Corp
Application granted granted Critical
Publication of ES2574278T3 publication Critical patent/ES2574278T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

Un procedimiento de codificación de video según HEVC que utiliza una transformada de filas que opera sobre filas de un bloque de valores de imagen y que tiene un vector de transformada de filas y una transformada de columnas que opera sobre columnas del bloque de valores de imagen y que tiene un vector de transformada de columnas, que comprende las etapas de establecer un conjunto de modos de transformada que incluyen un modo de salto en la que una o ambas de la transformada de filas y la transformada de columnas son saltadas; seleccionar uno de dichos modos; para cualquier bloque en el que una transformada es saltada, aplicar un factor de modificación a escala a los valores de imagen correspondientes de ese bloque, donde el factor de modificación a escala es el producto de 64 y la raíz cuadrada del tamaño del vector de transformada de la transformada saltada y es un número entero; y para al menos algunos bloques o conjuntos de bloques proporcionar una indicación del modo seleccionado para un decodificador.

Description

DESCRIPCION
Codificacion y decodificacion de video usando transformadas 5 CAMPO DE LA INVENCION
[0001] Esta invencion se refiere a sistemas de compresion y descompresion de video y, en particular, a un marco para modelizar de forma adaptativa la representacion de senales entre codificacion por prediccion y por entropla, mediante el uso adaptativo de funciones transformadas y herramientas relacionadas, incluyendo
10 modification a escala, cuantificacion, barrido y serialization.
ANTECEDENTES DE LA INVENCION
[0002] La transmision y el almacenamiento de secuencias de video se emplean en varias aplicaciones como, 15 por ejemplo, programas de TV, servicios de descarga directa (“streaming") de video por internet y videoconferencias.
[0003] Las secuencias de video, en un formato sin procesar, requieren una cantidad muy grande de datos a representar, dado que cada segundo de una secuencia puede consistir en decenas de fotogramas individuales y cada fotograma se representa normalmente mediante al menos 8 bits por pixel, con cada fotograma requiriendo
20 varios cientos o miles de plxeles. Para minimizar los costes de transmision y almacenamiento, se usa compresion de video en los datos de video sin procesar. El objetivo es representar la information original con la menor capacidad posible, es decir, con tan pocos bits como sea posible. La reduction de la capacidad necesaria para representar una secuencia de video afectara a la calidad de video de la secuencia comprimida, es decir su similitud con la secuencia de video no comprimida original.
25
[0004] Los codificadores de video del estado de la tecnica, tales como AVC/H.264, utilizan cuatro procesos principales para conseguir el nivel maximo de compresion de video mientras consiguen un nivel deseado de calidad de video para la secuencia de video comprimida: prediccion, transformation, cuantificacion y codificacion por entropla. El proceso de prediccion explota la redundancia temporal y espacial encontrada en secuencias de video
30 para reducir enormemente la capacidad requerida para representar los datos. El mecanismo usado para predecir datos es conocido tanto por el codificador como el decodificador, por lo tanto solamente una senal de error, o residual, debe ser enviada al decodificador para reconstruir la senal original. Este proceso se realiza normalmente en bloques de datos (por ejemplo 8x8 plxeles) en lugar de fotogramas enteros. La prediccion se realiza normalmente contra fotogramas ya reconstruidos o bloques de plxeles reconstruidos que pertenecen al mismo fotograma.
35
[0005] El proceso de transformacion pretende explotar la correlation presente en las senales residuales. Esto lo hace concentrando la energla de la senal en pocos coeficientes. Por lo tanto, los coeficientes de transformada normalmente requieren menos bits para ser representados que los plxeles de la residual. H.264 usa transformadas de tipo numero entero de 4x4 y 8x8 basadas en la transformada discreta del coseno (DCT).
40
[0006] La capacidad requerida para representar los datos en la salida del proceso de transformacion puede seguir siendo demasiado alta para muchas aplicaciones. Ademas, no es posible modificar el proceso de transformacion para conseguir el nivel deseado de capacidad para la senal comprimida. El proceso de cuantificacion se ocupa de eso, permitiendo una reduccion adicional de la capacidad necesaria para representar la senal. Debe
45 observarse que este proceso es destructivo, es decir la secuencia reconstruida parecera diferente de la original.
[0007] El proceso de codificacion por entropla toma todos los coeficientes de transformada cuantificados no nulos y los procesa para ser representados de forma eficiente en un flujo de bits. Esto requiere leer, o barrer, los coeficientes de transformada en cierto orden para minimizar la capacidad requerida para representar la secuencia de
50 video comprimida.
[0008] La description anterior se aplica a un codificador de video; un decodificador de video realizara todos los procesos anteriores en un orden aproximadamente inverso. En particular, el proceso de transformacion en el lado del decodificador requerira el uso de la inversa de la transformada que esta siendo usada en el codificador.
55 Analogamente, la codificacion por entropla se convierte en decodificacion por entropla y el proceso de cuantificacion se convierte en modificacion a escala inversa. El proceso de prediccion normalmente se realiza de la misma forma exacta tanto en el codificador como en el decodificador.
[0009] La presente invencion se refiere a la parte de transformacion de la codificacion, por lo tanto, en el
presente documento se presenta una revision mas exhaustiva del proceso de transformada.
[0010] Las propiedades estadisticas de la residual afectan a la capacidad de la transformada (es decir DCT)
de comprimir la energia de la senal de entrada en un pequeno numero de coeficientes. La residual muestra 5 propiedades estadisticas muy diferentes, dependiendo de la calidad de la prediction y si la prediction explota redundancia espacial o temporal. Otros factores que afectan a la calidad de la prediccion son el tamano de los bloques que estan siendo usados y las caracteristicas espaciales/temporales de la secuencia que esta siendo procesada.
10 [0011] Es bien conocido que la DCT se aproxima al rendimiento maximo de compactacion de energia para
senales Markov-I altamente correlacionadas. El rendimiento de compactacion de energia de DCT comienza cayendo a medida que la correlation de senales se vuelve mas debil. Por ejemplo, es posible mostrar como la transformada discreta del seno (DST) puede superar a la DCT para senales de entrada con menores caracteristicas de correlacion adyacentes.
15
[0012] La DCT y DST en codification de imagen y de video se usan normalmente en bloques, es decir senales en 2D; esto significa que una transformada unidimensional se realiza en primer lugar en una direction (por ejemplo, horizontal) seguida por una transformada unidimensional realizada en la otra direccion. Como ya se ha mencionado, la capacidad de compactacion de energia de una transformada depende de las estadisticas de la senal
20 de entrada. Es posible, y de hecho tambien es habitual en algunas circunstancias, para la senal bidimensional introducida en la transformada presentar diferentes estadisticas a lo largo de los dos ejes vertical y horizontal. En este caso, seria deseable seleccionar la transformada de mejor rendimiento en cada eje. Un enfoque similar ya se ha intentado dentro de la nueva norma ISO e ITU de condition de video en desarrollo, codificacion de video de alta eficiencia (HEVC). En particular, una combination de dos transformadas separables unidimensionales tales como
25 una similar a DCT y DST se ha usado en la norma HEVC en desarrollo.
[0013] Aunque las normas de codificacion previas basadas en DCT usan una transformada bidimensional (DCT de 2D), las soluciones mas nuevas aplican una combinacion de DCT y DST a bloques intrapredichos, es decir en bloques que son predichos espacialmente. Se ha demostrado que DST es una mejor election que DCT para la
30 transformation de filas, cuando la prediccion direccional es desde una direccion que es mas cercana a la horizontal que a la vertical, y, analogamente, es una mejor eleccion para transformacion de columnas cuando la prediccion direccional es mas cercana a la vertical. En la direccion restante (por ejemplo en filas, cuando se aplica DST en columnas), se usa DCT.
35 [0014] Para fines de implementation, en codificacion de video es habitual usar aproximaciones de numeros
enteros de DCT y DST que, en el resto de este texto se denominaran simplemente DCT y DST. Una de las soluciones para transformada similar a DCT de numero entero usa representation de datos intermedios de 16 bits y es conocida como mariposa parcial (“partial butterfly"). Sus principales propiedades son las mismas propiedades de (anti)simetria que las de DCT, vectores de base casi ortogonales, representacion de datos de 16 bits antes y
40 despues de cada fase de transformada, multiplicadores de 16 bits para todas las multiplicaciones internas y sin necesidad de correccion de diferentes normas de vectores de base durante la (des)cuantificacion.
[0015] El documento de la tecnica anterior MALVAR H S ET AL: “LOW-COMPLEXITY TRANSFORM AND
QUANTIZATION IN H.264/AVC”, IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO
45 TECHNOLOGY, IEEE SERVICE CENTER, PISCATAWAY, NJ, EE. UU., vol. 13, no. 7, paginas 598-603 del 1 de julio de 2003 presenta una vision general de los disenos de transformada y cuantificacion en la norma H.264/AVC con un enfoque especial en consideraciones respecto a implementaciones de baja complejidad usando aritmetica de numero entero de 16 bits.
50 [0016] El documento de la tecnica anterior YUMI SOHN ET AL: “One Dimensional Transform For H.264
Based Intra Coding”, 26. PICTURE CODING SYMPOSIUM, LISBOA del 7 de noviembre de 2007 desvela la adicion de modos de transformada alternativos para la norma H.264/AVC. El codificador puede seleccionar entre la transformada en 2D convencional, una transformada en 1D vertical, una transformada en 1D horizontal, o ninguna transformada que esta siendo aplicada a la senal residual de prediccion.
55
RESUMEN DE LA INVENCION
[0017] En un aspecto, la presente invention consiste en un procedimiento de codificacion de video tal como
se define en la reivindicacion 1.
[0018] La presente invencion tambien consiste en un procedimiento de decodificacion de video tal como se
define en la reivindicacion 2.
5 [0019] Pueden usarse los mismos factores de modificacion a escala para todos los coeficientes en una fila o
columna modificada a escala.
[0020] Preferentemente, se aplica una matriz de cuantificacion que tiene los mismos valores en cada columna cuando la transformada que opera sobre columnas es saltada, y se aplica una matriz de cuantificacion que
10 tiene los mismos valores en cada fila cuando la transformada que opera sobre filas es saltada.
[0021] Puede realizarse un barrido doble, donde un bloque de coeficientes de transformada se representa con sub-bloques de coeficientes; cada sub-bloque es visitado en barrido a nivel de sub-bloques, y dentro de cada sub-bloque se usa un barrido.
15
[0022] Las siguientes caracterlsticas preferidas son relevantes para cada uno de los aspectos de la invencion descritos anteriormente.
[0023] El conjunto de modos de salto de transformada puede comprender los dos modos de: transformada 20 sobre filas y columnas; y ninguna transformada. Como alternativa, el conjunto de modos de salto de transformada
puede comprender los cuatro modos de: transformada sobre filas y columnas; transformada sobre filas solamente; transformada sobre columnas solamente; y ninguna transformada.
[0024] La seleccion de modo puede senalizarse a un decodificador con una palabra de codigo asignada a 25 cada modo. El mismo modo de salto de transformada puede usarse en todos los componentes (luminancia - Y y
crominancia - U y V) de un bloque YUV. El modo de salto de transformada puede senalizarse para todos los componentes YUV de un bloque, para un grupo de bloques, y se senaliza por separado para cada componente para otro grupo de bloques. Por lo tanto, en HEVC puede ser util contar con senalizacion de modo YUV conjunta para bloques codificados INTER, y modo TSM separado para cada componente para bloques codificados en INTRA.
30
[0025] Puede no ser necesario que el modo de salto de transformada sea senalizado para bloques que tienen solamente coeficientes de valor nulo. Puede no ser necesario senalizarlo cuando el componente de luminancia tiene solamente valores nulos; en este caso la transformada en 2D se usa sobre componentes de crominancia. Puede no ser necesario senalizarlo cuando el unico coeficiente de valor no nulo del componente de luminancia es la esquina
35 superior izquierda del bloque (componente DC) en este caso, la transformada en 2D se usa sobre componentes de crominancia. El modo de salto de transformada puede senalizarse solamente para bloques con otros modos predefinidos (por ejemplo predichos a partir de otros fotogramas solamente).
[0026] En algunos ejemplos, el orden en el que los coeficientes dentro de un bloque son barridos en la fase 40 de codificacion por entropla puede adaptarse segun el modo de salto de transformada. Por lo tanto, puede
emplearse barrido fila por fila donde la transformada de filas es saltada y la transformada de columnas es conservada, y emplearse barrido columna por columna donde la transformada de columnas es saltada y la transformada sobre filas es conservada.
45 DESCRIPCION DETALLADA DE LA PRESENTE INVENCION
[0027] La presente invencion se describira a continuacion a modo de ejemplo con referencia a los dibujos adjuntos, en los que:
50 La figura 1 es un diagrama de bloques que ilustra una caracterlstica en un codificador segun una realizacion de la invencion;
La figura 2 es un diagrama de bloques que ilustra la caracterlstica en un decodificador segun la realizacion;
55 La figura 3 es un diagrama que ilustra una alternativa al enfoque de barrido en zigzag conocido;
La figura 4 es un diagrama que ilustra un enfoque de barrido alternativo adicional;
La figura 5 es un diagrama de bloques que ilustra una caracterlstica en un codificador segun una realizacion
adicional de la invencion;
La figura 6 es un diagrama de bloques que ilustra la caracterlstica en un decodificador segun la realizacion;
5 La figura 7 es un diagrama de bloques que ilustra una caracterlstica en un decodificador segun una realizacion adicional de la invencion
[0028] Esta invencion presenta un modo para realizar el proceso de transformacion - modo de salto de transformada (TSM). Tal como se ha descrito anteriormente, la transformada mas comun usada en la codificacion de
10 video es la DCT. Su rendimiento de compactacion de energla depende de la correlacion de la residual. Tambien se ha descrito como la residual puede estar altamente descorrelacionada, o correlacionada en una direccion solamente, haciendo a la DCT en 2D menos eficiente. Se ha propuesto saltar el proceso de transformacion cuando el codificador toma dicha decision en un sentido de tasa-distorsion. El modo de transformada seleccionado debe senalizarse al decodificador, que realiza a continuation una combination de transformada/ saltar transformada, tal 15 como se define en la serialization.
[0029] Es posible operar con dos modos, es decir un primer modo con una transformada en 2D (que comprende la transformada de filas y la transformada de columnas) y un segundo modo con ninguna transformada.
20 [0030] En gran parte de la description a continuacion, estos modos se suplementan con los modos
adicionales formados saltando solamente la transformada de filas o solamente la transformada de columnas. Por lo tanto, se definen cuatro modos de transformada tal como se muestra en la tabla 1.
Tabla 1 - Opciones de modo de salto de transformada
TSM
Transformada sobre filas Transformada sobre columnas Nota
TS0
+ + Transformada en 2D
TS1
+ - Transformada en 1D
TS2
- + Transformada en 1D
TS3
- - Ninguna transformada
[0031] El modo TS0 corresponde a una transformada en 2D, es decir DCT en 2D. El modo de TS1 define la aplicacion de DCT horizontal unidimensional, seguida por un salto de transformada en la direccion ortogonal, es decir la transformada de columnas es saltada. TS2 define el salto de la transformada horizontal, mientras que
30 solamente se transforman columnas. Finalmente, el modo TS3 salta completamente transformadas en ambos ejes, es decir, no se aplica ninguna transformada a la senal de entrada.
[0032] Las figuras 1 y 2 muestran diagramas de bloques del modo de salto de transformada fundamental, para codificador y decodificador, respectivamente. Cada modo de salto de transformada se selecciona con un par de
35 indicadores correspondientes (Tf0, Tf1), de modo que TS0: (1, 1), TS1: (1, 0), TS2: (0, 1) y TS3: (0, 0).
[0033] En cuanto a cualesquiera otros bits adicionales procedentes de un flujo de bits comprimido que permitan una option adaptativa, la senalizacion del modo de salto de transformada puede ser costosa. Por lo tanto, hay concebidas varias estrategias para maximizar la eficiencia de codificacion.
40
[0034] Pueden senalizarse cuatro opciones de TSM usando palabras de codigo disenadas cuidadosamente. No es necesario que esas palabras de codigo sean transmitidas para cada bloque, sino que pueden usarse algunos otros procedimientos para ahorrar la tasa de bits necesaria.
45 [0035] Algunas de las posibilidades para reducir el coste de senalizacion se enumeran a continuacion; cada
opcion influyendo sobre partes relacionadas con transformada del codificador y el decodificador:
1. El mismo modo de transformada usado en todos los componentes (luminancia - Y y crominancia - U y V) de un bloque YUV; por lo tanto, para bloques co-localizados Y, U y V solamente se transmite una election de TSM.
50
2. TSM no senalizado cuando todos los bloques cuantificados (Y, U y V) tienen solamente coeficientes con valores nulos.
3. TSM no senalizado para bloques cuando el bloque Y tiene solamente coeficientes de valor nulo, y entonces se usa DCT en 2D en componentes U y V.
4. TSM senalizado solamente para bloques con ciertos otros modos (por ejemplo bidireccional predicho); en caso 5 contrario, se aplica DCT en 2D.
5. Aplicacion de TSM senalizado en un conjunto de bloques (si “en” entonces modos de TS senalizados para cada bloque del conjunto).
10 6. TSM senalizado en un conjunto de bloques (por ejemplo todos los sub-bloques comparten el mismo TSM).
7. TSM senalizado si ciertas otras caracterlsticas de bloque estan presentes; por ejemplo TSM no senalizado cuando el bloque Y tiene solamente un valor no nulo, y ese valor esta en la esquina superior izquierda del bloque (componente DC); en ese caso se usa DCT en 2D para todos los componentes.
15
[0036] Cuatro modos de TSM (transformada en 2D, dos transformadas de bloques en 1D y transformada
saltada en un bloque) pueden definirse con diversas palabras de codigo, por ejemplo con palabras de 2 bits sencillas, o con mas bits (es decir con codigos unarios):
TSM
Senalizacion de 2 bits Codigo unario
TS0
11 1
TS1
10 01
TS2
01 001
TS3
00 000
20
[0037] Si se usa codificacion aritmetica, cada bin de la palabra de codigo puede codificarse con diferentes
modelos de probabilidad (es decir estados de contexto inicial para cada segmento), dependiendo del actual tamano de bloque y del valor de QP.
25 [0038] Por otro lado, si se usa codificacion de longitud variable, palabras de codigo de TSM pueden
codificarse independientemente de o mezcladas con otros elementos de sintaxis, para reducir la sobrecarga de senalizacion.
[0039] En algunos enfoques, un bloque no siempre se transforma de una vez, sino que se aplican bastantes 30 opciones para su division en subunidades mas pequenas, y se aplican transformadas sobre cada subunidad.
Representativo de dicha estructura de transformada es el procedimiento de arbol cuadruple residual “Residual QuadTree" (RQT). Aunque la aplicacion de TSM sobre bloques que no se dividen mas en unidades mas pequenas se ha asumido hasta ahora, tambien puede aplicarse TSM sobre dichas estructuras de transformada multidivididas. Se identifican varias opciones:
35
1. El TSM se decide a nivel de bloques, y se aplica la misma eleccion de transformada sobre cada subunidad.
2. El TSM se permite solamente a nivel de la ralz de la estructura de transformacion, es decir cuando un bloque no se divide mas en unidades mas pequenas cuando se permite una estructura multidividida; si un bloque se divide en
40 unidades mas pequenas, cada unidad se transforma usando transformada en 2D.
3. El TSM se decide y se senaliza para cada subunidad, independientemente de su profundidad.
4. El TSM se decide y se senaliza para subunidades, hasta una profundidad (tamano) especlfica de unidades; para 45 subunidades inferiores, cuando TSB no se senaliza, se usa transformada en 2D.
[0040] Los coeficientes dentro de un bloque pueden tener diferentes caracterlsticas cuando la transformada no se realiza en una o ambas direcciones. Por lo tanto, pueden aplicarse diferentes estrategias de codificacion, dependiendo del modo de salto de transformada, para comprimir mejor coeficientes dados.
[0041] Cuando se aplica una transformada en 2D sobre un bloque, los coeficientes resultantes se agrupan a menudo hacia la esquina superior izquierda de un bloque, es decir son componentes de baja frecuencia. El barrido convencional, por ejemplo barrido en zigzag es, por lo tanto, una buena eleccion para la codificacion de dichas senales.
5
[0042] Si solamente se aplica transformada en 1D (TS1 o TS2), puede usarse barrido adaptativo. Por ejemplo, puede usarse un barrido fila por fila, o un barrido columna por columna para casos TS2 y TS1 respectivamente, dado que puede esperarse que la transformada aplicada concentre los coeficientes hacia frecuencias mas bajas.
10
[0043] Para el caso TS3, donde no se aplica una transforma en ninguna direccion, puede usarse un barrido convencional (usado para un bloque transformado en 2D). Como alternativa, puede emplearse un patron de barrido diferente, que tiene en cuenta la probabilidad (impllcita en la decision de no llevar a cabo ninguna transformada) de que coeficientes no nulos estan distribuidos de forma no uniforme. Por ejemplo, los coeficientes pueden estar
15 agrupados en “islas” rodeadas por “mares” de coeficientes nulos.
[0044] Por lo tanto, en una nueva disposicion, las posiciones del primer y el ultimo coeficientes significativos dentro de un bloque pueden transmitirse en el flujo de bits, y a continuacion puede realizarse un barrido convencional de coeficientes dentro de un bloque. Esto se muestra en la figura 3 donde los cuadrados blancos
20 representan coeficientes que no estan codificados y tienen valor nulo, los cuadrados grises representan coeficientes que se codificaran, es decir incluyen coeficientes (no nulos) significativos), donde el primer coeficiente codificado esta marcado con “F” y el ultimo coeficiente codificado esta marcado con “L”. El barrido se realiza solamente sobre filas y columnas que pertenecen al area definida por el primer y el ultimo coeficiente. En este procedimiento de barrido, las coordenadas x e y del primer coeficiente deben ser iguales o mas pequenas que las coordenadas x e y 25 del ultimo coeficiente significativo.
[0045] Esta disposicion debe causar una codificacion altamente eficiente en el caso en el que se agrupen coeficientes no nulos, pero requiere la complejidad adicional en el codificador de determinar las posiciones del primer y el ultimo coeficientes significativos dentro de un bloque, junto con la necesidad de senalizar esas posiciones
30 al decodificador.
[0046] En una alternativa, se usa un barrido en zigzag doble, tal como se representa en la figura 4, donde un bloque de coeficientes de transformada se representa con sub-bloques de coeficientes. Cada sub-bloque es visitado en barrido en zigzag a nivel de sub-bloque, y dentro de cada bloque se usa un barrido en zigzag (o cualquier otro
35 barrido). Esto permite un mejor agrupamiento de coeficientes no nulos, que tienden a estar espacialmente cerca.
[0047] Sera deseable, donde se toma la decision de saltar cualquiera o ambas transformadas en 1D, minimizar o eliminar la necesidad de cambiar otros elementos del proceso para alojar la transformada o transformadas saltadas.
40
[0048] En este caso, se identifican dos estrategias de implementacion para la fase de transformada adaptativa:
1) saltar transformada de filas / columnas seleccionadas, y modificar la fase de cuantificacion.
45
2) sustituir la transformada de filas / columnas seleccionadas por una etapa de modificacion a escala adecuada y adaptar la etapa de cuantificacion si se requiere.
[0049] Aunque la primera estrategia se presenta adecuadamente con las figuras 1 y 2, la segunda estrategia 50 que emplea modificacion a escala se representa en las figuras 5 y 6. Una de las principales razones por las que se
realiza modificacion a escala es mantener los niveles de senal, con la presion mas elevada soportada, entre bloques de transformada. Esto se indica usando la llnea discontinua en las figuras 5 y 6.
[0050] La modificacion a escala se realiza modificando a escala cada valor de pixel de entrada en un factor 55 que se deriva de norma-2 de vectores de transformada correspondientes (que se usarlan para obtener un valor de
coeficiente de transformada, en la misma posicion en una fila/columna, si se selecciono la transformada). Algunas transformadas tienen propiedades cercanas a ortonormales de cada vector y esta propiedad puede simplificar adicionalmente el diseno de modificacion a escala, dado que puede usarse un unico valor para modificar a escala adecuadamente una fila/columna completa en la que la transformada es saltada.
[0051] En lo sucesivo, se describen estrategias de modificacion a escala en el contexto de transformada de DCT de numero entero con representacion de datos intermedios de 16 bits. Se reconocera, sin embargo, que esto es solo un ejemplo.
5
[0052] Las transformadas usadas en HEVC tienen las normas (TNn), donde N es el tamano de la transformada, cerca de los siguientes numeros:
- Transformada de 4 puntos: TN4 = 128 = 27; TNS4 = 7;
10
- Transformada de 8 puntos: TN8 = 181 = 27,5; TNS8 = 7,5;
- Transformada de 16 puntos: TN16 = 256 = 28; TNS16 = 8;
15 - Transformada de 32 puntos: TN32 = 362 = 28,5. TNS32 = 8,5;
donde TNS es el parametro de desplazamiento de norma de transformada (“Transform Norm Shift") (potencia de 2 representada por desplazamiento de bits a la izquierda). Notese que, en HEVC cada vector de transformada puede tener una norma ligeramente diferente, pero estos numeros son buenas aproximaciones para implementaciones practicas. Este hecho tambien se desvla en los disenos de cuantificacion y en el ajuste del nivel de transformada para preservar la representacion de datos intermedios de 16 bits. Por ejemplo, en diseno de decodificador HEVC, el valor de 16 bits entra en la transformada inversa. Para alcanzar precision de 16 bits entre transformadas de columna (1a fase inversa) y de fila (2a fase inversa), y precision de 9+DB despues de la transformada de filas, se produce el siguiente desplazamiento de bits del nivel de senal (considerando un tamano de bloque de N x N):
SHIFT = TNSn - SHIFT_INV_1ST + TNSn - (SHIFT_INV_2ND - DB),
donde, mediante la norma, SHIFT_INV_1ST = 7 y SHIFT_INV_2ND = 12, y DB es el incremento de profundidad de bits para procesamiento (por ejemplo 0 o 2). La profundidad de bits del procesamiento interno es B = 8 + DB. Por lo 30 tanto, SHIFT (desplazamiento) es igual a:
SHIFT = 2 ■ TNSn - 19 + DB = 2 ■ TNSn - 27 + B.
Esto corresponde al parametro desplazamiento de transformada usado en la cuantificacion HEVC.
35
Esto conduce, para el ejemplo donde se considera un bloque 4 x 4 (TNS4 = 7), a
-SHIFT4 = 13 - B,
40 es decir desplazamiento a la derecha en 13 - B.
[0053] Aunque este ejemplo puede usarse para abordar un ajuste del nivel de senal para TS3, hay que tener en cuenta algunas consideraciones adicionales cuando la transformada se aplica en una direccion solamente. Esto es porque TNSN no son siempre numeros enteros, por lo tanto el desplazamiento de bits no es la unica opcion para
45 el ajuste del nivel. Otras opciones para abordar disenos unificados para dichas combinaciones se abordan en el siguiente texto.
[0054] Donde una transformada se sustituye por modificacion a escala, la fase de transformada adaptativa esta disenada de tal manera que pueda intercalarse dentro de la transformada DCT de numero entero con
50 representacion de datos intermedios de 16 bits, es decir con el objetivo de sustituir algunas de sus partes y de ser compatibles con el resto del codec que soporta transformada en 2D original. Por ejemplo, puede usarse la no aplicacion de la transformada sobre filas, de una manera que siga siendo compatible con la parte de transformada 2D que se aplica sobre columnas. Esto significa que la cuantificacion aplicada para la transformada en 2D tambien puede usarse con la eleccion de la transformada adaptativa.
55
[0054] El salto de transformada directa se define para filas y columnas por separado.
[0055] En muestras x de filas el salto de transformada se aplica como:
20
25
y = (x ■ escala + compensacion) desplazado a la derecha S bits
(a)
donde:
5 S = M - 1 + DB
compensacion = 1 desplazado a la izquierda (S - 1) bits
DB = B - incremento de profundidad de 8 bits para procesamiento
10
M = log2(N), donde N es el tamano de fila/columna en el numero de plxeles, y la escala es un multiplicador de numero entero sin signo.
[0057] En las columnas, el salto de transformada se aplica como en (a) donde x son muestras de columnas, 15 pero con:
S = M + 6
compensacion = 1 desplazado a la izquierda (S - 1) bits
20
[0058] De esta manera, se garantiza una anchura de bits de 16 despues de cada fase de transformada, como en la transformada en 2D.
[0059] De nuevo, factores de escala se designan de una manera para estar cerca de la norma-2 de vectores 25 de transformada relacionados (escalaN 2 = TNn 2 = N ■ 642) y para ser un numero entero. En las muestras x de
columnas el salto de transformada inverso se aplica como
y = (x ■ escala + compensacion) desplazado a la derecha S bits
30 donde:
S=7
compensacion = 1 desplazado a la izquierda (S - 1) bits 35
y la escala es la misma que en el salto hacia delante.
[0060] En filas, se aplica la misma operacion de salto de transformada, pero con:
40 S = 12 - DB, donde DB es el mismo que en el salto de transformada directa.
[0061] Para ahorrar procesamiento de plxeles innecesario, donde una o ambas transformadas en 1D son saltadas, la modificacion a escala puede moverse a cuantificacion. Ademas (por ejemplo), si solamente se conserva la transformada vertical, esta puede adaptarse, para garantizar la representacion en 16 bits maxima de plxeles. Esto
45 permite que se realice un uso completo de la anchura de bits disponible. Por lo tanto, la modificacion a escala en cuantificacion tiene que adaptarse no solamente debido a la modificacion a escala relacionada con la transformada saltada sino tambien relacionada con una nueva modificacion a escala dentro de una transformada.
TSM = TS0 (transformada en 2D)
50
Se usa transformada 2D regular y cuantificacion correspondiente.
TSM - TS1 (1D transformada sobre filas) y TS2 (1D transformada sobre columnas)
55 En ambos casos, la transformada directa corresponde a la transformada de filas original
y = (x + compensacion) desplazado a la derecha S bits, (b)
donde:
x es el valor original del bloque residual,
S = M - 1 + DB,
5
compensation = 1 desplazado a la izquierda (S - 1) bits y M y DB son los mismos que en (a).
10 [0062] Esto garantiza precision de datos intermedios de 16 bits.
La cuantificacion esta adaptada y tiene en cuenta el nivel al que esta ahora la senal.
TSM = TS3 (ninguna transformada)
15
[0063] Los plxeles residuales se cuantifican directamente usando la matriz plana, de modo que el nivel de senal corresponda a los niveles de coeficientes cuantificados que son transformados en 2D y cuantificados.
[0064] Otro ejemplo de como puede ajustarse el nivel de la senal cuando una transformada es saltada se 20 presenta a continuation, con referencia a la figura 7. En este ejemplo, el objetivo es reducir una serie de
operaciones requeridas para alcanzar el rendimiento deseado. En ese contexto, donde una transformada o sus partes pueden ser saltadas o sustituidas, esta tecnica usa una combination de una o mas operaciones basicas:
1. Cambios a desplazamiento de bits dentro de fases de transformada;
25
2. Ajuste de la cuantificacion que corresponde a la modification a escala de una senal un factor menor que 2;
3. Sustitucion de la transformada o sus partes por un escalar fuera de la cuantificacion.
30 [0065] Cada modificacion a escala de la senal puede representarse modificando a escala con un factor de 2N
(donde N es un numero entero positivo) y modificando a escala con un factor M que es menor que 2. Notese que, en este caso, N es el tamano de transformada como en el ejemplo previo). En esta invention, la Operation 1 permite la modificacion a escala de senal con un factor de 2N (desplazamiento de bits) y la Operacion 2 permite modificacion a escala con M. La election de M normalmente esta limitada y depende del diseno de cuantificacion. Un componente 35 tlpico de una transformada en 1D en codification de video es el desplazamiento de bits. Por lo tanto, la Operacion 1 aplicada en este caso permite facilmente el ajuste de un nivel de senal con un factor de 2N. En el caso en el que ambas transformadas son saltadas, el ajuste del nivel de la senal puede realizarse en el bloque de “modificacion a escala” de la figura 7, que corresponde a la Operacion 3. En cualquier caso, el ajuste de la senal con un factor menor que 2, una compensacion del parametro de cuantificacion, o factor de modificacion a escala de cuantificacion, 40 puede seleccionarse adecuadamente para realizar el ajuste del nivel de senal requerido. Por ejemplo, en codificacion de video de alta eficiencia (HEVC), anadir una compensacion de 3 a un parametro de cuantificacion es equivalente a ajustar el nivel de la senal con cuadr(2) (ralz 2).
[0066] Se entendera que la invencion se ha descrito a modo de ejemplo solamente y que son posibles una
45 amplia variedad de modificaciones sin alejarse del alcance de la invencion tal como se describe en las reivindicaciones adjuntas. Caracterlsticas que se describen en el presente documento en ciertas combinaciones pueden encontrar aplicacion util en otras combinaciones mas alla de las mencionadas especlficamente y, en ciertos casos, pueden usarse en solitario. Por ejemplo, los enfoques de modificacion a escala en codificacion o decodificacion de video, donde:
50
posiciones del primer y el ultimo coeficientes a codificar/decodificar dentro de un bloque son senalizadas al decodificador y se realiza una modificacion a escala de coeficientes entre dichos primer y el ultimo coeficientes; o
se realiza un barrido doble, donde un bloque de coeficientes de transformada se representa con sub-bloques de 55 coeficientes; cada sub-bloque es visitado en barrido en zigzag a nivel de sub-bloque, y dentro de cada sub-bloque, se usa un patron de barrido adicional;
puede ser util mas alla del caso de modo de salto de transformada.
[0067] Aunque aspectos de esta invencion se han ilustrado con cuatro modos de salto de transformada, sera
posible, tal como se ha indicado anteriormente, en ciertas realizaciones operar con solamente dos de esos modelos.

Claims (12)

  1. REIVINDICACIONES
    1. Un procedimiento de codificacion de video segun HEVC que utiliza una transformada de filas que opera sobre filas de un bloque de valores de imagen y que tiene un vector de transformada de filas y una
    5 transformada de columnas que opera sobre columnas del bloque de valores de imagen y que tiene un vector de transformada de columnas, que comprende las etapas de establecer un conjunto de modos de transformada que incluyen un modo de salto en la que una o ambas de la transformada de filas y la transformada de columnas son saltadas; seleccionar uno de dichos modos; para cualquier bloque en el que una transformada es saltada, aplicar un factor de modification a escala a los valores de imagen correspondientes de ese bloque, donde el factor de 10 modificacion a escala es el producto de 64 y la ralz cuadrada del tamano del vector de transformada de la transformada saltada y es un numero entero; y para al menos algunos bloques o conjuntos de bloques proporcionar una indication del modo seleccionado para un decodificador.
  2. 2. Un procedimiento de decodificacion de video segun HEVC que ha sido codificado utilizando una 15 transformada de filas que opera sobre filas de un bloque de valores de imagen y que tiene un vector de
    transformada de filas y una transformada de columnas que opera sobre columnas del bloque de valores de imagen y que tiene un vector de transformada de columnas; que comprende las etapas de recibir, para al menos algunos bloques o conjuntos de bloques, una indicacion del modo de salto de transformada en el que una o ambas de la transformada de filas y la transformada de columnas son saltadas; aplicar transformadas inversas segun el modo y 20 aplicar modificacion a escala inverso a valores de imagen no transformados cualesquiera, siendo el factor de modificacion a escala el producto de 64 y la ralz cuadrada del tamano del vector de transformada de la transformada saltada y siendo un numero entero.
  3. 3. Un procedimiento segun la reivindicacion 1 o la reivindicacion 2, en el que se usan los mismos 25 factores de modificacion a escala para todos los coeficientes en la fila o columna modificada a escala.
  4. 4. Un procedimiento segun una cualquiera de las reivindicaciones anteriores, en el que se aplica una matriz de cuantificacion que tiene los mismos valores en cada columna cuando la transformada que opera sobre columnas es saltada, y se aplica una matriz de cuantificacion que tiene los mismos valores en cada fila cuando la
    30 transformada que opera sobre filas es saltada.
  5. 5. Un procedimiento segun una cualquiera de las reivindicaciones anteriores, en el que se realiza un barrido doble, donde un bloque de coeficientes de transformada se representa con sub-bloques de coeficientes; cada sub-bloque es visitado en barrido a nivel de sub-bloques, y dentro de cada sub-bloque se usa un barrido.
    35
  6. 6. Un procedimiento segun una cualquiera de las reivindicaciones anteriores, en el que el conjunto de modos de salto de transformada comprende:
    transformada sobre filas y columnas;
    40
    transformada sobre filas solamente; transformada sobre columnas solamente;
    45 ninguna transformada.
  7. 7. Un procedimiento segun una cualquiera de las reivindicaciones anteriores, en el que la selection de modo se senaliza a un decodificador con una palabra de codigo asignada a cada modo.
    50 8. Un procedimiento segun una cualquiera de las reivindicaciones anteriores, donde el orden en el que
    los coeficientes dentro de un bloque son barridos en la fase de codificacion por entropla se adapta segun el modo de salto de transformada y preferentemente en el que se emplea barrido fila por fila donde la transformada de filas es saltada y la transformada de columnas es conservada, y se emplea barrido columna por columna donde la transformada de columnas es saltada y la transformada sobre filas es conservada.
  8. 9. Un procedimiento segun una cualquiera de las reivindicaciones anteriores, donde el modo de salto de
    transformada se senaliza para todos los componentes YUV de un bloque, para un grupo de bloques, y se senaliza por separado para cada componente para otro grupo de bloques.
  9. 10. Un procedimiento segun una cualquiera de las reivindicaciones anteriores, en el que se usa el mismo
    modo de salto de transformada sobre todos los componentes (luminancia - Y y crominancia - U y V) de un bloque YUV.
    5 11. Un procedimiento segun una cualquiera de las reivindicaciones anteriores, en el que el modo de salto
    de transformada no se senaliza para bloques que tienen solamente coeficientes de valor nulo o cuando el componente de luminancia tiene solamente valores nulos; en este caso se usa una transformada en 2D sobre componentes de crominancia o cuando el unico coeficiente de valor no nulo del componente de luminancia es la esquina superior izquierda del bloque (componente DC) en este caso se usa una transformada en 2D sobre 10 componentes de crominancia o se senaliza solamente para bloques con otros modos predefinidos (por ejemplo predichos a partir de otros fotogramas solamente).
  10. 12. Un producto de programa informatico que contiene instrucciones que hacen que medios programables implementen un procedimiento segun una cualquiera de las reivindicaciones anteriores.
    15
  11. 13. Un decodificador de video adaptado y configurado para funcionar segun la reivindicacion 2 o cualquier reivindicacion dependiente de la reivindicacion 2.
  12. 14. Un codificador de video adaptado y configurado para funcionar segun la reivindicacion 1 o cualquier 20 reivindicacion dependiente de la reivindicacion 1.
ES12729698.6T 2011-06-27 2012-06-19 Codificación y decodificación de video usando transformadas Active ES2574278T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
GB1110873.5A GB2492333B (en) 2011-06-27 2011-06-27 Video encoding and decoding using transforms
GB201110873 2011-06-27
PCT/GB2012/051413 WO2013001279A2 (en) 2011-06-27 2012-06-19 Video encoding and decoding using transforms

Publications (1)

Publication Number Publication Date
ES2574278T3 true ES2574278T3 (es) 2016-06-16

Family

ID=44485219

Family Applications (1)

Application Number Title Priority Date Filing Date
ES12729698.6T Active ES2574278T3 (es) 2011-06-27 2012-06-19 Codificación y decodificación de video usando transformadas

Country Status (11)

Country Link
US (1) US8923406B2 (es)
EP (2) EP2652954B1 (es)
JP (2) JP6063935B2 (es)
KR (1) KR101622450B1 (es)
CN (2) CN103404141B (es)
ES (1) ES2574278T3 (es)
GB (1) GB2492333B (es)
PL (1) PL2652954T3 (es)
PT (1) PT2652954E (es)
TW (1) TWI516095B (es)
WO (2) WO2013001279A2 (es)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11722698B2 (en) 2016-08-24 2023-08-08 Sony Corporation Image processing apparatus and image processing method

Families Citing this family (58)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2555287B (en) * 2011-10-17 2018-11-07 Kt Corp Video decoding method using transform method selected from a transform method set
KR101550726B1 (ko) * 2011-10-17 2015-09-07 주식회사 케이티 영상 부호화/복호화 방법 및 그 장치
RU2719340C2 (ru) 2011-10-18 2020-04-17 Кт Корпорейшен Способ декодирования видеосигнала
MX358516B (es) 2011-10-19 2018-08-24 Kt Corp Método y aparato para codificar/decodificar imágenes.
US9743116B2 (en) 2012-01-19 2017-08-22 Huawei Technologies Co., Ltd. High throughput coding for CABAC in HEVC
US10616581B2 (en) 2012-01-19 2020-04-07 Huawei Technologies Co., Ltd. Modified coding for a transform skipped block for CABAC in HEVC
US9654139B2 (en) 2012-01-19 2017-05-16 Huawei Technologies Co., Ltd. High throughput binarization (HTB) method for CABAC in HEVC
US9749633B2 (en) * 2012-01-19 2017-08-29 Vid Scale, Inc. System and method of video coding quantization and dynamic range control
US20130188736A1 (en) 2012-01-19 2013-07-25 Sharp Laboratories Of America, Inc. High throughput significance map processing for cabac in hevc
US9860527B2 (en) 2012-01-19 2018-01-02 Huawei Technologies Co., Ltd. High throughput residual coding for a transform skipped block for CABAC in HEVC
CN104335582B (zh) * 2012-06-12 2019-03-08 太阳专利托管公司 动态图像编解码方法以及动态图像编解码装置
US9426466B2 (en) 2012-06-22 2016-08-23 Qualcomm Incorporated Transform skip mode
GB2503875B (en) 2012-06-29 2015-06-10 Canon Kk Method and device for encoding or decoding an image
US9877025B2 (en) 2013-07-12 2018-01-23 British Broadcasting Corporation Video encoding and decoding with prediction at higher precision
JP6139774B2 (ja) * 2013-07-15 2017-05-31 ホアウェイ・テクノロジーズ・カンパニー・リミテッド Hevcにおけるcabacのための変換スキップされたブロックのための修正コーディング
CN105684442B (zh) * 2013-07-23 2020-02-21 英迪股份有限公司 用于编码/解码图像的方法
US9445132B2 (en) 2013-09-09 2016-09-13 Qualcomm Incorporated Two level last significant coefficient (LSC) position coding
GB2518823A (en) * 2013-09-25 2015-04-08 Sony Corp Data encoding and decoding
CN105594208A (zh) * 2013-10-11 2016-05-18 索尼公司 解码装置、解码方法、编码装置以及编码方法
JP6287035B2 (ja) * 2013-10-11 2018-03-07 ソニー株式会社 復号装置および復号方法
KR102185857B1 (ko) 2014-02-13 2020-12-02 삼성전자주식회사 영상 부호화, 복호화 방법 및 장치
EP3222044A1 (en) 2014-11-21 2017-09-27 VID SCALE, Inc. One-dimensional transform modes and coefficient scan order
KR102365685B1 (ko) 2015-01-05 2022-02-21 삼성전자주식회사 인코더의 작동 방법과 상기 인코더를 포함하는 장치들
KR102390407B1 (ko) * 2015-03-18 2022-04-25 한화테크윈 주식회사 디코더 및 디코더에서의 역변환 방법
US10547872B2 (en) 2015-09-10 2020-01-28 Samsung Electronics Co., Ltd. Encoding device, decoding device, and encoding method and decoding method thereof
JP2018533284A (ja) * 2015-09-21 2018-11-08 エルジー エレクトロニクス インコーポレイティド 係数誘導予測を用いてビデオ信号を処理する方法及び装置
US20170150156A1 (en) * 2015-11-25 2017-05-25 Qualcomm Incorporated Illumination compensation with non-square predictive blocks in video coding
CN105578190B (zh) 2016-02-03 2018-05-04 珠海全志科技股份有限公司 应用于视频硬解码的无损压缩方法及系统
US10244248B2 (en) 2016-02-25 2019-03-26 Mediatek Inc. Residual processing circuit using single-path pipeline or multi-path pipeline and associated residual processing method
CN109076226B (zh) * 2016-05-13 2021-08-13 索尼公司 图像处理装置和方法
CA3019490A1 (en) * 2016-05-13 2017-11-16 Sony Corporation Image processing apparatus and method
US10887626B2 (en) * 2016-05-13 2021-01-05 Sharp Kabushiki Kaisha Image decoding device and image encoding device
JPWO2018061837A1 (ja) * 2016-09-30 2019-07-11 ソニー株式会社 画像処理装置および方法
CA3041856A1 (en) 2016-12-28 2018-07-05 Sony Corporation Image processing apparatus and method for curbing deterioration in coding efficiency
BR112020000876A2 (pt) * 2017-07-28 2020-07-21 Panasonic Intellectual Property Corporation Of America dispositivo codificador, dispositivo decodificador, método de codificação, e método de decodificação
WO2019022099A1 (ja) * 2017-07-28 2019-01-31 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置、復号装置、符号化方法及び復号方法
CN110999293B (zh) * 2017-07-31 2022-11-04 韩国电子通信研究院 图像编码/解码方法和装置以及存储比特流的记录介质
CN111226442B (zh) 2017-08-04 2022-06-21 Lg电子株式会社 配置用于视频压缩的变换的方法及计算机可读存储介质
EP3484151A1 (en) * 2017-11-13 2019-05-15 Thomson Licensing Method and apparatus for generating quantization matrices in video encoding and decoding
CN116132673A (zh) * 2017-12-13 2023-05-16 三星电子株式会社 视频解码方法及其装置以及视频编码方法及其装置
BR122021019694B1 (pt) 2017-12-21 2022-05-17 Lg Electronics Inc Método de decodificação / codificação de imagem realizado por um aparelho de decodificação / codificação, aparelho de decodificação/codificação para decodificação/codificação de imagem, método e aparelho de transmissão de dados que compreende um fluxo de bits para uma imagem e mídia de armazenamento digital legível por computador não transitória
WO2019135448A1 (ko) * 2018-01-02 2019-07-11 삼성전자 주식회사 비디오 복호화 방법 및 그 장치 및 비디오 부호화 방법 및 그 장치
JP6477930B2 (ja) * 2018-01-17 2019-03-06 ソニー株式会社 符号化装置および符号化方法
CN118301348A (zh) 2018-10-05 2024-07-05 韩国电子通信研究院 图像编码/解码方法和设备以及存储比特流的记录介质
US11412260B2 (en) * 2018-10-29 2022-08-09 Google Llc Geometric transforms for image compression
WO2020182213A1 (en) * 2019-03-13 2020-09-17 Beijing Bytedance Network Technology Co., Ltd. Sub-block transform in transform skip mode
KR20200110236A (ko) * 2019-03-13 2020-09-23 현대자동차주식회사 데이터 블록에 변환 생략 모드를 효율적으로 적용하기 위한 방법 및 장치
JP6891325B2 (ja) * 2019-03-20 2021-06-18 キヤノン株式会社 画像符号化方法
JP6743225B2 (ja) * 2019-03-20 2020-08-19 キヤノン株式会社 画像復号装置、画像復号方法及びプログラム
US11695960B2 (en) * 2019-06-14 2023-07-04 Qualcomm Incorporated Transform and last significant coefficient position signaling for low-frequency non-separable transform in video coding
CN112135147B (zh) * 2019-06-24 2023-02-28 杭州海康威视数字技术股份有限公司 编码方法、解码方法及装置
CN110418138B (zh) * 2019-07-29 2021-08-27 北京奇艺世纪科技有限公司 视频处理方法、装置、电子设备及存储介质
CN114270817B (zh) 2019-08-20 2024-07-05 北京字节跳动网络技术有限公司 基于位置的系数缩放
CN114365490B (zh) 2019-09-09 2024-06-18 北京字节跳动网络技术有限公司 高精度图像和视频编解码的系数缩放
CN114731392A (zh) 2019-09-21 2022-07-08 北京字节跳动网络技术有限公司 用于图像和视频编解码的高精度变换和量化
KR20220112754A (ko) * 2019-12-11 2022-08-11 소니그룹주식회사 화상 처리 장치, 비트 스트림 생성 방법, 계수 데이터 생성 방법 및 양자화 계수 생성 방법
KR20220152299A (ko) * 2020-03-12 2022-11-15 인터디지털 브이씨 홀딩스 프랑스 비디오 인코딩 및 디코딩을 위한 방법 및 장치
WO2022037700A1 (en) * 2020-08-21 2022-02-24 Beijing Bytedance Network Technology Co., Ltd. Coding mode dependent selection of transform skip mode

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69227352T2 (de) * 1991-11-12 1999-04-15 Japan Broadcasting Corp Verfahren und System für die Ausführung einer hochwirksamen Bildsignalkodierung
JP3361543B2 (ja) * 1992-01-27 2003-01-07 日本放送協会 画像信号符号化装置
JP3211989B2 (ja) * 1992-08-31 2001-09-25 日本ビクター株式会社 直交変換符号化装置及び復号化装置
KR0134504B1 (ko) * 1992-09-09 1998-04-23 배순훈 적응적 주파수 변환기를 가진 영상 부호화기
JPH06217280A (ja) * 1993-01-14 1994-08-05 Sony Corp 動画像符号化及び復号化装置
US6215898B1 (en) * 1997-04-15 2001-04-10 Interval Research Corporation Data processing system and method
EP1325638A1 (en) * 2000-09-27 2003-07-09 Koninklijke Philips Electronics N.V. Decoding of data
US7206459B2 (en) * 2001-07-31 2007-04-17 Ricoh Co., Ltd. Enhancement of compressed images
JP4267848B2 (ja) * 2001-09-25 2009-05-27 株式会社リコー 画像符号化装置、画像復号装置、画像符号化方法、及び、画像復号方法
CN101448162B (zh) * 2001-12-17 2013-01-02 微软公司 处理视频图像的方法
US7242713B2 (en) * 2002-05-02 2007-07-10 Microsoft Corporation 2-D transforms for image and video coding
US6795584B2 (en) * 2002-10-03 2004-09-21 Nokia Corporation Context-based adaptive variable length coding for adaptive block transforms
KR20050026318A (ko) * 2003-09-09 2005-03-15 삼성전자주식회사 인트라 스킵 모드를 포함하는 비디오 인코딩_디코딩 장치및 방법
CN101005620B (zh) * 2004-09-03 2011-08-10 微软公司 为隔行扫描和逐行扫描视频编码和解码宏块和运动信息中的革新
CN100488254C (zh) * 2005-11-30 2009-05-13 联合信源数字音视频技术(北京)有限公司 一种基于上下文的熵编码方法及解码方法
CN103957409B (zh) * 2006-01-09 2017-12-29 马蒂亚斯·纳罗施克 编码方法和解码方法、编码器和解码器
CN101106721A (zh) * 2006-07-10 2008-01-16 华为技术有限公司 一种编解码装置及相关编码器
CN101267553A (zh) * 2007-03-12 2008-09-17 华为技术有限公司 一种实现编、解码的方法和装置
KR101885258B1 (ko) * 2010-05-14 2018-08-06 삼성전자주식회사 비디오 신호의 부호화 방법과 그 장치, 및 비디오 복호화 방법과 그 장치
CN102447907A (zh) * 2012-01-31 2012-05-09 北京工业大学 一种针对hevc的视频序列的编码方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11722698B2 (en) 2016-08-24 2023-08-08 Sony Corporation Image processing apparatus and image processing method

Also Published As

Publication number Publication date
JP2014523175A (ja) 2014-09-08
JP6328220B2 (ja) 2018-05-23
WO2013001278A1 (en) 2013-01-03
US8923406B2 (en) 2014-12-30
CN103404141B (zh) 2017-06-06
EP2652954B1 (en) 2016-03-30
PL2652954T3 (pl) 2016-10-31
PT2652954E (pt) 2016-06-07
GB2492333B (en) 2018-12-12
TW201320751A (zh) 2013-05-16
CN103404141A (zh) 2013-11-20
EP3026911A1 (en) 2016-06-01
US20140056362A1 (en) 2014-02-27
JP6063935B2 (ja) 2017-01-18
KR101622450B1 (ko) 2016-05-18
CN105847815B (zh) 2019-05-10
WO2013001279A2 (en) 2013-01-03
TWI516095B (zh) 2016-01-01
CN105847815A (zh) 2016-08-10
WO2013001279A3 (en) 2013-03-07
GB2492333A (en) 2013-01-02
JP2017098975A (ja) 2017-06-01
GB201110873D0 (en) 2011-08-10
KR20140027932A (ko) 2014-03-07
EP2652954A2 (en) 2013-10-23

Similar Documents

Publication Publication Date Title
ES2574278T3 (es) Codificación y decodificación de video usando transformadas
JP6895555B2 (ja) 復号化方法及び符号化方法
JP7445030B2 (ja) 統一された有意性マップ符号化方法および装置
US11388440B2 (en) Method and apparatus for a low complexity transform unit partitioning structure for HEVC
ES2816567T3 (es) Método y aparato para decodificar modo de intra-predicción
US7916959B2 (en) Image encoding method, image decoding method, image encoding apparatus, image decoding apparatus, image encoding program, and image decoding program
ES2828734T3 (es) Procedimiento y aparatos para decodificación de imágenes
ES2805039T3 (es) Aparato de decodificación de imágenes
ES2638093T3 (es) Codificación y decodificación de coeficiente de transformada
AU2012294683B2 (en) Coding of transform coefficients for video coding
CN107071413B (zh) 一种执行帧内预测的编码设备和解码设备
JP5815853B2 (ja) ビデオコーディングにおける量子化マトリクスに従うトランスフォームブロック処理の方法及びシステム
ES2789198T3 (es) Procedimiento de decodificación de imágenes
KR20200049899A (ko) 적응적 트리 선택을 사용한 이진 집합의 비디오 인코딩 및 디코딩을 위한 방법 및 장치
US20120082230A1 (en) Variable length coding of video block coefficients
KR20210125095A (ko) 화상 부호화 장치, 화상 부호화 방법 및 저장 매체
GB2339989A (en) Reduced memory video decoder stores locally compressed decoded pictures
EP3941054A1 (en) Image decoder, image decoding method, and program
ES2299847T3 (es) Tasa de bits fija, compresion y descompresion entre cuadros de un video.
WO2023174407A1 (zh) 用于编码、解码的方法、装置及其设备
GB2559912A (en) Video encoding and decoding using transforms
KR20210100172A (ko) 화상 부호화 장치, 화상 부호화 방법, 화상 복호 장치, 화상 복호 방법
JP2011254257A (ja) 画像圧縮装置