PT2652954E - Codificação e descodificação de vídeo utilizando transformadas - Google Patents

Codificação e descodificação de vídeo utilizando transformadas Download PDF

Info

Publication number
PT2652954E
PT2652954E PT127296986T PT12729698T PT2652954E PT 2652954 E PT2652954 E PT 2652954E PT 127296986 T PT127296986 T PT 127296986T PT 12729698 T PT12729698 T PT 12729698T PT 2652954 E PT2652954 E PT 2652954E
Authority
PT
Portugal
Prior art keywords
transform
block
blocks
transformed
column
Prior art date
Application number
PT127296986T
Other languages
English (en)
Inventor
Mrak Marta
Gabriellini Andrea
Sprljan Nikola
Flynn David
Original Assignee
British Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by British Broadcasting Corp filed Critical British Broadcasting Corp
Publication of PT2652954E publication Critical patent/PT2652954E/pt

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

DESCRIÇÃO "CODIFICAÇÃO E DESCODIFICAÇÃO DE VÍDEO UTILIZANDOTRANSFORMADAS"
CAMPO DA INVENÇÃO A presente invenção refere-se a sistemas de compressão edescompressão de vídeo e, em particular, a uma estrutura paramodelar, de forma adaptativa, uma representação de sinal entrecodificação por predição e entropia, pela utilização adaptativade funções de transformadas e ferramentas relacionadas,incluindo escalonamento, quantificação, varrimento esinalização.
ANTECEDENTES DA INVENÇÃO
Transmissão e armazenamento de sequências de video sãoempregues em diversas aplicações, como, e. g., transmissões deTV, serviços de transferência de dados em contínuo de vídeo daInternet e videoconferência.
As sequências de vídeo num formato em bruto obrigam àrepresentação de uma grande quantidade de dados, uma vez quecada segundo de uma sequência pode ser constituído por dezenasde fotogramas individuais e cada fotograma é representado,tipicamente, pelo menos, por 8 bits por pixel, exigindo cadafotograma várias centenas ou milhares de pixéis. De modo a minimizar os custos de transmissão e armazenamento, utiliza-secompressão de vídeo nos dados de vídeo em bruto. 0 objetivo érepresentar a informação original com tão pouca capacidadequanto possível, i. e., com o menor número de bits possível. Aredução da capacidade necessária para representar uma sequênciade vídeo vai afetar a qualidade de vídeo da sequênciacomprimida, i. e., a sua semelhança com a sequência de vídeooriginal não comprimida.
Os codificadores de vídeo do estado da técnica, tais como oAVC/H.264, utilizam quatro processos principais para obter onível máximo de compressão de vídeo, obtendo, simultaneamente,um nível desejado de qualidade de vídeo para a sequência devídeo comprimida: codificação por predição, transformação, quantificação e entropia. 0 processo de predição explora aredundância temporal e espacial encontrada em sequências devídeo para reduzir, significativamente, a capacidade necessáriapara representar os dados. 0 mecanismo utilizado para preverdados é conhecido pelo codificador e pelo descodificador e,assim, só tem que ser enviado um sinal de erro, ou resíduo, parao descodificador para este reconstruir o sinal original. Esteprocesso é, tipicamente, realizado em blocos de dados (e. g.,8x8 pixéis), e não em fotogramas inteiros. A predição é,tipicamente, realizada por comparação com fotogramas járeconstruídos ou blocos de pixéis reconstruídos pertencentes aomesmo fotograma. 0 processo de transformação visa explorar a correlaçãopresente nos sinais residuais. Fá-lo por concentração da energiado sinal em alguns coeficientes. Assim, os coeficientes detransformada exigem, tipicamente, menos bits para seremrepresentados do que os pixéis do resíduo. H.264 utiliza transformadas de tipo inteiro 4x4 e 8x8 com base na TransformadaDiscreta de Cosseno (DCT). A capacidade necessária para representar os dados na saidado processo de transformação pode, ainda, ser demasiado elevadapara muitas aplicações. Além disso, não é possível modificar oprocesso de transformação para obter o nível desejado decapacidade para o sinal comprimido. 0 processo de quantificaçãoresolve esse problema ao permitir uma maior redução dacapacidade necessária para representar o sinal. Devesalientar-se que este processo é destrutivo, i. e., a sequênciareconstruída será diferente da original 0 processo de codificação por entropia processa todos oscoeficientes de transformada não nulos quantificados de modo aserem eficientemente representados num fluxo de bits. Istoobriga a ler, ou a varrer, os coeficientes de transformadasegundo uma ordem determinada para minimizar a capacidadenecessária para representar a sequência de vídeo comprimida. A descrição acima aplica-se a um codificador de vídeo; umdescodificador de vídeo irá executar todos os processos acimacom uma ordem aproximadamente inversa. Em particular, o processode transformação do lado do descodificador irá obrigar autilizar a inversa da transformada utilizada no codificador. Damesma forma, a codificação por entropia transforma-se emdescodificação por entropia e o processo de quantificaçãotransforma-se num escalonamento inverso. 0 processo de prediçãoé, tipicamente, realizado exatamente da mesma forma nocodificador e descodificador. A presente invenção refere-se à parte de transformação dacodificação e, assim, uma avaliação mais completa do processo detransformação é aqui apresentada.
As propriedades estatísticas do resíduo afetam a capacidadeda transformada (i. e., DCT) para comprimir a energia do sinalde entrada num pequeno número de coeficientes. 0 resíduo mostrapropriedades estatísticas muito diferentes, dependendo daqualidade da predição e do facto de a predição explorarredundância espacial ou temporal. Outros fatores que afetam aqualidade da predição são o tamanho dos blocos a utilizar e ascaracterísticas espaciais/temporais da sequência a processar.
Sabe-se, com segurança, que a DCT se aproxima do desempenhode compactação máxima de energia para sinais de Markov deprimeira ordem altamente correlacionados. 0 desempenho decompactação de energia da DCT começa a degradar-se quando acorrelação de sinal se torna mais fraca. Por exemplo, é possívelmostrar como é que a Transformada Discreta de Seno (DST) podeter um melhor desempenho que a DCT para sinais de entrada comcaracterísticas de correlação adjacentes inferiores. A DCT e DST na codificação de imagem e vídeo são,normalmente, utilizadas em blocos, i. e., sinais 2D; istosignifica que uma transformada unidimensional é, em primeirolugar, realizada numa direção (e. g., horizontal), seguida poruma transformada unidimensional executada na outra direção. Comojá mencionado, a capacidade de compactação de energia de umatransformada é dependente das estatísticas do sinal de entrada.É possível, e de facto é também comum em algumas circunstâncias,que a entrada de sinal bidimensional para a transformada exibadiferentes estatísticas ao longo dos dois eixos vertical e horizontal. Neste caso, seria desejável escolher a transformadacom melhor desempenho em cada eixo. Uma abordagem semelhante jáfoi tentada no âmbito da recente norma de codificação de videoISO e ITU em desenvolvimento, Codificação de Video de EficiênciaElevada (HEVC). Em particular, uma combinação de duastransformadas unidimensionais separáveis, tais como uma de tipoDCT e DST, foi utilizada na norma HEVC em desenvolvimento.
Embora normas de codificação anteriores com base numa DCTutilizem uma transformada bidimensional (DCT 2D) , soluções maisrecentes aplicam uma combinação de DCT e DST a blocos preditoscom predição intra, i. e., em blocos que são preditosespacialmente. Tem sido demonstrado que a DST é uma melhorescolha do que a DCT para a transformação de linhas, quando apredição direcional resulta de uma direção que se encontra maisperto da horizontal do que da vertical e, de modo semelhante, éuma melhor escolha para a transformação de colunas quando apredição direcional se encontra mais perto da vertical. Nadireção restante (e. g., em filas, quando a DST é aplicada emcolunas), utiliza-se a DCT.
Para fins de implementação, na codificação de video, é comumutilizar aproximações de números inteiros de DCT e DST que nadescrição que se segue, serão simplesmente designadas por DCT eDST. Uma das soluções para uma transformada tipo DCT de númerosinteiros utiliza uma representação de dados intermédia de16 bits e é conhecida como borboleta parcial devido à sua forma.As suas principais propriedades são iguais às propriedades de(anti)simetria da DCT, vetores de base quase ortogonais,representação de dados de 16 bits antes e depois de cada fase detransformação, multiplicadores de 16 bits para todas asmultiplicações internas e sem necessidade de correção de diferentes normas de vetores de base durante a (des)quantificação. 0 documento da técnica anterior, MALVAR H S ET AL:"LOW—COMPLEXITY TRANSFORM AND QUANTIZATION IN H.264/AVC", IEEETRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY, IEEESERVICE CENTER, PISCATAWAY, NJ, US, vol. 13, N.2 7, páginas 598-603 de 1 de julho de 2003, apresenta uma visão genérica das conceções de transformadas e quantificação na normaH.264/AVC com um foco especial nas considerações sobre implementações de baixa complexidade utilizando aritmética denúmeros inteiros de 16 bits. O documento da técnica anterior, YUMI SOHN ET AL: "OneDimensional Transform For H.264 Based Intra Coding", 26. PICTURECODING SYMPOSIUM, Lisboa, 7 de novembro de 2007, divulga aadição de modos de transformadas alternativos para a normaH.264/AVC. O codificador pode selecionar entre a aplicação deuma transformada 2D convencional, uma transformada 1D vertical,uma transformada 1D horizontal ou nenhuma transformação ao sinalresidual de predição.
SUMÁRIO DA INVENÇÃO
Num aspeto, a presente invenção consiste num método decodificação de vídeo como definido na reivindicação 1. A presente invenção também consiste num método de descodificação de vídeo como definido na reivindicação 2.
Podem utilizar-se os mesmos fatores de escalonamento paratodos os coeficientes numa linha ou coluna escalonada.
De um modo preferido, uma matriz de quantificação que tem osmesmos valores em cada coluna é aplicada quando uma transformadaagindo sobre as colunas é ignorada e uma matriz de quantificaçãoque tem os mesmos valores em cada linha é aplicada quando umatransformada agindo sobre as linhas é ignorada.
Pode realizar-se um varrimento duplo quando um bloco decoeficientes de transformada é representado com sub-blocos decoeficientes; cada sub-bloco é visitado num varrimento ao níveldos sub-blocos e utiliza-se um varrimento no interior de cadasub-bloco.
As características preferidas que se seguem são relevantespara cada um dos aspetos da invenção definida acima. 0 conjunto de modos de salto de transformadas podecompreender os dois modos seguintes: transformada sobre linhas ecolunas; e nenhuma transformada. Em alternativa, o conjunto demodos de salto de transformadas pode compreender os seguintesquatro modos de: transformada sobre linhas e colunas; transformada apenas sobre as linhas; transformada apenas sobreas colunas; e nenhuma transformada. A seleção de modo pode ser sinalizada para umdescodificador, sendo atribuída a cada modo uma palavra decódigo. 0 mesmo modo de salto de transformadas pode serutilizado em todos os componentes (luminância - Y e crominância- U e V) de um bloco YUV. 0 modo de salto de transformadas podeser sinalizado para todos os componentes YUV de um bloco, para um grupo de blocos, e é sinalizado separadamente para cadacomponente, para outro grupo de blocos. Assim, em HEVC pode serútil ter uma sinalização de modo YUV conjunta para blocoscodificados de modo INTER, e um modo TSM separado para cadacomponente para os blocos codificados de modo INTRA.
Pode não ser necessário sinalizar o modo de salto detransformadas para blocos tendo apenas coeficientes de valornulo. Pode não ser necessário sinalizá-lo quando o componente deluminância tem apenas valores nulos; neste caso, utiliza-se umatransformada 2D em componentes de crominância. Pode não sernecessário sinalizá-lo quando o único coeficiente de valor nãonulo do componente de luminância é o canto superior esquerdo dobloco (componente DC) e, neste caso, utiliza-se uma transformada2D em componentes de crominância. 0 modo de salto detransformadas pode ser apenas sinalizado para blocos com outrosmodos predefinidos (e. g. preditos apenas a partir de outrosfotogramas).
Em alguns exemplos, a ordem de varrimento de coeficientesdentro de um bloco na fase de codificação por entropia pode seradaptada de acordo com o modo de salto de transformadas. Assim,pode ser empregue um varrimento linha-a-linha quando atransformada sobre linhas é ignorada e a transformada sobrecolunas é mantida, ser empregue um varrimento coluna-a-colunaquando a transformada sobre colunas é ignorada e a transformadasobre linhas é mantida.
DESCRIÇÃO DETALHADA DA PRESENTE INVENÇÃO A presente invenção irá agora, ser descrita a titulo deexemplo e recorrendo aos desenhos anexos, nos quais: A Figura 1 é um diagrama de blocos ilustrando umacaracteristica num codificador de acordo com uma forma derealização da invenção; A Figura 2 é um diagrama de blocos ilustrando a caracteristica num descodificador de acordo com a forma derealização; A Figura 3 é um diagrama ilustrando uma alternativa àabordagem de varrimento em ziguezague conhecido; A Figura 4 é um diagrama ilustrando outra abordagem devarrimento alternativa; A Figura 5 é um diagrama de blocos ilustrando uma caracteristica num codificador de acordo com outra forma derealização da invenção; A Figura 6 é um diagrama de blocos ilustrando a caracteristica num descodificador de acordo com a forma derealização; A Figura 7 é um diagrama de blocos ilustrando uma caracteristica num descodificador de acordo com outra formade realização da invenção
Esta invenção apresenta um modo para executar o processo detransformação - Modo de Salto de Transformadas (TSM). Como descrito acima, a transformada mais comum utilizada na codificação de vídeo é a DCT. 0 seu desempenho de compactação deenergia depende da correlação do resíduo. Também se descreveucomo é que o resíduo pode ser significativamente descorrelacionado ou correlacionado apenas numa direção, fazendo com que a DCT 2D seja menos eficiente. Propõe-se ignorar oprocesso de transformação quando o codificador toma essa decisãonum sentido de distorção-taxa. 0 modo de transformada selecionado deve ser sinalizado ao descodificador, que, emseguida, realiza uma combinação de transformada/salto detransformada conforme definido na sinalização. É possível funcionar com dois modos, isto é, um primeiromodo com uma transformada 2D (compreendendo a transformada sobrelinhas e a transformada sobre colunas) e um segundo modo semtransformadas.
Em grande parte da descrição que se segue, esses modos sãocomplementados com modos adicionais formados ao ignorar apenas atransformada sobre linhas ou apenas a transformada sobrecolunas. Assim, são definidos quatro modos de transformada, comoapresentado no Tabela 1.
Tabela 1 - Opções de Modo de Salto de Transformadas 0 modo TSO corresponde a uma transformada 2D, i. e., DCT 2D.0 modo TS1 define a aplicação de uma DCT unidimensional horizontal seguida por um salto de transformada na direçãoortogonal, i. e., ignora-se a transformada sobre colunas. TS2define a ignorância da transformada horizontal, enquanto apenasas colunas são transformadas. Finalmente, o modo TS3 ignoracompletamente as transformadas em ambos os eixos, i. e., nenhumatransformada é aplicada ao sinal de entrada.
As Figuras 1 e 2 mostram diagramas de blocos nucleares demodos de salto de transformadas, para codificador edescodificador, respetivamente. Cada modo de salto detransformadas é selecionado com um correspondente (TfO, Tfl) parde sinalizadores, de modo a que TSO: (1, 1), TS1: (1, 0), TS2:(0, 1) e TS3: (0, 0) .
Quanto a quaisquer outros bits adicionais de um fluxo debits comprimido que permitem uma opção adaptativa, umasinalização do modo de salto de transformadas pode serdispendiosa. Por conseguinte, são concebidas várias estratégiaspara maximizar a eficiência da codificação.
Quatro opções do TSM podem ser sinalizadas utilizandopalavras de código cuidadosamente concebidas. Essas palavras decódigo não precisam de ser transmitidas para cada bloco, masalguns outros métodos podem ser utilizados para poupar avelocidade de transmissão de bits necessária
Algumas das possibilidades para reduzir o custo desinalização são enunciadas em seguida; influenciando cada opçãopartes relacionadas com as transformadas do codificador edescodificador: 1. 0 mesmo modo de transformada utilizado em todos oscomponentes (luminância - Y e crominância - U e V) deum bloco YUV; por conseguinte, para blocoscolocalizados Y, U e V apenas uma escolha de TSM étransmitida. 2. 0 TSM não é sinalizado quando todos os blocosquantificados (Y, U e V) têm apenas coeficientes comvalores nulos. 3. 0 TSM não é sinalizado para blocos quando o bloco Y temapenas coeficientes de valor nulo e, depois, DCT 2D éutilizada em componentes U e V. 4. 0 TSM é sinalizado apenas para blocos com determinadosoutros modos (e. g.r bidirecional predito); de outraforma, aplica-se DCT 2D. 5. Aplicação de TSM sinalizado num conjunto de blocos (se"Ligado", então, modos TS sinalizados para cada blocodo conjunto) . 6. 0 TSM é sinalizado num conjunto de blocos (e. g., todosos sub-blocos partilham o mesmo TSM). 7. 0 TSM é sinalizado se determinadas outras características do bloco estiverem presentes; e. g., oTSM não é sinalizado quando o bloco Y tem apenas umvalor não nulo e esse valor se encontra no cantosuperior esquerdo do bloco (componente DC); nesse caso,utiliza-se DCT 2D para todos os componentes.
Quatro modos TSM (transformada 2D, duas transformadas debloco 1D e transformada ignorada num bloco) podem ser definidoscom várias palavras de código, e. g., com palavras simples de2 bits ou com mais bits (i. e., com códigos unários):
Se se utilizar codificação aritmética, cada elemento binárioda palavra de código pode ser codificado com diferentes modelosde probabilidade (i. e., estados de contexto inicial para cadasegmento), dependendo do tamanho de bloco atual e do valor QP.
Por outro lado, se se utilizar codificação de comprimentovariável, as palavras de código de TSM podem ser codificadas deforma independente de ou misturada com outros elementos desintaxe, para reduzir a carga adicional de sinalização.
Em algumas abordagens, um bloco nem sempre é transformado deuma só vez, mas são aplicadas, em vez disso, opções para a suadivisão em subunidades mais pequenas e transformadas sãoaplicadas em cada subunidade. 0 método de Árvore QuaternáriaResidual (RQT) é representativo de uma tal estrutura detransformadas. Embora a aplicação do TSM em blocos que nãocontinuam a ser subdivididos em unidades mais pequenas tenhasido assumido até agora, o TSM também pode ser aplicado em taisestruturas de transformadas com múltiplas divisões. Váriasopções são identificadas: 1. 0 TSM é decidido a um nível de blocos e a mesma escolhade transformada é aplicada em cada subunidade. 2. 0 TSM é ativado apenas ao nível da raiz da estrutura detransformação, i. e.r quando um bloco não continua aser dividido em unidades mais pequenas quando umaestrutura com múltiplas divisões é habilitada; se umbloco for dividido em unidades mais pequenas, cadaunidade é transformada utilizando uma transformada 2D. 3. 0 TSM é decidido e sinalizado para cada subunidade,independentemente da sua profundidade. 4. 0 TSM é decidido e sinalizado para subunidades, até umaprofundidade (tamanho) específica das unidades; parasubunidades mais pequenas, quando 0 TSB não ésinalizado, utiliza—se uma transformada 2D.
Os coeficientes dentro de um bloco podem ter característicasdiferentes, quando a transformada não é realizada numa ou emambas as direções. Deste modo, podem ser aplicadas diferentesestratégias de codificação, dependendo do modo de salto detransformadas, para comprimir com mais eficácia determinadoscoeficientes.
Quando uma transformada 2D é aplicada num bloco, oscoeficientes resultantes são, frequentemente, agrupados emdireção do canto superior esquerdo de um bloco, ou seja, sãocomponentes de baixa frequência. Um varrimento convencional,e. g., varrimento em ziguezague, é, por conseguinte, uma boaescolha para a codificação de tais sinais.
Se apenas se aplicar uma transformada ID (TS1 ou TS2), podeutilizar-se um varrimento adaptativo. Por exemplo, pode utilizar-se um varrimento linha-a-linha ou coluna-a-coluna para os casos TS2 e TS1, respetivamente, uma vez que se pode esperarque a transformada aplicada concentre os coeficientes no sentidodas frequências mais baixas.
No caso TS3, quando uma transformada não é aplicada emqualquer direção, pode utilizar-se um varrimento convencional(utilizado para um bloco transformado em 2D) . Em alternativa,pode empregar-se um padrão de varrimento diferente, queconsidera a probabilidade (implícita na decisão de não realizarqualquer transformada) de os coeficientes não nulos não seremuniformemente distribuídos. Por exemplo, os coeficientes podemser agrupados em "ilhas" cercadas por "mares" de coeficientesnulos.
Assim, numa nova configuração, as posições do primeiro eúltimo coeficientes significativos dentro de um bloco podem sertransmitidas no fluxo de bits e um varrimento convencional decoeficientes dentro de um bloco pode, então, ser realizado. Istoé mostrado na Figura 3, onde os quadrados brancos representamcoeficientes que não são codificados e têm um valor zero, osquadrados cinzentos representam coeficientes que serão codificados, i. e., incluem coeficientes significativos (nãonulos), em que o primeiro coeficiente codificado é identificadopela letra "F" e o último coeficiente codificado é identificadocom a letra "L" . 0 varrimento é efetuado apenas em linhas e colunas que pertencem a área definida pelo primeiro e o últimocoeficiente. Neste método de varrimento, as coordenadas x e y doprimeiro coeficiente têm que ser iguais ou menores do que ascoordenadas x e y do último coeficiente significativo.
Esta configuração deve conduzir a uma codificação altamenteeficiente no caso em que os coeficientes não nulos estão agrupados, mas requer uma complexidade adicional no codificadorpara determinar as posições do primeiro e último coeficientessignificativos dentro de um bloco, em conjunto com a necessidadede sinalizar essas posições para o descodificador.
Em alternativa, utiliza-se um varrimento duplo emziguezague, como retratado na Figura 4, onde um bloco decoeficientes de transformada está representado com sub-blocos decoeficientes. Cada sub-bloco é visitado no varrimento emziguezague ao nivel dos sub-blocos e utiliza-se um varrimento emziguezague dentro de cada bloco (ou qualquer outro varrimento).Isto permite um melhor agrupamento de coeficientes não nulos,que tendem a ficar espacialmente próximos.
Será desejável, quando é tomada a decisão de ignorar uma ouambas as transformadas 1D, minimizar ou eliminar a necessidadede alterar outros elementos do processo para acomodar atransformada ou transformadas ignoradas.
Aqui, identificam-se duas estratégias de implementação dafase de transformada adaptativa: 1) ignorar transformada selecionada de linhas/colunas emodificar fase de quantificação. 2) substituir transformada selecionada de linhas/colunaspor um passo de escalonamento adequado e adaptar opasso de quantificação, se necessário.
Embora a primeira estratégia seja adequadamente apresentadacom as Figuras 1 e 2, a segunda estratégia que empregaescalonamento é retratada nas Figuras 5 e 6. Uma das principaisrazões pelas quais o escalonamento é realizado é para manter os níveis de sinal, com a precisão mais elevada suportada, entreblocos de transformada. Isto é indicado utilizando a linha atracejado nas Figuras 5 e 6. 0 escalonamento é realizado ao escalonar cada valor de pixelde entrada por um fator que é derivado da norma-2 de vetores detransformada correspondentes (que seriam utilizados para obterum valor de coeficiente de transformada, na mesma posição numalinha/coluna, se a transformada fosse selecionada). Algumastransformadas têm propriedades próximo das propriedadesortonormais de cada vetor e essa propriedade pode simplificarainda mais a conceção de escalonamento já que pode utilizar-seum único valor para escalonar adequadamente uma linha/colunainteira na qual a transformada é ignorada.
Em seguida, discutem-se estratégias de escalonamento nocontexto de uma transformada DCT inteira com uma representaçãode dados intermédia de 16 bits. Deve reconhecer-se, no entanto,que este é apenas um exemplo.
As transformadas utilizadas em HEVC têm as normas (TNn) , emque N é o tamanho da transformada, próximo dos seguintesnúmeros:
Transformada de 4-pontos: TN4 = 128 = 27; TNS4 = 7;
Transformada de 8-pontos: TN8 = 181 = 27'5; TNSs = 7,5;
Transformada de 16-pontos: TN46 = 256 = 28; TNS46 = 8;
Transformada de 32-pontos: TN32 = 362 = 28'5. TNS32 = 8,5; em que TNS é o parâmetro correspondente de Deslocamento de Normade Transformada (potência de 2 representada por deslocamento debit para a esquerda). Deve salientar-se que, em HEVC, cada vetor de transformada pode ter uma norma ligeiramente diferente, masestes números são boas aproximações para implementaçõespráticas. Este facto também está refletido nas conceções dequantificação e no ajuste do nivel de transformada parapreservar a representação de dados intermédia de 16 bits. Porexemplo, na conceção de um descodificador HEVC, um valor de16 bits introduz uma transformada inversa. Para obter umaprecisão de 16 bits entre as transformadas sobre colunas (lâfase inversa) e linhas (2a fase inversa) e uma precisão de 9+DBdepois da transformada sobre as linhas, ocorrem os seguintesdeslocamentos de bits ao nivel de sinal (considerando um tamanhode bloco de N x N): SHIFT = TNSn - SHIFTJNVJST + TNSn - (SHIFT_INV_2ND - DB), em que, pela norma, SHIFT_INV_1ST = 7 e SHIFT_INV_2ND = 12, e DBé o incremento de profundidade de bits para processamento(e. g., 0 ou 2) . A profundidade de bits de processamento interno é B=8+DB. Por conseguinte, SHIFT é igual a: SHIFT = 2 · TNSn -19 + DB = 2 · TNSn - 27 + B.
Isto corresponde ao parâmetro deslocamento de transformadautilizado na quantificação HEVC. Isto conduz a, para o exemploem que se considera um bloco 4x4 (TNS4 = 7) , -SHIFT4= 13-B, i. e., um deslocamento para a direita de 13-B.
Embora este exemplo possa ser utilizado para resolverajustes do nível de sinal para TS3, algumas considerações adicionais têm de ser tidas em conta quando a transformada é aplicada apenas numa direção. Isso acontece porque TNSn nemsempre são números inteiros e, assim, o deslocamento de bits nãoé a única opção para ajustes de nivel. Outras opções pararesolver conceções unificadas para tais combinações sãoabordadas no texto a seguir.
Quando uma transformada é substituída por escalonamento, afase de transformada adaptativa é concebida de modo a poder serintercalada na transformada DCT inteira com representação de dados intermédia de 16 bits, i. e., com o objetivo de substituiralgumas das suas partes e de ser compatível com o resto do codec que suporta uma transformada 2D original. Por exemplo, uma não aplicação de uma transformada pode ser utilizada em linhas de ummodo que seja ainda compatível com a parte da transformada 2Dque é aplicada em colunas. Isto significa que a quantificaçãoaplicada para a transformada 2D também pode ser utilizada comuma escolha de transformada adaptativa. 0 salto da transformada para diante é definido para linhas ecolunas separadamente.
Em amostras x de linhas o salto de transformada é aplicado como: y = (x.scale + offset) deslocado para a direita por S bits (a) em que:
S = M - 1 + DB offset = 1 deslocado para a esquerda por (S - 1) bits DB = B - incremento de profundidade de 8 bits paraprocessamento M = log2 (N), em que N é o tamanho da linha/coluna no númerode pixéis e scale é um multiplicador inteiro sem sinal.
Nas colunas, o salto de transformada é aplicado como em (a),em que x são amostras de colunas, mas com: S = M + 6 offset = 1 deslocado para a esquerda por (S - 1) bits
Desta forma, é assegurada uma largura de bits de 16, depoisde cada fase de transformada, como na transformada 2D.
Novamente, fatores de escala são concebidos de modo a haveruma aproximação à norma-2 de vetores de transformadarelacionados (scaleN2 = TNn2 = N. 642) e a ser um número inteiro.Em amostras x de colunas o salto de transformada inversa éaplicado como y = (x.scale + offset) deslocado para a direita por S bitsem que: S=7 offset = 1 deslocado para a esquerda por (S - 1) bits e a escala é igual à do salto para diante.
Nas linhas, é aplicada a mesma operação de salto detransformada, mas com: S = 12 DB, em que DB é igual ao caso do salto de transformada para diante.
De modo a poupar um processamento desnecessário de pixéis,em que uma ou ambas as transformadas 1D são ignoradas, o escalonamento pode ser passado para quantificação. Além disso(por exemplo), mesmo que seja mantida apenas a transformadavertical, esta pode ser adaptada, para assegurar uma representação de pixéis máxima de 16 bits. Isso permite umaplena utilização da largura de bits disponível. Por conseguinte,o escalonamento em quantificação tem de ser adaptado, não só devido ao escalonamento relacionado com a transformada ignorada,mas também relacionado com um novo escalonamento dentro de umatransformada. TSM = TSO (transformada 2D)
Utiliza-se uma transformada 2D regular e quantificaçãocorrespondente. TSM - TS1 (transformada 1D em linhas) e TS2 (transformada 1Dem colunas)
Em ambos os casos, a transformada para diante corresponde àtransformada original de linhas y = (x + offset) deslocado para a direita por S bits (b)em que: x é o valor original do bloco residual, S = Μ - 1 + DB, offset = 1 deslocado para a esquerda por (S - 1) bits e M e DB são os mesmos que em (a).
Isso garante uma precisão de dados intermédia de 16 bits. A quantificação é adaptada e tem em conta o nível a que osinal se encontra agora. TSM = TS3 (sem transformada)
Os pixéis residuais são diretamente quantificados utilizandoa matriz plana, de modo a que o nível de sinal corresponda aosníveis de coeficientes quantificados que são transformados em 2De quantificados.
Outro exemplo de como o nível do sinal pode ser ajustadoquando uma transformada é ignorada é apresentado a seguir, comreferência à Figura 7. Neste exemplo, o objetivo é reduzir umnúmero de operações necessárias para atingir o desempenhodesejado. Neste contexto, em que uma transformada ou suas partespodem ser ignoradas ou substituídas, esta técnica utiliza umacombinação de uma ou mais operações básicas: 1. Mudanças do deslocamento de bits dentro de fases detransformada; 2. Ajuste de quantificação que corresponde ao escalonamentode um sinal por um fator inferior a 2; 3. Substituição da transformada ou suas partes por umescalar fora da quantificação.
Cada escalonamento do sinal pode ser representado por umescalonamento por um fator de 2N (em que N é um número inteiropositivo) e por um escalonamento por um fator M que é menor doque 2. Deve salientar-se que, neste caso, N é o tamanho detransformada, como no exemplo anterior). Nesta invenção,Operação 1 possibilita um escalonamento de sinal por um fator de2n (deslocamento de bits) e Operação 2 possibilita um escalonamento por Μ. A escolha de M é, tipicamente, limitada edepende da conceção de quantificação. Um componente típico deuma transformada 1D em codificação de vídeo é o deslocamento debits. Por conseguinte, a Operação 1 aplicada aqui permite, facilmente, o ajuste de um nível de sinal por um fator de 2N. No caso em que ambas as transformadas são ignoradas, o ajuste donível do sinal pode ser realizado no bloco "Escalonamento" daFigura 7, que corresponde a Operação 3. Em qualquer caso, o ajuste do sinal por um fator inferior a 2, um deslocamento deparâmetro de quantificação ou fator de escalonamento de quantificação, podem ser adequadamente escolhidos para efetuar oajuste de nível de sinal requerido. Por exemplo, na Codificaçãode Vídeo de Eficiência Elevada (HEVC), a adição de um deslocamento de 3 a um parâmetro de quantificação é equivalentea ajustar o nível do sinal por raiz quadrada de (2) (raiz 2).
Deve compreender-se que a invenção foi descrita apenas atítulo de exemplo e que uma grande variedade de modificações sãopossíveis sem se divergir do âmbito da invenção como definidonas reivindicações anexas. Aspetos que são aqui descritos emdeterminadas combinações podem ser aplicados utilmente em outrascombinações, além das especificamente mencionadas e podem, emcertos casos, ser utilizados individualmente. Por exemplo, as abordagens de varrimento na codificação de vídeo oudescodificação, em que: as posições dos primeiro e último coeficientes a codificar/descodifrear dentro de um bloco são sinalizadaspara o descodificador e um varrimento dos coeficientes éefetuado entre os referidos primeiro e último coeficientes; ou um varrimento duplo é efetuado quando um bloco de coeficientes de transformada é representado com sub-blocosde coeficientes; sendo cada sub-bloco visitado por um varrimento em ziguezague ao nível dos sub-blocos e dentro decada sub-bloco é utilizado um padrão de varrimentoadicional; podem ser úteis para além do caso de modo de salto de transformada.
Embora aspetos da presente invenção tenham sido ilustradoscom quatro modos de salto de transformadas é possível, como seobservou acima, em determinadas aplicações, funcionar com apenasdois desses modos.
Lisboa, 31 de maio de 2016

Claims (14)

  1. REIVINDICAÇÕES
    1. Método de codificação de video de acordo com HEVC utilizandouma transformada de linhas agindo sobre linhas de um blocode valores de imagem e tendo um vetor de transformada delinhas, e uma transformada de colunas agindo sobre colunasdo bloco de valores de imagem e tendo um vetor detransformada de colunas, compreendendo os passos deestabelecer um conjunto de modos de transformada incluindoum modo de salto, em que uma ou ambas de entre atransformada de linhas e transformada de colunas sãoignoradas; selecionar um dos referidos modos; para qualquerbloco onde uma transformada é ignorada, aplicar um fator deescalonamento aos valores de imagem correspondentes dessebloco, em que o fator de escalonamento é o produto de 64pela raiz quadrada do tamanho do vetor de transformada datransformada ignorada e é um número inteiro; e para, pelomenos, alguns blocos ou conjuntos de blocos, fornecer umaindicação do modo selecionado para um descodificador.
  2. 2. Método de descodificação de vídeo de acordo com HEVC quetenha sido codificado utilizando uma transformada de linhasoperando sobre linhas de um bloco de valores de imagem etendo um vetor de transformada de linhas, e uma transformadade colunas agindo sobre colunas do bloco de valores deimagem e tendo um vetor de transformada de colunas;compreendendo os passos de receber para, pelo menos, algunsblocos ou conjuntos de blocos, uma indicação do modo desalto de transformadas, em que uma ou ambas de entre atransformada de linhas e transformada de colunas sãoignoradas; aplicar transformadas inversas de acordo com o modo e aplicar escalonamento inverso a quaisquer valores deimagem não transformados, sendo o fator de escalonamento oproduto de 64 pela raiz quadrada do tamanho do vetor de transformada da transformada ignorada e sendo um númerointeiro.
  3. 3. Método, de acordo com a Reivindicação 1 ou Reivindicação 2, em que se utilizam os mesmos fatores de escalonamento para todos os coeficientes na linha ou coluna escalonadas.
  4. 4. Método, de acordo com qualquer uma das reivindicações anteriores, em que uma matriz de quantificação que tem osmesmos valores em cada coluna é aplicada quando uma transformada agindo sobre as colunas é ignorada, e umamatriz de quantificação que tem os mesmos valores em cadalinha é aplicada quando uma transformada agindo sobre as linhas é ignorada.
  5. 5. Método, de acordo com qualquer uma das reivindicações anteriores, em que se executa um varrimento duplo quando umbloco de coeficientes de transformada é representado comsub-blocos de coeficientes; cada sub-bloco é visitado numvarrimento ao nivel dos sub-blocos e utiliza-se umvarrimento dentro de cada sub-bloco.
  6. 6. Método, de acordo com qualquer uma das reivindicações anteriores, em que o conjunto de modos de salto detransformadas compreende: transformada sobre linhas e colunas;transformada apenas sobre as linhas;transformada apenas sobre as colunas; sem transformada.
  7. 7. Método, de acordo com qualquer uma das reivindicaçõesanteriores, em que a seleção de modo é sinalizada a umdescodificador, sendo atribuída uma palavra de código a cadamodo.
  8. 8. Método, de acordo com qualquer uma das reivindicações anteriores, em que a ordem de varrimento dos coeficientesdentro de um bloco na fase de codificação por entropia éadaptada de acordo com o modo de salto de transformadas e,de um modo preferido, em que se emprega um varrimentolinha-a-linha quando a transformada de linhas é ignorada e atransformada de colunas é mantida, e se emprega umvarrimento coluna-a-coluna quando a transformada de colunasé ignorada e a transformada de linhas é mantida.
  9. 9. Método, de acordo com qualquer uma das reivindicações anteriores, em que o modo de salto de transformadas ésinalizado para todos os componentes YUV de um bloco, paraum grupo de blocos, e é sinalizado separadamente para cadacomponente para outro grupo de blocos.
  10. 10. Método, de acordo com qualquer uma das reivindicações anteriores, em que o mesmo modo de salto de transformadas éutilizado em todos os componentes (luminância - Y ecrominância - U e V) de um bloco YUV.
  11. 11. Método, de acordo com qualquer uma das reivindicações anteriores, em que o modo de salto de transformadas não ésinalizado para blocos tendo apenas coeficientes de valornulo ou quando o componente de luminância tem apenas valores nulos; neste caso, uma transformada 2D é utilizada emcomponentes de crominância ou quando o único coeficiente devalor não nulo do componente de luminância é o cantosuperior esquerdo do bloco (componente DC), neste caso, umatransformada 2D é utilizada em componentes de crominância oué sinalizada apenas para blocos com outros modospredefinidos (e. g., preditos apenas a partir de outrosfotogramas).
  12. 12. Produto de programa de computador contendo instruções quefazem com que meios programáveis implementem um método deacordo com qualquer uma das reivindicações anteriores.
  13. 13. Descodificador de vídeo adaptado e configurado para funcionar de acordo com a Reivindicação 2 ou qualquerreivindicação dependente da Reivindicação 2.
  14. 14. Codificador de vídeo adaptado e configurado para funcionarde acordo com a Reivindicação 1 ou qualquer reivindicaçãodependente da Reivindicação 1.
PT127296986T 2011-06-27 2012-06-19 Codificação e descodificação de vídeo utilizando transformadas PT2652954E (pt)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
GB1110873.5A GB2492333B (en) 2011-06-27 2011-06-27 Video encoding and decoding using transforms

Publications (1)

Publication Number Publication Date
PT2652954E true PT2652954E (pt) 2016-06-07

Family

ID=44485219

Family Applications (1)

Application Number Title Priority Date Filing Date
PT127296986T PT2652954E (pt) 2011-06-27 2012-06-19 Codificação e descodificação de vídeo utilizando transformadas

Country Status (11)

Country Link
US (1) US8923406B2 (pt)
EP (2) EP2652954B1 (pt)
JP (2) JP6063935B2 (pt)
KR (1) KR101622450B1 (pt)
CN (2) CN103404141B (pt)
ES (1) ES2574278T3 (pt)
GB (1) GB2492333B (pt)
PL (1) PL2652954T3 (pt)
PT (1) PT2652954E (pt)
TW (1) TWI516095B (pt)
WO (2) WO2013001278A1 (pt)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11722698B2 (en) 2016-08-24 2023-08-08 Sony Corporation Image processing apparatus and image processing method

Families Citing this family (58)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR112014009433B1 (pt) 2011-10-17 2023-01-24 Kt Corporation Método de decodificação de vídeo
CN107257457B (zh) * 2011-10-17 2020-04-21 株式会社Kt 利用解码装置解码视频信号的方法
KR102030718B1 (ko) 2011-10-18 2019-10-10 주식회사 케이티 영상 부호화 방법, 영상 복호화 방법, 영상 부호화기 및 영상 복호화기
RU2626013C1 (ru) 2011-10-19 2017-07-21 Кт Корпорейшен Способ декодирования видеосигнала
US9654139B2 (en) 2012-01-19 2017-05-16 Huawei Technologies Co., Ltd. High throughput binarization (HTB) method for CABAC in HEVC
US20130188736A1 (en) 2012-01-19 2013-07-25 Sharp Laboratories Of America, Inc. High throughput significance map processing for cabac in hevc
US10616581B2 (en) 2012-01-19 2020-04-07 Huawei Technologies Co., Ltd. Modified coding for a transform skipped block for CABAC in HEVC
EP2805492B1 (en) 2012-01-19 2018-11-14 VID SCALE, Inc. System and method of video coding quantization and dynamic range control
US9743116B2 (en) 2012-01-19 2017-08-22 Huawei Technologies Co., Ltd. High throughput coding for CABAC in HEVC
US9860527B2 (en) 2012-01-19 2018-01-02 Huawei Technologies Co., Ltd. High throughput residual coding for a transform skipped block for CABAC in HEVC
CN109905710B (zh) * 2012-06-12 2021-12-21 太阳专利托管公司 动态图像编码方法及装置、动态图像解码方法及装置
US9426466B2 (en) 2012-06-22 2016-08-23 Qualcomm Incorporated Transform skip mode
GB2503875B (en) 2012-06-29 2015-06-10 Canon Kk Method and device for encoding or decoding an image
US9877025B2 (en) 2013-07-12 2018-01-23 British Broadcasting Corporation Video encoding and decoding with prediction at higher precision
JP6139774B2 (ja) * 2013-07-15 2017-05-31 ホアウェイ・テクノロジーズ・カンパニー・リミテッド Hevcにおけるcabacのための変換スキップされたブロックのための修正コーディング
KR101709775B1 (ko) 2013-07-23 2017-02-23 인텔렉추얼디스커버리 주식회사 영상 부호화/복호화 방법 및 장치
US9445132B2 (en) 2013-09-09 2016-09-13 Qualcomm Incorporated Two level last significant coefficient (LSC) position coding
GB2518823A (en) 2013-09-25 2015-04-08 Sony Corp Data encoding and decoding
JP6287035B2 (ja) * 2013-10-11 2018-03-07 ソニー株式会社 復号装置および復号方法
US20160227253A1 (en) * 2013-10-11 2016-08-04 Sony Corporation Decoding device, decoding method, encoding device and encoding method
KR102185857B1 (ko) 2014-02-13 2020-12-02 삼성전자주식회사 영상 부호화, 복호화 방법 및 장치
CN107211146A (zh) * 2014-11-21 2017-09-26 Vid拓展公司 一维变换模式和系数扫描顺序
KR102365685B1 (ko) 2015-01-05 2022-02-21 삼성전자주식회사 인코더의 작동 방법과 상기 인코더를 포함하는 장치들
KR102390407B1 (ko) * 2015-03-18 2022-04-25 한화테크윈 주식회사 디코더 및 디코더에서의 역변환 방법
KR20180040514A (ko) 2015-09-10 2018-04-20 삼성전자주식회사 부호화 장치, 복호화 장치 및 그 부호화 방법 및 복호화 방법
WO2017052174A1 (ko) * 2015-09-21 2017-03-30 엘지전자(주) 계수 유도 예측을 이용하여 비디오 신호를 처리하는 방법 및 장치
US20170150186A1 (en) * 2015-11-25 2017-05-25 Qualcomm Incorporated Flexible transform tree structure in video coding
CN105578190B (zh) * 2016-02-03 2018-05-04 珠海全志科技股份有限公司 应用于视频硬解码的无损压缩方法及系统
US10244248B2 (en) * 2016-02-25 2019-03-26 Mediatek Inc. Residual processing circuit using single-path pipeline or multi-path pipeline and associated residual processing method
US10887626B2 (en) * 2016-05-13 2021-01-05 Sharp Kabushiki Kaisha Image decoding device and image encoding device
KR102397673B1 (ko) 2016-05-13 2022-05-16 소니그룹주식회사 화상 처리 장치 및 방법
CA3022221A1 (en) * 2016-05-13 2017-11-16 Sony Corporation Apparatus and method for image processing for suppressing a reduction of coding efficiency
US10728552B2 (en) 2016-09-30 2020-07-28 Sony Corporation Image processing apparatus and method
WO2018123644A1 (ja) 2016-12-28 2018-07-05 ソニー株式会社 画像処理装置および方法
KR20200031102A (ko) * 2017-07-28 2020-03-23 파나소닉 인텔렉츄얼 프로퍼티 코포레이션 오브 아메리카 부호화 장치, 복호 장치, 부호화 방법 및 복호 방법
WO2019022099A1 (ja) * 2017-07-28 2019-01-31 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 符号化装置、復号装置、符号化方法及び復号方法
CN115442606A (zh) * 2017-07-31 2022-12-06 韩国电子通信研究院 对图像编码和解码的方法及存储比特流的计算机可读介质
WO2019027302A1 (ko) 2017-08-04 2019-02-07 엘지전자 주식회사 비디오 압축을 위한 변환을 구성하는 방법 및 장치
EP3484151A1 (en) * 2017-11-13 2019-05-15 Thomson Licensing Method and apparatus for generating quantization matrices in video encoding and decoding
CN111788830B (zh) * 2017-12-13 2023-04-04 三星电子株式会社 视频解码方法及其装置以及视频编码方法及其装置
CN115776572A (zh) 2017-12-21 2023-03-10 Lg电子株式会社 图像解码和编码方法、存储比特流的介质和数据发送方法
KR20200096537A (ko) * 2018-01-02 2020-08-12 삼성전자주식회사 비디오 복호화 방법 및 그 장치 및 비디오 부호화 방법 및 그 장치
JP6477930B2 (ja) * 2018-01-17 2019-03-06 ソニー株式会社 符号化装置および符号化方法
CN112806018B (zh) * 2018-10-05 2024-05-17 韩国电子通信研究院 图像编码/解码方法和设备以及存储比特流的记录介质
US11412260B2 (en) * 2018-10-29 2022-08-09 Google Llc Geometric transforms for image compression
WO2020185027A1 (ko) * 2019-03-13 2020-09-17 현대자동차주식회사 데이터 블록에 변환 생략 모드를 효율적으로 적용하기 위한 방법 및 장치
CN113632493A (zh) * 2019-03-13 2021-11-09 北京字节跳动网络技术有限公司 变换跳过模式中的子块变换
JP6743225B2 (ja) * 2019-03-20 2020-08-19 キヤノン株式会社 画像復号装置、画像復号方法及びプログラム
JP6891325B2 (ja) * 2019-03-20 2021-06-18 キヤノン株式会社 画像符号化方法
US11695960B2 (en) * 2019-06-14 2023-07-04 Qualcomm Incorporated Transform and last significant coefficient position signaling for low-frequency non-separable transform in video coding
CN112135147B (zh) * 2019-06-24 2023-02-28 杭州海康威视数字技术股份有限公司 编码方法、解码方法及装置
CN110418138B (zh) * 2019-07-29 2021-08-27 北京奇艺世纪科技有限公司 视频处理方法、装置、电子设备及存储介质
CN117336482A (zh) 2019-08-20 2024-01-02 北京字节跳动网络技术有限公司 变换跳过模式的信令通知
WO2021047540A1 (en) 2019-09-09 2021-03-18 Beijing Bytedance Network Technology Co., Ltd. Coefficient scaling for high precision image and video coding
EP4018648A4 (en) 2019-09-21 2022-11-23 Beijing Bytedance Network Technology Co., Ltd. HIGH PRECISION TRANSFORMATION AND QUANTIZATION FOR IMAGE AND VIDEO CODING
CN115176476A (zh) * 2019-12-11 2022-10-11 索尼集团公司 图像处理装置、比特流生成方法、系数数据生成方法以及量化系数生成方法
EP4118823A1 (en) * 2020-03-12 2023-01-18 InterDigital VC Holdings France Method and apparatus for video encoding and decoding
WO2022037700A1 (en) * 2020-08-21 2022-02-24 Beijing Bytedance Network Technology Co., Ltd. Coding mode dependent selection of transform skip mode

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0542261B1 (en) * 1991-11-12 1998-10-21 Nippon Hoso Kyokai Method of performing high efficiency coding of image signal and system therefor
JP3361543B2 (ja) * 1992-01-27 2003-01-07 日本放送協会 画像信号符号化装置
JP3211989B2 (ja) * 1992-08-31 2001-09-25 日本ビクター株式会社 直交変換符号化装置及び復号化装置
KR0134504B1 (ko) * 1992-09-09 1998-04-23 배순훈 적응적 주파수 변환기를 가진 영상 부호화기
JPH06217280A (ja) * 1993-01-14 1994-08-05 Sony Corp 動画像符号化及び復号化装置
US6215898B1 (en) * 1997-04-15 2001-04-10 Interval Research Corporation Data processing system and method
KR20020064913A (ko) * 2000-09-27 2002-08-10 코닌클리케 필립스 일렉트로닉스 엔.브이. 데이터 디코딩
US7206459B2 (en) * 2001-07-31 2007-04-17 Ricoh Co., Ltd. Enhancement of compressed images
JP4267848B2 (ja) * 2001-09-25 2009-05-27 株式会社リコー 画像符号化装置、画像復号装置、画像符号化方法、及び、画像復号方法
CN101448162B (zh) * 2001-12-17 2013-01-02 微软公司 处理视频图像的方法
US7242713B2 (en) * 2002-05-02 2007-07-10 Microsoft Corporation 2-D transforms for image and video coding
US6795584B2 (en) * 2002-10-03 2004-09-21 Nokia Corporation Context-based adaptive variable length coding for adaptive block transforms
KR20050026318A (ko) * 2003-09-09 2005-03-15 삼성전자주식회사 인트라 스킵 모드를 포함하는 비디오 인코딩_디코딩 장치및 방법
CN101005620B (zh) * 2004-09-03 2011-08-10 微软公司 为隔行扫描和逐行扫描视频编码和解码宏块和运动信息中的革新
CN100488254C (zh) * 2005-11-30 2009-05-13 联合信源数字音视频技术(北京)有限公司 一种基于上下文的熵编码方法及解码方法
HUE044060T2 (hu) * 2006-01-09 2019-09-30 Musmann Hans Georg A predikciós hiba adaptív kódolása hibrid videó kódolásban
CN101106721A (zh) * 2006-07-10 2008-01-16 华为技术有限公司 一种编解码装置及相关编码器
CN101267553A (zh) * 2007-03-12 2008-09-17 华为技术有限公司 一种实现编、解码的方法和装置
KR101885258B1 (ko) * 2010-05-14 2018-08-06 삼성전자주식회사 비디오 신호의 부호화 방법과 그 장치, 및 비디오 복호화 방법과 그 장치
CN102447907A (zh) * 2012-01-31 2012-05-09 北京工业大学 一种针对hevc的视频序列的编码方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11722698B2 (en) 2016-08-24 2023-08-08 Sony Corporation Image processing apparatus and image processing method

Also Published As

Publication number Publication date
GB201110873D0 (en) 2011-08-10
JP2017098975A (ja) 2017-06-01
JP2014523175A (ja) 2014-09-08
WO2013001278A1 (en) 2013-01-03
CN105847815A (zh) 2016-08-10
CN105847815B (zh) 2019-05-10
GB2492333A (en) 2013-01-02
EP2652954B1 (en) 2016-03-30
TW201320751A (zh) 2013-05-16
US20140056362A1 (en) 2014-02-27
CN103404141B (zh) 2017-06-06
JP6328220B2 (ja) 2018-05-23
EP2652954A2 (en) 2013-10-23
JP6063935B2 (ja) 2017-01-18
PL2652954T3 (pl) 2016-10-31
GB2492333B (en) 2018-12-12
CN103404141A (zh) 2013-11-20
US8923406B2 (en) 2014-12-30
KR20140027932A (ko) 2014-03-07
TWI516095B (zh) 2016-01-01
WO2013001279A2 (en) 2013-01-03
ES2574278T3 (es) 2016-06-16
WO2013001279A3 (en) 2013-03-07
EP3026911A1 (en) 2016-06-01
KR101622450B1 (ko) 2016-05-18

Similar Documents

Publication Publication Date Title
PT2652954E (pt) Codificação e descodificação de vídeo utilizando transformadas
JP7445030B2 (ja) 統一された有意性マップ符号化方法および装置
US7916959B2 (en) Image encoding method, image decoding method, image encoding apparatus, image decoding apparatus, image encoding program, and image decoding program
JP2023040013A (ja) 適応ツリー選択を使用してバイナリ・セットをビデオ符号化およびビデオ復号する方法および装置
KR100751869B1 (ko) 적응 블록 변환을 위한 콘텍스트-기반 적응 가변장 부호화
JP2019017104A (ja) ビデオを復号化する方法、ビデオを符号化する方法、デコーダ、エンコーダ、復号プログラムを記録したコンピュータ読み取り可能な記録媒体、および符号化プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2005229632A (ja) 画像および/またはビデオ符号器と復号器における変換係数を符号化するための方法と装置および対応するコンピュータプログラムと対応するコンピュータによる読み出し可能な記憶媒体
CN112040230B (zh) 用于对图像或视频数据的当前块进行编码的方法
US20200068198A1 (en) Block-based video decoding method using pre-scan and apparatus thereof
US20050259742A1 (en) System and method for choosing tables in CAVLC
KR20210125089A (ko) 화상 복호 장치, 화상 복호 방법 및 프로그램
GB2559912A (en) Video encoding and decoding using transforms
WO2016143093A1 (ja) 動画像符号化装置及びそれに用いるIntra予測符号化方法、及び動画像復号化装置
JP2005318560A (ja) 可変長復号装置及び方法