BR112018004469B1 - Método de inter-predição para codificação de vídeo e aparelho para inter-predição em codificação de vídeo - Google Patents

Método de inter-predição para codificação de vídeo e aparelho para inter-predição em codificação de vídeo Download PDF

Info

Publication number
BR112018004469B1
BR112018004469B1 BR112018004469-5A BR112018004469A BR112018004469B1 BR 112018004469 B1 BR112018004469 B1 BR 112018004469B1 BR 112018004469 A BR112018004469 A BR 112018004469A BR 112018004469 B1 BR112018004469 B1 BR 112018004469B1
Authority
BR
Brazil
Prior art keywords
current block
prediction
inter
weighting factors
pixels
Prior art date
Application number
BR112018004469-5A
Other languages
English (en)
Other versions
BR112018004469A2 (pt
BR112018004469A8 (pt
Inventor
Ching-Yeh Chen
Chih-Wei Hsu
Han Huang
Yu-Wen Huang
Original Assignee
Hfi Innovation Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from PCT/CN2015/088952 external-priority patent/WO2017035831A1/en
Application filed by Hfi Innovation Inc filed Critical Hfi Innovation Inc
Publication of BR112018004469A2 publication Critical patent/BR112018004469A2/pt
Publication of BR112018004469A8 publication Critical patent/BR112018004469A8/pt
Publication of BR112018004469B1 publication Critical patent/BR112018004469B1/pt

Links

Abstract

MÉTODO E APARELHO DE INTER-PREDIÇÃO ADAPTATIVA EM CODIFICAÇAO DE VIDEO. Um método e aparelho de codificação de vídeo usando Inter-predição adaptativa são divulgados. Um processo de Inter-predição selecionado é determinado, em que o processo de Inter- predição selecionado seleciona um filtro de Interpredição a partir de vários filtros de Inter-predição para o bloco atual dependendo de primeiros dados de pixel que compreendem pixels reconstruídos vizinhos (NRP) do bloco atual. O processo de Inter-predição selecionado pode ser ainda determinado dependendo de pixels de compensação de movimento extras (EMCP) em torno de um bloco de referência compensado de movimento correspondente ao bloco atual. A distorção entre o NRP e o EMCP pode ser usada para determinar o filtro de Inter-predição selecionado. A distorção pode ser calculada usando uma soma de diferenças absolutas ou diferenças quadráticas entre o NRP e o EMCP.

Description

REFERÊNCIA CRUZADA PARA PEDIDOS RELACIONADOS
[001] A presente invenção reivindica prioridade ao Pedido de Patente PCT, número de série PCT/CN2015/088952, depositado em 6 de setembro de 2015. O Pedido de Patente PCT é aqui incorporado por referência na sua totalidade.
CAMPO TÉCNICO
[002] A presente invenção refere-se a codificação de vídeo de dados de vídeo. Em particular, a presente invenção relaciona-se com a Inter-predição adaptativa na codificação de vídeo para melhorar a eficiência de codificação.
FUNDAMENTOS
[003] Dados de vídeo requerem muito espaço de armazenamento para armazenar ou uma ampla largura de banda para transmitir. Junto com a crescente alta resolução e taxas de quadros mais altas, os requisitos de largura de banda de armazenamento ou transmissão seriam formidáveis se os dados de vídeo forem armazenados ou transmitidos de forma descompactada. Portanto, os dados de vídeo são frequentemente armazenados ou transmitidos em um formato comprimido usando técnicas de codificação de vídeo. A eficiência de codificação foi substancialmente melhorada usando formatos de compressão de vídeo mais recentes, como H.264/AVC e o padrão emergente HEVC (High Efficiency Video Coding).
[004] A Figura 1 ilustra um sistema de codificação de vídeo Inter/Intra adaptativa exemplar incorporando processamento de circuito fechado. Para Inter-predição, Estimativa de Movimento (ME)/Compensação de Movimento (MC) 112 são usados para fornecer dados de predição com base em dados de vídeo de outra imagem ou imagens. O Comutador 114 seleciona dados de Intra-Predição 110 ou Inter-predição e dados de predição selecionados são fornecidos à Somador 116 para formar erros de predição, também chamados de resíduos. O erro de predição é então processado por Transformada (T) 118 seguido por Quantização (Q) 120. Os resíduos transformados e quantificados são então codificados pelo Codificador de Entropia 122 para serem incluídos em um fluxo de bits de vídeo correspondente aos dados de vídeo compactados. Quando um modo de Inter-predição é usado, uma imagem ou imagens de referência devem ser reconstruídas também na extremidade de codificador. Consequentemente, os resíduos transformados e quantificados são processados por quantificação inversa (IQ) 124 e Transformação Inversa (TI) 126 para recuperar os resíduos. Os resíduos são então adicionados de volta aos dados de predição 136 em Reconstrução (REC) 128 para reconstruir dados de vídeo. Os dados de vídeo reconstruídos são armazenados em Armazenamento Temporário de Imagem de Referência 134 e usados para a predição de outros quadros. No entanto, o filtro de circuito fechado 130 (por exemplo, filtro de desbloqueio e/ou deslocamento adaptativo de amostra, SAO) pode ser aplicado aos dados de vídeo reconstruídos antes que os dados de vídeo sejam armazenados no armazenamento temporário de imagem de referência.
[005] A Figura 2 ilustra um diagrama de blocos de sistema de um decodificador de vídeo correspondente para o sistema de codificador na Figura 1. Uma vez que o codificador também contém um decodificador local para reconstruir os dados de vídeo, alguns componentes de decodificador já são usados no codificador, exceto para o decodificador de entropia 210. Além disso, apenas a compensação de movimento 220 é necessária para o lado de decodificador. O comutador 146 seleciona Intra-predição ou Inter-predição e os dados de predição selecionados são fornecidos à reconstrução (REC) 128 para serem combinados com resíduos recuperados. Além de realizar decodificação de entropia em resíduos comprimidos, decodificação de entropia 210 também é responsável pela decodificação de entropia de informação lateral e fornece a informação lateral aos respectivos blocos. Por exemplo, informação de modo Intra é fornecida à Intra-predição 110, a informação de modo Inter é fornecida à compensação de movimento 220, informação de filtro de circuito fechado é fornecida ao filtro de circuito fechado 130 e resíduos são fornecidos para quantificação inversa 124. Os resíduos são processados pelo IQ 124, IT 126 e posterior processo de reconstrução para reconstruir os dados de vídeo. Novamente, dados de vídeo reconstruídos a partir do REC 128 são submetidos a uma série de processamentos incluindo IQ 124 e IT 126 como mostrado na Figura 2 e estão sujeitos a artefatos de codificação. Os dados de vídeo reconstruídos são processados posteriormente pelo filtro de circuito fechado 130.
[006] No sistema de Codificação de vídeo de Alta Eficiência (HEVC), o macrobloco de tamanho fixo de H.264/AVC é substituído por um bloco flexível, denominada unidade de codificação (CU). Os pixels na CU compartilham os mesmos parâmetros de codificação para melhorar a eficiência de codificação. Uma CU pode começar com uma CU maior (LCU), que também é referida como unidade de árvore codificada (CTU) em HEVC. Cada CU é um bloco quadrado 2Nx2N e pode ser recursivamente dividida em quatro CUs menores até que o tamanho mínimo predefinido seja atingido. Uma vez que a divisão da árvore hierárquica de CU é feita, cada folha de CU é dividida em uma ou mais unidades de predição (PUs) de acordo com o tipo de predição e a partição de PU. Além disso, a unidade básica para codificação de transformada é tamanho quadrado chamado Unidade de Transformada (TU).
[007] Em HEVC, previsões Intra e Inter são aplicadas a cada bloco (ou seja, PU). Os modos de predição Intra usam os pixels reconstruídos vizinhos espaciais para gerar os preditores direcionais. Por outro lado, os modos de Inter- predição utilizam os quadros de referência reconstruídos temporalmente para gerar preditores compensados de movimento. Os resíduos de predição são codificados usando codificação de transformada, quantificação e entropia. Preditores mais precisos levarão a menor predição residual, o que, por sua vez, levará a menos dados compactados (ou seja, maior taxa de compressão).
[008] Inter-predições explorarão as correlações de pixels entre quadros e serão eficientes se a cena estiver estacionária ou o movimento for translacional. Nesse caso, a estimativa de movimento pode encontrar facilmente blocos semelhantes com valores de pixels semelhantes nos quadros vizinhos temporais. Para Inter-predição em HEVC, a Inter- predição pode ser uni-predição ou bi-predição. Para uni- predição, um bloco atual é previsto por um bloco de referência em uma imagem codificada anterior. Para bi- predição, um bloco atual é previsto por dois blocos de referência em duas imagens codificadas anteriores. A predição de dois blocos de referência é calculada para formar um preditor final para bi-predição.
[009] Em muitos padrões de codificação de vídeo, também são suportados vetores de movimento fracionários. Por exemplo, no padrão HEVC, a compensação de movimento fracionária é implementada usando um filtro de interpolação de 8 saídas predefinido para o componente luminância e um filtro de interpolação de 4 saídas predefinido para o componente cromático, respectivamente. No entanto, o processo de Inter-predição em HEVC é corrigido. Por exemplo, fatores de ponderação (ou seja, 0,5 e 0,5) na predição bidirecional ou coeficientes de filtro na compensação de movimento fracionária são corrigidos. Portanto, a Inter- predição convencional não pode se adaptar bem às características locais dos blocos. Portanto, para melhorar ainda mais a eficiência de compressão da Inter-predição, é desejável desenvolver o método de Inter-predição adaptativo.
SUMÁRIO
[010] Um método e aparelho de codificação de vídeo usando a Inter-predição adaptativa são divulgados. De acordo com a presente invenção, é determinado um processo de Inter- predição selecionado, em que o processo de Inter-predição selecionado seleciona um filtro de Inter-predição de múltiplos filtros de Inter-predição para o bloco atual, dependendo dos primeiros dados de pixel compreendendo pixels reconstruídos vizinhos do bloco atual. O bloco atual é então codificado ou decodificado usando o processo de Inter- predição selecionado. Os primeiros dados de pixel podem ainda compreender pixels compensados de movimento extras em torno de um bloco de referência compensado de movimento correspondente ao bloco atual. A distorção entre os pixels reconstruídos vizinhos do bloco atual e os pixels compensados de movimento extras em torno do bloco de referência compensado de movimento pode ser usada para determinar o filtro de Inter-predição. A distorção pode ser calculada usando uma soma de diferenças absolutas ou diferenças quadráticas entre os pixels reconstruídos vizinhos do bloco atual e os pixels compensados de movimento extras ao redor do bloco de referência compensado de movimento. Os primeiros dados de pixel foram selecionados com base em informação de movimento do bloco atual e informação de movimento de pixels reconstruídos vizinhos do bloco atual. Os pixels reconstruídos vizinhos do bloco atual podem compreender uma ou mais linhas ou colunas de pixels vizinhos acima do limite superior do bloco atual. Os pixels reconstruídos vizinhos do bloco atual podem ser selecionados usando sub-amostra.
[011] Em uma modalidade, os múltiplos filtros de Inter- predição têm diferentes números de saídas de filtro, diferentes coeficientes de filtro ou ambos. O processo de Inter-predição selecionado é determinado pela seleção entre um grupo de processos de Inter-predição, que inclui um processo de Inter-predição, que suporta os múltiplos filtros de Inter-predição, um processo de Inter-predição ativo que suporta múltiplos conjuntos de fatores de ponderação para a predição bidirecional, ou um processo de Inter-predição ativo suportando ambos os múltiplos filtros de Inter- predição e os múltiplos conjuntos de fatores de ponderação. A informação associada ao grupo de processos de Inter- predição pode ser sinalizada em um nível de sequência, nível de imagem ou nível de fatia de fluxo de bits de vídeo. O grupo de processos de Inter-predição pode ser determinado de acordo com o tipo de fatia, o modo de predição ou a informação de movimento. A informação do processo de Inter-predição selecionado pode ser sinalizada de forma explícita a partir de um codificador para um decodificador. Se o uso do processo de Inter-predição selecionado está habilitado ou desativado pode ser sinalizado em um nível de sequência, nível de imagem, nível de fatia, nível de unidade de codificação ou nível de unidade de predição de fluxo de bits de vídeo.
[012] Em outra modalidade, é determinado um processo de Inter-predição selecionado, no qual o processo de Inter- predição selecionado seleciona um conjunto de fatores de ponderação de múltiplos conjuntos de fatores de ponderação para o bloco atual para predição bidirecional e, em seguida, o bloco atual é codificado ou decodificado usando o processo de predição selecionado. Os conjuntos múltiplos de fatores de ponderação compreendem [0,5, 0,5], [0,25, 0,75], [0,75, 0,25], [0,375, 0,625] e [0,625, 0,375]. Para o caso de múltiplos conjuntos de fatores de ponderação, a distorção entre pixels reconstruídos vizinhos do bloco atual e pixels compensados de movimento extras em torno de um bloco de referência compensado de movimento correspondente ao bloco atual é usada para determinar o conjunto de fatores de ponderação. O primeiro preditor associado à primeira informação de movimento e segundo preditor associado à segunda informação de movimento são derivados apenas uma vez para cada pixel dos pixels reconstruídos vizinhos do bloco atual. Uma soma e uma diferença associada ao primeiro preditor e ao segundo preditor são determinadas para cada pixel dos pixels reconstruídos vizinhos do bloco atual. Posteriormente, distorções associadas aos fatores de ponderação, [0,5, 0,5], [0,625, 0,375], [0,375, 0,625], [0,75, 0,25] e [0,25, 0,75] são calculadas como D0 = (X << 3) -Q, D1 = D0 -R, D2 = D0 + R, D3 = D1-R e D4 = D2 + R, respectivamente, onde X denota um valor reconstruído dos pixels reconstruídos vizinhos do bloco atual.
BREVE DESCRIÇÃO DOS DESENHOS
[013] A Figura 1 ilustra um exemplo de sistema adaptativo de codificação de vídeo Inter/Intra usando transformada, quantificação e processamento de circuito fechado.
[014] A Figura 2 ilustra um exemplo de sistema adaptativo de decodificação de vídeo Inter/Intra usando transformada, quantificação e processamento de circuito fechado.
[015] A Figura 3 ilustra um exemplo de Inter-predição adaptativa por selecionar um método de Inter-predição por um processo de Inter-predição selecionado baseado na distorção entre pixels reconstruídos vizinhos do bloco atual e pixels compensados de movimento estendidos de um bloco de referência compensado de movimento correspondente ao bloco atual de acordo com uma modalidade da presente invenção.
[016] A Figura 4 ilustra um exemplo de Inter-predição adaptativa por selecionar um filtro de interpolação entre três candidatos por um processo de Inter-predição selecionado baseado na distorção entre pixels reconstruídos vizinhos do bloco atual e pixels de compensação de movimento estendidos de um bloco de referência compensado de movimento correspondente ao bloco atual de acordo com uma modalidade da presente invenção.
[017] A Figura 5 ilustra um fluxograma exemplar para um sistema de codificação de vídeo que utiliza a Inter-predição adaptativa de acordo com uma modalidade da presente invenção.
DESCRIÇÃO DETALHADA
[018] A descrição a seguir é do modo mais bem contemplado de realização da invenção. Esta descrição é feita com o objetivo de ilustrar os princípios gerais da invenção e não deve ser tomada em um sentido limitativo. O âmbito da invenção é melhor determinado por referência às reivindicações anexas.
[019] Como mencionado anteriormente, a Inter-predição convencional é bastante estática e não pode se adaptar às características locais no vídeo subjacente. Consequentemente, em uma modalidade da presente invenção, a correlação entre um bloco atual e pixels reconstruídos vizinhos é utilizada para alcançar a adaptação local da Inter-predição. O método é referido como Inter-Predição Adaptativa.
[020] Em uma modalidade, podem ser utilizados mais de um processo de Inter-predição e os pixels reconstruídos vizinhos em torno de um bloco atual são usados para o processo de Inter-predição selecionado para selecionar um método de Inter-predição correspondente a um filtro de interpolação e/ou um conjunto de fatores de ponderação para o bloco atual. Os mais de um processo de Inter-predição podem corresponder a um processo de Inter-predição que suporta diferentes filtros de interpolação (também denominados filtros de Inter-predição) e/ou um processo de Inter- predição que suporta diferentes conjuntos de fatores de ponderação para a predição bidirecional. Os diferentes filtros de interpolação podem corresponder a diferentes números de saídas de filtro e/ou coeficientes de filtro diferentes.
[021] Em uma modalidade, a seleção entre diferentes filtros de Inter-predição pode ser dependente de pixels reconstruídos vizinhos (NRP) em torno do bloco atual. A seleção entre os diferentes filtros de Inter-predição também pode depender dos pixels compensados de movimento extras para pixels reconstruídos vizinhos em torno do bloco atual. Os pixels reconstruídos vizinhos podem ser selecionados com base em informação de movimento do bloco atual e pixels reconstruídos vizinhos. Por exemplo, com base na comparação de movimento entre a informação de movimento do bloco atual e os pixels reconstruídos vizinhos, apenas os pixels reconstruídos vizinhos no limite esquerdo do bloco atual são selecionados para determinar o filtro de Inter-predição de vários filtros se a informação de movimento do bloco atual é a mesma que a da CU esquerda, mas diferente daquela da CU acima. Na modalidade anterior, a seleção entre diferentes filtros de Inter-predição é derivada implicitamente. No entanto, em outra modalidade, a seleção entre diferentes filtros de Inter-predição pode ser explicitamente sinalizada.
[022] A Figura 3 ilustra um exemplo de selecionar um método de Inter-predição por um processo de Inter-predição selecionado de acordo com uma modalidade da presente invenção. Na Figura 3, os pixels reconstruídos vizinhos (NRP) compreendem N linhas vizinhas acima 312 acima do limite superior do bloco atual 310 e N colunas vizinhas à esquerda (ou seja, linhas verticais) 314 à esquerda do limite esquerdo do bloco atual 310. Em um exemplo, os pixels reconstruídos vizinhos do bloco atual 310 são selecionados usando sub- amostragem. Os preditores ou pixels de compensação de movimento estendidos (EMCP) compreendem N linhas vizinhas acima 322 acima do limite superior do bloco de referência compensado de movimento 320 e N colunas vizinhas à esquerda (ou seja, linhas verticais) 324 à esquerda do limite esquerdo do bloco de referência compensado de movimento 320. O bloco de referência compensado de movimento 320 é identificado de acordo com o local do bloco atual 310 e o vetor de movimento 330. O vetor de movimento pode ter precisão de número inteiro ou resolução fracionária-pel. Consequentemente, pode ser utilizada compensação de movimento de número inteiro ou compensação de movimento fracionária.
[023] Comparado com a Inter-predição convencional, a modalidade acima requer a realização de compensação de movimento adicional associada ao NRP e EMCP para selecionar um método de Inter-predição entre vários candidatos.
[024] N é um número inteiro igual a 1 ou maior. A configuração de NRP e EMCP mostrada na Figura 3 pretende ilustrar um exemplo de acordo com uma modalidade e deve ser interpretada como limitações à presente invenção. Por exemplo, o número de linhas vizinhas acima pode ser diferente do número de linhas vizinhas à esquerda.
[025] A Figura 4 ilustra um exemplo de processo de predição adaptativa de acordo com uma modalidade da presente invenção. Neste exemplo, três tipos de filtros de interpolação podem ser usados em um sistema de codificação de vídeo. O processo de Inter-predição adaptativa pode começar com a realização de compensação de movimento usando esses três filtros de interpolação para pixels reconstruídos vizinhos (412) em torno do bloco atual (410) para gerar pixels compensados de movimento extras (422a, 422b, 422c) em torno do bloco de referência compensado de movimento (420a, 420b, 420c), como mostrado na Figura 4. As distorções entre pixels reconstruídos vizinhos (412) e pixels compensados de movimento extras (422a, 422b, 422c) são então calculadas para esses três tipos de filtros de interpolação. O filtro de interpolação com a menor distorção é usado para gerar o preditor do bloco atual. Para a predição unidirecional, a Inter-predição adaptativa pode ser conseguida selecionando de forma adaptativa um filtro de diferentes filtros de interpolação. Como mencionado acima, pode-se usar compensação de movimento de número inteiro ou compensação de movimento fracionária.
[026] Em outra modalidade, para a predição bidirecional, a Inter-predição adaptativa pode ser implementada apoiando diferentes conjuntos de fatores de ponderação, tais como [0,5, 0,5], [0,25, 0,75], [0,75, 0,25], [0,375, 0,625], ou [0,625, 0,375] entre dois preditores. Nesta modalidade, um conjunto de fatores de ponderação é selecionado dependendo dos pixels reconstruídos vizinhos do bloco atual e/ou dos pixels compensados de movimento extras em torno de um bloco de referência compensado de movimento correspondente ao bloco atual. Por exemplo, de acordo com a distorção entre os pixels reconstruídos vizinhos e os pixels compensados de movimento extras, um conjunto de fatores de ponderação é selecionado para codificar ou decodificar o bloco atual. No entanto, na predição bidirecional convencional, os fatores de ponderação [0,5, 0,5] são sempre utilizados.
[027] Em outra modalidade, diferentes fatores de ponderação para os dois preditores como diferentes filtros de interpolação também podem ser usados na predição bidirecional.
[028] Ainda em outra modalidade, diferentes métodos de inter-predição podem ser combinados para formar outro método de Inter-predição. Por exemplo, diferentes conjuntos de fatores de ponderação podem ser combinados com filtros de interpolação variantes, de modo que cada combinação única de um determinado conjunto de fatores de ponderação e um filtro de interpolação particular é um método de Inter-predição. A seleção de um processo de Inter-predição a partir de conjuntos suportados de fatores de ponderação e filtros de interpolação suportados depende dos pixels reconstruídos vizinhos do bloco atual e/ou dos pixels compensados de movimento extras em torno de um bloco de referência compensado de movimento correspondente ao bloco atual.
[029] Ainda em uma outra modalidade, a distorção entre pixels reconstruídos vizinhos e pixels compensados de movimento extras pode ser medida como a soma de diferenças absolutas, soma de erros quadrados e assim por diante.
[030] Ainda em outra modalidade, para a predição bidirecional com fatores de ponderação adaptativos, são divulgados cálculos de distorção eficientes para um conjunto de fatores de ponderação candidatos. Mais uma vez, compensação de movimento adicional precisa ser realizada para os pixels reconstruídos vizinhos, onde X denota um valor reconstruído dos pixels reconstruídos vizinhos: 1) Executa compensação de movimento e obtém preditores P0 e P1 para pixels dos pixels reconstruídos vizinhos associados a dois vetores de movimento correspondentes. 2) Q = (P0 + P1) << 2 3) R = P0-P1 4) A distorção para o fator de ponderação [0,5, 0,5] é calculada como D0 = (X << 3) -Q. 5) A distorção para o fator de ponderação [0,625, 0,375] é calculada como D1 = D0 -R 6) A distorção para o fator de ponderação [0,375, 0,625] é calculada como D2 = D0 + R 7) A distorção para o fator de ponderação [0,75, 0,25] é calculada como D3 = D1 -R 8) A distorção para o fator de ponderação [0,25, 0,75] é calculada como D4 = D2 + R
[031] A expressão na ilustração acima usa notações simplificadas para P0, P1, Q e R, onde os índices para localizações de pixels nos pixels reconstruídos vizinhos são descartados. As distorções D0 a D4 são calculadas como a soma das distorções de pixels individuais nos pixels reconstruídos vizinhos. Como mostrado acima, apenas uma compensação de movimento é realizada para cada pixel reconstruído vizinho como no passo 1, então as distorções de todos os conjuntos de fatores de ponderação candidatos podem ser derivadas como nos passos a seguir. Para ser específico, uma variável Q relacionada à soma dos dois preditores é calculada no passo 2. Além disso, uma variável R relacionada à diferença dos dois preditores é calculada no passo 3. As distorções associadas com vários conjuntos de fatores de ponderação podem ser calculadas de forma eficiente com base em Q, R e/ou uma distorção previamente calculada para outro conjunto de fatores de ponderação.
[032] Ainda em outra modalidade, a seleção de processos de Inter-predição adaptativa suportados entre diferentes processos de Inter-predição adaptativa pode ser sinalizada no nível de sequência, no nível de imagem ou no nível de fatia. A seleção dos processos de Inter-predição adaptativa suportados pode depender do tipo de fatia, do modo de predição ou da informação de movimento. Além disso, se habilitar a Inter-predição adaptativa pode ser sinalizado no nível de sequência, nível de imagem, nível de fatia, nível de unidade de codificação ou nível de unidade de predição.
[033] Ainda em outra modalidade, a seleção da predição bidirecional com fatores de ponderação adaptativos pode ser explicitamente sinalizada para o decodificador em nível de sequência, nível de imagem, nível de fatia, nível de unidade de codificação ou nível de unidade de predição.
[034] A Figura 5 ilustra um fluxograma exemplar para um sistema de codificação de vídeo que utiliza a Inter-predição adaptativa de acordo com uma modalidade da presente invenção. No lado de codificador, os dados de entrada podem corresponder aos dados de pixel a serem codificados. No lado de decodificador, os dados de entrada podem corresponder aos dados codificados, incluindo o bloco atual e outros dados associados. De acordo com este método, os dados de entrada associados a um bloco atual em uma imagem atual são recebidos no passo 510. Um processo de Inter-predição selecionado é determinado, no qual o processo de Inter-predição selecionado seleciona um filtro de Inter-predição de vários filtros de Inter-predição para o bloco atual dependendo dos primeiros dados de pixel compreendendo pixels reconstruídos vizinhos do bloco atual no passo 520. O bloco atual é codificado ou decodificado usando o processo de Inter- predição selecionado no passo 530.
[035] O fluxograma mostrado pretende ilustrar um exemplo de codificação de vídeo de acordo com a presente invenção. Um especialista na técnica pode modificar cada passo, reorganizar os passos, dividir um passo ou combinar passos para praticar a presente invenção sem se afastar do espírito da presente invenção. Na divulgação, foram utilizadas sintaxe e semântica específicas para ilustrar exemplos para implementar modalidades da presente invenção. Uma pessoa experiente pode praticar a presente invenção substituindo a sintaxe e a semântica por sintaxe e semântica equivalentes sem se afastar do espírito da presente invenção.
[036] A descrição acima é apresentada para permitir que uma pessoa com conhecimentos comuns na técnica pratique a presente invenção, tal como previsto no contexto de uma aplicação particular e a sua exigência. Várias modificações nas modalidades descritas serão evidentes para aqueles com habilidade na técnica, e os princípios gerais aqui definidos podem ser aplicados a outras modalidades. Portanto, a presente invenção não se destina a ser limitada às modalidades particulares mostradas e descritas, mas deve ser concedido o escopo mais amplo consistente com os princípios e características inovadoras aqui descritas. Na descrição detalhada acima, são ilustrados vários detalhes específicos de modo a fornecer uma compreensão completa da presente invenção. No entanto, os especialistas na técnica entenderão que a presente invenção pode ser praticada.
[037] A modalidade da presente invenção como descrito acima pode ser implementada em vários modelos de hardware, software ou uma combinação de ambos. Por exemplo, uma modalidade da presente invenção pode ser um ou mais circuitos integrados em um chip de compressão de vídeo ou código de programa integrado no software de compressão de vídeo para executar o processamento aqui descrito. Uma modalidade da presente invenção também pode ser um código de programa a ser executado em um processador de sinal digital (DSP) para executar o processamento aqui descrito. A invenção também pode envolver uma série de funções a serem executadas por um processador de computador, um processador de sinal digital, um microprocessador ou uma matriz de porta de campo programável (FPGA). Estes processadores podem ser configurados para executar tarefas específicas de acordo com a invenção, executando código de software legível por máquina ou código de firmware que define os métodos particulares incorporados pela invenção. O código de software ou código de firmware podem ser desenvolvidos em diferentes linguagens de programação e diferentes formatos ou estilos. O código de software também pode ser compilado para diferentes plataformas alvo. No entanto, diferentes formatos de código, estilos e linguagens de códigos de software e outros meios de configuração de código para executar as tarefas de acordo com a invenção não se afastarão do espírito e alcance da invenção.
[038] A invenção pode ser incorporada em outras formas específicas sem se afastar de seu espírito ou características essenciais. Os exemplos descritos devem ser considerados em todos os aspectos apenas como ilustrativos e não restritivos. O âmbito da invenção é, portanto, indicado pelas reivindicações anexas, e não pela descrição anterior. Todas as mudanças que se enquadram no significado e intervalo de equivalência das reivindicações devem ser adotadas dentro do seu escopo.

Claims (7)

1. Método de Inter-predição para codificação de vídeo, o método CARACTERIZADO pelo fato de que compreende: receber dados de entrada associados a um bloco atual (310) em uma imagem atual; determinar um processo de Inter-predição selecionado, em que o processo de Inter-predição selecionado seleciona um conjunto de fatores de ponderação de múltiplos conjuntos de fatores de ponderação para o bloco atual (310) para predição bidirecional; e codificar o bloco atual (310) usando o processo de Inter- predição selecionado; em que uma distorção entre pixels reconstruídos vizinhos (312, 314) do bloco atual (310) e pixels compensados de movimento extras (322, 324) em torno de um bloco de referência compensado de movimento (320) correspondente ao bloco atual (310) é usada para determinar o conjunto de fatores de ponderação, e em que um primeiro preditor associado com a primeira informação de movimento e um segundo preditor associado com a segunda informação de movimento são derivados apenas uma vez para cada pixel dos pixels reconstruídos vizinhos (312, 314) do bloco atual (310), uma soma e uma diferença associada com o primeiro preditor e o segundo preditor são determinadas para cada pixel dos pixels reconstruídos vizinhos (312, 314) do bloco atual (310).
2. Método, de acordo com a reivindicação 1, CARACTERIZADO pelo fato de que os múltiplos conjuntos de fatores de ponderação compreendem [0,5, 0,5], [0,25, 0,75], [0,75, 0,25], [0,375, 0,625] e [0,625, 0,375].
3. Método, de acordo com a reivindicação 2, CARACTERIZADO pelo fato de que as distorções associadas aos múltiplos fatores de ponderação, [0,5, 0,5], [0,625, 0,375], [0,375, 0,625], [0,75, 0,25] e [0,25, 0,75] são calculadas como D0 = (X << 3) - Q, D1 = D0 - R, D2 = D0 + R, D3 = D1 - R e D4 = D2 + R, respectivamente, e em que X denota um valor reconstruído dos pixels reconstruídos vizinhos (312, 314) do bloco atual (310).
4. Método, de acordo com a reivindicação 1, CARACTERIZADO pelo fato de que o processo de Inter-predição selecionado é determinado dependendo dos primeiros dados de pixel compreendendo pixels reconstruídos vizinhos (312, 314) do bloco atual (310).
5. Método, de acordo com reivindicação 1, CARACTERIZADO pelo fato de que o processo de Inter-predição selecionado é determinado dependendo dos primeiros dados de pixel compreendendo pixels compensados de movimento extras (322, 324) em torno de um bloco de referência compensado de movimento (320) correspondente ao bloco atual (310).
6. Método, de acordo com a reivindicação 1, CARACTERIZADO pelo fato de que a seleção do conjunto de fatores de ponderação é explicitamente sinalizada para um decodificador em um nível de sequência, nível de imagem, nível de fatia, nível de unidade de codificação ou nível de unidade de predição.
7. Aparelho para Inter-predição em codificação de vídeo, o aparelho CARACTERIZADO pelo fato de que compreende um ou mais circuitos ou processadores eletrônicos dispostos para: receber dados de entrada associados a um bloco atual (310) em uma imagem atual; determinar um processo de Inter-predição selecionado, em que o processo de Inter-predição selecionado seleciona um conjunto de fatores de ponderação de múltiplos conjuntos de fatores de ponderação para o bloco atual para predição bidirecional; e codificar o bloco atual (310) usando o processo de Inter- predição selecionado; em que uma distorção entre pixels reconstruídos vizinhos (312, 314) do bloco atual (310) e pixels compensados de movimento extras (322, 324) em torno de um bloco de referência compensado de movimento (320) correspondente ao bloco atual (310) é usada para determinar o conjunto de fatores de ponderação, e em que um primeiro preditor associado com a primeira informação de movimento e um segundo preditor associado com a segunda informação de movimento são derivados apenas uma vez para cada pixel dos pixels reconstruídos vizinhos (312, 314) do bloco atual (310), uma soma e uma diferença associada com o primeiro preditor e o segundo preditor são determinadas para cada pixel dos pixels reconstruídos vizinhos (312, 314) do bloco atual (310).
BR112018004469-5A 2015-09-06 2016-09-05 Método de inter-predição para codificação de vídeo e aparelho para inter-predição em codificação de vídeo BR112018004469B1 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
PCT/CN2015/088952 WO2017035831A1 (en) 2015-09-06 2015-09-06 Adaptive inter prediction
CNPCT/CN2015/088952 2015-09-06
PCT/CN2016/097996 WO2017036417A1 (en) 2015-09-06 2016-09-05 Method and apparatus of adaptive inter prediction in video coding

Publications (3)

Publication Number Publication Date
BR112018004469A2 BR112018004469A2 (pt) 2018-09-25
BR112018004469A8 BR112018004469A8 (pt) 2023-02-07
BR112018004469B1 true BR112018004469B1 (pt) 2023-08-15

Family

ID=

Similar Documents

Publication Publication Date Title
ES2962642T3 (es) Método y Aparato de Inter-predicción Adaptativa en Codificación de Video
US11310526B2 (en) Hardware friendly constrained motion vector refinement
US20180242024A1 (en) Methods and Apparatuses of Candidate Set Determination for Quad-tree Plus Binary-tree Splitting Blocks
WO2017076221A1 (en) Method and apparatus of inter prediction using average motion vector for video coding
KR101239567B1 (ko) 움직임 추정에 대한 검색 범위 선택 방법과 그의 시스템 및 컴퓨터 판독가능 저장 매체
DK2684362T3 (en) Video encoding and decoding
US20210281873A1 (en) Methods and apparatuses of candidate set determination for binary-tree splitting blocks
BR112016011075B1 (pt) Método de filtragem de laço adaptativa baseada em blocos
JP2017069971A (ja) インタ予測方法及びその装置
US10785475B2 (en) Method and apparatus of video coding with prediction offset
BR112014005323B1 (pt) Método e dispositivo de derivação de valores de modo de predição de referência e codificação e decodificação de informação representando modos de predição
KR20130006616A (ko) 비디오 인코딩 및 디코딩을 위한 암시적인 적응 움직임 벡터 예측자 선택을 위한 방법 및 장치
KR20190122884A (ko) 인코딩 방법 및 장치, 디코딩 방법 및 장치, 및 컴퓨터 판독가능 저장 매체
KR20200005648A (ko) 인트라 예측 모드 기반 영상 처리 방법 및 이를 위한 장치
US9706221B2 (en) Motion search with scaled and unscaled pictures
US8879621B2 (en) Image predictive coding device, image predictive coding method, image predictive coding program, image predictive decoding device, image predictive decoding method, and image predictive decoding program
AU2016316317B2 (en) Method and apparatus of prediction offset derived based on neighbouring area in video coding
BR112018004469B1 (pt) Método de inter-predição para codificação de vídeo e aparelho para inter-predição em codificação de vídeo
US20180109796A1 (en) Method and Apparatus of Constrained Sequence Header
JP2014230031A (ja) 画像符号化装置、及び画像符号化プログラム