BRPI0318823B1

BRPI0318823B1 - Método para codificação dados de sinal de vídeo para um bloco de imagem

Info

Publication number: BRPI0318823B1
Application number: BRPI0318823-0A
Authority: BR
Inventors: Macdonald Boyce Jill
Original assignee: Thomson Licensing S.A.
Priority date: 2002-07-05
Filing date: 2003-07-14
Publication date: 2018-03-27
Also published as: BRPI0318822B1

Abstract

método de codificação para produzir dados de sinal de vide para uma imagem tendo uma pluralidade de blocos de imagem. trata-se de um decodificador de video (300), codificador (500) e de métodos correspondentes para processar os dados de sinal de video para um bloco de imagem e um índice de imagem de referência particular para predizer o bloco de imagem, os quais utilizam a ponderação adaptativa de imagens de referência para aperfeiçoar a compactação do vídeo, onde um decodificador (300) inclui uma unidade de fator de ponderação de imagem de referência (380) para determinar um fator de ponderação correspondendo ao índice de imagem de referência particular; um codificador (500) inclui um designador de fator de ponderação de imagem de referência (572) para designar um fator de ponderação correspondendo ao índice de imagem de referência particular; e um método para decodificar inclui receber um índice de imagem de referência com os dados que correspondem ao bloco de imagem, determinar um fator de ponderação para cada índice de imagem de referência recebido, recuperar uma imagem de referência para cada índice, compensar o movimento da imagem de referência recuperada e multiplicar a imagem de referência com movimento compensado pelo fator de ponderação correspondente para formar uma imagem de referência com movimento compensado ponderada.

Description

(54) Título: MÉTODO PARA CODIFICAÇÃO DADOS DE SINAL DE VÍDEO PARA UM BLOCO DE IMAGEM (51) Int.CI.: H04N 19/196; H04N 19/513 (52) CPC: H04N 19/196,H04N 19/513 (30) Prioridade Unionista: 05/07/2002 US 60/395.843, 09/04/2003 US 10/410.456, 15/07/2002 US 60/395.874 (73) Titular(es): THOMSON LICENSING S.A.

(72) Inventor(es): JILL MACDONALD BOYCE “MÉTODO PARA CODIFICAÇÃO DADOS DE SINAL DE VÍDEO PARA UM BLOCO DE IMAGEM”

Dividido do pedido de patente de invenção PI 0305519-1, depositado em 14/07/2003.

REFERÊNCIA CRUZADA COM PEDIDOS RELACIONADOS

Este pedido reivindica o benefício do Pedido de Patente Provisório dos Estados

Unidos N^o de Série 60/395.843 (Processo N^o PU020340), intitulado “Adaptative Weighting Of Reference Pictures In Video CODEC” e depositado em 15 de julho de 2002, o qual é incorporado por referência aqui dentro em sua totalidade. Em adição, este pedido reivindica o benefício do Pedido de Patente Provisório dos Estados Unidos N^o de Série 60/395.874 (Processo N^o PU020339), intitulado “Motion Estimation With Weighting Prediction” também depositado em 15 de julho de 2002, o qual é incorporado por referência aqui dentro em sua totalidade.

CAMPO DA INVENÇÃO

A presente invenção é direcionada para decodificadores de vídeo e, em particular, para a utilização da ponderação adaptativa de imagens de referência em decodificadores de vídeo.

FUNDAMENTO DA INVENÇÃO

Os dados de vídeo geralmente são processados e transferidos em forma de fluxos de bits. Os codificadores e decodificadores (‘CODECs”) de compactação de vídeo típicos ganham muita de sua eficiência de compactação por formar uma predição da imagem de referência de uma imagem a ser codificada e por codificar a diferença entre a imagem corrente e a predição. Quanto mais esta predição está correlacionada com a imagem corrente, menos bits são necessários para compactar esta imagem, desse modo aumentando a efici25 ência do processo. Assim, isto é desejável para a melhor predição possível da imagem de referência a ser formada.

Em vários padrões de compactação de vídeo, incluindo o Moving Picture Experts Group (“MPEG”)-1, MPEG-2 e MPEG-4, uma versão com movimento compensado de uma imagem de referência anterior é utilizada como uma predição para a imagem corrente e somente a diferença entre a imagem corrente e a predição é codificada. Quando uma única predição de imagem (imagem “P”) é utilizada, a imagem de referência não é dimensionada quando a predição com movimento compensado é formada. Quando predições de imagem bidirecional (imagem “B”) são utilizadas, predições intermediárias são formadas a partir de duas imagens diferentes e então as duas predições intermediárias têm a média tirada jun35 tas, utilizando fatores de ponderação iguais de (/, /) para cada um, para formar uma única predição com a média produzida. Nestes padrões MPEG, as duas imagens de referência são sempre cada uma a partir da direção para frente e a partir da direção para trás para as

Petição 870170091498, de 27/11/2017, pág. 8/11 imagens Β.

SUMÁRIO DA INVENÇÃO

Estas e outras inconveniências e desvantagens da técnica anterior são endereçadas por um sistema e método para ponderação adaptativa de imagens de referência em decodificadores de vídeo.

Um decodificador de vídeo e métodos correspondentes para processar os dados de sinal de vídeo para um bloco de imagem e um índice de imagem de referência particular para predizer o bloco de imagem são descritos, os quais utilizam a ponderação adaptativa de imagens de referência para aperfeiçoar a compactação do vídeo. Um decodificador inclui uma unidade de fator de ponderação de imagem de referência para determinar um fator de ponderação correspondendo ao índice de imagem de referência particular.

Um método correspondente para decodificar vídeo inclui receber um índice de imagem de referência com os dados que correspondem ao bloco de imagem, determinar um fator de ponderação para cada índice de imagem de referência recebido, recuperar uma imagem de referência para cada índice, compensar o movimento da imagem de referência recuperada e multiplicar a imagem de referência com movimento compensado pelo fator de ponderação correspondente para formar uma imagem de referência com movimento compensado ponderada.

Estes e outros aspectos, características e vantagens da presente invenção irão se tornar aparentes a partir da descrição seguinte de modalidades ilustrativas, as quais devem ser lidas em conexão com os desenhos acompanhantes.

BREVE DESCRIÇÃO DOS DESENHOS

A ponderação adaptativa das imagens de referência nos codificadores e decodificadores de vídeo de acordo com os princípios da presente invenção é apresentada nas figuras ilustrativas seguintes, nas quais:

A Figura 1 apresenta um diagrama de blocos para um decodificador de vídeo padrão;

A Figura 2 apresenta um diagrama de blocos para um decodificador de vídeo com a predição dupla adaptativa;

A Figura 3 apresenta um diagrama de blocos para um decodificador de vídeo com a ponderação de imagem de referência de acordo com os princípios da presente invenção;

A Figura 4 apresenta um diagrama de blocos para um codificador de vídeo padrão;

A Figura 5 apresenta um diagrama de blocos para um codificador de vídeo com a ponderação de imagem de referência de acordo com os princípios da presente invenção;

A Figura 6 apresenta um fluxograma para um processo de decodificação de acordo com os princípios da presente invenção; e

A Figura 7 apresenta um fluxograma para um processo de codificação de acordo com os princípios da presente invenção.

DESCRIÇÃO DETALHADA DAS MODALIDADES PREFERIDAS

A presente invenção apresenta um aparelho e método para estimativa de vetor de movimento e para designação de fator de ponderação adaptativa de imagem de referência. Em algumas sequências de vídeo, em particular aquelas com desaparecimento gradual de imagem, a imagem corrente ou bloco de imagem a ser codificado está mais fortemente correlacionado com uma imagem de referência dimensionada por um fator de ponderação do que com a própria imagem de referência. Os CODECs de vídeo sem fatores de ponderação aplicados junto a imagens de referência codificam as sequências de desaparecimento gradual da imagem de forma muito ineficiente. Quando os fatores de ponderação são utilizados na codificação, um codificador de vídeo precisa determinar tanto os fatores de ponderação como os vetores de movimento, mas a melhor escolha para cada um destes depende do outro, com a estimativa de movimento tipicamente sendo a parte mais computacionalmente intensiva de um codificador de compactação de vídeo digital.

No padrão de compactação proposto da Joint Video Team (JVT”), cada imagem P pode utilizar várias imagens de referência para formar uma predição da imagem, mas cada bloco de movimento individual ou região 8x8 de um macrobloco utiliza somente uma única imagem de referência para a predição. Em adição a codificar e transmitir os vetores de movimento, um índice da imagem de referência é transmitido para cada bloco de movimento ou região 8x8, indicando qual imagem de referência é utilizada. Um conjunto limitado de imagens de referência possíveis é armazenado tanto no codificador como no decodificador, e o número de imagens de referência que podem ser permitidas é transmitido.

No padrão JVT, para as imagens de predição dupla (também chamadas de imagens “B”), dois preditores são formados para cada bloco de movimento ou região 8x8, cada um dos quais pode ser a partir de uma imagem de referência separada e os dois preditores têm a média calculada juntos para formar um único preditor com a média produzida. Para os blocos de movimento codificados de forma com duas predições, as imagens de referência podem ambas ser a partir da direção para frente, ambas ser a partir da direção para trás ou cada uma a partir da direção para frente e da direção para trás. Duas listas são mantidas das imagens de referência disponíveis que podem ser utilizadas para a predição. As duas imagens de referência são referidas como preditor da lista 0 e da lista 1. Um índice para cada imagem de referência é codificado e transmitido, refJdxJO e refjdxjl, para as imagens de referência da lista 0 e da lista 1, respectivamente. As imagens com predição dupla do Joint Video Team (“JVT”) ou “B” devem permitir a ponderação adaptativa entre as duas predições, isto é,

Pred = [(P0) * (PredO)] + [(P1) * (Predl)] + D, onde P0 e P1 são fatores de ponderação, PredO e Predl são as predições de ima•XÁ gem de referência para a lista 0 e iista 1, respectivamente e D é um deslocamento.

Dois métodos têm sido propostos para indicação de fatores de ponderação. No primeiro, os fatores de ponderação são determinados petas direções que são utilizadas para as imagens de referência. Neste método, se o índice refJdxJO for menor ou igual a ref_idxJ1, fatores de ponderação de (1/2, %) são utilizados, caso contrário fatores (2, -1) são utilizados.

No segundo método oferecido, qualquer número de fatores de ponderação é transmitido para cada fração. Então, um índice do fator de ponderação é transmitido para cada bloco de movimento ou região 8x8 de um macrobloco que utiliza a predição bidirecional. O decodificador utiliza o índice de fator de ponderação recebido para escolher o fator de ponderação apropriado, a partir do conjunto transmitido, para utilizar quando decodificando o bloco de movimento ou região 8x8. Por exemplo, se três fatores de ponderação forem enviados na camada de fração, eles corresponderíam aos índices de fator de ponderação 0, 1 e 2, respectivamente.

A descrição seguinte meramente ilustra os princípios da invenção. Assim, será apreciado que os com conhecimento na técnica estarão aptos a planejar várias disposições que, apesar de não explicitamente descritas ou apresentadas aqui dentro, incorporam os princípios da invenção e estão incluídas dentro de seu espírito e escopo. Adicionalmente, todos os exemplos e a linguagem de condição relacionados aqui dentro são principalmente pretendidos expressivamente para ser somente para propósitos pedagógicos para ajudar ao leitor a entender os princípios da invenção e os conceitos contribuídos pelo inventor para incrementar a técnica e devem ser construídos como sendo sem limitação a tais exemplos e condições especificamente relacionados. Além disso, todas as declarações aqui dentro relacionando os princípios, aspectos e modalidades da invenção, bem como os exemplos da mesma, são pretendidos para abranger os equivalentes estruturais e funcionais da mesma. Adicionalmente, é pretendido que tais equivalentes incluam tanto os equivalente atualmente conhecidos como os equivalentes desenvolvidos no futuro, isto é, quaisquer elementos desenvolvidos que executem a mesma função, independente da estrutura.

Assim, por exemplo, será apreciado pelos com conhecimento na técnica que os diagramas de blocos aqui dentro representam vistas conceituais de circuitamento ilustrativo incorporando os princípios da invenção. De forma similar, será apreciado que quaisquer fluxogramas, diagramas de fluxo, diagramas de transição de estado, pseudocódtgo e similares representam vários processos que podem ser substanciatmente representados em meio legível por computador e assim executados por um computador ou processador, quer ou não tal computador ou processador seja explicitamente apresentado.

As funções dos vários elementos apresentados nas figuras podem ser proporcionadas através do uso de hardware dedicado bem como hardware capaz de executar softwa5 re em associação com os software apropriado. Quando proporcionadas por um processador, as funções podem ser proporcionadas por um único processador dedicado, por um único processador compartilhado, ou por uma pluralidade de processadores individuais, alguns dos quais podem ser compartilhados. Além disso, o uso explícito do termo “processador ou “controlador” não deve ser construído para referir-se exclusivamente ao hardware capaz de executar o software e pode implicitamente incluir, sem limitação, hardware processador de sinal digital (“DSP”), memória somente para leitura (“ROM”) para armazenar o software, memória de acesso randomico (“RAM”) e armazenamento não volátil. Outro hardware, convencional e/ou personalizado, também pode ser incluído. De forma similar, quaisquer chaves apresentadas nas figuras são somente conceituais. Sua função pode ser realizada através da operação de lógica de programa, através de lógica dedicada, através da interação do controle de programa com a lógica dedicada, ou mesmo manualmente, a técnica particular podendo ser selecionada pelo implementador como mais especificamente entendido a partir do contexto.

Nas reivindicações a este respeito, qualquer elemento expresso como um dispositivo para executar uma função especificada é pretendido abranger qualquer modo de executar esta função incluindo, por exemplo, a) uma combinação de elementos de circuito que executa esta função ou b) software em qualquer forma, incluindo, portanto, firmware, microcódigo ou similares, combinado com o circuitamento apropriado para executar este software para executar a função. A invenção como definida por tais reivindicações reside no fato de que as funcionalidades proporcionadas pelos vários dispositivos relacionados são combinadas e juntadas na maneira que as reivindicações chama. Assim, o requerente considera qualquer dispositivo que possa proporcionar estas funcionalidades como equivalente a estes apresentados aqui dentro.

Como apresentado na Figura 1, um decodificador de vídeo padrão é indicado geralmente pelo número de referência 100. O decodificador de vídeo 100 inclui um decodificador de comprimento variável (VLD”) 110 conectado em comunicação de sinal com um quantizador inverso 120. O quantizador inverso 120 está conectado em comunicação de sinal com um transformador inverso 130. O transformador inverso 130 está conectado em comunicação de sinal com um primeiro terminal de entrada de um somador ou junção de soma 140, onde a saída da junção de soma 140 proporciona a saída do decodificador de vídeo 100. A saída da junção de soma 140 está conectada em comunicação de sinal com um armazenamento de imagem de referência 150. O armazenamento de imagem de referência 150 está conectado em comunicação de sinal com um compensador de movimento 160, o qual está conectado em comunicação de sinal com um segundo terminal de entrada da junção de soma 140.

Voltando-se para a Figura 2, um decodificador de vídeo com a predição dupla a-2 daptativa é indicado geralmente pelo número de referência 200. O decodificador de vídeo 200 inclui um VLD 210 conectado em comunicação de sinal com um quantizador inverso 220. O quantizador inverso 220 está conectado em comunicação de sinal com um transformador inverso 230. O transformador inverso 230 está conectado em comunicação de sinal com um primeiro terminal de entrada de uma junção de soma 240, onde a saída da junção de soma 240 proporciona a saída do decodificador de vídeo 200. A saída da junção de soma 240 está conectada em comunicação de sinal com um armazenamento de imagem de referência 250. O armazenamento de imagem de referência 250 está conectado em comunicação de sinal com um compensador de movimento 260, o qual está conectado em comunicação de sinal com uma primeira entrada de um multiplicador 270.

O VLD 210 está adicionalmente conectado em comunicação de sinal com uma pesquisa de fator de ponderação de imagem de referência 280 para proporcionar um índice de coeficiente de predição dupla adaptativa (“ABP”) para a pesquisa 280. Uma primeira saída da pesquisa 280 é para proporcionar um fator de ponderação e está conectada em comunicação de sinal com uma segunda entrada do multiplicador 270. A saída do multiplicador 270 está conectada em comunicação de sinal com uma primeira entrada de uma junção de soma 290. Uma segunda saída da pesquisa 280 é para proporcionar um deslocamento e está conectada em comunicação de sinal com uma segunda entrada da junção de soma 290. A saída da junção de soma 290 está conectada em comunicação de sinal com um segundo terminal de entrada da junção de soma 240.

Voltando-se para a Figura 3, um decodificador de vídeo com a ponderação de imagem de referência é indicado geralmente pelo número de referência 300. O decodificador de vídeo 300 inclui um VLD 310 conectado em comunicação de sinal com um quantizador inverso 320. O quantizador inverso 320 está conectado em comunicação de sinal com um transformador inverso 330. O transformador inverso 330 está conectado em comunicação de sinal com um primeiro terminal de entrada de uma junção de soma 340, onde a saída da junção de soma 340 proporciona a saída do decodificador de vídeo 300. A saída da junção de soma 340 está conectada em comunicação de sinal com um armazenamento de imagem de referência 350. O armazenamento de imagem de referência 350 está conectado em comunicação de sinal com um compensador de movimento 360, o qual está conectado em comunicação de sinal com uma primeira entrada de um multiplicador 370.

O VLD 310 está adicionalmente conectado em comunicação de sinal com uma pesquisa de fator de ponderação de imagem de referência 380 para proporcionar um índice de imagem de referência para a pesquisa 380. Uma primeira saída da pesquisa 380 é para proporcionar um fator de ponderação e está conectada em comunicação de sinal com uma segunda entrada do multiplicador 370. A saída do multiplicador 370 está conectada em comunicação de sinal com uma primeira entrada de uma junção de soma 390. Uma segunda

7θ saída da pesquisa 380 é para proporcionar um deslocamento e está conectada em comunicação de sinal com uma segunda entrada da junção de soma 390. A saída da junção de soma 390 está conectada em comunicação de sinal com um segundo terminai de entrada da junção de soma 340.

Como apresentado na Figura 4, um codificador de vídeo padrão é indicado geralmente pelo número de referência 400. Uma entrada para codificador 400 está conectada em comunicação de sinal com uma entrada não-inversora de uma junção de soma 410. A saída da junção de soma 410 está conectada em comunicação de sinal com um transformador de bloco 420. O transformador 420 está conectada em comunicação de sinal com um quantizador 430. A saída do quantizador 430 está conectada em comunicação de sinal com um codificador de comprimento variável (”VLC”) 440, onde a saída do VLC 440 é uma saída externamente disponível do codificador 400.

A saída do quantizador 430 é adicionalmente conectada em comunicação de sinal com um quantizador inverso 450. O quantizador inverso 450 está em comunicação de sinal com um transformador de bloco inverso 460, o qual, por sua vez, está conectado em comunicação de sinal com um armazenamento de imagem de referência 470. Uma primeira saída do armazenamento de imagem de referência 470 está conectada em comunicação de sinal com uma primeira entrada de um estimador de movimento 480. A entrada para o codificador 400 está adicionalmente conectada em comunicação de sinal com uma segunda entrada do estimador de movimento 480. A saída do estimador de movimento 480 está conectada em comunicação de sina! com uma primeira entrada de um compensador de movimento 490. Uma segunda entrada do armazenamento de imagem de referência 470 está conectada em comunicação de sinal com uma segunda entrada do compensador de movimento 490. A saída do compensador de movimento 490 está conectada em comunicação de sinal com uma entrada inversora da junção de soma 410.

Voltando-se para a Figura 5, um codificador de vídeo com a ponderação de imagem de referência é indicado geralmente pelo número de referência 500. Uma entrada para o codificador 500 está conectada em comunicação de sinal com uma entrada não-inversora de uma junção de soma 510. A saída da junção de soma 510 está conectada em comunicação de sinal com um transformador de bloco 520. O transformador 520 está conectado em comunicação de sinal com um quantizador 530. A saída do quantizador 530 está conectada em comunicação de sinal com um VLC 540, onde a saída do VLC 540 é uma saída externamente disponível do codificador 500.

A saída do quantizador 530 está adicionalmente conectada em comunicação de sinal com um quantizador inverso 550. O quantizador inverso 550 está conectado em comunicação de sinal com um transformador de bloco inverso 560, o qual, por sua vez, está conectado em comunicação de sinal com um armazenamento de imagem de referência 570.

5Μ

Uma primeira saída do armazenamento de imagem de referência 570 está conectada em comunicação de sinal com uma primeira entrada de um designador de fator de ponderação de imagem de referência 572. A entrada para o codificador 500 está adicionalmente conectada em comunicação de sinal com uma segunda entrada do designador de fator de ponderação de imagem de referência 572. A saída do designador de fator de ponderação de imagem de referência 572, a qual é indicativa de um fator de ponderação, está conectada em comunicação de sinal com uma primeira entrada de um estimador de movimento 580. Uma segunda saída do armazenamento de imagem de referência 570 está conectada em comunicação de sinal com uma segunda entrada do estimador de movimento 580.

A entrada para o codificador 500 está adicionalmente conectada em comunicação de sinal com uma terceira entrada do estimador de movimento 580. A saída do estimador de movimento 580, a qual é indicativa de vetores de movimento, está conectada em comunicação de sinal com uma primeira entrada de um compensador de movimento 590. Uma terceira saída do armazenamento de imagem de referência 570 está conectada em comunicação de sina! com uma segunda entrada do compensador de movimento 590. A saída do compensador de movimento 590, a qual é indicativa de uma imagem de referência com movimento compensado, está conectada em comunicação de sinal com uma primeira entrada de um multiplicador 592. A saída do designador de fator de ponderação de imagem de referência 572, a qual é indicativa de um fator de ponderação, está conectada em comunicação de sinal com uma segunda entrada do multiplicador 592. A saída do multiplicador 592 está conectada em comunicação de sinal com uma entrada de inversora da junção de soma 510.

Voltando-se agora para a Figura 6, um processo ilustrativo para decodificar dados de sinal de vídeo para um bloco de imagem é indicado geralmente pelo número de referência 600. O processo inclui um bloco inicial 610 que passa o controle para um bloco de entrada 612. O bloco de entrada 612 recebe os dados compactados do bloco de imagem e passa o controle para um bloco de entrada 614. O bloco de entrada 614 recebe pelo menos um índice de imagem de referência com os dados para o bloco de imagem, cada índice de imagem de referência correspondendo a uma imagem de referência particular. O bloco de entrada 614 passa o controle para um bloco de função 616, o qual determina um fator de ponderação correspondendo a cada um dos índices de imagem de referência recebidos e passa o controle para um bloco de função opcional 617. O bloco de função opcional 617 determina um deslocamento correspondendo a cada um dos índices de imagem de referência recebidos e passa o controle para um bloco de função 618. O bloco de função 618 recupera uma imagem de referência correspondendo a cada um dos índices de imagem de referência recebidos e passa o controle para um bloco de função 620. O bloco de função 620, por sua vez, compensa o movimento da imagem de referência recuperada e passa o controle para um bloco de função 622. O bloco de função 622 multiplica a imagem de refeJ £ rência com o movimento compensado pelo fator de ponderação correspondente e passa o controle para um bloco de função opcional 623. O bloco de função opcional 623 adiciona a imagem de referência com o movimento compensado para o deslocamento correspondente e passa o controle para um bloco de função 624. O bloco de função 624, por sua vez, forma uma imagem de referência com movimento compensado ponderada e passa o controle para um bloco final 626.

Voltando-se agora para a Figura 7, um processo ilustrativo para codificar dados de sinal de vídeo para um bloco de imagem é indicado geralmente pelo número de referência 700. O processo inclui um bloco inicia! 710 que passa o controle para um bloco de entrada 712. O bloco de entrada 712 recebe os dados do bloco de imagem substancialmente não compactados e passa o controle para um bloco de função 714. O bloco de função 714 designa um fator de ponderação para o bloco de imagem correspondendo a uma imagem de referência particular possuindo um índice correspondente. O bloco de função 714 passa o controle para um bloco de função opcional 715. O bloco de função opcional 715 designa um deslocamento para o bloco de imagem correspondendo a uma imagem de referência particular possuindo um índice correspondente. O bloco de função opcional 715 passa o controle para um bloco de função 716, o qual calcula os vetores de movimento correspondendo à diferença entre o bloco de imagem e a imagem de referência particular e passa o controle para um bloco de função 718. O bloco de função 718 compensa o movimento da imagem de referência particular em correspondência com os vetores de movimento e passa o controle para um bloco de função 720. O bloco de função 720, por sua vez, multiplica a imagem de referência com movimento compensado pelo fator de ponderação designado para formar uma imagem de referência com movimento compensado ponderada e passa o controle para um bloco de função opcional 721. O bloco de função opcional 721, por sua vez, adiciona a imagem de referência com movimento compensado para o deslocamento designado para formar uma imagem de referência com movimento compensado ponderada e passa o controle para um bloco de função 722. O bloco de função 722 subtrai a imagem de referência com movimento compensado ponderada do bloco de imagem substancialmente não compactado e passa o controle para um bloco de função 724. O bloco de função 724, por sua vez, codifica um sinal com a diferença entre o bloco de imagem substancialmente não compactado e a imagem de referência com movimento compensado ponderada junto com o índice correspondente da imagem de referência particular e passa o controle para um bloco final 726.

Na presente modalidade ilustrativa, para cada imagem ou fração codificada, um fator de ponderação é associado com cada imagem de referência permitida com respeito a que blocos da imagem corrente podem ser codificados. Quando cada bloco individual na imagem corrente é codificado ou decodificado, o fator(es) de ponderação e o deslocamen57 to(s) que correspondem aos seus índices de imagem de referência são aplicados para a predição de referência para formar um preditor de peso. Todos os blocos na fração que são codificados com respeito à mesma imagem de referência aplicam o mesmo fator de ponderação para a predição da imagem de referência.

A utilização ou não da ponderação adaptativa quando codificando-se uma imagem pode ser indicada no conjunto de parâmetros da imagem ou no conjunto de parâmetros da seqüência, ou na fração ou cabeçalho da imagem. Para cada fração ou imagem que utiliza a ponderação adaptativa, um fator de ponderação pode ser transmitido para cada uma das imagens de referência que podem ser permitida que pode ser utilizada para codificar esta fração ou imagem. O número de imagens de referência que podem ser permitidas é transmitido no cabeçalho da fração. Por exemplo, se três imagens de referência puderem ser utilizadas para codificar a fração corrente, até três fatores de ponderação são transmitidos e eles estão associados com a imagem de referência com o mesmo índice.

Se nenhum fator de ponderação for transmitido, pesos padrão são utilizados. Em uma modalidade da presente invenção, pesos padrão de (1/2, %) são utilizados quando nenhum fator de ponderação é transmitido. Os fatores de ponderação podem ser transmitidos utilizando-se códigos de comprimento variável ou fixo.

Diferente dos sistemas típicos, cada fator de ponderação que é transmitido com cada fração, bloco ou imagem corresponde a um índice de imagem de referência particular. Anteriormente, qualquer conjunto de fatores de ponderação transmitidos com cada fração ou imagem não estavam associados com quaisquer imagens de referência particulares. Ao invés disso, um índice de ponderação de predição dupla adaptativa era transmitido para cada bloco de movimento ou região 8x8 para selecionar qual dos fatores de ponderação a partir do conjunto transmitido era para ser aplicado para este bloco de movimento ou região 8x8 particular.

Na presente modalidade da presente invenção, o índice do fator de ponderação para cada bloco de movimento ou região 8x8 não é explicitamente transmitido. Ao invés disso, o fator de ponderação que está associado com o índice de imagem referência transmitido é utilizado. Isto dramaticamente reduz a quantidade de atividades de suporte no fluxo de bits transmitido para permitir a ponderação adaptativa das imagens de referência.

Este sistema e técnica podem ser aplicados junto às imagens “P de predição, as quais são codificadas com um único preditor, ou junto às imagens “B” de predição dupla, as quais são codificadas com dois preditores. Os processos de decodificação, os quais estão presentes tanto no codificador como no decodificador, são descritos abaixo para os casos de imagem P e B. Alternativamente, esta técnica também pode ser aplicada junto a sistemas de codificação utilizando os conceitos similares às imagens I, B e P.

Os mesmos fatores de ponderação podem ser utilizados para a predição direcional

Α única nas imagens B e para a predição bidirecional nas imagens B. Quando um único preditor é utilizado para uma macrobloco, nas imagens P ou para a predição direcional única nas imagens B, um único índice de imagem de referência é transmitido para o bloco. Após o processo de decodificação, a etapa de compensação de movimento produz um preditor, o fator de ponderação é aplicado para o preditor. O preditor ponderado é então adicionado para o resíduo codificado e o recorte é feito na soma, para formar a imagem decodificada. Para uso para blocos em imagens P ou para blocos em imagens B que utilizam somente a predição da lista 0, o preditor ponderado é formado como:

Pred = WO * PredO + DO (1) onde WO é o fator de ponderação associado com a imagem de referência da lista 0, DO é o deslocamento associado com a imagens de referência da lista 0 e PredO é o bloco de predição com movimento compensado da imagem de referência da lista 0.

Para uso para blocos nas imagens B que utilizam somente a predição da lista 0, o preditor ponderado é formado como:

Pred = W1 * Predl + D1 (2) onde W1 é o fator de ponderação associado com a imagem de referência da lista 1, D0 é o deslocamento associado com a imagem de referência da lista 1 e Predl é o bloco de predição com movimento compensado da imagem de referência da lista 1.

Os preditores ponderados podem ser recortados para garantir que os valores resultantes estarão dentro da faixa permitida de valores de pixel, tipicamente 0 até 255. A precisão da multiplicação nas fórmulas de ponderação pode ser limitada a qualquer número predeterminado de bits de resolução.

No caso de predição dupla, os índices de imagem de referência são transmitidos para cada um dos dois preditores. A compensação de movimento é executada para formar os dois preditores. Cada preditor utiliza o fator de ponderação associado com seu índice de imagem de referência para formar dois preditores ponderados. Os dois preditores ponderados têm então a média calculada para formar um preditor com a média calculada, o qual é então adicionado para o resíduo codificado.

Para uso para blocos em imagens B que utilizam as predições da lista 0 e da lista 1, o preditor ponderado é formado como:

Pred= (P0 * Pred0+D0+P1 * Pred1+D1)/2 (3)

O recorte pode ser aplicado junto ao preditor ponderado ou junto a quaisquer valores intermediários no cálculo do preditor ponderado para garantir que os valores resultantes estarão dentro da faixa permitida de valores de pixel, tipicamente 0 até 255.

Assim, um fator de ponderação é aplicado junto à predição da imagem de referência de um codificador e decodificador de compactação de vídeo que utiliza várias imagens de referência. O fator de ponderação adapta-se para os blocos de movimento individuais dentro de uma imagem, baseado no índice de imagem de referência que é utilizado para este bloco de movimento. Pelo fato do índice de imagem de referência já ser transmitido no fluxo de bits de vídeo compactado, as atividades de suporte para adaptar o fator de ponderação em baseado no bloco de movimento são dramaticamente reduzidas. Todos os blocos de movimento que são codificados com respeito à mesma imagem de referência aplicam o mesmo fator de ponderação para a predição da imagem de referência.

Estes e outros aspectos e vantagens da presente invenção podem ser prontamente verificados pelos com conhecimento comum na técnica pertinente baseado nas instruções aqui dentro. Deve ser entendido que as instruções da presente invenção podem ser implementados em várias formas de hardware, software, firmware, processadores de propósito especial, ou em combinações dos mesmos.

Mais de preferência, as instruções da presente invenção são implementadas como uma combinação de hardware e de software. Além disso, o software de preferência é implementado como um programa de aplicação de forma tangível incorporado em uma unidade de armazenamento de programa. O programa de aplicação pode ser transferido e executado por uma máquina compreendendo qualquer arquitetura adequada. De preferência, a máquina é implementada em uma plataforma de computador possuindo hardware tal como uma ou mais unidades centrais de processamento (“CPU”), uma memória de acesso randomico (“RAM”) e as interfaces de entrada/saída (Ί/O”). A plataforma de computador também pode incluir um sistema operacional e o código de microinstrução. Os vários processos e funções descritas aqui dentro podem ser parte do código de microinstrução ou parte do programa de aplicação, ou qualquer combinação dos mesmos, os quais podem ser executados por uma CPU. Em adição, várias outras unidades periféricas podem ser conectadas com a plataforma de computador tal como uma unidade de armazenamento de dados adicional e uma unidade de impressão.

Deve ser adicionalmente entendido que, pelo fato de que alguns componentes constituintes do sistema e os métodos descritos nos desenhos acompanhantes de preferência serem implementados em software, as conexões reais entre os componentes do sistema ou dos blocos de função do processo podem diferir dependendo da maneira na qual a presente invenção é programada. Dadas as instruções aqui dentro, os com conhecimento comum na técnica pertinente estarão aptos a contemplar estas e implementações ou configurações similares da presente invenção.

Apesar das modalidades ilustrativas terem sido descritas aqui dentro com referência aos desenhos acompanhantes, deve ser entendido que a presente invenção não está limitada a estas modalidades precisas e que várias alterações e modificações podem ser efetuadas na mesma pelos com conhecimento comum na técnica pertinente sem sair do escopo ou do espírito da presente invenção. Todas tais alterações e modificações são pre6 tendidas de estarem incluídas dentro do escopo da presente invenção como exposto nas reivindicações anexas.

Claims

REIVINDICAÇÕES

1. Método (700) para codificação dados de sinal de vídeo para um bloco de imagem, o método sendo CARACTERIZADO por compreender:

receber (712) um bloco de imagem não compactado;

5 designar (714) o primeiro fator de ponderação para o bloco de imagem correspondendo a uma primeira imagem de referência, possuindo um índice correspondente, em que o índice correspondente determina (1) a primeira imagem de referência particular e (2) o primeiro fator de ponderação;

computar (716) o primeiro vetor de movimento correspondendo a diferença entre o 10 bloco de imagem e a primeira imagem de referência;

compensar o movimento (718) de um bloco da primeira imagem de referência correspondendo ao primeiro vetor de movimento;

modificar (721) o bloco da imagem de referência compensado pela designação do primeiro fator de ponderação para formar um primeiro bloco de imagem de referência com15 pensado no movimento ponderado;

comparar (722) o primeiro bloco de imagem de referência compensado no movimento ponderado ao bloco de imagem não compactado;

codificar (724) um sinal indicativo da diferença entre o bloco de imagem não compactado e o primeiro bloco de imagem de referência compensado no movimento ponderado

20 junto com o primeiro índice correspondente da primeira imagem de referência;

designar um segundo fator de ponderação para o bloco de imagem correspondente a segunda imagem de referencia possuindo um segundo índice correspondente, em que o segundo índice correspondente determina (1) a segunda imagem de referência e (2) o segundo fator de ponderação;

25 computar o segundo vetor de movimento correspondendo a diferença entre o bloco de imagem e a segunda imagem de referência;

compensar o movimento de um bloco da segunda imagem de referência correspondendo ao segundo vetor de movimento;

multiplicar o bloco da segunda imagem de referencia compensado no movimento 30 pelo segundo fator de ponderação designado para formar o segundo bloco de imagem de referência compensado no movimento ponderado;

subtrair o segundo bloco de imagem de referência compensado no movimento ponderado do bloco de imagem não compactado; e codificar um sinal indicativo da diferença entre o bloco de imagem não compactado

35 e segundo bloco de imagem de referência compensado no movimento ponderado junto com o segundo índice correspondente da segunda imagem de referência.

Petição 870170091498, de 27/11/2017, pág. 9/11
2. Método, de acordo com a reivindicação 1, CARACTERIZADO pelo fato de que as duas imagens de referências diferentes são ambas da mesma direção em relação ao bloco de imagem.
3. Método, de acordo com a reivindicação 1, CARACTERIZADO pelo fato de que 5 computar o vetor de movimento compreende:

testar dentro de uma região de pesquisa para cada deslocamento dentro de uma faixa predeterminada os deslocamentos relativos para o bloco de imagem;

calcular pelo menos um da soma da diferença absoluta e do erro médio quadrático de cada pixel no bloco de imagem com o primeiro bloco de imagem de referência compen10 sado no movimento correspondendo ao primeiro preditor;

selecionar um deslocamento com a menor soma da diferença absoluta e do erro médio quadrático como o primeiro vetor de movimento para o primeiro preditor calcular pelo menos um da soma da diferença absoluta e do erro médio quadrático de cada pixel no bloco de imagem com o segundo bloco de imagem de referência compen15 sado no movimento correspondendo ao segundo preditor; e selecionar um deslocamento com a menor soma da diferença absoluta e do erro médio quadrático como o segundo vetor de movimento para o segundo preditor.

Petição 870170091498, de 27/11/2017, pág. 10/11

3?

130

440

QUANTtZAÇÃO

INVERSA

TRANSFOR

MADA

INVERSA

VLD

160 —

150