BR112017006017B1 - Método de predição de imagem e aparelho relacionado - Google Patents

Método de predição de imagem e aparelho relacionado Download PDF

Info

Publication number
BR112017006017B1
BR112017006017B1 BR112017006017-5A BR112017006017A BR112017006017B1 BR 112017006017 B1 BR112017006017 B1 BR 112017006017B1 BR 112017006017 A BR112017006017 A BR 112017006017A BR 112017006017 B1 BR112017006017 B1 BR 112017006017B1
Authority
BR
Brazil
Prior art keywords
model
pixel
models
image block
pixel area
Prior art date
Application number
BR112017006017-5A
Other languages
English (en)
Other versions
BR112017006017A2 (pt
Inventor
Xin Huang
Hong Zhang
Haitao Yang
Original Assignee
Huawei Technologies Co., Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from CN201410606914.2A external-priority patent/CN104363449B/zh
Application filed by Huawei Technologies Co., Ltd filed Critical Huawei Technologies Co., Ltd
Publication of BR112017006017A2 publication Critical patent/BR112017006017A2/pt
Publication of BR112017006017B1 publication Critical patent/BR112017006017B1/pt

Links

Abstract

MÉTODO DE PREDIÇÃO DE IMAGEM E APARELHO RELACIONADO. Modalidades da presente invenção descrevem um método de predição de imagem e um aparelho relacionado. O método de predição de imagem inclui: determinar (101) N modelos cujos graus de correspondência com um modelo atual satisfazem uma condição predefinida, em que o modelo atual é um modelo correspondente a um bloco de imagens atual, M é um número inteiro positivo, e os M modelos são obtidos por pesquisar imagens de referência do bloco de imagens atual; determinar (102) um peso de uma área de pixels em um bloco de imagens correspondente a cada modelo nos N modelos, em que pesos de pelo menos duas áreas de pixel em um bloco de imagens correspondente a pelo menos um modelo nos N modelos são diferentes; e calcular (103) um valor de pixel previsto de uma área de pixels no bloco de imagens atual com base no peso e um valor de pixel da área de pixels no bloco de imagens correspondente a cada modelo nos N modelos, em que a área de pixels inclui pelo menos um pixel. As soluções técnicas nas modalidades da presente invenção são úteis para melhorar precisão de predição de imagem.

Description

CAMPO TÉCNICO
[1] A presente invenção refere-se ao campo das tecnologias de processamento de imagem e, especificamente, a um método de predição de imagem e a um aparelho relacionado.
FUNDAMENTOS
[002] Com desenvolvimento de tecnologias de aquisição fotoelétrica e aumento continuo de requisitos para videos digitais de alta definição, uma quantidade de dados de video é cada vez maior. Devido à limitada largura de banda de transmissão heterogênea e aplicações de video diversificadas, requisitos mais elevados são continuamente impostos em eficiência de codificação de video. Uma tarefa de desenvolver um padrão de Codificação de Video de Alta Eficiência (Inglês: high efficiency video coding, HEVC para abreviar) é iniciada de acordo com os requisitos.
[003] Um principio básico de codificação de compressão de video é utilizar correlação entre um dominio de espaço, um dominio de tempo e uma palavra de código para remover redundância tanto quanto possivel. Atualmente, uma prática predominante é utilizar uma estrutura de codificação de video hibrida baseada em blocos para implementar codificação de compressão de video por executar passos de predição (incluindo predição intra-quadro e predição inter-quadro), transformada, quantização, codificação de entropia e similares. Em uma tecnologia de predição intra-quadro, informação de redundância de um bloco de imagens atual é removida utilizando informação de pixel espacial do bloco de imagens atual, para obter um residue; em uma tecnologia de predição inter-quadro, informação de redundância de um bloco*, de imagens atual é removida utilizando informação de pixel de uma imagem codificada ou decodificada adjacente a uma imagem atual, para obter um residuo. Esta estrutura de codificação mostra alta viabilidade, e, portanto, HEVC ainda utiliza esta estrutura de codificação de video hibrida baseada em bloco.
[004] Na técnica anterior, um método é fornecido para prever um valor de pixel de um bloco de imagens atual com base em uma tecnologia de filtragem de meios não locais. Depois de todos os modelos correspondentes a um modelo atual serem obtidos por pesquisar imagens de referência, um valor de pixel previsto de um bloco de imagens atual é obtido utilizando uma média de valores de pixel de blocos de imagem correspondentes aos vários modelos. No entanto, em um processo de teste e prática, verifica-se que, por vezes, precisão de predição em uma tecnologia de predição existente é relativamente baixa e, consequentemente, isto é susceptível de afetar qualidade de codificação e decodificação de video.
SUMÁRIO
[005] Modalidades da presente invenção fornecem um método de predição de imagem e um aparelho relacionado, de modo a melhorar a precisão de predição de imagem.
[006] Um primeiro aspecto da presente invenção fornece um método de predição de imagem, incluindo: determinar N modelos cujos graus de correspondência com um modelo atual satisfazem uma condição predefinida, em que o modelo atual é um modelo correspondente a um bloco de imagens atual, M é um inteiro positivo, e os M modelos são obtidos por pesquisar imagens de referência do bloco de imagens atual; determinar um peso de uma área de pixels em um bloco de imagens correspondente a cada modelo nos N modelos, em pesos de pelo menos duas áreas de pixel em um bloco de imagens correspondente a pelo menos um modelo nos N modelos são diferentes; e calcular um valor de pixel previsto de uma área de pixels no bloco de imagens atual com base no peso e um valor de pixel da área de pixels no bloco de imagens correspondente a cada modelo nos N modelos, em que a área de pixels inclui pelo menos um pixel.
[007] Com referência ao primeiro aspecto, em uma primeira forma possivel de implementação do primeiro aspecto, a determinação de um peso de uma área de pixels em um bloco de imagens correspondente a cada modelo nos N modelos inclui: determinar um peso de cada modelo nos N modelos de acordo com um grau de correspondência entre cada modelo nos N modelos e o modelo atual; e determinar, com base no peso de cada modelo nos N modelos e um parâmetro sobre uma similaridade entre cada modelo nos N modelos e a área de pixels no bloco de imagens correspondente, o peso da área de pixels no bloco de imagens correspondente a cada modelo nos N modelos.
[008] Com referência à primeira forma possivel de implementação do primeiro aspecto, em uma segunda forma possivel de implementação do primeiro aspecto, o parâmetro sobre a similaridade entre cada modelo nos N modelos e a área de pixels no bloco de imagens correspondente inclui: uma distância entre uma área de pixels determinada em cada modelo nos N modelos e a área de pixels no bloco de imagens correspondente; e / ou uma proporção de uma média ou uma média ponderada de valores de pixel de uma área de pixels determinada em cada modelo nos N modelos para o valor de pixel da área de pixels no bloco de imagens correspondente ou uma diferença absoluta entre uma média ou uma média ponderada de valores de pixel de uma área de pixels determinada em cada modelo nos N modelos e o valor de pixel da área de pixels no bloco de imagens correspondente.
[009] Com referência à primeira forma possivel de implementação do primeiro aspecto, ou à segunda forma possivel de implementação do primeiro aspecto, em uma terceira forma possivel de implementação do primeiro aspecto, a determinação de um peso de cada modelo nos N modelos de acordo com um grau de correspondência entre cada modelo nos N modelos e o modelo atual inclui: determinar o peso de cada modelo nos N modelos com base na fórmula seguinte e de acordo com o grau de correspondência entre cada modelo nos N modelos e o modelo atual: , em que representa distorção entre o modelo atual Tx e um modelo Tm nos N modelos, S representa uma quantidade de áreas de pixel no modelo atual Tx, o representa um fator de escala de modelo, a e o são números reais maiores que 0, wm representa um peso do modelo Tm, e o modelo Tra é qualquer modelo nos N modelos.
[0010] Com referência a qualquer uma da primeira a terceira formas possiveis de implementação do primeiro aspecto, em uma quarta forma possível de implementação do primeiro aspecto, a determinação, com base no peso de cada modelo nos N modelos e um parâmetro sobre uma similaridade entre cada modelo nos N modelos e a área de pixels no bloco de imagens correspondente, do peso da área de pixels no bloco de imagens correspondente a cada modelo nos N modelos inclui: determinar, com base na fórmula seguinte e com base no peso de cada modelo nos N modelos e o parâmetro sobre a similaridade entre cada modelo nos N modelos e a área de pixels no bloco de imagens correspondente, o peso da área de pixels no bloco de imagens correspondente a cada modelo nos N modelos: em que wm(i, j) representa um peso de uma área de pixels cujas coordenadas são (i, j) e que está em um bloco de imagens m correspondente ao modelo Tm nos N modelos, R(i, j) representa um parâmetro sobre uma similaridade entre a área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens meo modelo Tm, e d(R(í, j)) representa um fator de escala da área de pixels correspondente a imagem R(i, j).
[0011] Com referência à quarta forma possível de implementação do primeiro aspecto, em uma quinta forma possível de implementação do primeiro aspecto, existe uma relação linear ou uma relação não linear entre 3(R(i, j)) e R(i, j) .
[0012] Com referência à quinta forma possível de implementação do primeiro aspecto, em uma sexta forma possível de implementação do linear entre 3(R(i, j)) e R(i, em que β é um coeficiente de primeiro aspecto, a relação j) é: d(R(i, j) ) = β*R(i, j), escala, e β é um número real maior que 0.
[0013] Com referência à quinta forma possivel de implementação do primeiro aspecto, em uma sétima forma possivel de implementação do primeiro aspecto, a relação não linear entre 3(R(i, j)) e R(i, j) é: um valor de <3(R(i, j)) é determinado com base em um intervalo de distância dentro do qual R(i, j) cai, e diferentes intervalos de distância correspondem a fatores de escala de área de pixels com valores diferentes.
[0014] Com referência à sétima forma possivel de implementação do primeiro aspecto, em uma oitava forma possivel de implementação do primeiro aspecto, a relação não linear entre 3(R(i, j)) e R(i, j) é: , em que al é menor que a2, a2 é menor que a3, e bl é menor que b2; e al, a2, a3, bl e b2 são números reais maiores que 0; ou a relação não linear entre 5(R(i, j)) e R(i, j) é: , em que a4 é menor que a5, a5 é menor que a6, a6 é menor que a7, b3 é menor que b4, e b4 é menor que b5; e a4, a5, a6, a7, b3, b4 e b5 são números reais maiores que 0; ou a relação não linear entre 3(R(i, j)) e R(i, j) é: , em que a8 é menor que a9, e a8, a9 e bδ são números reais maiores que 0.
[0015] Com referência a qualquer uma da quarta à oitava formas possíveis de implementação do primeiro aspecto, em uma nona forma possível de implementação do primeiro aspecto, R(i, j) é igual a d(i, j) ou e(i, j), d(i, j) representa uma distância entre a área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m e uma área de pixels determinada no modelo Tm, e e(i, j) representa uma proporção de um valor de pixel da área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m para um valor de pixel médio ou um valor de pixel médio ponderado do modelo Tm ou uma diferença absoluta entre um valor de pixel da área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m e um valor de pixel médio ou um valor de pixel médio ponderado do modelo Tm.
[0016] Com referência à nona forma possível de implementação do primeiro aspecto, em uma décima forma possível de implementação do primeiro aspecto, d(i, j) representa uma distância entre a área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m e um pixel superior esquerdo no modelo Tm, ou d(i, j) representa uma distância entre a área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m e um pixel y no modelo Tm; e a distância entre a área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens meo pixel y no modelo Tm é menor ou igual a uma distância entre a área de pixels cujas coordenadas são (i, j) e bloco de imagens m e qualquer pixel no modelo pixel y.
[0017] Com referência a qualquer um do primeiro aspecto, ou a primeira à décima formas possiveis de implementação do primeiro aspecto, em uma décima primeira forma possivel de implementação do primeiro aspecto, o cálculo de um valor de pixel previsto de uma área de pixels no bloco de imagens atual com base no peso e em um valor de pixel da área de pixels no bloco de imagens correspondente a cada modelo nos N modelos inclui: calcular o valor de pixel previsto da área de pixels no bloco de imagens atual utilizando a seguinte fórmula e com base no peso e o valor de pixel da área de pixels no bloco de imagens correspondente a cada modelo nos N modelos: , em que wm(i, j) representa o peso da área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m correspondente ao modelo Tm nos N modelos, pm(i, j) representa o valor de pixel da área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m, e pre(i, j) representa um valor de pixel previsto de uma área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens atual.
[0018] Com referência a qualquer um do primeiro aspecto, ou a primeira à décima primeira formas possiveis de implementação do primeiro aspecto, em uma décima segunda forma possivel de implementação do primeiro aspecto, a determinação de N modelos cujos graus de correspondência com um modelo atual satisfazem uma condição predefinida inclui: determinar M modelos com o grau mais alto de correspondência com o modelo atual; e determinar, a partir dos M modelos, N modelos que satisfazem a condição predefinida, em que N é menor do que M.
[0019] Com referência à décima segunda forma possivel de implementação do primeiro aspecto, em uma décima terceira forma possivel de implementação do primeiro aspecto, a determinação, a partir dos M modelos, de N modelos que satisfazem a condição predefinida inclui: determinar N modelos a partir dos M modelos, em que distorção entre valores de pixel dos N modelos e um valor de pixel do modelo atual é menor ou igual a um limiar.
[0020] Com referência à décima terceira forma possivel de implementação do primeiro aspecto, em uma décima quarta forma possivel de implementação do primeiro aspecto, o limiar é igual à distorção média entre o valor de pixel do modelo atual e os valores de pixel dos M modelos ou o limiar é igual a um valor de ajuste da distorção média entre o valor de pixel do modelo atual e os valores de pixel dos M modelos.
[0021] Com referência a qualquer um do primeiro aspecto, ou a primeira à décima quarta formas possiveis de implementação do primeiro aspecto, em uma décima quinta forma possivel de implementação do primeiro aspecto, o método de predição de imagem é aplicado em um processo de codificação de video, ou o método de predição de imagem é aplicado em um processo de decodificação de video.
[0022] Um segundo aspecto da presente invenção fornece um aparelho de predição de imagem, uma primeira unidade de determinação, determinar N modelos cujos graus de correspondência com um modelo atual satisfazem uma condição predefinida, em que o modelo atual é um modelo correspondente a um bloco de imagens atual, M é um inteiro positivo, e os M modelos são obtidos por pesquisar imagens de referência do bloco de imagens atual; uma segunda unidade de determinação, configurada para determinar um peso de uma área de pixels em um bloco de imagens correspondente a cada modelo nos N modelos, em que pesos de pelo menos duas áreas de pixel em um bloco de imagens correspondente a pelo menos um modelo nos N modelos são diferentes; e uma unidade de predição, configurada para calcular um valor de pixel previsto de uma área de pixels no bloco de imagens atual com base no peso e um valor de pixel da área de pixels no bloco de imagens correspondente a cada modelo nos N modelos, em que a área de pixels inclui pelo menos um pixel.
[0023] Com referência ao segundo aspecto, em uma primeira forma possivel de implementação do segundo aspecto, a segunda unidade de determinação inclui: uma primeira subunidade de determinação, configurada para determinar um peso de cada modelo nos N modelos de acordo com um grau de correspondência entre cada modelo nos N modelos e o modelo atual; e uma segunda subunidade de determinação, configurada para determinar, com base no peso de cada modelo nos N modelos e um parâmetro sobre uma similaridade entre cada modelo nos N modelos e a area de pixels no bloco de imagens correspondente, o peso da área de pixels no bloco de imagens correspondente a cada modelo nos N modelos.
[0024] Com referência à primeira forma possivel de implementação do segundo aspecto, em uma segunda forma possivel de implementação do segundo aspecto, o parâmetro sobre a similaridade entre cada modelo nos N modelos e a área de pixels no bloco de imagens correspondente inclui: uma distância entre uma área de pixels determinada em cada modelo nos N modelos e a área de pixels no bloco de imagens correspondente; e / ou uma proporção de uma média ou uma média ponderada de valores de pixel de uma área de pixels determinada em cada modelo nos N modelos para o valor de pixel da área de pixels no bloco de imagens correspondente ou uma diferença absoluta entre uma média ou uma média ponderada de valores de pixel de uma área de pixels determinada em cada modelo nos N modelos e o valor de pixel da área de pixels no bloco de imagens correspondente.
[0025] Com referência à primeira forma possivel de implementação do segundo aspecto, ou à segunda forma possivel de implementação do segundo aspecto, em uma terceira forma possivel de implementação do segundo aspecto, a primeira subunidade de determinação é configurada especificamente para determinar o peso de cada modelo nos N modelos com base na fórmula seguinte e de acordo com o grau de correspondência entre cada modelo nos N modelos e o modelo atual: , em que representa distorção entre o modelo atual Tx e um modelo Tm nos N modelos, S representa uma quantidade de áreas de pixel no modelo atual Tx, α representa um fator de escala de modelo, a e o são números reais maiores que 0, wra representa um peso do modelo Tm, e o modelo Tm é qualquer modelo nos N modelos.
[0026] Com referência a qualquer uma da primeira a terceira formas possiveis de implementação do segundo aspecto, em uma quarta forma possivel de implementação do segundo aspecto, a segunda subunidade de determinação é especificamente configurada para determinar, com base na fórmula seguinte e com base no peso de cada modelo nos N modelos e o parâmetro sobre a similaridade entre cada modelo nos N modelos e a área de pixels no bloco de imagens correspondente, o peso da área de pixels no bloco de imagens correspondente a cada modelo nos N modelos: em que wm(i, j) representa um peso de uma área de pixels cujas coordenadas são (i, j) e que está em um bloco de imagens m correspondente ao modelo Tm nos N modelos, R(i, j) representa um parâmetro sobre uma similaridade entre a área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens meo modelo Tm, e 3(R(i, j)) representa um fator de escala da área de pixels correspondente a imagem R(i, j).
[0027] Com referência à quarta forma possivel de implementação do segundo aspecto, em uma quinta forma possivel de implementação do segundo aspecto, existe uma relação linear ou uma relação não linear entre 5(R(i, j)) e R(i, j)•
[0028] Com referência à quinta forma possivel de implementação do segundo aspecto, em uma sexta forma possivel de implementação do segundo aspecto, a relação linear entre 3(R(i, j)) e R(i, j) é:5(R(i, j)) = β*R(i, j), em que β é urfc coeficiente de escala, e β é um número real maior que 0.
[0029] Com referência à quinta forma possivel de implementação do segundo aspecto, em uma sétima forma possivel de implementação do segundo aspecto, a relação não linear entre <9(R(i, j)) e R(i, j) é: um valor de 5(R(i, j)) é determinado com base em um intervalo de distância dentro do qual R(i, j) cai, e diferentes intervalos de distância correspondem a fatores de escala de área de pixels com diferentes valores.
[0030] Com referência à sétima forma possivel de implementação do segundo aspecto, em uma oitava forma possivel de implementação do segundo aspecto, a relação não linear entre <9 (R (i, j)) e R(i, j) é: , em que al é menor que a2, a2 é menor que a3, e bl é menor que b2; e al, a2, a3, bl e b2 são números reais maiores que 0; ou a relação não linear entre <3(R(i, j)) e R(i, j) é: , em que a4 é menor que a5, a5 é menor que a6, a6 é menor que a7, b3 é menor que b4, e b4 é menor que b5; e a4, a5, a6, a7, b3, b4 e b5 são números reais maiores que 0; ou a relação não linear entre 3(R(í, j)) e R(i, j) é: , em que a8 é menor que a9, e a8, a9 e b6 são números reais maiores que 0.
[0031] Com referência a qualquer uma da quarta à oitava formas possiveis de implementação do segundo aspecto, em uma nona forma possivel de implementação do segundo aspecto, R(i, j) é igual a d(i, j) ou e(i, j), d(i, j) representa uma distância entre a área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m e uma área de pixels determinada no modelo Tm, e e(i, j) representa uma proporção de um valor de pixel da área de pixels cujas coordenadas são {i, j) e que está no bloco de imagens m para um valor de pixel médio ou um valor de pixel médio ponderado do modelo Tm ou uma diferença absoluta entre um valor de pixel da área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m e um valor de pixel médio ou um valor de pixel médio ponderado do modelo Tm,
[0032] Com referência à nona forma possivel de implementação do segundo aspecto, em uma décima forma possivel de implementação do segundo aspecto, d(i, j) representa uma distância entre a área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m e um pixel superior esquerdo no modelo Tm, ou d(i, j) representa uma distância entre a área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m e um pixel y no modelo Tm; e a distância entre a área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens meo pixel y no modelo Tm é menor ou igual a uma distância entre a área de pixels cujas coordenadas são (i, j) e que está no epp bloco de imagens m e qualquer pixel no modelo Tm exceto o pixel y.
[0033] Com referência a qualquer um do segundo aspecto, ou a primeira à décima formas possíveis de implementação do segundo aspecto, em uma décima primeira forma possível de implementação do segundo aspecto, a unidade de predição é especificamente configurada para calcular o valor de pixel previsto da área de pixels no bloco de imagens atual utilizando a seguinte fórmula e com base no peso e no valor de pixel da área de pixels no bloco de imagens correspondente a cada modelo nos N modelos: , em que Wm(i, j) representa o peso da área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m correspondente ao modelo Tm nos N modelos, pm(i, j) representa o valor de pixel da área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m, e pre{i, j) representa um valor de pixel previsto de uma área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens atual.
[0034] Com referência a qualquer um do segundo aspecto, ou a primeira à décima primeira formas possíveis de implementação do segundo aspecto, em uma décima segunda forma possível de implementação do segundo aspecto, a primeira unidade de determinação é especificamente configurada para: determinar M modelos com urn grau mais alto de correspondênciá com o modelo atual; e determinar, a partir dos M modelos, N modelos que satisfazem a condição predefinida, em que N é menor que M.
[0035] Com referência à décima segunda forma possivel de implementação do segundo aspecto, em uma décima terceira forma possivel de implementação do segundo aspecto, a primeira unidade de determinação é especificamente configurada para: determinar os M modelos com o grau mais elevado de correspondência com o modelo atual; e determinar N modelos a partir dos M modelos, em que distorção entre valores de pixel dos N modelos e um valor de pixel do modelo atual é menor ou igual a um limiar.
[0036] Com referência à décima terceira forma possivel de implementação do segundo aspecto, em uma décima quarta forma possivel de implementação do segundo aspecto, o limiar é igual à distorção média entre o valor de pixel do modelo atual e os valores de pixel dos M modelos ou o limiar é igual a um valor de ajuste da distorção média entre o valor de pixel do modelo atual e os valores de pixel dos M modelos.
[0037] Com referência a qualquer um do segundo aspecto, ou a primeira à décima quarta formas possiveis de implementação do segundo aspecto, em uma décima quinta forma possivel de implementação do segundo aspecto, o aparelho de predição de imagem é aplicado a um aparelho de codificação de video, ou o aparelho de predição de imagem é aplicado a um aparelho de decodificação de video.
[0038] Pode ser aprendido que, nas soluções nas modalidades da presente invenção, após N modelos cujos graus de correspondência com um modelo atual satisfazem uma condição predefinida serem determinados, um peso de uma área de pixels em um bloco de imagens correspondente a cada rnodeló’'»?^ , nos N modelos é determinado, e um valor de pixel previsto de uma área de pixels no bloco de imagens atual é calculado com base no peso e em um valor de pixel da área de pixels no bloco de imagens correspondente a cada modelo nos N modelos. A área de pixels inclui pelo menos um pixel. Pesos de pelo menos duas áreas de pixel em um bloco de imagens correspondente a pelo menos um modelo nos N modelos determinados são diferentes, isto é, os pesos de pelo menos duas áreas de pixel em um bloco de imagens correspondente a um mesmo modelo são diferentes. Por conseguinte, uma solução de arte convencional na qual os pesos de todas as áreas de pixel em blocos de imagem correspondentes a todos os modelos são os mesmos (onde os pesos são todos iguais a 1) é abandonada. Como há uma diferença especifica entre os pesos das áreas de pixel, é mais provável conformar com uma diferença de correlação real. Deste modo, um valor de pixel de uma área de pixels em um bloco de imagens atual é precisamente previsto e eficiência de codificação e decodificação de video são melhoradas.
BREVE DESCRIÇÃO DOS DESENHOS
[0039] Para descrever as soluções técnicas nas modalidades da presente invenção ou na técnica anterior mais claramente, o seguinte descreve brevemente os desenhos anexos necessários para descrever as modalidades ou a técnica anterior. Aparentemente, os desenhos anexos na descrição seguinte mostram apenas algumas modalidades da presente invenção, e os especialistas na técnica podem ainda derivar outros desenhos a partir destes desenhos anexos sem esforços criativos.
[0040] A Figura 1-a é um diagrama esquemático de uma maneira de divisão de unidade de predição correspondente à predição intra-quadro de acordo com uma modalidade da presente invenção;
[0041] A Figura 1-b é um diagrama esquemático de várias maneiras de divisão de unidade de predição correspondentes à predição inter-quadro de acordo com uma modalidade da presente invenção;
[0042] A Figura 1-c é um fluxograma esquemático de um método de predição de imagem de acordo com uma modalidade da presente invenção;
[0043] A Figura 1-d é um diagrama esquemático de uma relação de localização entre um bloco de imagens e um modelo de acordo com uma modalidade da presente invenção;
[0044] A Figura 2 é um fluxograma esquemático de outro método de predição de imagem de acordo com uma modalidade da presente invenção;
[0045] A Figura 3 é um fluxograma esquemático de outro método de predição de imagem de acordo com uma modalidade da presente invenção;
[0046] A Figura 4 é um fluxograma esquemático de outro método de predição de imagem de acordo com uma modalidade da presente invenção;
[0047] A Figura 5 é um diagrama esquemático de um aparelho de predição de imagem de acordo com uma modalidade da presente invenção;
[0048] A Figura 6 é um diagrama esquemático de outro aparelho de predição de imagem de acordo com uma modalidade da presente invenção; e
[0049] A Figura 7 é um diagrama esquemático de outra aparelho de predição de imagem de acordo com uma modalidade da presente invenção.
DESCRIÇÃO DAS MODALIDADES
[0050] As modalidades da presente invenção fornecem um método de predição de imagem e um aparelho relacionado, de modo a melhorar a precisão de predição de imagem.
[0051] Para fazer com que os especialistas na técnica compreendam melhor as soluções técnicas da presente invenção, o seguinte descreve clara e completamente as soluções técnicas nas modalidades da presente invenção com referência aos desenhos anexos nas modalidades da presente invenção. Aparentemente, as modalidades descritas são apenas algumas em vez de todas as modalidades da presente invenção. Todas as outras modalidades obtidas pelos especialistas na técnica com base nas modalidades da presente invenção sem esforços criativos estarão incluidas no âmbito de proteção da presente invenção.
[0052] Os detalhes são descritos separadamente a seguir.
[0053] Na divulgação, reivindicações e desenhos anexos da presente invenção, os termos "primeiro", "segundo", "terceiro", "quarto" e semelhantes têm a intenção de distinguir entre objetos diferentes, mas não indicam uma ordem particular. Além disso, os termos "inclui", "tem", e qualquer outra variante dos mesmos destinam-se a cobrir uma inclusão não exclusiva. Por exemplo, um processo, um método, um sistema, um produto ou um dispositivo que inclui uma série de passos ou unidades não está limitado aos passos ou unidades listadas, mas opcionalmente inclui ainda um passo ou unidade não listada ou, opcionalmente, inclui ainda outro passo ou unidade inerente do processo, método, produto ou dispositivo.
[0054] O que segue descreve, em primeiro lugar, alguns conceitos que podem estar envolvidos nas modalidades da presente invenção.
[0055] Na maioria das estruturas de codificação, uma sequência de video inclui uma série de imagens (inglês: picture), as imagens são divididas em fatias (inglês: fatia), e as fatias são ainda divididas em blocos (inglês: bloco). Codificação de video é para executar processamento de codificação da esquerda para a direita e de cima para baixo linha a linha a partir de uma posição de canto superior esquerdo de uma imagem usando um bloco como uma unidade. Em alguns novos padrões de codificação de video, o conceito de bloco é ampliado. Existe um macrobloco (inglês: macrobloco, MB para abreviar) no padrão H.264, e o MB pode ser dividido em vários blocos de predição que podem ser usados para codificação preditiva. No padrão HEVC, conceitos básicos, tais como uma unidade de codificação (inglês: unidade de codificação, CU para abreviar), uma unidade de predição (inglês: unidade de predição, PU para abreviar) e uma unidade de transformação), são usados, e unidades múltiplas são classificadas de acordo com as funções, e uma estrutura baseada em árvore completamente nova é usada para descrição. Por exemplo, a CU pode ser dividida em CUs menores de acordo com um "quadtree", e a CU menor pode ser dividida para formar uma estrutura "quadtree". A PU e a TU também têm estruturas de árvore semelhantes. Independentemente de uma unidade ser uma CU, uma PU ou uma TU, a unidade pertence ao conceito de bloco de bloco em essência. A CU é semelhante a um macroblo-cp MB ou um bloco de codificação e é uma unidade basica para particionar e codificar uma imagem. A PU pode corresponder a um bloco de predição, e é uma unidade básica para codificação preditiva. A CU é ainda dividida em múltiplas PUs de acordo com um modo de divisão. A TU pode corresponder a um bloco de transformação e é uma unidade básica para transformar um residuo de predição.
[0056] No padrão HEVC, um tamanho da unidade de codificação pode incluir quatro niveis: 64 x 64, 32 x 32, 16 x 16 e 8 x 8. As unidades de codificação em cada nivel podem ser divididas em unidades de predição de diferentes tamanhos de acordo com a predição intra-quadro e predição inter- quadro. Por exemplo, como mostrado na Figura 1-a e a Figura 1-b, a Figura 1-a mostra uma maneira de divisão de unidade de predição correspondente à predição intra-quadro. A Figura 1-b mostra várias maneiras de divisão de unidade de predição correspondentes à predição inter-quadro.
[0057] Em um processo de desenvolvimento e evolução de uma tecnologia de codificação de video, especialistas de codificação de video descobrem vários métodos para utilizar correlação temporal e espacial entre blocos de codificação / decodificação adjacentes para tentar melhorar eficiência de codificação. No padrão codificação de video avançado / H264 (inglês: Advanced Video Coding, AVC para abreviar), um modo de salto (skip mode) e um modo direto (direct mode) tornam-se ferramentas eficazes para melhorar a eficiência de codificação. Os blocos dos dois modos de codificação utilizados quando uma taxa de bits é baixa podem ocupar mais de metade de uma sequência de codificação completa. Quando o modo de salto é usado, um vetor de movimento de um bloèjpB^& de imagens atual pode ser derivado usando vetores de °'3eH ’ * movimento próximos apenas por adicionar uma bandeira de modo de salto para um fluxo de bits e um valor de um bloco de referência é copiado diretamente de acordo com o vetor de movimento como um valor reconstruído do bloco de imagens atual. Além disso, quando o modo direto é utilizado, um codificador pode derivar o vetor de movimento do bloco de imagens atual utilizando os vetores de movimento adjacentes e copiar diretamente o valor do bloco de referência de acordo com o vetor de movimento como um valor previsto do bloco de imagens atual, e executar codificação preditiva no bloco de imagens atual utilizando o valor previsto em um codificador. No padrão de HEVC desenvolvido, algumas novas ferramentas de codificação são introduzidas para melhorar ainda mais a eficiência de codificação de video. Um modo de codificação de fusão (merge) e um modo de predição de vetor de movimento avançado (inglês: advanced motion vector prediction, AMVP para abreviar) são duas importantes ferramentas de predição inter-quadro. Durante codificação de fusão (merge), um conjunto de informação de movimento candidato é construído utilizando informação de movimento (incluindo uma direção de predição, um vetor de movimento e um índice de imagem de referência) de um bloco codificado adjacente de um bloco de codificação atual, informação de movimento candidata que permite eficiência de codificação ser mais elevada pode ser selecionada como informação de movimento do bloco de codificação atual por meio de comparação, um valor previsto do bloco de codificação atual é encontrado em imagens de referência, codificação preditiva é realizada no bloco de codificação atual, e um valor de indice que indica um bloco codificado adjacente cuja informação de movimento é selecionada é escrito em um fluxo de bits. Quando o modo de predição de vetor de movimento avançado é utilizado, um vetor de movimento de um bloco codificado adjacente é utilizado como um valor previsto de vetor de movimento de um bloco de codificação atual, um vetor de movimento que permite que eficiência de codificação seja a mais elevada pode ser selecionado para prever um vetor de movimento do bloco de codificação atual, e um valor de indice que indica um bloco codificado adjacente cujo vetor de movimento é selecionado pode ser escrito em um fluxo de bits de vídeo.
[0058] As soluções técnicas nas modalidades da presente invenção são ainda discutidas a seguir.
[0059] Um método de predição de imagem fornecido nas modalidades da presente invenção é descrito em primeiro lugar a seguir. O método de predição de imagem fornecido nas modalidades da presente invenção é executado por um aparelho de codificação de vídeo ou por um aparelho de decodificação de vídeo. O aparelho de codificação de vídeo ou o aparelho de decodificação de vídeo pode ser qualquer aparelho que necessite emitir ou armazenar um vídeo, por exemplo, um dispositivo tal como um computador portátil, um computador tablet, um computador pessoal, um telefone móvel ou um servidor de vídeo.
[0060] Em uma modalidade de um método de predição de imagem da presente invenção, o método de predição de imagem inclui: determinar N modelos cujos graus de correspondência com um modelo atual satisfazem uma condição predefinida, em que o modelo atual é um modelo correspondente a um bloco de imagens atual, M é um número inteiro positivo são obtidos por pesquisar imagens de referência do bloco de imagens atual; determinar um peso de uma área de pixels em um bloco de imagens correspondente a cada modelo nos N modelos, em que pesos de pelo menos duas áreas de pixel em um bloco de imagens correspondente a pelo menos um modelo nos N modelos são diferentes; e calcular um valor de pixel previsto de uma área de pixels no bloco de imagens atual com base no peso e um valor de pixel da área de pixels no bloco de imagens correspondente a cada modelo nos N modelos, em que a área de pixels inclui pelo menos um pixel.
[0061] Com referência à Figura 1-c, a Figura 1-c é um fluxograma esquemático de um método de predição de imagem de acordo com uma modalidade da presente invenção. Conforme ilustrado na Figura 1-c, o método de predição de imagem fornecido nesta modalidade da presente invenção pode incluir os seguintes passos.
[0062] 101. Determinar N modelos cujos graus de correspondência com um modelo atual satisfaz uma condição predefinida.
[0063] O modelo atual é um modelo correspondente a um bloco de imagens atual. Os M modelos são obtidos por pesquisar imagens de referência do bloco de imagens atual. M é um número inteiro positivo.
[0064] Por exemplo, N pode ser igual a 1, 2, 3, 4, 5, 7, 9, 12 ou outro valor.
[0065] 102. Determinar um peso de uma área de pixels em um bloco de imagens correspondente a cada modelo nos N modelos.
[0066] Pesos de pelo menos duas áreas de pixel em um bloco de imagens correspondente a pelo menos um modelo N modelos são diferentes.
[0067] A área de pixels mencionada em cada modalidade da presente invenção inclui pelo menos um pixel. Isto é, a área de pixels pode ser um pixel ou um bloco de pixels, e se a área de pixels é um bloco de pixels, a área de pixels pode ter, por exemplo, um tamanho de 2x2, 1x2, 1x3, 4x2, 4 x 3, ou 4 x 4, ou outro tamanho.
[0068] Os modelos nos N modelos correspondem a blocos de imagem diferentes, e, portanto, os N modelos correspondem a N blocos de imagem. Um modelo pode ser em forma de L ou em outra forma. Por exemplo, como mostrado na Figura 1-d, um modelo correspondente a um bloco de imagens pode ser uma área de pixels em forma de L adjacente ao bloco de imagens. Por exemplo, na Figura 1-d, uma área de pixels em forma de L Tx adjacente a um bloco de imagens x é um modelo Tx correspondente ao bloco de imagens x, uma área de pixels em forma de L Tmi adjacente a um bloco de imagens ml é um modelo Tmi correspondente ao bloco de imagens ml, e uma área de pixels em forma de L Tm2 adjacente a um bloco de imagens m2 é um modelo Tm2 correspondente ao bloco de imagens m2. Pode haver nenhuma área de sobreposição entre um bloco de imagens e um modelo correspondente ao bloco de imagens.
[0069] Por exemplo, o peso da área de pixels no bloco de imagens correspondente a cada modelo nos N modelos pode ser relacionado com um parâmetro sobre uma similaridade entre cada modelo nos N modelos e a área de pixels no bloco de imagens correspondente. Um parâmetro sobre uma similaridade entre dois objetos pode ser usado para representar a similaridade entre os dois objetos. Por exemplo, um parâmetro sobre uma similaridade entre um modelo Tm nos N modelos e uma área de pixels w em um bloco de imagens m pode ser utilizado para representar a similaridade entre o modelo Tm e a área de pixels w no bloco de imagens m. O bloco de imagens m é um bloco de imagens correspondente ao modelo Tm- O modelo Tm pode ser qualquer modelo nos N modelos. A área de pixels w é qualquer área de pixels no bloco de imagens m.
[0070] Em um exemplo especifico, o parâmetro sobre a similaridade entre o modelo Tm e a área de pixels w no bloco de imagens m pode ser, por exemplo, uma distância entre a área de pixels w e uma área de pixels determinada no modelo Tm, ou pode ser uma proporção de uma média ou uma média ponderada de valores de pixel de uma área de pixels determinada no modelo Tre para um valor de pixel da área de pixels w ou uma diferença absoluta entre uma média ou uma média ponderada de valores de pixel de uma área de pixels determinada no modelo Tm e um valor de pixel da área de pixels w. Ou seja, pode haver uma correspondência entre um peso da área de pixels w no bloco de imagens m correspondente ao modelo Tm e a distância entre a área de pixels w e a área de pixels determinada no modelo Tm. Alternativamente, pode haver uma correspondência entre um peso da área de pixels w no bloco de imagens m correspondente ao modelo Tm nos N modelos e a proporção da média ou a média ponderada dos valores de pixel da área de pixels determinada no modelo Tm para o valor de pixel da área de pixels w ou a diferença absoluta entre a média ou a média ponderada dos valores de pixel da área de pixels determinada no modelo Tm e o valor de pixel da área de pixels w.
[0071] Um modelo correspondente a um bloco de imagens é algum dos pixels reconstruídos adjacentes do bloco de imagens, e tem uma correspondência com o bloco de imagens. 0 modelo correspondente ao bloco de imagens pode ser utilizado para representar o bloco de imagens para pesquisa e correspondência. Um bloco de imagens correspondente a um modelo de correspondência pode ser encontrado para uma operação tal como a predição utilizando uma correspondência entre o modelo e o bloco de imagens.
[0072] Opcionalmente, em algumas modalidades possíveis da presente invenção, a área de pixels determinada no modelo anterior Tm pode ser, por exemplo, um pixel superior esquerdo, uma área de pixels superior esquerda, um pixel inferior esquerdo, uma área de pixels inferior esquerda, um pixel superior direito, uma área de pixels superior direita, um pixel inferior direito, uma área de pixels inferior direita, uma área de pixels central, um pixel central ou outra área de pixels no modelo Tm.
[0073] A área de pixels superior esquerda no modelo Tm é o pixel superior esquerdo no modelo Tm ou um bloco de pixels que está no modelo Tm e que inclui o pixel superior esquerdo no modelo Tm; a área de pixels inferior esquerda no modelo Tm é o pixel inferior esquerdo no modelo Tm ou um bloco de pixels que está no modelo Tm e que inclui o pixel inferior esquerdo no modelo Tm; a área de pixels superior direita no modelo Tm é o pixel superior direito no modelo Tm ou um bloco de pixels que está no modelo Tm e que inclui o pixel superior direito no modelo Tm; a área de pixels central no modelo Tm é o pixel central no modelo Tm ou um bloco de pixels que está no modelo Tm e que inclui o pixel central no modelo Tm.
[0074] A distância entre a área de pixels w e a area de pixels determinada no modelo Tm pode ser, por exemplo, uma distância entre um pixel na área de pixels w e um pixel na área de pixels determinada no modelo Tm, em que os dois pixels estão mais próximos uns dos outros, ou a distância entre a área de pixels w e a área de pixels determinada no modelo Tm pode ser uma distância entre qualquer pixel na área de pixels w e qualquer pixel na área de pixels determinada no modelo Tm, ou a distância entre a área de pixels w e a área de pixels determinada no modelo Tm pode ser uma distância entre um pixel determinado na área de pixels w (onde o pixel determinado na área de pixels w pode ser um pixel superior esquerdo, um pixel inferior esquerdo, um pixel superior direito, um pixel inferior direito ou um pixel central na área de pixels w) e um pixel determinado na área de pixels determinada no modelo Tm (onde o pixel determinado no modelo Tm é, por exemplo, o pixel superior esquerdo, o pixel inferior esquerdo, o pixel superior direito, o pixel inferior direito ou o pixel central no modelo Tm). Certamente, a distância entre a área de pixels w e a área de pixels determinada no modelo Tm pode ser calculada de outra maneira.
[0075] 103. Calcular um valor de pixel previsto de uma área de pixels no bloco de imagens atual com base no peso e em um valor de pixel da área de pixels no bloco de imagens correspondente a cada modelo nos N modelos.
[0076] Pode ser aprendido que, na solução de predição de imagem nesta modalidade, depois de N modelos cujos graus de correspondência com um modelo atual satisfazem uma condição predefinida serem determinados, um peso de uma área de pixels em um bloco de imagens correspondente a cada modelo nos N modelos é determinado, e um valor de pixel previsto de uma área de pixels no bloco de imagens atual é calculado com base no peso e em um valor de pixel da área de pixels no bloco de imagens correspondente a cada modelo nos N modelos. A área de pixels inclui pelo menos um pixel. Pesos de pelo menos duas áreas de pixel em um bloco de imagens correspondente a pelo menos um modelo nos N modelos determinados são diferentes, isto é, os pesos de pelo menos duas áreas de pixel em um bloco de imagens correspondente a um mesmo modelo são diferentes. Por conseguinte, uma solução de arte convencional na qual os pesos de todas as áreas de pixel em blocos de imagem correspondentes a todos os modelos são os mesmos (onde os pesos são todos iguais a 1) é abandonada. Como há uma diferença especifica entre os pesos das áreas de pixel, é mais provável conformar com uma diferença de correlação real. Deste modo, um valor de pixel de uma área de pixels em um bloco de imagens atual é precisamente previsto e eficiência de codificação e decodificação de video são melhoradas.
[0077] Opcionalmente, em algumas modalidades possiveis da presente invenção, a determinação de N modelos cujos graus de correspondência com um modelo atual satisfazem uma condição predefinida inclui: determinar N modelos com um grau mais elevado de correspondência com o modelo atual; ou determinar M modelos com um grau mais elevado de correspondência com o modelo atual e determinar, a partir dos M modelos, N modelos que satisfazem a condição predefinida, em que N é menor que M.
[0078] Por exemplo, a determinação, a partir dos M modelos, de N modelos que satisfazem a condição predefinide inclui: determinar N modelos a partir dos M modelos, em que distorção entre valores de pixel dos N modelos e um valor de pixel do modelo atual é menor ou igual a um limiar. Por exemplo, o limiar é igual à distorção média entre o valor de pixel do modelo atual e os valores de pixel dos M modelos, ou o limiar é igual a um valor de ajuste de distorção média entre o valor de pixel do modelo atual e os valores de pixel dos M modelos. Certamente, o limiar pode ser outro valor predefinido. Pode ser entendido que um limiar de rastreio é introduzido para ajudar a obter, por meio de rastreio, um modelo que é com um grau de correspondência relativamente baixo e que não está envolvido em uma operação, de modo que precisão de predição é melhorada, e complexidade de operação é reduzida.
[0079] Pode haver diversas maneiras de determinar o peso da área de pixels no bloco de imagens correspondente a cada modelo nos N modelos.
[0080] Por exemplo, a determinação de um peso de uma área de pixels em um bloco de imagens correspondente a cada modelo nos N modelos pode incluir: determinar um peso de cada modelo nos N modelos de acordo com um grau de correspondência entre cada modelo nos N modelos e o modelo atual; e determinar, com base no peso de cada modelo nos N modelos e um parâmetro sobre uma similaridade entre cada modelo nos N modelos e a área de pixels no bloco de imagens correspondente, o peso da área de pixels no bloco de imagens correspondente a cada Modelo nos N modelos.
[0081] Opcionalmente, em algumas modalidades possiveis da presente invenção, o parâmetro sobre a similaridade entre cada modelo nos N modelos e a area de pixels no bloco de imagens correspondente pode incluir: uma pixels determinada em cada modelo nos N modelos e a área de pixels no bloco de imagens correspondente; e / ou uma proporção de uma média ou uma média ponderada de valores de pixel de uma área de pixels determinada em cada modelo nos N modelos para o valor de pixel da área de pixels no bloco de imagens correspondente ou uma diferença absoluta entre uma média ou uma média ponderada de valores de pixel de uma área de pixels determinada em cada modelo nos N modelos e o valor de pixel da área de pixels no bloco de imagens correspondente.
[0082] Opcionalmente, em algumas modalidades possíveis da presente invenção, a determinação de um peso de cada modelo nos N modelos de acordo com um grau de correspondência entre cada modelo nos N modelos e o modelo atual pode incluir: determinar o peso de cada modelo nos N modelos com base na fórmula seguinte e de acordo com o grau de correspondência entre cada modelo nos N modelos e o modelo atual: , em que representa distorção entre o modelo atual Tx e um modelo Tm nos N modelos, S representa uma quantidade de áreas de pixel no modelo atual Tx, o representa um fator de escala de modelo, a e o são números reais maiores que 0, wm representa um peso do modelo Tm, e o modelo Tm é qualquer modelo nos N modelos. Quando um valor de a é, por exemplo, um número inteiro como 2, 3 ou 4, complexidade da operação é simplificada.
[0083] Opcionalmente, em algumas modalidacF^g possíveis da presente invenção, a determinação, com base no peso de cada modelo nos N modelos e um parâmetro sobre uma similaridade entre cada modelo nos N modelos e a área de pixels no bloco de imagens correspondente, do peso da área de pixels no bloco de imagens correspondente a cada modelo nos N modelos pode incluir: determinar, com base na fórmula seguinte e com base no peso de cada modelo nos N modelos e o parâmetro sobre a similaridade entre cada modelo nos N modelos e a área de pixels no bloco de imagens correspondente, o peso da área de pixels no bloco de imagens correspondente a cada modelo nos N modelos: em que wm(i, j) representa um peso de uma área de pixels cujas coordenadas são (i, j) e que está em um bloco de imagens m correspondente ao modelo Tm nos N modelos, R(i, j) representa um parâmetro sobre uma similaridade entre a área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens meo modelo Tm, e 5(R(i, j)) representa um fator de escala da área de pixels correspondente a imagem R(i, j).
[0084] Opcionalmente, em algumas modalidades possíveis da presente invenção, existe uma relação linear ou uma relação não linear entre 3(R(i, j)) e R(i, j).
[0085] Por exemplo, a relação linear entre <?(R(i, j)) e R(i, j) é: 5(R(i, j)) = β*R(i, j), em que β é um coeficiente de escala, e β é um número real maior que 0.
[0086] Por exemplo, a relação não linear entre 5(R(i, j)) e R(i, j) é: um valor de 5(R(i, j)) é determinado com base em um intervalo de distância dentro do qual R(i, j) cai, e diferentes intervalos de distância correspondem e fatores de escala de área de pixels com diferentes valores.
[0087] Por exemplo, a relaçao não linear entre d (R(i j)) e R(i, j) pode ser: , em que al é menor que a2, a2 é menor que a3, e bl é menor que b2; e al, a2, a3, bl e b2 são números reais maiores que 0.
[0088] Por exemplo, al = 0,3, a2 = 0,5 e a3 = 1. Por exemplo, bl = 4 e b2 = 8.
[0089] Para outro exemplo, a relação não linear entre d(R(i, j)) e R(i, j) pode ser: , em que a 4 é menor que a5, a5 é menor que a6, a6 é menor que a7, b3 é menor que b4, e b4 é menor que b5; e a4, a5, a6, a7, b3, b4 e b5 são números reais maiores do que 0.
[0090] Por exemplo, a4 = 0,3, a5 = 0,5, a6 = 0,8 e a7 = 1. Por exemplo, b3 =4, b4 = 5 e b5 = 6.
[0091] Para outro exemplo, a relação não linear entre 5{R(i, j)) e R(i, j) pode ser:, em que a8 é menor que a9, e a8, a9 e b6 são números reais maiores que 0.
[0092] Por exemplo, a8 = 0,5 e a9 = 1. Por exemplo, b6 = 5.
[0093] Os exemplos anteriores mostram que a relação não linear entre cJ(R(i, j)) e R(i, j) pode ser uma relação de função por parte. Uma quantidade por peça de uma função por peça pode não ser limitada a 2, 3 ou 4 mostrada nos exemplos precedentes e, certamente, pode ser maior.
[0094] Opcionalmente, em algumas modalidades possíveis da presente invenção, R(i, j) pode ser, por exemplo, igual a d(i, j) ou e(i, j), d(i, j) representa uma distância entre a área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m e uma área de pixels determinada no modelo Tm, e e(i, j) representa uma proporção de um valor de pixel da área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m para um valor de pixel médio ou um valor de pixel médio ponderado do modelo Tra ou uma diferença absoluta entre um valor de pixel da área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m e um valor de pixel médio ou um valor de pixel médio ponderado do modelo Tm.
[0095] Por exemplo, d(i, j) pode representar uma distância entre a área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m e um pixel superior esquerdo no modelo Tm, ou d(i, j) pode representar uma distância entre a área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m e um pixel y no modelo Tm; e a distância entre a área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens meo pixel y no modelo Tm é menor ou igual a uma distância entre a área de , pixels cujas coordenadas são (i, j) e que está no bloco deV / imagens m e qualquer pixel no modelo Tm exceto o pixel y.
[0096] Opcionalmente, em algumas modalidades possiveis da presente invenção, o cálculo de um valor de pixel previsto de uma área de pixels no bloco de imagens atual com base no peso e um valor de pixel da área de pixels no bloco de imagens correspondente a cada modelo nos N modelos inclui: calcular o valor de pixel previsto da área de pixels no bloco de imagens atual utilizando a seguinte fórmula e com base no peso e no valor de pixel da área de pixels no bloco de imagens correspondente a cada modelo nos N modelos: , em que wm(i, j) representa o peso da área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m correspondente ao modelo Tm nos N modelos, pm(i, j) representa o valor de pixel da área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m, e pre(i, j) representa um valor de pixel previsto de uma área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens atual.
[0097] O método de predição de imagem fornecido nesta modalidade pode ser aplicado em um processo de codificação de video, ou pode ser aplicado em um processo de decodificação de video.
[0098] Para compreender melhor e implementar as soluçoes anteriores nesta modalidade da presente invenção descrições adicionais são fornecidas a seguir com referência a um cenário de aplicação mais especifico.
[0099] Com referência à Figura 2, a Figura 2 é um fluxograma esquemático de outro método de predição de imagem de acordo com outra modalidade da presente invenção. Conforme ilustrado na Figura 2, o outro método de predição de imagem fornecido na outra modalidade da presente invenção pode incluir os seguintes passos.
[00100] 201. Determinar M modelos com um grau mais alto de correspondência com um modelo atual.
[00101] M pode ser um valor especificado, isto é, os M modelos com o grau mais alto de correspondência com o modelo atual podem ser selecionados a partir de vários modelos candidatos. Por exemplo, cinco modelos com o grau mais alto de correspondência com o modelo atual podem ser determinados a partir de dez modelos candidatos. Certamente, graus de correspondência entre os cinco modelos e o modelo atual não são necessariamente iguais, mas um grau de correspondência entre qualquer modelo nos cinco modelos e o modelo atual é maior ou igual a um grau de correspondência entre qualquer modelo candidato, exceto os cinco modelos e o modelo atual.
[00102] O modelo atual é um modelo correspondente a um bloco de imagens atual. Os M modelos são obtidos por pesquisar imagens de referência do bloco de imagens atual. M é um número inteiro positivo.
[00103] Por exemplo, M pode ser igual a 2, 3, 4, 5, 7, 9, 12, ou outro valor.
[00104] 202. Determinar, a partir dos M modelos, N modelos que satisfazem uma condição predefinida.
[00105] Por exemplo, a determinação, a partir de M modelos, de N modelos que satisfazem uma condição predefinida inclui: determinar N modelos a partir dos M modelos, em que distorção entre valores de pixel dos N modelos e um valor de pixel do modelo atual é menor ou igual a um limiar. Por exemplo, o limiar é igual à distorção média entre o valor de pixel do modelo atual e os valores de pixel dos M modelos, ou o limiar é igual a um valor de ajuste de distorção média entre o valor de pixel do modelo atual e os valores de pixel dos M modelos. Certamente, o limiar pode ser outro valor predefinido. Pode ser entendido que um limiar de rastreio é introduzido para ajudar a obter, por meio de rastreio, um modelo que é com um grau de correspondência relativamente baixo e que não está envolvido em uma operação, de modo que precisão de predição é melhorada, e complexidade de operação é reduzida.
[00106] 203. Determinar um peso de cada modelo nos N modelos.
[00107] Por exemplo, o peso de cada modelo nos N modelos pode ser determinado de acordo com um grau de correspondência entre cada modelo nos N modelos e o modelo atual.
[00108] 204. Determinar, com base no peso de cada modelo nos N modelos, um peso de uma área de pixels em um bloco de imagens correspondente a cada modelo nos N modelos.
[00109] Por exemplo, o peso da área de pixels no bloco de imagens correspondente a cada modelo nos N modelos pode ser determinado com base no peso de cada modelo nos N modelos I e um parâmetro sobre uma similaridade entre cada modelo nos N modelos e a área de pixel no bloco de imagens correspondente.
[00110] Pesos de pelo menos duas áreas de pixel em um bloco de imagens correspondente a pelo menos um modelo nos N modelos são diferentes.
[00111] A área de pixels mencionada em cada modalidade da presente invenção inclui pelo menos um pixel. Isto é, a área de pixels pode ser um pixel ou um bloco de pixels, e se a área de pixels é um bloco de pixels, a área de pixels pode ter, por exemplo, um tamanho de 2x2, 1^2, 1^3, 4x2, 4 x 3, ou 4 x 4, ou outro tamanho.
[00112] Os modelos nos N modelos correspondem a blocos de imagem diferentes, e, portanto, os N modelos correspondem a N blocos de imagem. Um modelo pode ser em forma de L ou em outra forma. Por exemplo, como mostrado na Figura 1-d, um modelo correspondente a um bloco de imagens pode ser uma área de pixels em forma de L adjacente ao bloco de imagens. Por exemplo, na Figura 1-d, uma área de pixels em forma de L Tx adjacente a um bloco de imagens x é um modelo Tx correspondente ao bloco de imagens x, uma área de pixels em forma de L Tmi adjacente a um bloco de imagens ml é um modelo Tmi correspondente ao bloco de imagens ml, e uma área de pixels em forma de L Tm2 adjacente a um bloco de imagens m2 é um modelo Tm2 correspondente ao bloco de imagens m2. Pode haver nenhuma área de sobreposição entre um bloco de imagens e um modelo correspondente ao bloco de imagens.
[00113] Por exemplo, o peso da área de pixels no bloco de imagens correspondente a cada modelo nos N modelos pode ser relacionado com o parâmetro sobre a similaridade entre cada modelo nos N modelos e a área de pixels no bloco de imagens correspondente. Um parâmetro sobre uma similaridade entre dois objetos pode ser usado para similaridade entre os dois objetos. Por exemplo, um parâmetro sobre uma similaridade entre um modelo Tm nos N modelos e uma área de pixels w em um bloco de imagens m pode ser utilizado para representar a similaridade entre o modelo Tm e a área de pixels w no bloco de imagens m. O bloco de imagens m é um bloco de imagens correspondente ao modelo Tm. O modelo Tra pode ser qualquer modelo nos N modelos. A área de pixels w é qualquer área de pixels no bloco de imagens m.
[00114] Em um exemplo especifico, o parâmetro sobre a similaridade entre o modelo Tm e a área de pixels w no bloco de imagens m pode ser, por exemplo, uma distância entre a área de pixels w e uma área de pixels determinada no modelo Tm, ou pode ser uma proporção de uma média ou uma média ponderada de valores de pixel de uma área de pixels determinada no modelo Tm para um valor de pixel da área de pixels w ou uma diferença absoluta entre uma média ou uma média ponderada de valores de pixel de uma área de pixels determinada no modelo Tm e um valor de pixel da área de pixels w. Ou seja, pode haver uma correspondência entre um peso da área de pixels w no bloco de imagens m correspondente ao modelo Tm e a distância entre a área de pixels w e a área de pixels determinada no modelo Tm. Alternativamente, pode haver uma correspondência entre um peso da área de pixels w no bloco de imagens m correspondente ao modelo Tm nos N modelos e a proporção da média ou a média ponderada dos valores de pixel da área de pixels determinada no modelo Tm para o valor de pixel da área de pixels w ou a diferença absoluta entre a média ou a média ponderada dos valores de pixel da área de pixels determinada no modelo Tm e o valor de pixel da área de pixels w.
[00115] Opcionalmente, em algumas modalidades possíveis da presente invenção, a área de pixels determinada no modelo anterior Tm pode ser, por exemplo, um pixel superior esquerdo, uma área de pixels superior esquerda, um pixel inferior esquerdo, uma área de pixels inferior esquerda, um pixel superior direito, uma área de pixels superior direita, um pixel inferior direito, uma área de pixels inferior direita, uma área de pixels central, um pixel central ou outra área de pixels no modelo Tm.
[00116] A área de pixels superior esquerda no modelo Tm é o pixel superior esquerdo no modelo Tm ou um bloco de pixels que está no modelo Tm e que inclui o pixel superior esquerdo no modelo Tm; a área de pixels inferior esquerda no modelo Tm é o pixel inferior esquerdo no modelo Tm ou um bloco de pixels que está no modelo Tm e que inclui o pixel inferior esquerdo no modelo Tm; a área de pixels superior direita no modelo Tm é o pixel superior direito no modelo Tm ou um bloco de pixels que está no modelo Tm e que inclui o pixel superior direito no modelo Tm; a área de pixels central no modelo Tm é o pixel central no modelo Tm ou um bloco de pixels que está no modelo Tm e que inclui o pixel central no modelo Tm.
[00117] A distância entre a área de pixels w e a área de pixels determinada no modelo Tm pode ser, por exemplo, uma distância entre um pixel na área de pixels w e um pixel na área de pixels determinada no modelo Tm, em que os dois pixels estão mais próximos uns dos outros, ou a distância entre a área de pixels w e a área de pixels determinada no modelo Tm pode ser uma distância entre qualquer pixel na área de pixels w e qualquer pixel na área de pixels determinate no modelo Tm, ou a distância entre a área de pixels w e a área de pixels determinada no modelo Tm pode ser uma distância entre um pixel determinado na área de pixels w (onde o pixel determinado na área de pixels w pode ser um pixel superior esquerdo, um pixel inferior esquerdo, um pixel superior direito, um pixel inferior direito ou um pixel central na área de pixels w) e um pixel determinado na área de pixels determinada no modelo Tm (onde o pixel determinado no modelo Tm é, por exemplo, o pixel superior esquerdo, o pixel inferior esquerdo, o pixel superior direito, o pixel inferior direito ou o pixel central no modelo Tm). Certamente, a distância entre a área de pixels w e a área de pixels determinada no modelo Tm pode ser calculada de outra maneira.
[00118] 205. Calcular um valor de pixel previsto de uma área de pixels no bloco de imagens atual com base no peso e em um valor de pixel da área de pixels no bloco de imagens correspondente a cada modelo nos N modelos.
[00119] Opcionalmente, em algumas modalidades possiveis da presente invenção, o parâmetro sobre a similaridade entre cada modelo nos N modelos e a área de pixels no bloco de imagens correspondente pode incluir: uma distância entre uma área de pixels determinada em cada modelo nos N modelos e a área de pixels no bloco de imagens correspondente; e / ou uma proporção de uma média ou uma média ponderada de valores de pixel de uma área de pixels determinada em cada modelo nos N modelos para o valor de pixel da área de pixels no bloco de imagens correspondente ou uma diferença absoluta entre uma média ou uma media ponderada de valores de pixel de uma área de pixe^g^ fir? determinada em cada modelo nos N modelos e o valor de pixel da área de pixels no bloco de imagens correspondente.
[00120] Opcionalmente, em algumas modalidades possiveis da presente invenção, que o peso de cada modelo nos N modelos é determinado de acordo com o grau de correspondência entre cada modelo nos N modelos e o modelo atual pode incluir: determinar o peso de cada modelo nos N modelos com base na fórmula seguinte e de acordo com o grau de correspondência entre cada modelo nos N modelos e o modelo atual:, em que representa distorção entre o modelo atual Tx e um modelo Tm nos N modelos, S representa uma quantidade de áreas de pixel no modelo atual Tx, α representa um fator de escala de modelo, a e o são números reais maiores que 0, wm representa um peso do modelo Tm, e o modelo Tm é qualquer modelo nos N modelos. Quando um valor de a é, por exemplo, um número inteiro como 2, 3 ou 4, complexidade da operação é simplificada.
[00121] Opcionalmente, em algumas modalidades possiveis da presente invenção, que o peso da área de pixels no bloco de imagens correspondente a cada modelo nos N modelos é determinado com base no peso de cada modelo nos N modelos e o parâmetro sobre a similaridade entre cada modelo nos N modelos e a área de pixels no bloco de imagens correspondente pode incluir: determinar, com base na fórmula seguinte e com base no peso de cada modelo nos N modelos e o parâmetro sobre a similaridade entre cada modelo nos N modelos e a área de pixels no bloco de imagé^Sg^ , correspondente, o peso da área de pixels no bloco de imagens correspondente a cada modelo nos N modelos: em que wm(i, j) representa um peso de uma área de pixels cujas coordenadas são (i, j) e que está em um bloco de imagens m correspondente ao modelo Tm nos N modelos, R(i, j) representa um parâmetro sobre uma similaridade entre a área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens meo modelo Tm, e 3(R(i, j)) representa um fator de escala da área de pixels correspondente a imagem R(i, j).
[00122] Opcionalmente, em algumas modalidades possíveis da presente invenção, existe uma relação linear ou uma relação não linear entre 3(R(i, j)) e R(i, j).
[00123] Por exemplo, a relação linear entre 5(R(i, j)) e R(i, j) é: 3(R(i, j)) = β*R(i, j), em que β é um coeficiente de escala, e β é um número real maior que 0.
[00124] Por exemplo, a relação não linear entre 5(R(i, j)) e R(i, j) é: um valor de 5(R(i, j)) é determinado com base em um intervalo de distância dentro do qual R(i, j) cai, e diferentes intervalos de distância correspondem a fatores de escala de área de pixels com diferentes valores.
[00125] Por exemplo, a relação não linear entre 5(R(i, j)) e R(i, j) pode ser:, em que al é menor que a2, a2 é menor que a3, e bl é menor que b2; e al, a2, a3, bl e b2 são números reais maiores que 0.
[00126] Para outro exemplo, a relação não linear entre a(R(i, j)) e R(i, j) pode ser: , em que a4 é menor que a5, a5 é menor que a6, a6 é menor que a7, b3 é menor que b4, e b4 é menor que b5; e a4, a5, a6, a7, b3, b4 e b5 são números reais maiores do que 0.
[00127] Para outro exemplo, a relação não linear entre d(R(i, j)) e R(i, j) pode ser: , em que a8 é menor que a9, e a8, a9 e b6 são números reais maiores que 0.
[00128] Os exemplos anteriores mostram que a relação não linear entre ú(R(i, j)) e R(i, j) pode ser uma relação de função por parte. Uma quantidade por peça de uma função por peça pode não ser limitada a 2, 3 ou 4 mostrada nos exemplos precedentes e, certamente, pode ser maior.
[00129] Opcionalmente, em algumas modalidades possiveis da presente invenção, R(i, j) pode ser, por exemplo, igual a d(i, j) ou e(i, j), d(i, j) representa uma distância entre a área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m e uma área de pixels determinada no modelo Tm, e e(i, j) representa uma proporção de um valor de pixel da área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m para um valor de pixel médio ou um valor de pixel médio ponderado do modelo Tm ou uma diferença absoluta entre um valor de pixel da área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m e um valor de pixel médio ou um valor de pixel médio ponderado do modelo Tm.
[00130] Por exemplo, d(i, j) pode representar uma distância entre a área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m e um pixel superior esquerdo no modelo Tm, ou d(i, j) pode representar uma distância entre a área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m e um pixel y no modelo Tm,’ e a distância entre a área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens meo pixel y no modelo Tm é menor ou igual a uma distância entre a área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m e qualquer pixel no modelo Tm exceto o pixel y.
[00131] Opcionalmente, em algumas modalidades possiveis da presente invenção, o cálculo de um valor de pixel previsto de uma área de pixels no bloco de imagens atual com base no peso e um valor de pixel da área de pixels no bloco de imagens correspondente a cada modelo nos N modelos inclui: calcular o valor de pixel previsto da área de pixels no bloco de imagens atual utilizando a seguinte fórmula e com base no peso e no valor de pixel da área de pixels no bloco de imagens correspondente a cada modelo nos N modelos: , em que Wm(i, j) representa o peso da área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m correspondente ao modelo Tm nos N modelos, pm(i, j) representa o valor de pixel da área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m, e pre(i, j) representa um valor de pixel previsto de uma área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens atual.
[00132] Pode ser entendido que, para uma área de pixels cujas coordenadas são (i, j), quando a área de pixels inclui múltiplos pixels, i e j em (i, j) caem dentro de intervalos de valores específicos em vez de valores fixos.
[00133] O método de predição de imagem fornecido nesta modalidade pode ser aplicado em um processo de codificação de video, ou pode ser aplicado em um processo de decodificação de video.
[00134] Pode ser aprendido que, na solução de predição de imagem nesta modalidade, depois de M moldes com um grau mais elevado de correspondência com um modelo atual serem determinados, N modelos cujos graus de correspondência com o modelo atual satisfazem uma condição predefinida são determinados adicionalmente a partir dos M modelos, um peso de uma área de pixels em um bloco de imagens correspondente a cada modelo nos N modelos é determinado e um valor de pixel previsto de uma área de pixels no bloco de imagens atual é calculado com base no peso e em um valor de pixel da área de pixels no bloco de imagens correspondente a cada modelo nos^Aij N modelos. A área de pixels inclui pelo menos um pixel. Pesos de pelo menos duas áreas de pixel em um bloco de imagens correspondente a pelo menos um modelo nos N modelos determinados são diferentes, isto é, os pesos de pelo menos duas áreas de pixel em um bloco de imagens correspondente a um mesmo modelo são diferentes. Por conseguinte, uma solução de arte convencional na qual os pesos de todas as áreas de pixel em blocos de imagem correspondentes a todos os modelos são os mesmos (onde os pesos são todos iguais a 1) é abandonada. Como há uma diferença especifica entre os pesos das áreas de pixel, é mais provável conformar com uma diferença de correlação real. Deste modo, um valor de pixel de uma área de pixels em um bloco de imagens atual é precisamente previsto e eficiência de codificação e decodificação de video são melhoradas.
[00135] Com referência à Figura 3, a Figura 3 é um fluxograma esquemático de um outro método de predição de imagem de acordo com outra modalidade da presente invenção. Conforme ilustrado na Figura 3, o outro método de codificação de video fornecido na outra modalidade da presente invenção pode incluir os passos seguintes.
[00136] 301. Um aparelho de codificação de video determina M modelos com um grau mais elevado de correspondência com um modelo atual.
[00137] M pode ser um valor especificado, isto é, os M modelos com o grau mais alto de correspondência com o modelo atual podem ser selecionados a partir de vários modelos candidatos. Por exemplo, cinco modelos com o grau mais alto de correspondência com o modelo atual podem ser determinados a partir de dez modelos candidatos. Certamente graus de correspondência entre os cinco modelos e o modelo atual não são necessariamente iguais, mas um grau de correspondência entre qualquer modelo nos cinco modelos e o modelo atual é maior ou igual a um grau de correspondência entre qualquer modelo candidato, exceto os cinco modelos e o modelo atual.
[00138] O modelo atual é um modelo correspondente a um bloco de imagens atual. Os M modelos são obtidos por pesquisar imagens de referência do bloco de imagens atual. M é um número inteiro positivo.
[00139] Por exemplo, M pode ser igual a 2, 3, 4, 5, 7, 9, 12, ou outro valor.
[00140] 302. 0 aparelho de codificação de video determina, a partir dos M modelos, N modelos que satisfazem uma condição predefinida.
[00141] Por exemplo, que os N modelos que satisfazem a condição predefinida são determinados a partir dos M modelos inclui: determinar N modelos a partir dos M modelos, em que distorção entre valores de pixel dos N modelos e um valor de pixel do modelo atual é menor ou igual a um limiar. Por exemplo, o limiar é igual à distorção média entre o valor de pixel do modelo atual e os valores de pixel dos M modelos, ou o limiar é igual a um valor de ajuste de distorção média entre o valor de pixel do modelo atual e os valores de pixel dos M modelos. Certamente, o limiar pode ser outro valor predefinido. Pode ser entendido que um limiar de rastreio é introduzido para ajudar a obter, por meio de rastreio, um modelo que é com um grau de correspondência relativamente baixo e que não está envolvido em uma operação, de modo que precisão de predição é melhorada, e complexidade de operação é reduzida.
[00142] 303. O aparelho de codificação de video determina um peso de cada modelo nos N modelos.
[00143] Por exemplo, o peso de cada modelo nos N modelos pode ser determinado de acordo com um grau de correspondência entre cada modelo nos N modelos e o modelo atual.
[00144] 304. O aparelho de codificação de vídeo determina, com base no peso de cada modelo nos N modelos, um peso de uma área de pixels em um bloco de imagens correspondente a cada modelo nos N modelos.
[00145] Por exemplo, o peso da área de pixels no bloco de imagens correspondente a cada modelo nos N modelos pode ser determinado com base no peso de cada modelo nos N modelos e um parâmetro sobre uma similaridade entre cada modelo nos N modelos e a área de pixel no bloco de imagens correspondente.
[00146] Pesos de pelo menos duas áreas de pixel em um bloco de imagens correspondente a pelo menos um modelo nos N modelos são diferentes.
[00147] A área de pixels mencionada em cada modalidade da presente invenção inclui pelo menos um pixel. Isto é, a área de pixels pode ser um pixel ou um bloco de pixels, e se a área de pixels é um bloco de pixels, a área de pixels pode ter, por exemplo, um tamanho de 2x2, 1x2, 1x3, 4x2, 4 x 3, ou 4 x 4, ou outro tamanho.
[00148] Os modelos nos N modelos correspondem a blocos de imagem diferentes, e, portanto, os N modelos correspondem a N blocos de imagem. Um modelo pode ser em forma de L ou em outra forma. Por exemplo, como mostrado na Figura 1-d, um modelo correspondente a um bloco de imagens pode ser uma área de pixels em forma de L adjacente ao bloco de imagens. Por exemplo, na Figura 1-d, uma área de pixels em forma de L Tx adjacente a um bloco de imagens x é um modelo Tx correspondente ao bloco de imagens x, uma área de pixels em forma de L Tmi adjacente a um bloco de imagens ml é um modelo Tmi correspondente ao bloco de imagens ml, e uma área de pixels em forma de L Tm2 adjacente a um bloco de imagens m2 é um modelo Tm2 correspondente ao bloco de imagens m2. Pode haver nenhuma área de sobreposição entre um bloco de imagens e um modelo correspondente ao bloco de imagens.
[00149] Por exemplo, o peso da área de pixels no bloco de imagens correspondente a cada modelo nos N modelos pode ser relacionado com o parâmetro sobre a similaridade entre cada modelo nos N modelos e a área de pixels no bloco de imagens correspondente. Um parâmetro sobre uma similaridade entre dois objetos pode ser usado para representar a similaridade entre os dois objetos. Por exemplo, um parâmetro sobre uma similaridade entre um modelo Tm nos N modelos e uma área de pixels w em um bloco de imagens m pode ser utilizado para representar a similaridade entre o modelo Tm e a área de pixels w no bloco de imagens m. O bloco de imagens m é um bloco de imagens correspondente ao modelo Tm. O modelo Tm pode ser qualquer modelo nos N modelos. A área de pixels w é qualquer área de pixels no bloco de imagens m.
[00150] Em um exemplo especifico, o parâmetro sobre a similaridade entre o modelo Tm e a área de pixels w no bloco de imagens m pode ser, por exemplo, uma distância entre a área de pixels w e uma área de pixels determinada no modelo Tm, ou pode ser uma proporção de uma média ou ponderada de valores de pixel de uma área determinada no modelo Tm para um valor de pixel da área de pixels w ou uma diferença absoluta entre uma média ou uma média ponderada de valores de pixel de uma área de pixels determinada no modelo Tm e um valor de pixel da área de pixels w. Ou seja, pode haver uma correspondência entre um peso da área de pixels w no bloco de imagens m correspondente ao modelo Tm e a distância entre a área de pixels w e a área de pixels determinada no modelo Tm. Alternativamente, pode haver uma correspondência entre um peso da área de pixels w no bloco de imagens m correspondente ao modelo Tm nos N modelos e a proporção da média ou a média ponderada dos valores de pixel da área de pixels determinada no modelo Tm para o valor de pixel da área de pixels w ou a diferença absoluta entre a média ou a média ponderada dos valores de pixel da área de pixels determinada no modelo Tm e o valor de pixel da área de pixels w.
[00151] Opcionalmente, em algumas modalidades possiveis da presente invenção, a área de pixels determinada no modelo anterior Tm pode ser, por exemplo, um pixel superior esquerdo, uma área de pixels superior esquerda, um pixel inferior esquerdo, uma área de pixels inferior esquerda, um pixel superior direito, uma área de pixels superior direita, um pixel inferior direito, uma área de pixels inferior direita, uma área de pixels central, um pixel central ou outra área de pixels no modelo Tm-
[00152] A área de pixels superior esquerda no modelo Tm é o pixel superior esquerdo no modelo Tm ou um bloco de pixels que está no modelo Tm e que inclui o pixel superior esquerdo no modelo Tm; a área de pixels inferior esquerda no modelo Tm é o pixel inferior esquerdo no modelo Tm ou um bloco de pixels que está no modelo Tm e que inclui o pixel inferior esquerdo no modelo Tm; a área de pixels superior direita no modelo Tm é o pixel superior direito no modelo Tm ou um bloco de pixels que está no modelo Tm e que inclui o pixel superior direito no modelo Tm; a área de pixels central no modelo Tra é o pixel central no modelo Tm ou um bloco de pixels que está no modelo Tm e que inclui o pixel central no modelo Tm
[00153] A distância entre a área de pixels w e a área de pixels determinada no modelo Tm pode ser, por exemplo, uma distância entre um pixel na área de pixels w e um pixel na área de pixels determinada no modelo Tm, em que os dois pixels estão mais próximos uns dos outros, ou a distância entre a área de pixels w e a área de pixels determinada no modelo Tm pode ser uma distância entre qualquer pixel na área de pixels w e qualquer pixel na área de pixels determinada no modelo Tm, ou a distância entre a área de pixels w e a área de pixels determinada no modelo Tm pode ser uma distância entre um pixel determinado na área de pixels w (onde o pixel determinado na área de pixels w pode ser um pixel superior esquerdo, um pixel inferior esquerdo, um pixel superior direito, um pixel inferior direito ou um pixel central na área de pixels w) e um pixel determinado na área de pixels determinada no modelo Tm (onde o pixel determinado no modelo Tm é, por exemplo, o pixel superior esquerdo, o pixel inferior esquerdo, o pixel superior direito, o pixel inferior direito ou o pixel central no modelo Tm). Certamente, a distância entre a área de pixels w e a área de pixels determinada no modelo Tm pode ser calculada de outra maneira.
[00154] 305. 0 aparelho de codificação de video calcula um valor de pixel previsto de uma área de pixels no bloco de imagens atual com base no peso e um valor de pixel da área de pixels no bloco de imagens correspondente a cada modelo nos N modelos.
[00155] Opcionalmente, em algumas modalidades possíveis da presente invenção, o parâmetro sobre a similaridade entre cada modelo nos N modelos e a área de pixels no bloco de imagens correspondente pode incluir: uma distância entre uma área de pixels determinada em cada modelo nos N modelos e a área de pixels no bloco de imagens correspondente; e / ou uma proporção de uma média ou uma média ponderada de valores de pixel de uma área de pixels determinada em cada modelo nos N modelos para o valor de pixel da área de pixels no bloco de imagens correspondente ou uma diferença absoluta entre uma média ou uma média ponderada de valores de pixel de uma área de pixels determinada em cada modelo nos N modelos e o valor de pixel da área de pixels no bloco de imagens correspondente.
[00156] Opcionalmente, em algumas modalidades possíveis da presente invenção, que o peso de cada modelo nos N modelos é determinado de acordo com o grau de correspondência entre cada modelo nos N modelos e o modelo atual pode incluir: determinar o peso de cada modelo nos N modelos com base na fórmula seguinte e de acordo com o grau de correspondência entre cada modelo nos N modelos e o modelo atual: , em que representa distorção entre o modelo atual Tx e um modelo Tm nos N modelos, S representa uma quantidade de áreas de pixel no modelo atual Tx, o representa um fator de escala de modelo, a e o são números reais maiores que 0, wm representa um peso do modelo Tm, e o modelo Tm é qualquer modelo nos N modelos. Quando um valor de a é, por exemplo, um número inteiro como 2, 3 ou 4, complexidade da operação é simplificada.
[00157] Opcionalmente, em algumas modalidades possiveis da presente invenção, que o peso da área de pixels no bloco de imagens correspondente a cada modelo nos N modelos é determinado com base no peso de cada modelo nos N modelos e o parâmetro sobre a similaridade entre cada modelo nos N modelos e a área de pixels no bloco de imagens correspondente pode incluir: determinar, com base na fórmula seguinte e com base no peso de cada modelo nos N modelos e o parâmetro sobre a similaridade entre cada modelo nos N modelos e a área de pixels no bloco de imagens correspondente, o peso da área de pixels no bloco de imagens correspondente a cada modelo nos N modelos: em que Wm(i, j) representa um peso de uma área de pixels cujas coordenadas são (i, j) e que está em um bloco de imagens m correspondente ao modelo Tm nos N modelos, R(i, j) representa um parâmetro sobre uma similaridade entre a área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens meo modelo Tm, e 3(R(i, j)) representa um fator de escala da área de pixels correspondente a imagem R(i, j).
[00158] Opcionalmente, em algumas modalidades possiveis da presente invenção, existe uma relação linear ou uma relação não linear entre a(R(i, j)) e R(i, j).
[00159] Por exemplo, a relação linear entre 3(R(i, j) ) e R(i, j) é: a(R(i, j)J = β*R(i, j), em que β é um coeficiente de escala, e β é um número real maior que 0.
[00160] Por exemplo, a relação não linear entre 3(R(i, j)) e R(i, j) é: um valor de 5(R(i, j)) é determinado com base em um intervalo de distância dentro do qual R(i, j) cai, e diferentes intervalos de distância correspondem a fatores de escala de área de pixels com diferentes valores.
[00161] Por exemplo, a relação não linear entre 3 (R (i, j)) e R(i, j) pode ser: , em que al é menor que a2, a2 é menor que a3, e bl é menor que b2; e al, a2, a3, bl e b2 são números reais maiores que 0.
[00162] Para outro exemplo, a relação não linear entre 3(R(i, j) ) e R(i, j) pode ser: , em que a4 é menor que a5, a5 é menor que a6, a6 é menor que a7, b3 é menor que b4, e b4 é menor que b5; e a4, a5, a6, a7, b3, b4 e b5 são números reais maiores do que 0.
[00163] Para outro exemplo, a relação não linear entre â(R(i, j)) e R(i, j) pode ser:, em que a8 é menor que a9, e a8, a9 e b6 são números reais maiores que 0.
[00164] Os exemplos anteriores mostram que a relação não linear entre 5(R(i, j)) e R(i, j) pode ser uma relação de função por parte. Uma quantidade por peça de uma função por peça pode não ser limitada a 2, 3 ou 4 mostrada nos exemplos precedentes e, certamente, pode ser maior.
[00165] Opcionalmente, em algumas modalidades possíveis da presente invenção, R(i, j) pode ser, por exemplo, igual a d(i, j) ou e(i, j), d(i, j) representa uma distância entre a área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m e uma área de pixels determinada no modelo Tm, e e(i, j) representa uma proporção de um valor de pixel da área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m para um valor de pixel médio ou um valor de pixel médio ponderado do modelo Tm ou uma diferença absoluta entre um valor de pixel da área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m e um valor de pixel médio ou um valor de pixel médio ponderado do modelo Tm.
[00166] Por exemplo, d(i, j) pode representar uma distância entre a área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m e um pixel superior esquerdo no modelo Tm, ou d(i, j) pode representar uma distância entre a área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m e um pixel y no modelo Tm; e a distância entre a área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens meo pixel y no modelo Tm é menor ou igual a uma distância entre a área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m e qualquer pixel no modelo Tm exceto o pixel y.
[00167] Opcionalmente, em algumas modalidades possíveis da presente invenção, que o valor de pixel previsto da área de pixels no bloco de imagens atual é calculado com base no peso e no valor de pixel da área de pixels no bloco de imagens correspondente a cada modelo nos N modelos inclui: calcular o valor de pixel previsto da área de pixels no bloco de imagens atual utilizando a seguinte fórmula e com base no peso e no valor de pixel da área de pixels no bloco de imagens correspondente a cada modelo nos N modelos: , em que wm(i, j) representa o peso da área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m correspondente ao modelo Tm nos N modelos, pm(i, j) representa o valor de pixel da área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m, e pre(i, j) representa um valor de pixel previsto de uma área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens atual.
[00168] Pode ser entendido que, para uma área de pixels cujas coordenadas são (i, j), quando a área de pixels inclui múltiplos pixels, i e j em (i, j) caem dentro de intervalos de valores específicos em vez de valores fixos.
[00169] 306. O aparelho de codificação de video obt-çjn um residue de predição do bloco de imagens atual utilizando um valor de pixel original da área de pixels no bloco de imagens atual e o valor de pixel previsto da área de pixels no bloco de imagens atual.
[00170] 307. 0 aparelho de codificação de video escreve o residue de predição do bloco de imagens atual em um fluxo de bits de video.
[00171] O método de predição de imagem fornecido nesta modalidade pode ser aplicado em um processo de codificação de video, ou pode ser aplicado em um processo de decodificação de video.
[00172] Pode ser aprendido que, na solução de codificação de imagem nesta modalidade, depois de M moldes com um grau mais elevado de correspondência com um modelo atual serem determinados, N modelos cujos graus de correspondência com o modelo atual satisfazem uma condição predefinida são ainda determinados a partir dos M modelos, um peso de uma área de pixels em um bloco de imagens correspondente a cada modelo nos N modelos é determinado e um valor de pixel previsto de uma área de pixels no bloco de imagens atual é calculado com base no peso e em um valor de pixel da área de pixels no bloco de imagens correspondente a cada modelo nos N modelos. A área de pixels inclui pelo menos um pixel. Pesos de pelo menos duas áreas de pixel em um bloco de imagens correspondente a pelo menos um modelo nos N modelos determinados são diferentes, isto é, os pesos de pelo menos duas áreas de pixel em um bloco de imagens correspondente a um mesmo modelo são diferentes. Por conseguinte, uma solução de arte convencional na qual os pesos de todas as áreas de pixel em blocos de imagem70eN correspondentes a todos os modelos são os mesmos (onde os pesos são todos iguais a 1) é abandonada. Como há uma diferença específica entre os pesos das áreas de pixel, é mais provável conformar com uma diferença de correlação real. Deste modo, um valor de pixel de uma área de pixels em um bloco de imagens atual é precisamente previsto e eficiência de codificação e decodificação de vídeo são melhoradas.
[00173] Com referência à Figura 4, a Figura 4 é um fluxograma esquemático de um outro método de predição de imagem de acordo com outra modalidade da presente invenção. Conforme ilustrado na Figura 4, o outro método de decodificação de video fornecido na outra modalidade da presente invenção pode incluir os seguintes passos.
[00174] 401. Um aparelho de decodificação de video determina M modelos com um grau mais elevado de correspondência com um modelo atual.
[00175] M pode ser um valor especificado, isto é, os M modelos com o grau mais alto de correspondência com o modelo atual podem ser selecionados a partir de vários modelos candidatos. Por exemplo, cinco modelos com o grau mais alto de correspondência com o modelo atual podem ser determinados a partir de dez modelos candidatos. Certamente, graus de correspondência entre os cinco modelos e o modelo atual não são necessariamente iguais, mas um grau de correspondência entre qualquer modelo nos cinco modelos e o modelo atual é maior ou igual a um grau de correspondência entre qualquer modelo candidato, exceto os cinco modelos e o modelo atual.
[00176] O modelo atual é um modelo correspondente a um bloco de imagens atual. Os M modelos são obtidos por pesquisar imagens de referência do bloco de imagens atual. M é um número inteiro positivo.
[00177] Por exemplo, M pode ser igual a 2, 3, 4, 5, 7, 9, 12, ou outro valor.
[00178] 402. O aparelho de decodif icação de video determina, a partir dos M modelos, N modelos que satisfazem uma condição predefinida.
[00179] Por exemplo, que os N modelos que satisfazem a condição predefinida são determinados a partir dos M modelos inclui: determinar N modelos a partir dos M modelos, em que distorção entre valores de pixel dos N modelos e um valor de pixel do modelo atual é menor ou igual a um limiar. Por exemplo, o limiar é igual à distorção média entre o valor de pixel do modelo atual e os valores de pixel dos M modelos, ou o limiar é igual a um valor de ajuste de distorção média entre o valor de pixel do modelo atual e os valores de pixel dos M modelos. Certamente, o limiar pode ser outro valor predefinido. Pode ser entendido que um limiar de rastreio é introduzido para ajudar a obter, por meio de rastreio, um modelo que é com um grau de correspondência relativamente baixo e que não está envolvido em uma operação, de modo que precisão de predição é melhorada, e complexidade de operação é reduzida.
[00180] 403. O aparelho de decodif icação de video determina um peso de cada modelo nos N modelos.
[00181] Por exemplo, o peso de cada modelo nos N modelos pode ser determinado de acordo com um grau de correspondência entre cada modelo nos N modelos e o modelo atual.
[00182] 404. O aparelho de decodificação de video I determina, com base no peso de cada modelo nos N modelos, um peso de uma área de pixels em um bloco de imagens correspondente a cada modelo nos N modelos.
[00183] Por exemplo, o peso da área de pixels no bloco de imagens correspondente a cada modelo nos N modelos pode ser determinado com base no peso de cada modelo nos N modelos e um parâmetro sobre uma similaridade entre cada modelo nos N modelos e a área de pixel no bloco de imagens correspondente.
[00184] Pesos de pelo menos duas áreas de pixel em um bloco de imagens correspondente a pelo menos um modelo nos N modelos são diferentes.
[00185] A área de pixels mencionada em cada modalidade da presente invenção inclui pelo menos um pixel. Isto é, a área de pixels pode ser um pixel ou um bloco de pixels, e se a área de pixels é um bloco de pixels, a área de pixels pode ter, por exemplo, um tamanho de 2x2, 1x2, 1x3, 4x2, 4 x 3, ou 4 x 4, ou outro tamanho.
[00186] Os modelos nos N modelos correspondem a blocos de imagem diferentes, e, portanto, os N modelos correspondem a N blocos de imagem. Um modelo pode ser em forma de L ou em outra forma. Por exemplo, como mostrado na Figura 1-d, um modelo correspondente a um bloco de imagens pode ser uma área de pixels em forma de L adjacente ao bloco de imagens. Por exemplo, na Figura 1-d, uma área de pixels em forma de L Tx adjacente a um bloco de imagens x é um modelo Tx correspondente ao bloco de imagens x, uma área de pixels em forma de L Tmi adjacente a um bloco de imagens ml é um modelo Tmi correspondente ao bloco de imagens ml, e uma área de pixels em forma de L Tm2 adjacente a um bloco de imagens m2 é um modelo Tm2 correspondente ao bloco de imagens m2. Pode haver nenhuma área de sobreposição entre um bloco de imagens e um modelo correspondente ao bloco de imagens.
[00187] Por exemplo, o peso da área de pixels no bloco de imagens correspondente a cada modelo nos N modelos pode ser relacionado com o parâmetro sobre a similaridade entre cada modelo nos N modelos e a área de pixels no bloco de imagens correspondente. Um parâmetro sobre uma similaridade entre dois objetos pode ser usado para representar a similaridade entre os dois objetos. Por exemplo, um parâmetro sobre uma similaridade entre um modelo Tm nos N modelos e uma área de pixels w em um bloco de imagens m pode ser utilizado para representar a similaridade entre o modelo Tm e a área de pixels w no bloco de imagens m. O bloco de imagens m é um bloco de imagens correspondente ao modelo Tm. O modelo Tm pode ser qualquer modelo nos N modelos. A área de pixels w é qualquer área de pixels no bloco de imagens m.
[00188] Em um exemplo especifico, o parâmetro sobre a similaridade entre o modelo Tm e a área de pixels w no bloco de imagens m pode ser, por exemplo, uma distância entre a área de pixels w e uma área de pixels determinada no modelo Tm, ou pode ser uma proporção de uma média ou uma média ponderada de valores de pixel de uma área de pixels determinada no modelo Tm para um valor de pixel da área de pixels w ou uma diferença absoluta entre uma média ou uma média ponderada de valores de pixel de uma área de pixels determinada no modelo Tm e um valor de pixel da área de pixels w. Ou seja, pode haver uma correspondência entre um peso da área de pixels w no bloco de imagens m correspondente ao modelo Tm e a distância entre a área de pixels w e a área/3eN i de pixels determinada no modelo Tm. Alternativamente, pode haver uma correspondência entre um peso da área de pixels w no bloco de imagens m correspondente ao modelo Tm nos N modelos e a proporção da média ou a média ponderada dos valores de pixel da área de pixels determinada no modelo Tm para o valor de pixel da área de pixels w ou a diferença absoluta entre a média ou a média ponderada dos valores de pixel da área de pixels determinada no modelo Tm e o valor de pixel da área de pixels w.
[00189] Opcionalmente, em algumas modalidades possiveis da presente invenção, a área de pixels determinada no modelo anterior Tm pode ser, por exemplo, um pixel superior esquerdo, uma área de pixels superior esquerda, um pixel inferior esquerdo, uma área de pixels inferior esquerda, um pixel superior direito, uma área de pixels superior direita, um pixel inferior direito, uma área de pixels inferior direita, uma área de pixels central, um pixel central ou outra área de pixels no modelo Tm.
[00190] A área de pixels superior esquerda no modelo Tm é o pixel superior esquerdo no modelo Tm ou um bloco de pixels que está no modelo Tm e que inclui o pixel superior esquerdo no modelo Tm; a área de pixels inferior esquerda no modelo Tm é o pixel inferior esquerdo no modelo Tm ou um bloco de pixels que está no modelo Tm e que inclui o pixel inferior esquerdo no modelo Tm; a área de pixels superior direita no modelo Tm é o pixel superior direito no modelo Tm ou um bloco de pixels que está no modelo Tm e que inclui o pixel superior direito no modelo Tm; a área de pixels central no modelo Tm é o pixel central no modelo Tm ou um bloco de pixels que está no modelo Tm e que inclui o pixel central modelo Tm.
[00191] A distância entre a área de pixels w e a área de pixels determinada no modelo Tm pode ser, por exemplo, uma distância entre um pixel na área de pixels w e um pixel na área de pixels determinada no modelo Tm, em que os dois pixels estão mais próximos uns dos outros, ou a distância entre a área de pixels w e a área de pixels determinada no modelo Tm pode ser uma distância entre qualquer pixel na área de pixels w e qualquer pixel na área de pixels determinada no modelo Tm, ou a distância entre a área de pixels w e a área de pixels determinada no modelo Tm pode ser uma distância entre um pixel determinado na área de pixels w (onde o pixel determinado na área de pixels w pode ser um pixel superior esquerdo, um pixel inferior esquerdo, um pixel superior direito, um pixel inferior direito ou um pixel central na área de pixels w) e um pixel determinado na área de pixels determinada no modelo Tm (onde o pixel determinado no modelo Tm é, por exemplo, o pixel superior esquerdo, o pixel inferior esquerdo, o pixel superior direito, o pixel inferior direito ou o pixel central no modelo Tm). Certamente, a distância entre a área de pixels w e a área de pixels determinada no modelo Tm pode ser calculada de outra maneira.
[00192] 405. O aparelho de decodificação de vídeo calcula um valor de pixel previsto de uma área de pixels no bloco de imagens atual com base no peso e um valor de pixel da área de pixels no bloco de imagens correspondente a cada modelo nos N modelos.
[00193] Opcionalmente, em algumas modalidades possíveis da presente invenção, o parâmetro sobre a similaridade entre cada modelo nos N modelos e a área de pixels no bloco de imagens correspondente pode incluir: uma distância entre uma área de pixels determinada em cada modelo nos N modelos e a área de pixels no bloco de imagens correspondente; e / ou uma proporção de uma média ou uma média ponderada de valores de pixel de uma área de pixels determinada em cada modelo nos N modelos para o valor de pixel da área de pixels no bloco de imagens correspondente ou uma diferença absoluta entre uma média ou uma média ponderada de valores de pixel de uma área de pixels determinada em cada modelo nos N modelos e o valor de pixel da área de pixels no bloco de imagens correspondente.
[00194] Opcionalmente, em algumas modalidades possíveis da presente invenção, que o peso de cada modelo nos N modelos é determinado de acordo com o grau de correspondência entre cada modelo nos N modelos e o modelo atual pode incluir: determinar o peso de cada modelo nos N modelos com base na fórmula seguinte e de acordo com o grau de correspondência entre cada modelo nos N modelos e o modelo atual: , em que representa distorção entre o modelo atual Tx e um modelo Tm nos N modelos, S representa uma quantidade de áreas de pixel no modelo atual Tx, o representa um fator de escala de modelo, a e o são números reais maiores que 0, wm representa um peso do modelo Tm, e o modelo Tm é qualquer modelo nos N modelos. Quando um valor de a é, por exemplo, um número inteiro como 2, 3 ou 4, complexidade da operação é simplificada.
[00195] Opcionalmente, em algumas modalidades possiveis da presente invenção, que o peso da área de pixels no bloco de imagens correspondente a cada modelo nos N modelos é determinado com base no peso de cada modelo nos N modelos e o parâmetro sobre a similaridade entre cada modelo nos N modelos e a área de pixels no bloco de imagens correspondente pode incluir: determinar, com base na fórmula seguinte e com base no peso de cada modelo nos N modelos e o parâmetro sobre a similaridade entre cada modelo nos N modelos e a área de pixels no bloco de imagens correspondente, o peso da área de pixels no bloco de imagens correspondente a cada modelo nos N modelos: , em que Wm(i, j) representa um peso de uma área de pixels cujas coordenadas são (i, j) e que está em um bloco de imagens m correspondente ao modelo Tm nos N modelos, R(i, j) representa um parâmetro sobre uma similaridade entre a área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens meo modelo Tm, e 3(R(i, j) ) representa um fator de escala da área de pixels correspondente a imagem R(i, j).
[00196] Opcionalmente, em algumas modalidades possiveis da presente invenção, existe uma relação linear ou uma relação não linear entre 5(R(i, j)) e R(i, j).
[00197] Por exemplo, a relação linear entre 5(R(i, j)) e R(i, j) é: 3(R(i, j)) = β*R(i, j), em que β é um coeficiente de escala, e β é um número real maior que 0.
[00198] Por exemplo, a relação não linear entre 3(R(i, j)) e R(i, j) é: um valor de 3(R(i, j)) é determinado com base em um intervalo de distância dentro do qual R(i, j ) cai, e diferentes intervalos de distância correspondem a fatores de escala de área de pixels com diferentes valores.
[00199] Por exemplo, a relação não linear entre a(R(i, j)) e R(i, j) pode ser: , em que al é menor que a2, a2 é menor que a3, e bl é menor que b2; e al, a2, a3, bl e b2 são números reais maiores que 0.
[00200] Para outro exemplo, a relação não linear entre 3(R(i, j)) e R(i, j) pode ser: , em que a4 é menor que a5, a5 é menor que a6, a6 é menor que a7, b3 é menor que b4, e b4 é menor que b5; e a4, a5, a6, a7, b3, b4 e b5 são números reais maiores do que 0.
[00201] Para outro exemplo, a relação não linear entre 3(R(i, j)) e R(i, j) pode ser: , em que a8 é menor que a9, e a8, a9 e b6 são números reais maiores que 0.
[00202] Os exemplos anteriores mostram que a relação não linear entre a{R(i, j)) e R(i, j) pode ser uma relação de função por parte. Uma quantidade por peça de uma função l 0 por peça pode não ser limitada a 2, 3 ou 4 mostrada nos exemplos precedentes e, certamente, pode ser maior.
[00203] Opcionalmente, em algumas modalidades possíveis da presente invenção, R(i, j) pode ser, por exemplo, igual a d(i, j) ou e(i, j), d(i, j) representa uma distância entre a área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m e uma área de pixels determinada no modelo Tm, e e(i, j) representa uma proporção de um valor de pixel da área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m para um valor de pixel médio ou um valor de pixel médio ponderado do modelo Tm ou uma diferença absoluta entre um valor de pixel da área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m e um valor de pixel médio ou um valor de pixel médio ponderado do modelo Tm.
[00204] Por exemplo, d(i, j) pode representar uma distância entre a área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m e um pixel superior esquerdo no modelo Tm, ou d(i, j) pode representar uma distância entre a área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m e um pixel y no modelo Tm,' e a distância entre a área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens meo pixel y no modelo Tm é menor ou igual a uma distância entre a área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m e qualquer pixel no modelo Tm exceto o pixel y.
[00205] Opcionalmente, em algumas modalidades possíveis da presente invenção, que o valor de pixel previsto da área de pixels no bloco de imagens atual é calculado com base no peso e no valor de pixel da área de pixels no bloco de imagens correspondente a cada modelo nos N modelos inclui: calcular o valor de pixel previsto da área de pixels no bloco de imagens atual utilizando a seguinte fórmula e com base no peso e no valor de pixel da área de pixels no bloco de imagens correspondente a cada modelo nos N modelos: em que wm(i, j) representa o peso da área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m correspondente ao modelo Tm nos N modelos, pm(i, j) representa o valor de pixel da área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m, e pre(i, j) representa um valor de pixel previsto de uma área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens atual.
[00206] Pode ser entendido que, para uma área de pixels cujas coordenadas são (i, j), quando a área de pixels inclui múltiplos pixels, i e j em (i, j) caem dentro de intervalos de valores específicos em vez de valores fixos.
[00207] 406. O aparelho de decodificação de video decodifica um fluxo de bits de video para obter um residue de predição do bloco de imagens atual.
[00208] 407. O aparelho de decodificação de video reconstrói o bloco de imagens atual utilizando o valor de pixel previsto do bloco de imagens atual e o residuo de predição do bloco de imagens atual.
[00209] Pode ser aprendido que, na solução de decodificação de imagem nesta modalidade, após e determinação de M modelos com um grau mais elevado de correspondência com um modelo atual, N modelos cujos graus de correspondência com o modelo atual satisfazem uma condição predefinida são determinados adicionalmente a partir dos M modelos, um peso de uma área de pixels em um bloco de imagens correspondente a cada modelo nos N modelos é determinado e um valor de pixel previsto de uma área de pixels no bloco de imagens atual é calculado com base no peso e em um valor de pixel da área de pixels no bloco de imagens correspondente a cada modelo nos N modelos. A área de pixels inclui pelo menos um pixel. Pesos de pelo menos duas áreas de pixel em um bloco de imagens correspondente a pelo menos um modelo nos N modelos determinados são diferentes, isto é, os pesos de pelo menos duas áreas de pixel em um bloco de imagens correspondente a um mesmo modelo são diferentes. Por conseguinte, uma solução de arte convencional na gual os pesos de todas as áreas de pixel em blocos de imagem correspondentes a todos os modelos são os mesmos (onde os pesos são todos iguais a 1) é abandonada. Como há uma diferença específica entre os pesos das áreas de pixel, é mais provável conformar com uma diferença de correlação real. Deste modo, um valor de pixel de uma área de pixels em um bloco de imagens atual é precisamente previsto e eficiência de codificação e decodificação de vídeo são melhoradas.
[00210] Desempenho é melhorado por implementar soluções anteriores sob algumas condições de teste.
[00211] Sob uma condição 1, isto é, em um cenário de aplicação em que N modelos que satisfazem uma condição são diretamente determinados a partir de modelos candidatos, e existe uma relação linear entre 3(R(i, j)) e R(i, exemplo, 5(R(i, j)) = β*R(i, j)), eficiência de codificação para cada componente de cor é melhorada como segue: Y-8,3%, U-7,8% e V-7,5%.
[00212] Sob uma condição 2, isto é, em um cenário de aplicação em que N modelos que satisfazem uma condição são diretamente determinados a partir de modelos candidatos, e existe uma relação de função por partes entre 5(R(i, j)) e R(i, j), eficiência de codificação para cada componente de cor é melhorada como segue: Y-8,1%, U-7,4% e V-7,5%.
[00213] Sob uma condição 3, isto é, em um cenário de aplicação em que M modelos são primeiro determinados a partir de modelos candidatos, N modelos que satisfazem uma condição são então determinados a partir dos M modelos, e existe uma relação linear entre 5(R(i, j)) e R(i, j) (por exemplo, a(R(i, j)) = β*R(i, j) ) , eficiência de codificação para cada componente de cor é melhorada como segue: Y-8,5%, U-8,0% e V-7,7% .
[00214] Efeitos de melhoria de desempenho de distorção de taxa obtidos por meio de testes com base em uma sequência ClassF são apresentados na tabela seguinte.
[00215] Pode ser aprendido que, sob uma condição de teste, eficiência de codificação e desempenho de distorção de taxa podem ser grandemente melhorados nas soluções r modalidades da presente invenção.
[00216] Aparelhos relacionados utilizados para implementar as soluções precedentes são ainda fornecidos a seguir.
[00217] Com referência à Figura 5, uma modalidade da presente invenção fornece ainda um aparelho de predição de imagem 500, e o aparelho 500 pode incluir: uma primeira unidade de determinação 510, configurada para determinar N modelos cujos graus de correspondência com um modelo atual satisfazem uma condição predefinida, em que o modelo atual é um modelo correspondente a um bloco de imagens atual, os M modelos são obtidos por pesquisar imagens de referência do bloco de imagens atual, e M é um número inteiro positivo; uma segunda unidade de determinação 520, configurada para determinar um peso de uma área de pixels em um bloco de imagens correspondente a cada modelo nos N modelos, em que pesos de pelo menos duas áreas de pixel em um bloco de imagens correspondente a pelo menos um modelo nos N modelos são diferentes; e uma unidade de predição 530, configurada para calcular um valor de pixel previsto de uma área de pixels no bloco de imagens atual com base no peso e um valor de pixel da área de pixels no bloco de imagens correspondente a cada modelo nos N modelos, em que a área de pixels inclui pelo menos um pixel.
[00218] Opcionalmente, em algumas modalidades possíveis da presente invenção, a segunda unidade de determinação 520 inclui: uma primeira subunidade de determinação, configured^, para determinar um peso de cada modelo nos N modelos de acordo com um grau de correspondência entre cada modelo nos N modelos e o modelo atual; e uma segunda subunidade de determinação, configurada para determinar, com base no peso de cada modelo nos N modelos e um parâmetro sobre uma similaridade entre cada modelo nos N modelos e a área de pixels no bloco de imagens correspondente, o peso da área de pixels no bloco de imagens correspondente a cada modelo nos N modelos.
[00219] Opcionalmente, em algumas modalidades possiveis da presente invenção, o parâmetro sobre a similaridade entre cada modelo nos N modelos e a área de pixels no bloco de imagens correspondente inclui: uma distância entre uma área de pixels determinada em cada modelo nos N modelos e a área de pixels no bloco de imagens correspondente; e / ou uma proporção de uma média ou uma média ponderada de valores de pixel de uma área de pixels determinada em cada modelo nos N modelos para o valor de pixel da área de pixels no bloco de imagens correspondente ou uma diferença absoluta entre uma média ou uma média ponderada de valores de pixel de uma área de pixels determinada em cada modelo nos N modelos e o valor de pixel da área de pixels no bloco de imagens correspondente.
[00220] Opcionalmente, em algumas modalidades possiveis da presente invenção, a primeira subunidade de determinação é especificamente configurada para determinar o peso de cada modelo nos N modelos com base na fórmula seguinte e de acordo com o grau de correspondência entre cada modelo nos N modelos e o modelo atual:, em que representa distorção entre o modelo atual Tx e um modelo Tm nos N modelos, S representa uma quantidade de áreas de pixel no modelo atual Tx, o representa um fator de escala de modelo, a e o são números reais maiores que 0, wm representa um peso do modelo Tm, e o modelo Tm é qualquer modelo nos N modelos.
[00221] Opcionalmente, em algumas modalidades possíveis da presente invenção, a segunda subunidade de determinação é configurada especificamente para determinar, com base na fórmula seguinte e com base no peso de cada modelo nos N modelos e o parâmetro sobre a similaridade entre cada modelo nos N modelos e a área de pixels no bloco de imagens correspondente, o peso da área de pixels no bloco de imagens correspondente a cada modelo nos N modelos: em que wm(i, j) representa um peso de uma área de pixels cujas coordenadas são (i, j) e que está em um bloco de imagens m correspondente ao modelo Tm nos N modelos, R(i, j) representa um parâmetro sobre uma similaridade entre a área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens meo modelo Tm, e 5(R(i, j)) representa um fator de escala da área de pixels correspondente a imagem R(i, j).
[00222] Opcionalmente, em algumas modalidades possiveis da presente invenção, existe uma relação linear ou uma relação não linear entre 5(R(i, j)) e R(i, j).
[00223] Opcionalmente, em algumas modalidades possiveis da presente invenção, a relação linear entre 5(R(i, j)) e R(i, j) é:5(R(i, j)) - β*R(i, j), em que β é um coeficiente de escala, e β é um número real maior que 0.
[00224] Opcionalmente, em algumas modalidades possiveis da presente invenção, a relação não linear entre 5(R(i, j)) e R(i, j) é: um valor de 5(R(i, j)) é determinado com base em um intervalo de distância dentro do qual R(i, j) cai, e diferentes intervalos de distância correspondem a fatores de escala de área de pixels com diferentes valores.
[00225] Opcionalmente, em algumas modalidades possiveis da presente invenção, a relação não linear entre d (R(i, j)) e R(i, j) é: , em que al é menor que a2, a2 é menor que a3, e bl é menor que b2; e al, a2, a3, bl e b2 são números reais maiores que 0; ou
[00226] a relação não linear entre S(R{i, j)) e R(i, j) é: , em que a4 é menor que a5, a5 é menor que a6, a6 é menor que a7, b3 é menor que b4, e b4 é menor que b5; e a4, a5, a6, a7, b3, b4 e b5 são números reais maiores que 0; ou
[00227] a relação não linear entre a(R(i, j)) e R(i, j) é: , em que
[00228] a8 é menor que a9, e a8, a9 e b6 são números reais maiores que 0.
[00229] Opcionalmente, em algumas modalidades possiveis da presente invenção, R(i, j) é igual a d(i, j) ou e(i, j), d(i, j) representa uma distância entre a área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m e uma área de pixels determinada no modelo Tm, e e(i, j) representa uma proporção de um valor de pixel da área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m para um valor de pixel médio ou um valor de pixel médio ponderado do modelo Tm ou uma diferença absoluta entre um valor de pixel da área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m e um valor de pixel médio ou um valor de pixel médio ponderado do modelo Tm.
[00230] Opcionalmente, em algumas modalidades possiveis da presente invenção, d(i, j) representa uma distância entre a área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m e um pixel superior esquerdo no modelo Tm, ou d(i, j) representa uma distância entre a área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m e um pixel y no modelo Tn; e a distância entre a área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens meo pixel y no modelo Tm é menor ou igual a uma distância entre a área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m e qualquer pixel no modelo Tm exceto o pixel y.
[00231] Ópcionalmente, em algumas modalidades^ , I possiveis da presente invenção, a unidade de predição 530 é especificamente configurada para calcular o valor de pixel previsto da área de pixels no bloco de imagens atual utilizando a seguinte fórmula e com base no peso e no valor de pixel da área de pixels no bloco de imagens correspondente a cada modelo nos N modelos: em que wm(i, j) representa o peso da área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m correspondente ao modelo Tm nos N modelos, pm(i, j) representa o valor de pixel da área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m, e pre(i, j) representa um valor de pixel previsto de uma área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens atual.
[00232] Opcionalmente, em algumas modalidades possiveis da presente invenção, a primeira unidade de determinação 510 é especificamente configurada para: determinar M modelos com um grau mais elevado de correspondência com o modelo atual; e determinar, a partir dos M modelos, N modelos que satisfazem a condição predefinida, em que N é menor que M.
[00233] Opcionalmente, em algumas modalidades possiveis da presente invenção, a primeira unidade de determinação 510 é especificamente configurada para: determinar os M modelos com o grau mais alto de £ Φ s. O & s correspondência com o modelo atual; e determinar N modelo a partir dos M modelos, em que distorção entre valores de pixel dos N modelos e um valor de pixel do modelo atual é menor ou igual a um limiar.
[00234] Opcionalmente, em algumas modalidades possíveis da presente invenção, o limiar é igual à distorção média entre o valor de pixel do modelo atual e os valores de pixel dos M modelos, ou o limiar é igual a um valor de ajuste da distorção média entre o valor de pixel do modelo atual e valores de pixel dos M modelos.
[00235] Opcionalmente, em algumas modalidades possíveis da presente invenção, o aparelho de predição de imagem é aplicado a um aparelho de codificação de vídeo, ou o aparelho de predição de imagem é aplicado a um aparelho de decodificação de vídeo.
[00236] Pode ser entendido que funções dos módulos de função do aparelho de predição de imagem 500 nesta modalidade podem ser especificamente implementadas de acordo com os métodos nas modalidades de método anteriores. Para um processo de implementação específico, consulte as descrições relacionadas nas modalidades de método anteriores. Os detalhes não são aqui descritos novamente. O aparelho de predição de imagem 500 pode ser qualquer aparelho que necessite emitir ou reproduzir um vídeo, por exemplo, um dispositivo tal como um computador portátil, um computador tablet, um computador pessoal ou um telefone móvel.
[00237] Pode ser aprendido que, depois de determinar N modelos cujos graus de correspondência com um modelo atual satisfazem uma condição predefinida, o aparelho de predição de imagem 500 nesta modalidade determina um peso de uma área de pixels em um bloco de imagens correspondente a cada modelofe, nos N modelos, e calcula um valor de pixel previsto de uma área de pixels no bloco de imagens atual com base no peso e um valor de pixel da área de pixels no bloco de imagens correspondente a cada modelo nos N modelos. A área de pixels inclui pelo menos um pixel. Pesos de pelo menos duas áreas de pixel em um bloco de imagens correspondente a pelo menos um modelo nos N modelos determinados são diferentes, isto é, os pesos de pelo menos duas áreas de pixel em um bloco de imagens correspondente a um mesmo modelo são diferentes. Por conseguinte, uma solução de arte convencional na qual os pesos de todas as áreas de pixel em blocos de imagem correspondentes a todos os modelos são os mesmos (onde os pesos são todos iguais a 1) é abandonada. Como há uma diferença especifica entre os pesos das áreas de pixel, é mais provável conformar com uma diferença de correlação real. Deste modo, um valor de pixel de uma área de pixels em um bloco de imagens atual é precisamente previsto e eficiência de codificação e decodificação de video são melhoradas.
[00238] Com referência à Figura 6, a Figura 6 é um diagrama esquemático de um aparelho de predição de imagem 600 de acordo com uma modalidade da presente invenção. O aparelho de predição de imagem 600 pode incluir pelo menos um barramento 601, pelo menos um processador 602 conectado ao barramento 601 e pelo menos uma memória 603 conectada ao barramento 601.
[00239] O processador 602 invoca, utilizando o barramento 601, código armazenado na memória 603, de modo a determinar N modelos cujos graus de correspondência com um modelo atual satisfazem uma condição predefinida, em que o modelo atual é um modelo correspondente a um bloco de imagéns atual, M e um numero inteiro positivo e os M modelos são obtidos por pesquisar imagens de referência do bloco de imagens atual; determinar um peso de uma área de pixels em um bloco de imagens correspondente a cada modelo nos N modelos, em que pesos de pelo menos duas áreas de pixel em um bloco de imagens correspondente a pelo menos um modelo nos N modelos são diferentes; e calcular um valor de pixel previsto de uma área de pixels no bloco de imagens atual com base no peso e um valor de pixel da área de pixels no bloco de imagens correspondente a cada modelo nos N modelos, em que a área de pixels inclui pelo menos um pixel.
[00240] Por exemplo, N pode ser igual a 1, 2, 3, 4, 5, 7, 9, 12 ou outro valor.
[00241] A área de pixels mencionada em cada modalidade da presente invenção inclui pelo menos um pixel. Isto é, a área de pixels pode ser um pixel ou um bloco de pixels, e se a área de pixels é um bloco de pixels, a área de pixels pode ter, por exemplo, um tamanho de 2 x 2, 1><2, 1*3, 4x2, 4 x 3, ou 4 x 4, ou outro tamanho.
[00242] Os modelos nos N modelos correspondem a blocos de imagem diferentes, e, portanto, os N modelos correspondem a N blocos de imagem.
[00243] Por exemplo, o peso da área de pixels no bloco de imagens correspondente a cada modelo nos N modelos pode ser relacionado com um parâmetro sobre uma similaridade entre cada modelo nos N modelos e a área de pixels no bloco de imagens correspondente. Um parâmetro sobre uma similaridade entre dois objetos pode ser usado para representar a similaridade entre os dois objetos. Por exemplo, um parâmetro sobre uma similaridade entre um modelo Tm nos N modelos j uma área de pixels w em um bloco de imagens m pode ser utilizado para representar a similaridade entre o modelo Tm e a área de pixels w no bloco de imagens m. 0 bloco de imagens m é um bloco de imagens correspondente ao modelo Tm. O modelo Tm pode ser qualquer modelo nos N modelos. A área de pixels w é qualquer área de pixels no bloco de imagens m.
[00244] Em um exemplo especifico, o parâmetro sobre a similaridade entre o modelo Tm e a área de pixels w no bloco de imagens m pode ser, por exemplo, uma distância entre a área de pixels w e uma área de pixels determinada no modelo Tm, ou pode ser uma proporção de uma média ou uma média ponderada de valores de pixel de uma área de pixels determinada no modelo Tm para um valor de pixel da área de pixels w ou uma diferença absoluta entre uma média ou uma média ponderada de valores de pixel de uma área de pixels determinada no modelo Tm e um valor de pixel da área de pixels w. Ou seja, pode haver uma correspondência entre um peso da área de pixels w no bloco de imagens m correspondente ao modelo Tm e a distância entre a área de pixels w e a área de pixels determinada no modelo Tm. Alternativamente, pode haver uma correspondência entre um peso da área de pixels w no bloco de imagens m correspondente ao modelo Tm nos N modelos e a proporção da média ou a média ponderada dos valores de pixel da área de pixels determinada no modelo Tm para o valor de pixel da área de pixels w ou a diferença absoluta entre a média ou a média ponderada dos valores de pixel da área de pixels determinada no modelo Tm e o valor de pixel da área de pixels w.
[00245] Opcionalmente, em algumas modalidades possiveis da presente invenção, a área de pixels determinada 0/^eN , no modelo anterior Tm pode ser, por exemplo, um pixel superior esquerdo, uma área de pixels superior esquerda, um pixel inferior esquerdo, uma área de pixels inferior esquerda, um pixel superior direito, uma área de pixels superior direita, um pixel inferior direito, uma área de pixels inferior direita, uma área de pixels central, um pixel central ou outra área de pixels no modelo Tm.
[00246] A área de pixels superior esquerda no modelo Tm é o pixel superior esquerdo no modelo Tm ou um bloco de pixels que está no modelo Tm e que inclui o pixel superior esquerdo no modelo Tm; a área de pixels inferior esquerda no modelo Tm é o pixel inferior esquerdo no modelo Tm ou um bloco de pixels que está no modelo Tm e que inclui o pixel inferior esquerdo no modelo Tm; a área de pixels superior direita no modelo Tm é o pixel superior direito no modelo Tm ou um bloco de pixels que está no modelo Tm e que inclui o pixel superior direito no modelo Tm; a área de pixels central no modelo Tm é o pixel central no modelo Tm ou um bloco de pixels que está no modelo Tm e que inclui o pixel central no modelo Tm.
[00247] A distância entre a área de pixels w e a área de pixels determinada no modelo Tm pode ser, por exemplo, uma distância entre um pixel na área de pixels w e um pixel na área de pixels determinada no modelo Tm, em que os dois pixels estão mais próximos uns dos outros, ou a distância entre a área de pixels w e a área de pixels determinada no modelo Tm pode ser uma distância entre qualquer pixel na área de pixels w e qualquer pixel na área de pixels determinada no modelo Tm, ou a distância entre a área de pixels w e a área de pixels determinada no modelo Tm pode ser uma distância entre um pixel determinado na área de pixels w {onde o pixel determinado na área de pixels w pode ser um pixel superior esquerdo, um pixel inferior esquerdo, um pixel superior direito, um pixel inferior direito ou um pixel central na área de pixels w) e um pixel determinado na área de pixels determinada no modelo Tm (onde o pixel determinado no modelo Tm é, por exemplo, o pixel superior esquerdo, o pixel inferior esquerdo, o pixel superior direito, o pixel inferior direito ou o pixel central no modelo Tm) . Certamente, a distância entre a área de pixels w e a área de pixels determinada no modelo Tm pode ser calculada de outra maneira.
[00248] Opcionalmente, em algumas modalidades possiveis da presente invenção, que os N modelos cujos graus de correspondência com o modelo atual satisfazem a condição predefinida inclui: determinar N modelos com um grau mais elevado de correspondência com o modelo atual; ou determinar M modelos com um grau mais elevado de correspondência com o modelo atual e determinar, a partir dos M modelos, N modelos que satisfazem a condição predefinida, em que N é menor que M.
[00249] Por exemplo, o processador 602 é configurado para determinar N modelos a partir dos M modelos, em que distorção entre valores de pixel dos N modelos e um valor de pixel do modelo atual é inferior ou igual a um limiar. Por exemplo, o limiar é igual à distorção média entre o valor de pixel do modelo atual e os valores de pixel dos M modelos, ou o limiar é igual a um valor de ajuste de distorção média entre o valor de pixel do modelo atual e os valores de pixel dos M modelos. Certamente, o limiar pode ser outro valor predefinido. Pode ser entendido que um limiar de rastreio é introduzido para ajudar a obter, por meio de rastreio, um modelo que é com um grau de correspondência relativamente baixo e que não está envolvido em uma operação, de modo que precisão de predição é melhorada, e complexidade de operação é reduzida.
[00250] Pode haver diversas maneiras de determinar, pelo processador 602, o peso da área de pixels no bloco de imagens correspondente a cada modelo nos N modelos.
[00251] Por exemplo, que o processador 602 é configurado para determinar o peso da área de pixels no bloco de imagens correspondente a cada modelo nos N modelos pode incluir: determinar um peso de cada modelo nos N modelos de acordo com um grau de correspondência entre cada modelo nos N modelos e o modelo atual; e determinar, com base no peso de cada modelo nos N modelos e um parâmetro sobre uma similaridade entre cada modelo nos N modelos e a área de pixels no bloco de imagens correspondente, o peso da área de pixels no bloco de imagens correspondente a cada Modelo nos N modelos.
[00252] Opcionalmente, em algumas modalidades possíveis da presente invenção, o parâmetro sobre a similaridade entre cada modelo nos N modelos e a área de pixels no bloco de imagens correspondente pode incluir: uma distância entre uma área de pixels determinada em cada modelo nos N modelos e a área de pixels no bloco de imagens correspondente; e / ou uma proporção de uma média ou uma média ponderada de valores de pixel de uma área de pixels determinada em cada modelo nos N modelos para o valor de pixel da área de pixels no bloco de imagens correspondent ou uma diferença absoluta entre uma média ou uma média ponderada de valores de pixel de uma área de pixels determinada em cada modelo nos N modelos e o valor de pixel da área de pixels no bloco de imagens correspondente.
[00253] Opcionalmente, em algumas modalidades possiveis da presente invenção, o processador 602 pode ser configurado para determinar o peso de cada modelo nos N modelos com base nas seguintes fórmulas e de acordo com o grau de correspondência entre cada modelo nos N modelos e o modelo atual: , em que representa distorção entre o modelo atual Tx e um modelo Tm nos N modelos, S representa uma quantidade de áreas de pixel no modelo atual Tx, o representa um fator de escala de modelo, a e o são números reais maiores que 0, wm representa um peso do modelo Tm, e o modelo Tm é qualquer modelo nos N modelos. Quando um valor de a é, por exemplo, um número inteiro como 2, 3 ou 4, complexidade da operação é simplificada.
[00254] Opcionalmente, em algumas modalidades possiveis da presente invenção, o processador 602 pode ser configurado para determinar, com base na fórmula seguinte e com base no peso de cada modelo nos N modelos e o parâmetro sobre a similaridade entre cada modelo nos N modelos e a área de pixels no bloco de imagens correspondente, o peso da área de pixels no bloco de imagens correspondente a cada modelo nos N modelos: em que wm(i, j) representa um peso de uma área de pixels cujas i *0’ coordenadas são (i, j) e que está em um bloco de imagens m correspondente ao modelo Tm nos N modelos, R(i, j) representa um parâmetro sobre uma similaridade entre a área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens meo modelo Tm, e 5(R(i, j)) representa um fator de escala da área de pixels correspondente a imagem R(i, j).
[00255] Opcionalmente, em algumas modalidades possiveis da presente invenção, existe uma relação linear ou uma relação não linear entre 3(R(i, j) ) e R(i, j).
[00256] Por exemplo, a relação linear entre 5(R(i, j)) e R(i, j) é: d (R(i, j) ) = β*R(i, j), em que β é um coeficiente de escala, e β é um número real maior que 0.
[00257] Por exemplo, a relação não linear entre 5(R(i, j)) e R(i, j) é: um valor de 5(R(i, j)) é determinado com base em um intervalo de distância dentro do qual R(i, j) cai, e diferentes intervalos de distância correspondem a fatores de escala de área de pixels com diferentes valores.
[00258] Por exemplo, a relação não linear entre 5(R(i, j)) e R(i, j) pode ser:, em que al é menor que a2, a2 é menor que a3, e bl é menor que b2; e al, a2, a3, bl e b2 são números reais maiores que 0.
[00259] Por exemplo, al = 0,3, a2 = 0,5 e a3 = 1. Por exemplo, bl = 4 e b2 = 8.
[00260] Para outro exemplo, a relação não linear entre a(R(i, j)) e R(i, j) pode ser: , em que a4 é menor que a5, a5 é menor que a6, a6 é menor que a7, b3 é menor que b4, e b4 é menor que b5; e a4, a5, a6, a7, b3, b4 e b5 são números reais maiores do que 0.
[00261] Por exemplo, a4 = 0,3, a5 = 0,5, a6 = 0,8 e a7 = 1. Por exemplo, b3 = 4, b4 = 5 e b5 = 6.
[00262] Para outro exemplo, a relação não linear entre 5(R(i, j)) e R(i, j) pode ser:, em que a8 é menor que a9, e a8, a9 e b6 são números reais maiores que 0.
[00263] Por exemplo, a8 = 0,5 e a9 = 1. Por exemplo, b6 = 5.
[00264] Os exemplos anteriores mostram que a relação não linear entre 5(R(i, j)) e R(i, j) pode ser uma relação de função por parte. Uma quantidade por peça de uma função por peça pode não ser limitada a 2, 3 ou 4 mostrada nos exemplos precedentes e, certamente, pode ser maior.
[00265] Opcionalmente, em algumas modalidades possiveis da presente invenção, R(i, j) pode ser, por exemplo, igual a d(i, j) ou e(i, j), d(i, j) representa uma distância entre a área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m e uma área de pixels de um valor de pixel da área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m para um valor de pixel médio ou um valor de pixel médio ponderado do modelo Tm ou uma diferença absoluta entre um valor de pixel da área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m e um valor de pixel médio ou um valor de pixel médio ponderado do modelo Tm.
[00266] Por exemplo, d(i, j) pode representar uma distância entre a área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m e um pixel superior esquerdo no modelo Tm, ou d(i, j) pode representar uma distância entre a área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m e um pixel y no modelo Tm; e a distância entre a área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens meo pixel y no modelo Tm é menor ou igual a uma distância entre a área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m e qualquer pixel no modelo Tm exceto o pixel y.
[00267] Opcionalmente, em algumas modalidades possíveis da presente invenção, o processador 602 é configurado para calcular o valor de pixel previsto da área de pixels no bloco de imagens atual utilizando a seguinte fórmula e com base no peso e no valor de pixel da área de pixels no bloco de imagens correspondente a cada modelo nos N modelos: , em que wm(i, j) representa o peso da área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m°e^ ’ *3< correspondente ao modelo Tm nos N modelos, pm(i, j) representa o valor de pixel da área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m, e pre(i, j) representa urn valor de pixel previsto de uma área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens atual.
[00268] Pode ser compreendido que funções dos módulos de função do aparelho de predição de imagem 600 nesta modalidade podem ser especificamente implementadas de acordo com os métodos nas modalidades de método anteriores. Para um processo de implementação especifico, consulte as descrições relacionadas nas modalidades de método anteriores. Os detalhes não são aqui descritos novamente. O aparelho de predição de imagem 600 pode ser qualquer aparelho que necessite emitir ou reproduzir um video, por exemplo, um dispositivo tal como um computador portátil, um computador tablet, um computador pessoal ou um telefone móvel.
[00269] Pode ser aprendido que, depois de determinar N modelos cujos graus de correspondência com um modelo atual satisfazem uma condição predefinida, o aparelho de predição de imagem 600 nesta modalidade determina um peso de uma área de pixels em um bloco de imagens correspondente a cada modelo nos N modelos, e calcula um valor de pixel previsto de uma área de pixels no bloco de imagens atual com base no peso e um valor de pixel da área de pixels no bloco de imagens correspondente a cada modelo nos N modelos. A área de pixels inclui pelo menos um pixel. Pesos de pelo menos duas áreas de pixel em um bloco de imagens correspondente a pelo menos um modelo nos N modelos determinados são diferentes, isto a os pesos de pelo menos duas áreas de pixel em um bloco de imagens correspondente a um mesmo modelo são diferentes. Por conseguinte, uma solução de arte convencional na qual os pesos de todas as áreas de pixel em blocos de imagem correspondentes a todos os modelos são os mesmos (onde os pesos são todos iguais a 1) é abandonada. Como há uma diferença especifica entre os pesos das áreas de pixel, é mais provável conformar com uma diferença de correlação real. Deste modo, um valor de pixel de uma área de pixels em um bloco de imagens atual é precisamente previsto e eficiência de codificação e decodificação de video são melhoradas.
[00270] Com referência à Figura 7, Figura 7 é um diagrama de blocos estrutural de um aparelho de predição de imagem 700 de acordo com outra modalidade da presente invenção. O aparelho de predição de imagem 700 pode incluir pelo menos um processador 701, pelo menos uma memória 705 e pelo menos um barramento de comunicações 702. O barramento de comunicações 702 está configurado para implementar uma conexão e comunicação entre estes componentes. Opcionalmente, o aparelho de predição de imagem 700 pode incluir pelo menos uma interface de rede 704 e / ou pelo menos uma interface de usuário 703, e a interface de usuário 703 pode incluir um monitor (por exemplo, uma tela sensivel ao toque, um LCD, um dispositivo de imagem holográfica (Holographic), um CRT, um projetor (projector), um dispositivo de clique (por exemplo, um mouse, uma trackball (trackball), uma almofada de toque, uma tela de toque), uma câmera e / ou um aparelho de captação.
[00271] A memória 705 pode incluir uma memória somente de leitura e uma memória de acesso aleatório e fornecer instrução e dados para o processador 701. Uma parte memória 705 pode ainda incluir uma memória de acesso aleatório não volátil.
[00272] Em algumas formas de implementação, a memória 705 armazena os seguintes elementos: um módulo executável ou uma estrutura de dados, ou um subconjunto de um módulo executável e uma estrutura de dados, ou um conjunto estendido de um módulo executável e uma estrutura de dados: um sistema operacional 7051, incluindo vários programas de sistema, e configurado para: implementar vários serviços básicos e processar tarefas baseadas em hardware; e um módulo de programa de aplicação 7052, incluindo vários programas de aplicação, e configurado para implementar vários serviços de aplicação.
[00273] Nesta modalidade da presente invenção, por invocar um programa ou uma instrução armazenada na memória 705, o processador 701 é configurado para: determinar N modelos cujos graus de correspondência com um modelo atual satisfazem uma condição predefinida, em que o modelo atual é um modelo correspondente a um bloco de imagens atual, M é um número inteiro positivo e os M modelos são obtidos por pesquisar imagens de referência do bloco de imagens atual; determinar um peso de uma área de pixels em um bloco de imagens correspondente a cada modelo nos N modelos, em que pesos de pelo menos duas áreas de pixel em um bloco de imagens correspondente a pelo menos um modelo nos N modelos são diferentes; e calcular um valor de pixel previsto de uma área de pixels no bloco de imagens atual com base no peso e um valor de pixel da área de pixels no bloco de imagens I c correspondente a cada modelo nos N modelos, em que a áreâ^ pixels inclui pelo menos um pixel.
[00274] Por exemplo, N pode ser igual a 1, 2, 3, 4, 5, 7, 9, 12 ou outro valor.
[00275] A área de pixels mencionada em cada modalidade da presente invenção inclui pelo menos um pixel. Isto é, a área de pixels pode ser um pixel ou um bloco de pixels, e se a área de pixels é um bloco de pixels, a área de pixels pode ter, por exemplo, um tamanho de 2 * 2, 1x2, 1x3, 4x2, 4 x 3, ou 4 x 4, ou outro tamanho.
[00276] Os modelos nos N modelos correspondem a blocos de imagem diferentes, e, portanto, os N modelos correspondem a N blocos de imagem.
[00277] Por exemplo, o peso da área de pixels no bloco de imagens correspondente a cada modelo nos N modelos pode ser relacionado com um parâmetro sobre uma similaridade entre cada modelo nos N modelos e a área de pixels no bloco de imagens correspondente. Um parâmetro sobre uma similaridade entre dois objetos pode ser usado para representar a similaridade entre os dois objetos. Por exemplo, um parâmetro sobre uma similaridade entre um modelo Tm nos N modelos e uma área de pixels w em um bloco de imagens m pode ser utilizado para representar a similaridade entre o modelo Tm e a área de pixels w no bloco de imagens m. 0 bloco de imagens m é um bloco de imagens correspondente ao modelo Tm. O modelo Tm pode ser qualquer modelo nos N modelos. A área de pixels w é qualquer área de pixels no bloco de imagens m.
[00278] Em um exemplo especifico, o parâmetro sobre a similaridade entre o modelo Tm e a área de pixels w no bloco de imagens m pode ser, por exemplo, uma distância entre a área de pixels w e uma área de pixels determinada no modelo Tm, ou pode ser uma proporção de uma média ou uma média ponderada de valores de pixel de uma área de pixels determinada no modelo Tm para um valor de pixel da área de pixels w ou uma diferença absoluta entre uma média ou uma média ponderada de valores de pixel de uma área de pixels determinada no modelo Tm e um valor de pixel da área de pixels w. Ou seja, pode haver uma correspondência entre um peso da área de pixels w no bloco de imagens m correspondente ao modelo Tm e a distância entre a área de pixels w e a área de pixels determinada no modelo Tm. Alternativamente, pode haver uma correspondência entre um peso da área de pixels w no bloco de imagens m correspondente ao modelo Tm nos N modelos e a proporção da média ou a média ponderada dos valores de pixel da área de pixels determinada no modelo Tm para o valor de pixel da área de pixels w ou a diferença absoluta entre a média ou a média ponderada dos valores de pixel da área de pixels determinada no modelo Tm e o valor de pixel da área de pixels w.
[00279] Opcionalmente, em algumas modalidades possiveis da presente invenção, a área de pixels determinada no modelo anterior Tm pode ser, por exemplo, um pixel superior esquerdo, uma área de pixels superior esquerda, um pixel inferior esquerdo, uma área de pixels inferior esquerda, um pixel superior direito, uma área de pixels superior direita, um pixel inferior direito, uma área de pixels inferior direita, uma área de pixels central, um pixel central ou outra área de pixels no modelo Tm.
[00280] A área de pixels superior esquerda no modelo Tm é o pixel superior esquerdo no modelo Tm ou um bloco de pixels que está no modelo Tm e que inclui o pixel superior $ esquerdo no modelo Tm; a área de pixels inferior esquerda no modelo Tm é o pixel inferior esquerdo no modelo Tm ou um bloco de pixels que está no modelo Tm e que inclui o pixel inferior esquerdo no modelo Tm; a área de pixels superior direita no modelo Tm é o pixel superior direito no modelo Tm ou um bloco de pixels que está no modelo Tm e que inclui o pixel superior direito no modelo Tm; a área de pixels central no modelo Tm é o pixel central no modelo Tm ou um bloco de pixels que está no modelo Tm e que inclui o pixel central no modelo Tm.
[00281] A distância entre a área de pixels w e a área de pixels determinada no modelo Tm pode ser, por exemplo, uma distância entre um pixel na área de pixels w e um pixel na área de pixels determinada no modelo Tm, em que os dois pixels estão mais próximos uns dos outros, ou a distância entre a área de pixels w e a área de pixels determinada no modelo Tm pode ser uma distância entre qualquer pixel na área de pixels w e qualquer pixel na área de pixels determinada no modelo Tm, ou a distância entre a área de pixels w e a área de pixels determinada no modelo Tm pode ser uma distância entre um pixel determinado na área de pixels w (onde o pixel determinado na área de pixels w pode ser um pixel superior esquerdo, um pixel inferior esquerdo, um pixel superior direito, um pixel inferior direito ou um pixel central na área de pixels w) e um pixel determinado na área de pixels determinada no modelo Tm (onde o pixel determinado no modelo Tm é, por exemplo, o pixel superior esquerdo, o pixel inferior esquerdo, o pixel superior direito, o pixel inferior direito ou o pixel central no modelo Tm). Certamente, a distância entre a área de pixels w e a área de pixels determinada no modelo Tm pode ser calculada de outra maneira.
[00282] Opcionalmente, em possiveis da presente invenção, que os N modelos cujos graus de correspondência com o modelo atual satisfazem a condição predefinida inclui: determinar N modelos com um grau mais elevado de correspondência com o modelo atual; ou determinar M modelos com um grau mais elevado de correspondência com o modelo atual e determinar, a partir dos M modelos, N modelos gue satisfazem a condição predefinida, em que N é menor que M.
[00283] Por exemplo, o processador 701 determina, a partir dos M modelos, que os N modelos que satisfazem a condição predefinida inclui: determinar N modelos a partir dos M modelos, em que distorção entre valores de pixel dos N modelos e um valor de pixel do modelo atual é inferior ou igual a um limiar. Por exemplo, o limiar é igual à distorção média entre o valor de pixel do modelo atual e os valores de pixel dos M modelos, ou o limiar é igual a um valor de ajuste de distorção média entre o valor de pixel do modelo atual e os valores de pixel dos M modelos. Certamente, o limiar pode ser outro valor predefinido. Pode ser entendido que um limiar de rastreio é introduzido para ajudar a obter, por meio de rastreio, um modelo que é com um grau de correspondência relativamente baixo e que não está envolvido em uma operação, de modo que precisão de predição é melhorada, e complexidade de operação é reduzida.
[00284] Pode haver modos diversos de determinar, pelo processador 701, o peso da área de pixels no bloco de imagens correspondente a cada modelo nos N modelos.
[00285] Por exemplo, que o processador 701 determina o peso da área de pixels no bloco de imagens correspondente a cada modelo nos N modelos pode incluir: determinar um peso de cada modelo nos N modelos de acordo com um grau de correspondência entre cada modelo nos N modelos e o modelo atual; e determinar, com base no peso de cada modelo nos N modelos e um parâmetro sobre uma similaridade entre cada modelo nos N modelos e a área de pixels no bloco de imagens correspondente, o peso da área de pixels no bloco de imagens correspondente a cada Modelo nos N modelos.
[00286] Opcionalmente, em algumas modalidades possiveis da presente invenção, o parâmetro sobre a similaridade entre cada modelo nos N modelos e a área de pixels no bloco de imagens correspondente pode incluir: uma distância entre uma área de pixels determinada em cada modelo nos N modelos e a área de pixels no bloco de imagens correspondente; e / ou uma proporção de uma média ou uma média ponderada de valores de pixel de uma área de pixels determinada em cada modelo nos N modelos para o valor de pixel da área de pixels no bloco de imagens correspondente ou uma diferença absoluta entre uma média ou uma média ponderada de valores de pixel de uma área de pixels determinada em cada modelo nos N modelos e o valor de pixel da área de pixels no bloco de imagens correspondente.
[00287] Opcionalmente, em algumas modalidades possiveis da presente invenção, o processador 701 pode determinar o peso de cada modelo nos N modelos com base na fórmula seguinte e de acordo com o grau de correspondência entre cada modelo nos N modelos e o modelo atual:, em que m representa distorção entre um modelo Tm nos N modelos, S representa uma quantidade de áreas de pixel no modelo atual Tx, o representa um fator de escala de modelo, a e o são números reais maiores que 0, wm representa um peso do modelo Tm, e o modelo Tm é qualquer modelo nos N modelos. Quando um valor de a é, por exemplo, um número inteiro como 2, 3 ou 4, complexidade da operação é simplificada.
[00288] Opcionalmente, em algumas modalidades possiveis da presente invenção, o processador 701 pode determinar, com base na fórmula seguinte e com base no peso de cada modelo nos N modelos e o parâmetro sobre a similaridade entre cada modelo nos N modelos e a área de de imagens correspondente, o peso da área de de imagens correspondente a cada modelo nos N modelos: , em que wm(i, j) representa um peso de uma área de pixels cujas coordenadas são (i, j) e que está em um bloco de imagens m correspondente ao modelo Tm nos N modelos, R(i, j) representa um parâmetro sobre uma similaridade entre a área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens meo modelo Tm, e 5(R(i, j)) representa um fator de escala da área de pixels correspondente a imagem R(i, j).
[00289] Opcionalmente, em algumas modalidades possiveis da presente invenção, existe uma relação linear ou uma relação não linear entre 5(R(i, j)) e R(i, j).
[00290] Por exemplo, a relação linear entre 5(R(i, j)) e R(ï, j) é: a (R (i, j)) = 13*R (i, j) , em que R é um coeficiente de escala, e R é um número real maior que 0.
[00291] Por exemplo, a relação não linear entre 3(R(i, j)) e R(i, j) é: um valor de <9(R(i, j)) é determinado com base em um intervalo de distância dentro do qual R(i, j) cai, e diferentes intervalos de distância correspondem a fatores de escala de área de pixels com diferentes valores.
[00292] Por exemplo, a relação não linear entre 3(R(i, j)) e R(i, j) pode ser: , em que al é menor que a2, a2 é menor que a3, e bl é menor que b2; e al, a2, a3, bl e b2 são números reais maiores que 0.
[00293] Por exemplo, al = 0,3, a2 = 0,5 e a3 = 1. Por exemplo, bl = 4 e b2 = 8.
[00294] Para outro exemplo, a relação não linear entre 3(R(i, j)) e R(i, j) pode ser: , em que a4 é menor que a5, a5 é menor que a6, a6 é menor que a7, b3 é menor que b4, e b4 é menor que b5; e a4, a5, a6, a7, b3, b4 e b5 são números reais maiores do que 0.
[00295] Por exemplo, a4 = 0,3, a5 - 0,5, a6 = 0,8 e a7 = 1. Por exemplo, b3 = 4, b4 = 5 e b5 = 6.
[00296] Para outro exemplo, a relação não linear entrffcy 5(R(i, j)) e R(i, j) pode ser: , em que a8 é menor que a9, e a8, a9 e b6 são números reais maiores que 0.
[00297] Por exemplo, a8 = 0,5 e a9 — 1. Por exemplo, b6 = 5.
[00298] Os exemplos anteriores mostram que a relação não linear entre 3(R(i, j)) e R(i, j) pode ser uma relação de função por parte. Uma quantidade por peça de uma função por peça pode não ser limitada a 2, 3 ou 4 mostrada nos exemplos precedentes e, certamente, pode ser maior.
[00299] Opcionalmente, em algumas modalidades possiveis da presente invenção, R(i, j) pode ser, por exemplo, igual a d(i, j) ou e(i, j), d(i, j) representa uma distância entre a área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m e uma área de pixels determinada no modelo Tra, e e(i, j) representa uma proporção de um valor de pixel da área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m para um valor de pixel médio ou um valor de pixel médio ponderado do modelo Tm ou uma diferença absoluta entre um valor de pixel da área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m e um valor de pixel médio ou um valor de pixel médio ponderado do modelo Tm.
[00300] Por exemplo, d(i, j) pode representar uma distância entre a área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m e um pixel superior esquerdo no modelo Tm, ou d(i, j) pode representar unroμ. distância entre a área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m e um pixel y no modelo Tm; e a distância entre a área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens meo pixel y no modelo Tm é menor ou igual a uma distância entre a área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m e qualquer pixel no modelo Tm exceto o pixel y.
[00301] Opcionalmente, em algumas modalidades possiveis da presente invenção, o processador 701 calcula o valor de pixel previsto da área de pixels no bloco de imagens atual utilizando a seguinte fórmula e com base no peso e no valor de pixel da área de pixels no bloco de imagens correspondente a cada modelo nos N modelos: em que wm(i, j) representa o peso da área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m correspondente ao modelo Tm nos N modelos, pm(i, j) representa o valor de pixel da área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m, e pre(i, j) representa um valor de pixel previsto de uma área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens atual.
[00302] Pode ser entendido que funções dos módulos de função do aparelho de predição de imagem 700 nesta modalidade podem ser especificamente implementadas de acordo com os métodos nas modalidades de método anteriores. Para um processo de implementação específico, consulte as descriçoes relacionadas nas modalidades de método anteriores. Os detalhes não são aqui descritos novamente. O aparelho de predição de imagem 700 pode ser qualquer aparelho que necessite emitir ou reproduzir um vídeo, por exemplo, um dispositivo tal como um computador portátil, um computador tablet, um computador pessoal ou um telefone móvel.
[00303] Pode ser aprendido que, depois de determinar N modelos cujos graus de correspondência com um modelo atual satisfazem uma condição predefinida, o aparelho de predição de imagem 700 nesta modalidade determina um peso de uma área de pixels em um bloco de imagens correspondente a cada modelo nos N modelos, e calcula um valor de pixel previsto de uma área de pixels no bloco de imagens atual com base no peso e em um valor de pixel da área de pixels no bloco de imagens correspondente a cada modelo nos N modelos. A área de pixels inclui pelo menos um pixel. Pesos de pelo menos duas áreas de pixel em um bloco de imagens correspondente a pelo menos um modelo nos N modelos determinados são diferentes, isto é, os pesos de pelo menos duas áreas de pixel em um bloco de imagens correspondente a um mesmo modelo são diferentes. Por conseguinte, uma solução de arte convencional na qual os pesos de todas as áreas de pixel em blocos de imagem correspondentes a todos os modelos são os mesmos (onde os pesos são todos iguais a 1) é abandonada. Como há uma diferença específica entre os pesos das áreas de pixel, é mais provável conformar com uma diferença de correlação real. Deste modo, um valor de pixel de uma área de pixels em um bloco de imagens atual é precisamente previsto e eficiência de codificação e decodificação de vídeo são melhoradas.
[00304] Deve ser notado que, para tornar as descricoes breves, as modalidades de método anteriores são expresáas como uma série de ações. No entanto, as pessoas especializadas na técnica devem compreender que a presente invenção não está limitada à sequência de ação descrita, porque de acordo com a presente invenção, alguns passos podem ser realizados em outras sequências ou realizados simultaneamente. Além disso, as pessoas especializadas na técnica devem também compreender que todas as modalidades descritas na especificação são modalidades implementáveis, e as ações e módulos relacionados não são necessariamente obrigatórios para a presente invenção.
[00305] Nas modalidades anteriores, todas as modalidades têm respectivos focos de descrição. Para uma parte que não está descrita em detalhe em uma modalidade, consulte as descrições relacionadas em outras modalidades.
[00306] Nas modalidades fornecidas nesta aplicação, deve ser entendido que o aparelho descrito pode ser implementado de outras maneiras. Por exemplo, a modalidade de aparelho descrita é meramente um exemplo. Por exemplo, a divisão de unidade é meramente divisão de função lógica e pode ser outra divisão na implementação real. Por exemplo, uma pluralidade de unidades ou componentes podem ser combinados ou integrados em um outro sistema, ou algumas características podem ser ignoradas ou não executadas. Além disso, acoplamentos mútuos ou acoplamentos diretos ou conexões de comunicação exibidos ou discutidos podem ser implementados através de algumas interfaces. Os acoplamentos indiretos ou conexões de comunicação entre os aparelhos ou unidades podem ser implementados em formas eletrônicas ou outras.
[00307] As unidades descritas como partes separadas podem ou não estar fisicamente separadas e as partes apresentadas como unidades podem ou não ser unidades fisicas, podem estar localizadas em uma posição ou podem ser distribuídas em uma pluralidade de unidades de rede. Algumas ou todas as unidades podem ser selecionadas de acordo com as necessidades reais para atingir os objetivos das soluções nas modalidades.
[00308] Além disso, as unidades funcionais nas modalidades da presente invenção podem ser integradas em uma unidade de processamento, ou cada uma das unidades pode existir isoladamente fisicamente, ou duas ou mais unidades estão integradas em uma unidade. A unidade integrada pode ser implementada em uma forma de hardware, ou pode ser implementada sob a forma de uma unidade funcional de software.
[00309] Quando a unidade integrada anterior é implementada na forma de uma unidade funcional de software e vendida ou utilizada como um produto independente, a unidade integrada pode ser armazenada em um meio de armazenamento legível por computador. Com base neste entendimento, as soluções técnicas da presente invenção essencialmente, ou a parte que contribui para a técnica anterior, ou todas ou algumas das soluções técnicas podem ser implementadas na forma de um produto de software. 0 produto de software é armazenado em um meio de armazenamento e inclui instruções para instruir um dispositivo de computador (que pode ser um computador pessoal, um servidor ou um dispositivo de rede) executar todos ou alguns dos passos dos métodos descritos nas modalidades da presentSk invenção. 0 meio de armazenamento anterior inclui qualquer meio que pode armazenar código de programa, tal como uma unidade flash USB, uma memória somente de leitura (ROM, Read-Only Memory), uma memória de acesso aleatório (RAM, Random Access Memory), um disco rigido removivel, um disco magnético ou um disco ótico.
[00310] As modalidades anteriores destinam-se apenas a descrever as soluções técnicas da presente invenção, mas não para limitar a presente invenção. Embora a presente invenção seja descrita em detalhe com referência às modalidades anteriores, pessoas com conhecimentos normais na técnica entenderão que podem ainda fazer modificações nas soluções técnicas descritas nas modalidades anteriores ou fazer substituições equivalentes a algumas das suas características técnicas, sem se afastar do espirito e do âmbito das soluções técnicas nas modalidades da presente invenção.

Claims (18)

1. Método de predição de imagem, caracterizado pelo fato de que compreende: determinar (101) N modelos cujos graus de correspondência com um modelo atual satisfazem uma condição predefinida, em que o modelo atual é um modelo correspondente a um bloco de imagens atual e em que um modelo correspondendo a um bloco de imagem é algum dos pixels reconstruídos adjacentes do bloco de imagem e possui uma correspondência com o bloco de imagem, N é um número inteiro positivo e os N modelos são obtidos por pesquisar imagens de referência do bloco de imagens atual, e em que os N modelos correspondem a N blocos de imagem diferentes; determinar (102) um peso de uma área de pixels em um bloco de imagens correspondente a cada modelo nos N modelos, em que pesos de pelo menos duas áreas de pixel em um bloco de imagens correspondente ao mesmo modelo nos N modelos são especificamente diferentes; e calcular (103) um valor de pixel previsto de uma área de pixels no bloco de imagens atual com base no peso e um valor de pixel da área de pixels no bloco de imagens correspondente a cada modelo nos N modelos, em que a área de pixels compreende pelo menos um pixel; em que a determinação (102) de um peso de uma área de pixels em um bloco de imagens correspondente a cada modelo nos N modelos compreende: determinar um peso de cada modelo nos N modelos de acordo com um grau de correspondência entre cada modelo nos N modelos e o modelo atual; e determinar, com base no peso de cada modelo nos N modelos e um parâmetro sobre uma similaridade entre cada modelo nos N modelos e a área de pixels no bloco de imagens correspondente, o peso da área de pixels no bloco de imagens correspondente a cada modelo nos N modelos, em que um parâmetro sobre uma semelhança entre um modelo (Tm) nos N modelos e uma área de pixel (w) no bloco de imagem correspondente (m) compreende uma correspondência entre um peso da área de pixel (w) no bloco de imagem (m) correspondente ao modelo (Tm) e uma distância entre a área de pixel (w) e uma determinada área de pixel no modelo (Tm) e em que a determinada área de pixel no modelo é um pixel ou área de pixel no modelo (Tm).
2. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que o parâmetro sobre a similaridade entre cada modelo nos N modelos e a área de pixels no bloco de imagens correspondente compreende: uma distância entre uma área de pixels determinada em cada modelo nos N modelos e a área de pixels no bloco de imagens correspondente; e / ou uma proporção de uma média ou uma média ponderada de valores de pixel de uma área de pixels determinada em cada modelo nos N modelos para o valor de pixel da área de pixels no bloco de imagens correspondente ou uma diferença absoluta entre uma média ou uma média ponderada de valores de pixel de uma área de pixels determinada em cada modelo nos N modelos e o valor de pixel da área de pixels no bloco de imagens correspondente.
3. Método, de acordo com a reivindicação 1 ou 2, caracterizado pelo fato de que a determinação de um peso de cada modelo nos N modelos de acordo com um grau de correspondência entre cada modelo nos N modelos e o modelo atual compreende: determinar o peso de cada modelo nos N modelos com base na fórmula seguinte e de acordo com o grau de correspondência entre cada modelo nos N modelos e o modelo atual:, em que E(Tx, Tm) representa distorção entre o modelo atual Tx e um modelo Tm nos N modelos, S representa uma quantidade de áreas de pixel no modelo atual Tx, α representa um fator de escala de modelo, a e α são números reais maiores que 0, wm representa um peso do modelo Tm, e o modelo Tm é qualquer modelo nos N modelos.
4. Método, de acordo com qualquer uma das reivindicações 1 a 3, caracterizado pelo fato de que a determinação, com base no peso de cada modelo nos N modelos e um parâmetro sobre uma similaridade entre cada modelo nos N modelos e a área de pixels no bloco de imagens correspondente, o peso da área de pixels no bloco de imagens correspondente a cada modelo nos N modelos compreende: determinar, com base na fórmula seguinte e com base no peso de cada modelo nos N modelos e o parâmetro sobre a similaridade entre cada modelo nos N modelos e a área de pixels no bloco de imagens correspondente, o peso da área de pixels no bloco de imagens correspondente a cada modelo nos N modelos: em que wm(i, j) representa um peso de uma área de pixels cujas coordenadas são (i, j) e que está em um bloco de imagens m correspondente ao modelo Tm nos N modelos, R(i, j) representa um parâmetro sobre uma similaridade entre a área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m e o modelo Tm, e d(R(i, j)) representa um fator de escala da área de pixels correspondente a imagem R(i, j).
5. Método, de acordo com a reivindicação 4, caracterizado pelo fato de que existe uma relação linear ou uma relação não linear entre d(R(i, j)) e R(i, j).
6. Método, de acordo com a reivindicação 5, caracterizado pelo fato de que a relação linear entre d(R(i, j)) e R(i, j) é: d(R(i, j)) = β*R(i, j), em que β é um coeficiente de escala, e β é um número real maior que 0.
7. Método, de acordo com a reivindicação 5, caracterizado pelo fato de que a relação não linear entre d(R(i, j)) e R(i, j) é: um valor de d(R(i, j)) é determinado com base em um intervalo de distância dentro do qual R(i, j) cai, e diferentes intervalos de distância correspondem a fatores de escala de área de pixels com diferentes valores.
8. Método, de acordo com a reivindicação 7, caracterizado pelo fato de que a relação não linear entre d(R(i, j)) e R(i, j) é: em que a1 é menor que a2, a2 é menor que a3, e b1 é menor que b2; e a1, a2, a3, b1 e b2 são números reais maiores que 0; ou a relação não linear entre d(R(i, j)) e R(i, j) é: em que a4 é menor que a5, a5 é menor que a6, a6 é menor que a7, b3 é menor que b4, e b4 é menor que b5; e a4, a5, a6, a7, b3, b4 e b5 são números reais maiores que 0; ou a relação não linear entre ∂(R(i, j)) e R(i, j) é: em que a8 é menor que a9, e a8, a9 e b6 são números reais maiores que 0.
9. Método, de acordo com qualquer uma das reivindicações 4 a 8, caracterizado pelo fato de que: R(i, j) é igual a d(i, j) ou e(i, j), d(i, j) representa uma distância entre a área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m e uma área de pixels determinada no modelo Tm, e e(i, j) representa uma proporção de um valor de pixel da área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m para um valor de pixel médio ou um valor de pixel médio ponderado do modelo Tm ou uma diferença absoluta entre um valor de pixel da área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m e um valor de pixel médio ou um valor de pixel médio ponderado do modelo Tm.
10. Método, de acordo com a reivindicação 9, caracterizado pelo fato de que d(i, j) representa uma distância entre a área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m e um pixel superior esquerdo no modelo Tm, ou d(i, j) representa uma distância entre a área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m e um pixel y no modelo Tm; e a distância entre a área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m e o pixel y no modelo Tm é menor ou igual a uma distância entre a área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m e qualquer pixel no modelo Tm exceto o pixel y.
11. Método, de acordo com qualquer uma das reivindicações 1 a 10, caracterizado pelo fato de que o cálculo de um valor de pixel previsto de uma área de pixels no bloco de imagens atual com base no peso e em um valor de pixel da área de pixels no bloco de imagens correspondente a cada modelo nos N modelos compreende: calcular o valor de pixel previsto da área de pixels no bloco de imagens atual utilizando a seguinte fórmula e com base no peso e o valor de pixel da área de pixels no bloco de imagens correspondente a cada modelo nos N modelos: , em que wm(i, j) representa o peso da área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m correspondente ao modelo Tm nos N modelos, pm(i, j) representa o valor de pixel da área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens m, e pre(i, j) representa um valor de pixel previsto de uma área de pixels cujas coordenadas são (i, j) e que está no bloco de imagens atual.
12. Método, de acordo com qualquer uma das reivindicações 1 a 11, caracterizado pelo fato de que a determinação de N modelos cujos graus de correspondência com um modelo atual satisfazem uma condição predefinida compreende: determinar M modelos com o grau mais alto de correspondência com o modelo atual; e determinar, a partir dos M modelos, N modelos que satisfazem a condição predefinida, em que N é menor do que M.
13. Método, de acordo com a reivindicação 12, caracterizado pelo fato de que a determinação, a partir dos M modelos, de N modelos que satisfazem a condição predefinida compreende: determinar N modelos a partir dos M modelos, em que distorção entre valores de pixel dos N modelos e um valor de pixel do modelo atual é menor ou igual a um limiar.
14. Método, de acordo com a reivindicação 13, caracterizado pelo fato de que: o limiar é igual à distorção média entre o valor de pixel do modelo atual e valores de pixel dos M modelos, ou o limiar é igual a um valor de ajuste de distorção média entre o valor de pixel do modelo atual e valores de pixel dos M modelos.
15. Método, de acordo com qualquer uma das reivindicações 1 a 14, caracterizado pelo fato de que: o método de predição de imagem é aplicado em um processo de codificação de vídeo, ou o método de predição de imagem é aplicado em um processo de decodificação de vídeo.
16. Aparelho de predição de imagem caracterizado pelo fato de que compreende: uma primeira unidade de determinação (510), configurada para determinar N modelos cujos graus de correspondência com um modelo atual satisfazem uma condição predefinida, em que o modelo atual é um modelo correspondente a um bloco de imagens atual e em que um modelo correspondendo a um bloco de imagem é algum dos pixels reconstruídos adjacentes do bloco de imagem e possui uma correspondência com o bloco de imagem, N é um inteiro positivo e os N modelos são obtidos por pesquisar imagens de referência do bloco de imagens atual, e em que os N modelos correspondem a N blocos de imagem diferentes; uma segunda unidade de determinação (520), configurada para determinar um peso de uma área de pixels em um bloco de imagens correspondente a cada modelo nos N modelos, em que pesos de pelo menos duas áreas de pixels em um bloco de imagens correspondente ao mesmo modelo nos N modelos são especificamente diferentes; e uma unidade de predição (530), configurada para calcular um valor de pixel previsto de uma área de pixels no bloco de imagens atual com base no peso e um valor de pixel da área de pixels no bloco de imagens correspondente a cada modelo nos N modelos, em que a área de pixels compreende pelo menos um pixel; em que a segunda unidade de determinação (520) compreende: uma primeira subunidade de determinação, configurada para determinar um peso de cada modelo nos N modelos de acordo com um grau de correspondência entre cada modelo nos N modelos e o modelo atual; e uma segunda subunidade de determinação, configurada para determinar, com base no peso de cada modelo nos N modelos e um parâmetro sobre uma similaridade entre cada modelo nos N modelos e a área de pixels no bloco de imagens correspondente, o peso da área de pixels no bloco de imagens correspondente a cada modelo nos N modelos, em que um parâmetro sobre uma semelhança entre um modelo (Tm) nos N modelos e uma área de pixel (w) no bloco de imagem correspondente (m) compreende uma correspondência entre um peso da área de pixel (w) no bloco de imagem (m) correspondente ao modelo (Tm) e uma distância entre a área de pixel (w) e uma determinada área de pixel no modelo (Tm) e em que a determinada área de pixel no modelo é um pixel ou área de pixel no modelo (Tm).
17. Aparelho, de acordo com a reivindicação 16, caracterizado pelo fato de que o parâmetro sobre a similaridade entre cada modelo nos N modelos e a área de pixels no bloco de imagens correspondente compreende: uma distância entre uma área de pixels determinada em cada modelo nos N modelos e a área de pixels no bloco de imagens correspondente; e / ou uma proporção de uma média ou uma média ponderada de valores de pixel de uma área de pixels determinada em cada modelo nos N modelos para o valor de pixel da área de pixels no bloco de imagens correspondente ou uma diferença absoluta entre uma média ou uma média ponderada de valores de pixel de uma área de pixels determinada em cada modelo nos N modelos e o valor de pixel da área de pixels no bloco de imagens correspondente.
18. Aparelho, de acordo com a reivindicação 16 ou 17, caracterizado pelo fato de que a primeira subunidade de determinação (510) é especificamente configurada para determinar o peso de cada modelo nos N modelos com base na fórmula seguinte e de acordo com o grau de correspondência entre cada modelo nos N modelos e o modelo atual: , em que E(Tx, Tm) representa distorção entre o modelo atual Tx e um modelo Tm nos N modelos, S representa uma quantidade de áreas de pixel no modelo atual Tx, o representa um fator de escala de modelo, a e o são números reais maiores que 0, wm representa um peso do modelo Tm, e o modelo Tm é qualquer modelo nos N modelos.
BR112017006017-5A 2014-10-31 2015-04-23 Método de predição de imagem e aparelho relacionado BR112017006017B1 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201410606914.2A CN104363449B (zh) 2014-10-31 2014-10-31 图像预测方法及相关装置
CN201410606914.2 2014-10-31
PCT/CN2015/077272 WO2016065872A1 (zh) 2014-10-31 2015-04-23 图像预测方法及相关装置

Publications (2)

Publication Number Publication Date
BR112017006017A2 BR112017006017A2 (pt) 2018-06-26
BR112017006017B1 true BR112017006017B1 (pt) 2023-06-13

Family

ID=

Similar Documents

Publication Publication Date Title
US11172217B2 (en) Picture prediction method and related apparatus
US10659803B2 (en) Picture prediction method and related apparatus
RU2675092C1 (ru) Способ прогнозирования изображения и устройство прогнозирования изображения
BR122020019754B1 (pt) Método de predição de imagem e aparelho relacionado, decodificador e meio de armazenamento legível por computador
JP6387582B2 (ja) 画像予測方法および関連する装置
BR122021011303B1 (pt) Método e aparelho de decodificação de imagem, método e aparelho de codificação de imagem e mídias de armazenamento não transitória legíveis por computador
WO2016054937A1 (zh) 三维图像编码方法和三维图像解码方法及相关装置
CN109076234A (zh) 图像预测方法和相关设备
BR112017006017B1 (pt) Método de predição de imagem e aparelho relacionado
BR112017007399B1 (pt) Método de predição de imagem e aparelho relacionado
BR112018000085B1 (pt) Método e aparelho de previsão de imagem e meio legível por computador
BR122023012613B1 (pt) Método de predição de imagem e dispositivo relacionado