BR112020012732A2 - método e aparelho para predição de informações de movimento de bloco de imagens, codificador, e decodificador - Google Patents
método e aparelho para predição de informações de movimento de bloco de imagens, codificador, e decodificador Download PDFInfo
- Publication number
- BR112020012732A2 BR112020012732A2 BR112020012732-9A BR112020012732A BR112020012732A2 BR 112020012732 A2 BR112020012732 A2 BR 112020012732A2 BR 112020012732 A BR112020012732 A BR 112020012732A BR 112020012732 A2 BR112020012732 A2 BR 112020012732A2
- Authority
- BR
- Brazil
- Prior art keywords
- movement information
- candidate
- list
- candidate movement
- information
- Prior art date
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/573—Motion compensation with multiple frame prediction using two or more reference frames in a given prediction direction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/137—Motion inside a coding unit, e.g. average field, frame or block difference
- H04N19/139—Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/105—Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
- H04N19/159—Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
- H04N19/517—Processing of motion vectors by encoding
- H04N19/52—Processing of motion vectors by encoding by predictive encoding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
- H04N19/521—Processing of motion vectors for estimating the reliability of the determined motion vectors or motion vector field, e.g. for smoothing the motion vector field or for correcting motion vectors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/577—Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/593—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
Modalidades deste pedido revelam um método para predição de informações de movimento de um bloco de imagens e um produto relacionado. O método inclui: determinar uma lista de informações de movimento de candidato de um bloco de imagens atual, em que a lista de informações de movimento de candidato inclui pelo menos uma parte de informações de movimento de candidato combinado, primeiras informações de movimento de candidato combinado na pelo menos uma parte de informações de movimento de candidato combinado são obtidas ponderando-se P partes de informações de movimento de candidato usando-se fatores de ponderação correspondentes, P é um número inteiro maior que ou igual a 2, fatores de ponderação wpi para pelo menos duas dentre as P partes de informações de movimento de candidato são respectivamente valores maiores que 0 ou menores que 1, e uma soma dos fatores de ponderação para as P partes de informações de movimento de candidato é 1; determinar informações de movimento alvo na lista de informações de movimento de candidato; e predizer informações de movimento do bloco de imagens atual com base nas informações de movimento alvo, em que as informações de movimento são usadas para intrapredição ou interpredição. As soluções nas modalidades deste pedido ajudam a melhorar acurácia de predição de informações de movimento de um bloco de imagens.
Description
[0001] Este pedido refere-se ao campo de codificação e decodificação de imagem de vídeo e, em particular, a um método e um aparelho para predição de informações de movimento de um bloco de imagens, um codificador, e um decodificador.
[0002] Usando-se tecnologias de compressão de vídeo, tais como MPEG-2, MPEG, ITU-TH,263, ITU-TH.264/MPEG-4 Part 10 (codificação de vídeo avançada (advanced video coding, AVC)), o padrão ITU-TH.265 de codificação de vídeo de alta eficiência (high efficiency video coding, HEVC), e tecnologias de compressão de vídeo descritas em partes estendidas dos padrões, os dispositivos podem transmitir e receber informações de vídeo digital. Geralmente, uma imagem de uma sequência de vídeo é dividida em blocos de imagem para codificação ou decodificação.
[0003] Na tecnologia de compressão de vídeo, para reduzir ou remover informações redundantes em uma sequência de vídeo, predição espacial (intrapredição, intra prediction) e/ou predição temporal (interpredição, inter prediction) com base em um bloco de imagens são/é introduzidas. Os modos de interpredição podem incluir, mas não são limitados a um modo de mesclagem (Merge Mode) e um modo de não mesclagem (por exemplo, um modo de predição de vetor de movimento avançado (modo AMVP)). Nos modos de interpredição, a interpredição é realizada usando-se um método de contenção de informações de vários movimentos.
[0004] Em um processo de interpredição, uma lista de informações de movimento de candidato (referida como uma lista de candidatos, para abreviação) incluindo uma pluralidade de grupos de informações de movimento (também referida como uma pluralidade de partes de informações de movimento de candidato) é introduzida. Por exemplo, um codificador pode predizer informações de movimento (por exemplo, um vetor de movimento) de um bloco de imagens atual a ser codificado, selecionando-se um grupo de informações de movimento de candidato apropriadas a partir da lista de candidatos, para obter um bloco de imagens de referência ideal (isto é, um bloco de predição) do bloco de imagens atual a ser codificado. Em um processo de intrapredição, uma lista de candidatos incluindo uma pluralidade de grupos de informações de movimento (também referida como vetores de bloco) é, às vezes, introduzida.
[0005] Entretanto, independentemente do modo de mesclagem ou do modo de não mesclagem, uma quantidade máxima de candidatos de partes de informações de movimento de candidato na lista de candidatos é limitada. Uma vez que as informações de movimento de candidato disponíveis são insuficientes, um valor padrão (por exemplo, um vetor zero) é adicionado à lista de candidatos como informações de movimento de candidato, para atender um requisito da quantidade máxima de candidatos, e um identificador de índice é atribuído a cada grupo de informações de movimento de candidato. Pode ser aprendido que esta prática pode causar um significado de referência relativamente baixo de algumas informações de movimento de candidato na lista de candidatos, e adicionalmente causar uma precisão relativamente baixa da predição de vetor de movimento até certo ponto e, consequentemente, o desempenho de codificação e decodificação é afetado.
[0006] As modalidades deste pedido fornecem um método e um aparelho para predizer informações de movimento de um bloco de imagens, um codificador correspondente e um decodificador correspondente, para melhorar a precisão da predição de vetor de movimento, melhorando, desse modo, o desempenho da codificação e decodificação.
[0007] De acordo com um primeiro aspecto, uma modalidade deste pedido fornece um método para predizer informações de movimento de um bloco de imagens, onde as informações de movimento são usadas para intrapredição ou interpredição, e o método inclui: determinar uma lista de informações de movimento de candidato de um bloco de imagens atual, onde a lista de informações de movimento de candidato inclui pelo menos uma parte de informações de movimento de candidato combinado, as primeiras informações de movimento de candidato combinado em pelo menos uma parte de informações de movimento de candidato combinado é obtida por ponderação de P partes de informações de movimento de candidato (que também podem ser referidas como P grupos de informações de movimento preditivo de candidato)
usando-se fatores de ponderação correspondentes, P é um número inteiro maior que ou igual a 2, e os fatores de ponderação wpi para pelo menos duas dentre as P partes de informações de movimento de candidato são, respectivamente, valores maiores que O e menores que 1; determinar as informações de movimento alvo na lista de informações de movimento de candidato; e prognosticar informações de movimento do bloco de imagens atual com base nas informações de movimento alvo. Deve ser entendido que uma soma dos fatores de ponderação para as P partes de informações de movimento de candidato é 1. Preferivelmente, o fator de ponderação wpi para cada uma dentre as P partes de informações de movimento de candidato pode ser um valor maior que O e menor que 1.
[0008] Por exemplo, as P partes de informações de movimento de candidato que são usadas para obter as primeiras informações de movimento de candidato combinado através do processamento de ponderação podem ser as P partes de informações de movimento de candidato cujos índices de imagem de referência são os mesmos que um índice de uma imagem de referência alvo; ou podem ser P partes de informações de movimento de candidato independentemente de as imagens de referência serem as mesmas, por exemplo, os índices de imagem de referência de algumas informações de movimento de candidato são os mesmos como o índice da imagem de referência alvo, e os índices de imagem de referência de algumas informações de movimento de candidato são diferentes do índice da imagem de referência alvo. Alternativamente, as P partes de informações de movimento de candidato que são fornecidas nesta modalidade deste pedido e que são usadas para obter as primeiras informações de movimento de candidato combinado através do processamento de ponderação podem ser as P partes de informações de movimento de candidato cujos índices de imagem de referência são os mesmos, ou podem ser as P partes de informações de movimento de candidato cujos índices de imagem de referência não são completamente os mesmos.
[0009] Pode ser aprendido que uma ou mais partes de informações de movimento de candidato combinado podem ser construídas através do processamento de ponderação, de modo que mais informações de movimento de candidato usadas para referência possam ser encontradas o máximo possível, enriquecendo, desse modo, as informações de movimento de candidato, e reduzindo ou evitando, até certo ponto, o preenchimento da lista de informações de movimento de candidato com informações de movimento de candidato com vetor zero. Por exemplo, para um mesmo cenário de aplicação de codificação e decodificação, a lista de informações de movimento de candidato pode ser preenchida com uma pluralidade de vetores zero antes da solução técnica desta aplicação ser introduzida. Entretanto, depois da solução técnica desta aplicação ser introduzida, nenhum vetor zero pode precisar ser preenchido ou os vetores zero que devem ser preenchidos podem ser reduzidos. Isto melhora a precisão da predição de vetor de movimento até certo ponto, melhorando, desse modo, o desempenho da codificação e decodificação.
[0010] Além disso, deve ser entendido que o bloco de imagens atual (referido como um bloco atual, para abreviação) neste relatório, pode ser entendido como um bloco de codificação atual (bloco de codificação) ou um bloco de decodificação atual (bloco de codificação).
[0011] Além disso, deve ser entendido que a determinação de informações de movimento alvo na lista de informações de movimento de candidato pode ser entendida como a seleção, a partir da lista de informações de movimento de candidato, de informações de movimento ideais (informações de movimento preditivo ideal) usadas para o bloco de imagens atual.
[0012] Além disso, deve ser entendido que, nesta modalidade deste pedido, as P partes de informações de movimento de candidato em que o processamento de ponderação é realizado (ou a ponderação deve ser realizada) podem ser as P partes das informações de movimento de candidato original que são previamente obtidas, ou P partes de informações de movimento de candidato não original que são previamente obtidas, ou as P partes de informações de movimento de candidato que são previamente obtidas e que incluem informações de movimento de candidato original e informações de movimento de candidato não original, ou as P partes de informações de movimento de candidato que foram colocadas na lista de informações de movimento de candidato, ou as P partes de informações de movimento de candidato que foram colocadas antes na lista de informações de movimento de candidato. Isto não é limitado nesta modalidade deste pedido.
[0013] Além disso, deve ser entendido que a lista de informações de movimento de candidato que é determinada ou construída nesta modalidade deste pedido e que é usada para predizer as informações de movimento do bloco de imagens atual pode incluir uma ou mais partes de informações de movimento de candidato combinado e uma ou mais partes de informações de movimento de candidato original, ou a lista de informações de movimento de candidato pode incluir apenas uma ou mais partes de informações de movimento de candidato combinado, ou a lista de informações de movimento de candidato pode incluir uma ou mais partes de informações de movimento de candidato combinado e informações de movimento de candidato obtidas de outra maneira. Isto não é limitado nesta modalidade deste pedido.
[0014] Além disso, deve ser entendido que a lista de informações de movimento de candidato que é determinada ou construída nesta modalidade deste pedido pode incluir um ou mais tipos de informações de movimento, por exemplo, uma ou mais informações de movimento de domínio de tempo (informações de movimento em uma direção de domínio de tempo), informações de movimento intervisualização (informações de movimento em uma direção intervisualização), e/ou informações dentro do movimento. Isto não é limitado nesta modalidade deste pedido.
[0015] Além disso, deve ser observado que as informações de movimento de candidato na lista de informações de movimento de candidato nesta modalidade deste pedido podem incluir um vetor de movimento MV e informações de indicação de imagem de referência. Certamente, as informações de movimento de candidato podem incluir, alternativamente, um ou ambos os vetores de movimento MV e as informações de indicação de imagem de referência. Por exemplo, quando um lado do codificador e um lado do decodificador concordam juntos com uma imagem de referência, as informações de movimento de candidato podem incluir apenas o vetor de movimento MV. O vetor de movimento inclui usualmente um deslocamento de componente horizontal e um deslocamento de componente vertical. Por exemplo, >) é usado para representar o MV, x representa um deslocamento de posição em uma direção horizontal, e y representa um deslocamento de posição em uma direção vertical. As informações de indicação de imagem de referência podem incluir, mas não são limitadas a uma lista de imagem de referência e um índice de imagem de referência correspondente à lista de imagem de referência. O Índice de imagem de referência é usado para identificar uma imagem de referência para a qual um vetor de movimento na lista de imagem de referência correspondente (RefPicListoO ou RefPicList1) aponta. Uma imagem pode ser referida como um quadro, e a imagem de referência pode ser referida como um quadro de referência.
[0016] Deve ser entendido que o método nesta modalidade deste pedido pode ser realizado por um aparelho para predizer informações de movimento de um bloco de imagens, por exemplo, um codificador de vídeo, um decodificador de vídeo, ou um dispositivo eletrônico que tem uma função de codificação e decodificação de vídeo e, especificamente, por exemplo, uma unidade de intrapredição ou uma unidade de interpredição em um codificador de vídeo, ou uma unidade de intrapredição ou uma unidade de compensação de movimento em um decodificador de vídeo.
[0017] Com referência ao primeiro aspecto, em algumas implementações do primeiro aspecto, pelo menos uma parte de informações de movimento de candidato combinado inclui adicionalmente segundas informações de movimento de candidato combinado, as segundas informações de movimento de candidato combinado são obtidas por ponderação de M partes de informações de movimento de candidato usando-se fatores de ponderação correspondentes, M é um número inteiro maior que ou igual a 2, e os fatores de ponderação wmi para pelo menos duas dentre as M partes de informações de movimento de candidato são, respectivamente, valores maiores que O e menores que 1. Por exemplo, um identificador de índice de pelo menos uma parte de informações de movimento de candidato em P identificadores de índice das P partes de informações de movimento de candidato é diferente de um identificador de índice de pelo menos uma parte de informações de movimento de candidato em M identificadores de índice das M partes de informações de movimento de candidato. Deve ser entendido que uma soma dos fatores de ponderação para as M partes de informações de movimento de candidato é 1.
[0018] Pode ser aprendido que os identificadores de índice das M partes de informações de movimento de candidato usados para obter as segundas informações de movimento de candidato combinado através do processamento de ponderação e os identificadores de índice das P partes de informações de movimento de candidato usados para obter as primeiras informações de movimento de candidato combinado através do processamento de ponderação que são fornecidos nesta modalidade deste pedido, podem corresponder a uma pluralidade de partes de informações de movimento de candidato que são completamente diferentes uma da outra, ou podem corresponder a uma pluralidade de partes de informações de movimento de candidato que são parcialmente diferentes uma da outra. Portanto, esta modalidade deste pedido fornece uma pluralidade de maneiras de combinação de ponderação, melhorando adicionalmente, desse modo, a flexibilidade e a integridade da construção da lista de informações de movimento de candidato.
[0019] Com referência ao primeiro aspecto, em algumas implementações do primeiro aspecto, cada uma dentre as P partes de informações de movimento de candidato inclui um vetor de movimento correspondente a uma primeira lista de referência e um índice de imagem de referência correspondente à primeira lista de referência; e/ou um vetor de movimento correspondente a uma segunda lista de referência e um índice de imagem de referência correspondente à segunda lista de referência; e P1 índices de imagem de referência que estão nas P partes de informações de movimento de candidato e que correspondem à primeira lista de referência são os mesmos, ou P1 índices de imagem de referência que estão nas P partes de informações de movimento de candidato e que correspondem à primeira lista de referência são os mesmos que um índice de uma primeira imagem de referência alvo; ou P2 índices de imagem de referência que estão nas P partes de informações de movimento de candidato e que correspondem à segunda lista de referência são os mesmos, ou P2 índices de imagem de referência que estão nas P partes de informações de movimento de candidato e que correspondem à segunda lista de referência são os mesmos que um índice de uma segunda imagem de referência alvo, onde 1<P1<P, 1<P2<P, e P1 ou P2 é um número inteiro maior que ou igual a
2.
[0020] Pode ser aprendido que, nas P partes de informações de movimento de candidato que são fornecidas nesta modalidade deste pedido e que são usadas para obter as primeiras informações de movimento de candidato combinado através do processamento de ponderação, as informações de movimento de candidato cujo índice de imagem de referência é diferente do índice da imagem de referência alvo podem não ser consideradas. Por exemplo, é considerado que existem três partes de informações de movimento de candidato, os índices de imagem de referência de duas dentre as três partes de informações de movimento de candidato são os mesmos como o índice da imagem de referência alvo, e um índice de imagem de referência de outra parte de informações de movimento de candidato é diferente do índice da imagem de referência alvo. As duas partes de informações de movimento de candidato cujos índices de imagem de referência são os mesmos como o índice da imagem de referência alvo podem ser ponderadas para obter as informações de movimento de candidato combinado, e as informações de movimento de candidato cujo índice de imagem de referência é diferente do índice da imagem de referência alvo não são usadas para ponderação. Alternativamente, uma vez que informações de movimento de candidato cujo índice de imagem de referência é diferente do índice da imagem de referência alvo existem, um vetor de movimento nas informações de movimento de candidato pode ser dimensionado primeiro, para obter um vetor de movimento que aponta para a imagem de referência alvo.
[0021] Alternativamente, em outra implementação, se as P partes de informações de movimento de candidato incluem informações de movimento de candidato cujo índice de imagem de referência é diferente do índice da imagem de referência alvo, as P partes de informações de movimento de candidato não são usadas para ponderação.
[0022] Com referência ao primeiro aspecto, em algumas implementações do primeiro aspecto, as primeiras informações de movimento de candidato combinado incluem: valores ponderados de Pi vetores de movimento de candidato que estão nas P partes de informações de movimento de candidato e que correspondem à primeira lista de referência, e/ou valores ponderados de P>2 vetores de movimento de candidato que estão nas P partes de informações de movimento de candidato e que correspondem à segunda lista de referência, onde 1<P1<P, 1<P2<P, P1 ou P2 é um número inteiro maior que ou igual a 2, e fatores de ponderação wpi para pelo menos dois dentre os P1: ou P2 vetores de movimento de candidato são respectivamente valores maiores que O e menores que 1. Deve ser entendido que uma soma de fatores de ponderação para os P1 vetores de movimento de candidato é 1, e uma soma de fatores de ponderação para os P> vetores de movimento de candidato é 1.
[0023] Deve ser entendido que, em um exemplo, cada uma dentre as P partes de informações de movimento de candidato pode incluir o vetor de movimento correspondente à primeira lista de referência e um índice de quadro de referência correspondente à primeira lista de referência, ou o vetor de movimento correspondente à segunda lista de referência e um índice de quadro de referência correspondente à segunda lista de referência, ou um combinação dos mesmos. Em outras palavras, cada uma dentre as P partes de informações de movimento de candidato pode incluir informações de movimento usadas em uma direção de predição para frente, informações de movimento usadas em uma direção de predição para trás, ou uma combinação dos mesmos. As informações de movimento usadas na direção de predição para frente pode incluir um índice de uma primeira imagem de referência correspondente à primeira lista de imagem de referência e um vetor de movimento que aponta para a primeira imagem de referência correspondente ao índice da primeira imagem de referência; e as informações de movimento usadas na direção de predição para trás podem incluir um índice de uma segunda imagem de referência correspondente à segunda lista de imagem de referência e um vetor de movimento que aponta para a segunda imagem de referência correspondente ao índice da segunda imagem de referência.
[0024] Com referência ao primeiro aspecto, em algumas implementações do primeiro aspecto, cada uma dentre as M partes de informações de movimento de candidato inclui um vetor de movimento correspondente à primeira lista de referência e um índice de imagem de referência correspondente à primeira lista de referência; e/ou um vetor de movimento correspondente à segunda lista de referência e um índice de imagem de referência correspondente à segunda lista de referência; e os M'1 índices de imagem de referência que estão nas M partes de informações de movimento de candidato e que correspondem à primeira lista de referência são os mesmos, ou os Mi índices de imagem de referência que estão nas M partes de informações de movimento de candidato e que correspondem à primeira lista de referência são os mesmos como o índice da primeira imagem de referência alvo; ou os M>2 índices de imagem de referência que estão nas M partes de informações de movimento de candidato e que correspondem à segunda lista de referência são os mesmos, ou os M>2 índices de imagem de referência que estão nas M partes de informações de movimento de candidato e que correspondem à segunda lista de referência são os mesmos como o Índice da segunda imagem de referência alvo, onde 1<M1<M, 1<M2<M, e M1: ou M? é um número inteiro maior que ou igual a2.
[0025] Pode ser aprendido que, nas M partes de informações de movimento de candidato que são fornecidas nesta modalidade deste pedido e que são usadas para obter as segundas informações de movimento de candidato combinado através do processamento de ponderação, as informações de movimento de candidato cujo índice de imagem de referência é diferente do índice da imagem de referência alvo podem não ser consideradas. Alternativamente, uma vez que as informações de movimento de candidato cujo índice de imagem de referência é diferente do índice da imagem de referência alvo existem, um vetor de movimento nas informações de movimento de candidato pode ser dimensionado primeiro, para obter um vetor de movimento que aponta para a imagem de referência alvo.
[0026] Alternativamente, em outra implementação, se as M partes de informações de movimento de candidato incluem informações de movimento de candidato cujo índice de imagem de referência é diferente do índice da imagem de referência alvo, as M partes de informações de movimento de candidato não são usadas para ponderação.
[0027] Com referência ao primeiro aspecto, em algumas implementações do primeiro aspecto, as segundas informações de movimento de candidato combinado incluem: valores ponderados de M: vetores de movimento de candidato que estão nas M partes de informações de movimento de candidato e que correspondem à primeira lista de referência, e/ou valores ponderados de M> vetores de movimento de candidato que estão nas M partes de informações de movimento de candidato e que correspondem à segunda lista de referência, onde 1<M1:<M, 1<M2<M, Mi: ou M2 é um número inteiro maior que ou igual a 2, e fatores de ponderação wmi para pelo menos dois dentre os M: ou M>2 vetores de movimento de candidato são respectivamente valores maiores que O e menores que 1. Deve ser entendido que uma soma de fatores de ponderação para os M: vetores de movimento de candidato é 1, e uma soma de fatores de ponderação para os M>2 vetores de movimento de candidato é 1.
[0028] Deve ser entendido que cada uma dentre as M partes de informações de movimento de candidato pode incluir o vetor de movimento correspondente à primeira lista de referência e um índice de quadro de referência correspondente à primeira lista de referência, ou o vetor de movimento correspondente à segunda lista de referência e um índice de quadro de referência correspondente à segunda lista de referência, ou uma combinação dos mesmos. Em outras palavras, cada uma dentre as M partes de informações de movimento de candidato pode incluir informações de movimento usadas em uma direção de predição para frente, informações de movimento usadas em uma direção de predição para trás, ou uma combinação das mesmas, onde as informações de movimento usadas na direção de predição para frente podem incluir um índice de uma primeira imagem de referência correspondente à primeira lista de imagem de referência e um vetor de movimento que aponta para a primeira imagem de referência correspondente ao índice da primeira imagem de referência; e as informações de movimento usadas na direção de predição para trás podem incluir um índice de uma segunda imagem de referência correspondente à segunda lista de imagem de referência e um vetor de movimento que aponta para a segunda imagem de referência correspondente ao índice da segunda imagem de referência.
[0029] Com referência ao primeiro aspecto, em algumas implementações do primeiro aspecto, as P partes de informações de movimento de candidato incluem as primeiras informações de movimento de candidato correspondentes a um primeiro identificador de índice e as segundas informações de movimento de candidato correspondentes a um segundo identificador de índice, o primeiro identificador de índice (também referido como um primeiro valor de índice) é menor que o segundo identificador de índice (também referido como um segundo valor de índice) e, correspondentemente, um fator de ponderação para as primeiras informações de movimento de candidato é maior que ou igual a um fator de ponderação para as segundas informações de movimento de candidato.
[0030] Opcionalmente, se um comprimento da lista de informações de movimento de candidato for maior que 2, as P partes de informações de movimento de candidato na lista de informações de movimento de candidato incluem as primeiras informações de movimento de candidato correspondentes ao primeiro identificador de índice e as segundas informações de movimento de candidato correspondentes ao segundo identificador de índice, uma quantidade de bits ocupada pelo primeiro identificador de índice é menor que uma quantidade de bits ocupada pelo segundo identificador de índice e, correspondentemente, o fator de ponderação para as primeiras informações de movimento de candidato é maior que ou igual ao fator de ponderação para as segundas informações de movimento de candidato.
[0031] Deve ser entendido que, uma relação de valor entre o fator de ponderação para as primeiras informações de movimento de candidato e o fator de ponderação para as segundas informações de movimento de candidato pode ser determinada com base em uma relação de valor entre o primeiro identificador de índice e o segundo identificador de índice (ou pode ser determinada com base nas posições de arranjo do primeiro identificador de índice e do segundo identificador de índice na lista de informações de movimento de candidato). Se o primeiro identificador de índice for menor que o segundo identificador de índice (ou o primeiro identificador de índice estiver organizado antes do segundo identificador de índice), o fator de ponderação para as primeiras informações de movimento de candidato é maior que ou igual ao fator de ponderação para as segundas informações de movimento de candidato.
[0032] Além disso, deve ser entendido que se o fatores de ponderação para todas as P partes de informações de movimento de candidato forem os mesmos, e a soma dos fatores de ponderação para as P partes de informações de movimento de candidato for 1, as P partes de informações de movimento de candidato são ponderadas para obter as primeiras informações de movimento de candidato combinado podem ser entendidas como um valor médio das P partes de informações de movimento de candidato que é calculado para obter as primeiras informações de movimento de candidato combinado.
[0033] Pode ser aprendido que nesta modalidade deste pedido, o fator de ponderação é determinado de forma flexível com base em uma relação de valor entre um ou mais identificadores de índice que um a um correspondem a uma ou mais partes de informações de movimento de candidato. Um fator de ponderação (também referido como um peso) para informações de movimento de candidato com uma correlação mais forte é maior, melhorando adicionalmente, desse modo, a precisão da predição de vetor de movimento.
[0034] Com referência ao primeiro aspecto, em algumas implementações do primeiro aspecto, as M partes de informações de movimento de candidato incluem terceiras informações de movimento de candidato correspondentes a um terceiro identificador de índice e quartas informações de movimento de candidato correspondentes a um quarto identificador de índice, o terceiro identificador de índice é menor que o quarto identificador de índice e, correspondentemente, um fator de ponderação para as terceiras informações de movimento de candidato é maior que ou igual a um fator de ponderação para as quartas informações de movimento de candidato.
[0035] Opcionalmente, se um comprimento da lista de informações de movimento de candidato for maior que 2, as M partes de informações de movimento de candidato na lista de informações de movimento de candidato incluem as terceiras informações de movimento de candidato correspondentes ao terceiro identificador de índice e as quartas informações de movimento de candidato correspondentes ao quarto identificador de índice, uma quantidade de bits ocupada pelo terceiro identificador de índice é menor que uma quantidade de bits ocupada pelo quarto identificador de índice e, correspondentemente, um fator de ponderação para as terceiras informações de movimento de candidato é maior que ou igual a um fator de ponderação para as quartas informações de movimento de candidato.
[0036] Deve ser entendido que, uma relação de valor entre o fator de ponderação para as terceiras informações de movimento de candidato e o fator de ponderação para as quartas informações de movimento de candidato pode ser determinada com base em uma relação de valor entre o terceiro identificador de índice e o quarto identificador de índice (ou pode ser determinada com base em posições de arranjo do terceiro identificador de índice e do quarto identificador de índice na lista de informações de movimento de candidato). Se o terceiro identificador de índice for menor que o quarto identificador de índice (ou o terceiro identificador de índice for organizado antes do quarto identificador de índice), o fator de ponderação para as terceiras informações de movimento de candidato é maior que ou igual ao fator de ponderação para as quartas informações de movimento de candidato.
[0037] Além disso, deve ser entendido que se o fatores de ponderação para todas as M partes de informações de movimento de candidato forem os mesmos, e a soma dos fatores de ponderação para as M partes de informações de movimento de candidato for 1, as M partes de informações de movimento de candidato são ponderadas para obter as segundas informações de movimento de candidato combinado pode ser entendidas como um valor médio das M partes de informações de movimento de candidato que é calculado para obter as segundas informações de movimento de candidato combinado.
[0038] Pode ser aprendido que nesta modalidade deste pedido, o fator de ponderação é determinado de forma flexível com base em uma relação de valor entre um ou mais identificadores de índice que um a um correspondem a uma ou mais partes de informações de movimento de candidato. Um fator de ponderação (também referido como um peso) para informações de movimento de candidato com uma correlação mais forte é maior, melhorando adicionalmente, desse modo, a precisão da predição de vetor de movimento.
[0039] Com referência ao primeiro aspecto, em algumas implementações do primeiro aspecto, as P partes de informações de movimento de candidato são P partes de informações de movimento de candidato original, por exemplo, P partes de informações de movimento de candidato original na lista de informações de movimento de candidato; ou as P partes de informações de movimento de candidato são (P-X) partes de informações de movimento de candidato original e X partes de informações de movimento de candidato não original, por exemplo, (P-X) partes de informações de movimento de candidato original e X partes de informações de movimento de candidato não original na lista de informações de movimento de candidato, onde X é um número inteiro positivo menor que ou igual a P.
[0040] Com referência ao primeiro aspecto, em algumas implementações do primeiro aspecto, as M partes de informações de movimento de candidato são M partes de informações de movimento de candidato original, por exemplo, M partes de informações de movimento de candidato original na lista de informações de movimento de candidato; ou as M partes de informações de movimento de candidato são (M-Y) partes de informações de movimento de candidato original e Y partes de informações de movimento de candidato não original, por exemplo, (M-Y) partes de informações de movimento de candidato original e Y partes de informações de movimento de candidato não original na lista de informações de movimento de candidato, onde Y é um número inteiro positivo menor que ou igual a M.
[0041] Com referência ao primeiro aspecto, em algumas implementações do primeiro aspecto, as informações de movimento de candidato original incluem informações de movimento de um ou mais blocos de referência de domínio espacial do bloco de imagens atual, informações de movimento de um ou mais blocos de referência de domínio de tempo do bloco de imagens atual, e/ou informações de movimento de um ou mais blocos de referência intervisualização do bloco de imagens atual; e as informações de movimento de candidato não original incluem as informações de movimento de candidato dimensionado, as primeiras informações de movimento de candidato combinado, as segundas informações de movimento de candidato combinado, informações de movimento de candidato bipreditivo combinado, e/ou informações de movimento zero, onde cada uma das informações de movimento de candidato dimensionado inclui um vetor de movimento que aponta para um primeiro quadro de referência alvo e que está na primeira lista de referência, e/ou um vetor de movimento que aponta para um segundo quadro de referência alvo e que está na segunda lista de referência.
[0042] Deve ser observado que o bloco de referência de domínio espacial neste relatório, é um bloco de referência relacionado a um domínio espacial do bloco de imagens atual, e pode incluir um ou mais blocos de referência de domínio espacial que estão em uma imagem em que o bloco de imagens atual está localizado e que são adjacentes ao bloco de imagens atual, e/ou um ou mais blocos de referência de domínio espacial que estão em uma imagem em que o bloco de imagens atual está localizado e que não são adjacentes ao bloco de imagens atual. Em um exemplo, um ou mais blocos de referência de domínio espacial que estão na imagem em que o bloco de imagens atual está localizado e que são adjacentes ao bloco de imagens atual, incluem um quarto bloco adjacente ao domínio espacial AO localizado no lado inferior esquerdo do bloco de imagens atual, um primeiro bloco adjacente ao domínio espacial A1 localizado no lado esquerdo do bloco de imagens atual, um terceiro bloco adjacente ao domínio espacial BO localizado no lado superior direito do bloco de imagens atual, um segundo bloco adjacente ao domínio espacial B1 localizado no lado superior do bloco de imagens atual, ou um quinto bloco adjacente ao domínio espacial B2 localizado no lado superior esquerdo do bloco de imagens atual.
[0043] Deve ser observado que o bloco de referência de domínio de tempo neste relatório, é um bloco de referência relacionado a um domínio de tempo do bloco de imagens atual, e pode incluir um ou mais blocos de referência de domínio espacial que estão em uma imagem de referência e que são adjacentes a um bloco co-localizado (co-located block), e/ou um ou mais sub- blocos no bloco co-localizado, onde o bloco co-localizado é um bloco de imagens que está na imagem de referência e cujo tamanho, forma e coordenadas são os mesmos como àqueles do bloco de imagens atual, ou o bloco co-localizado é um bloco de imagens que está na imagem de referência, que se desvia de uma posição especificada do bloco de imagens atual por um deslocamento, e cujo tamanho e forma são os mesmos como àqueles do bloco de imagens atual. A imagem de referência neste relatório, é uma imagem reconstruída. Especificamente, a imagem de referência neste relatório, é uma imagem de referência em uma ou mais listas de imagem de referência, por exemplo, pode ser uma imagem de referência correspondente a um índice especificado de imagem de referência em uma lista especificada de imagem de referência, ou pode ser uma imagem de referência em uma posição da cabeça em uma lista padrão de imagem de referência. Isto não é limitado nesta aplicação. Em um exemplo, o bloco de referência de domínio de tempo inclui um bloco adjacente ao domínio espacial inferior direto H que é do bloco co-localizado (co-located block) e que está no bloco de imagens atual, um bloco do meio superior esquerdo CO do bloco co-localizado, um bloco do meio inferior direito C3 do bloco co- localizado, um bloco superior esquerdo TL do bloco co-localizado, ou um bloco inferior direito BR do bloco co-localizado.
[0044] Deve ser observado que o bloco intervisualização de referência neste relatório, é um bloco de referência relacionado aos pontos de vista do bloco de imagens atual, e pode incluir um ou mais blocos de referência de domínio espacial que estão em uma imagem de referência e que são adjacentes a um bloco correspondente, e/ou um ou mais sub-blocos no bloco correspondente, onde o bloco correspondente é um bloco de imagens que está na imagem de referência e cujo tamanho, forma e coordenadas são os mesmos como àqueles do bloco de imagens atual, ou o bloco correspondente é um bloco de imagens (para ser específico, obtido através do posicionamento usando-se um vetor de disparidade) que está na imagem de referência, que se desvia de uma posição especificada do bloco de imagens atual por um deslocamento, e cujo tamanho e forma são os mesmos como àqueles do bloco de imagens atual. A imagem de referência neste relatório é uma imagem reconstruída. Especificamente, a imagem de referência neste relatório é uma imagem de referência que está em um ponto de referência e que está em um momento igual ou diferente de um momento de uma imagem atual. Isto não é limitado nesta aplicação.
[0045] Deve ser observado que, um bloco de referência é um determinado bloco de imagens do vetor de movimento (também se refere a um bloco de imagens codificado ou um bloco de imagens decodificado).
[0046] Deve ser observado que as informações de movimento de candidato bipreditivo combinado neste relatório, são informações de movimento de candidato de um tipo bipreditivo que é obtido combinando-se informações de movimento de candidato em diferentes direções de predição em dois grupos de informações de movimento de candidato original incluídos na lista de informações de movimento de candidato. A combinação neste relatório pode ser entendida como a combinação de informações de movimento de candidato original em uma direção de predição para frente em um grupo de informações de movimento de candidato original e informações de movimento de candidato original em uma direção de predição para trás em outro grupo de informações de movimento de candidato original, para obter um grupo de novas informações de movimento de candidato construídas do tipo bipreditivo.
[0047] Com referência ao primeiro aspecto, em algumas implementações do primeiro aspecto, as informações de movimento de candidato dimensionado são obtidas usando-se o seguinte método: determinar o primeiro quadro de referência alvo que é do bloco de imagens atual e que corresponde à primeira lista de referência e/ou o segundo quadro de referência alvo que é do bloco de imagens atual e que corresponde à segunda lista de referência; determinar se uma imagem de referência que está incluída nas informações de movimento de candidato e que corresponde à primeira lista de referência é a mesma como o primeiro quadro de referência alvo, e/ou se uma imagem de referência que é incluída nas informações de movimento de candidato e que corresponde à segunda lista de referência é a mesma como o segundo quadro de referência alvo; e se a imagem de referência que é incluída nas informações de movimento de candidato e que corresponde à primeira lista de referência for diferente do primeiro quadro de referência alvo, dimensionar com base em uma distância de domínio de tempo ou uma distância intervisualização, o vetor de movimento que é incluído nas informações de movimento de candidato e que corresponde à primeira lista de imagem de referência, para obter o vetor de movimento que aponta para o primeiro quadro de referência alvo; e/ou se a imagem de referência que é incluída nas informações de movimento de candidato e que corresponde à segunda lista de referência for diferente do segundo quadro de referência alvo, dimensionar com base em uma distância de domínio de tempo ou uma distância intervisualização, o vetor de movimento que é incluído nas informações de movimento de candidato e que corresponde à segunda lista de imagem de referência, para obter o vetor de movimento que aponta para o segundo quadro de referência alvo.
[0048] Em um exemplo, o primeiro quadro de referência alvo é um quadro de referência que corresponde à primeira lista de referência e que são as informações de movimento de candidato usadas com mais frequência na lista de informações de movimento de candidato, ou um quadro de referência que corresponde à primeira lista de referência e que são informações de movimento de candidato que tem um menor identificador de índice na lista de informações de movimento de candidato; alternativamente, o segundo quadro de referência alvo é um quadro de referência que corresponde à segunda lista de referência e que são as informações de movimento de candidato usadas com mais frequência na lista de informações de movimento de candidato, ou um quadro de referência que corresponde à segunda lista de referência e que são as informações de movimento de candidato que tem um menor identificador de índice na lista de informações de movimento de candidato.
[0049] Em outro exemplo, existem quatro candidatos de mesclagem originais na lista de informações de movimento de candidato; e, correspondentemente, a primeira imagem de referência alvo é uma imagem de referência que corresponde à primeira lista de referência e que é de um candidato de mesclagem original usado com mais frequência nos candidatos de mesclagem originais na lista de informações de movimento de candidato, ou uma imagem de referência que corresponde à primeira lista de referência e que é de um candidato de mesclagem original que tem um menor identificador de índice de imagem de referência nos candidatos de mesclagem originais na lista de informações de movimento de candidato, ou uma imagem de referência que corresponde à primeira lista de referência e que é de um candidato de mesclagem original que tem um menor identificador de índice nos candidatos de mesclagem originais na lista de informações de movimento de candidato; ou a segunda imagem de referência alvo é uma imagem de referência que corresponde à segunda lista de referência e que é de um candidato de mesclagem original usado com mais frequência nos candidatos de mesclagem originais na lista de informações de movimento de candidato, ou uma imagem de referência que corresponde à segunda lista de referência e que é de um candidato de mesclagem original que tem um menor identificador de índice de imagem de referência nos candidatos de mesclagem originais na lista de informações de movimento de candidato, ou uma imagem de referência que corresponde à segunda lista de referência e que é de um candidato de mesclagem original que tem um menor identificador de índice nos candidatos de mesclagem originais na lista de informações de movimento de candidato.
[0050] Ainda em outro exemplo, se uma quantidade de partes de informações de movimento de candidato na lista de informações de movimento de candidato for menor que ou igual a uma quantidade R pré-ajustada, a primeira imagem de referência alvo é uma imagem de referência que corresponde à primeira lista de referência e que é de informações de movimento de candidato usadas com mais frequência nas informações de movimento de candidato na lista de informações de movimento de candidato, ou uma imagem de referência que corresponde à primeira lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice de imagem de referência nas informações de movimento de candidato na lista de informações de movimento de candidato, ou uma imagem de referência que corresponde à primeira lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice nas informações de movimento de candidato na lista de informações de movimento de candidato; ou se uma quantidade de partes de informações de movimento de candidato na lista de informações de movimento de candidato for maior que uma quantidade R pré-ajustada (por exemplo, 4), a primeira imagem de referência alvo é uma imagem de referência que corresponde à primeira lista de referência e que é de informações de movimento de candidato usadas com mais frequência nas primeiras R partes de informações de movimento de candidato na lista de informações de movimento de candidato, ou uma imagem de referência que corresponde à primeira lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice de imagem de referência nas primeiras R partes de informações de movimento de candidato na lista de informações de movimento de candidato, ou uma imagem de referência que corresponde à primeira lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice nas primeiras R partes de informações de movimento de candidato na lista de informações de movimento de candidato.
[0051] Além disso, se uma quantidade de partes de informações de movimento de candidato na lista de informações de movimento de candidato for menor que ou igual a uma quantidade R pré-ajustada, a segunda imagem de referência alvo é uma imagem de referência que corresponde à segunda lista de referência e que é de informações de movimento de candidato usadas com mais frequência nas informações de movimento de candidato na lista de informações de movimento de candidato, ou uma imagem de referência que corresponde à segunda lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice de imagem de referência nas informações de movimento de candidato na lista de informações de movimento de candidato, ou uma imagem de referência que corresponde à segunda lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice nas informações de movimento de candidato na lista de informações de movimento de candidato; ou se uma quantidade de partes de informações de movimento de candidato na lista de informações de movimento de candidato for maior que uma quantidade R pré-ajustada, a segunda imagem de referência alvo é uma imagem de referência que corresponde à segunda lista de referência e que é de informações de movimento de candidato usadas com mais frequência nas primeiras R partes de informações de movimento de candidato na lista de informações de movimento de candidato, ou uma imagem de referência que corresponde à segunda lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice de imagem de referência nas primeiras R partes de informações de movimento de candidato na lista de informações de movimento de candidato, ou uma imagem de referência que corresponde à segunda lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice nas primeiras R partes de informações de movimento de candidato na lista de informações de movimento de candidato.
[0052] Ainda em um outro exemplo, a primeira imagem de referência alvo é uma imagem de referência que corresponde à primeira lista de referência e que é de informações de movimento de candidato usadas com mais frequência nas P ou M partes de informações de movimento de candidato a serem combinadas, ou uma imagem de referência que corresponde à primeira lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice de imagem de referência nas P ou M partes de informações de movimento de candidato, ou uma imagem de referência que corresponde à primeira lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice nas P ou M partes de informações de movimento de candidato; e/ou a segunda imagem de referência alvo é uma imagem de referência que corresponde à segunda lista de referência e que é de informações de movimento de candidato usadas com mais frequência nas P ou M partes de informações de movimento de candidato a serem combinadas, ou uma imagem de referência que corresponde à segunda lista de referência e que é de informações de movimento de candidato que tem um menor identificador de Índice de imagem de referência nas P ou M partes de informações de movimento de candidato, ou uma imagem de referência que corresponde à segunda lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice nas P ou M partes de informações de movimento de candidato.
[0053] Deve ser entendido que se todas as informações de movimento de candidato em que o processamento de ponderação é realizado
(ou a ponderação deve ser realizada) forem as informações de intra-movimento, o processamento de dimensão não precisa ser realizado antecipadamente; ou se as informações de movimento de candidato em que o processamento de ponderação é realizado incluir as informações de movimento na direção de domínio de tempo e/ou as informações de movimento na direção intervisualização, o processamento de dimensão precisa ser realizado antecipadamente.
[0054] Pode ser aprendido que, antes do processamento de ponderação ser realizado, um vetor de movimento que aponta para um quadro de referência diferente do quadro de referência alvo é pré-processado, de modo que o vetor de movimento seja dimensionado para o vetor de movimento que aponta para o quadro de referência alvo, melhorando adicionalmente, desse modo, a efetividade da predição de vetor de movimento.
[0055] Com referência ao primeiro aspecto, em algumas implementações do primeiro aspecto, uma quantidade de bits ocupada por um identificador de índice das informações de movimento de candidato combinado é maior que ou igual a uma quantidade de bits ocupada por um identificador de índice das informações de movimento de candidato original.
[0056] Pode ser aprendido que, o identificador de índice das informações de movimento de candidato combinado é definido como um identificador de índice com uma quantidade de bits relativamente grande, facilitando, desse modo, a compatibilidade com um processo existente de construção da lista de informações de movimento de candidato.
[0057] Com referência ao primeiro aspecto, em algumas implementações do primeiro aspecto, a quantidade de bits ocupada pelo identificador de índice das informações de movimento de candidato combinado é menor que ou igual à quantidade de bits ocupada pelo identificador de índice das informações de movimento de candidato original.
[0058] Pode ser aprendido que em alguns modos de intra ou interpredição, a eficiência de codificação e decodificação com base nas informações de movimento de candidato combinado é maior que a eficiência de codificação e decodificação com base nas informações de movimento de candidato original, de modo que uma probabilidade de que as informações de movimento de candidato combinado são as informações de movimento alvo é relativamente alta. Portanto, o identificador de índice das informações de movimento de candidato combinado pode ser definido como um identificador de Índice com uma quantidade de bits relativamente pequena, ajudando, desse modo, a reduzir sobrecarga de bits de transmissão de vídeo.
[0059] Com referência ao primeiro aspecto, em algumas implementações do primeiro aspecto, a predição de informações de movimento do bloco de imagens atual com base nas informações de movimento alvo inclui: usar as informações de movimento alvo como as informações de movimento do bloco de imagens atual.
[0060] Com referência ao primeiro aspecto, em algumas implementações do primeiro aspecto, as informações de movimento incluem uma predição de vetor de movimento, e a predição de informações de movimento do bloco de imagens atual com base nas informações de movimento alvo inclui: analisar um fluxo de bits para obter uma diferença de predição de vetor de movimento do bloco de imagens atual; e usar uma soma da predição de vetor de movimento nas informações de movimento alvo e a diferença de predição de vetor de movimento como um vetor de movimento do bloco de imagens atual.
[0061] Com referência ao primeiro aspecto, em algumas implementações do primeiro aspecto, o método é usado para codificar o bloco de imagens atual, e a determinação de informações de movimento alvo inclui: determinar as informações de movimento alvo na lista de informações de movimento de candidato, onde um custo de distorção de taxa para codificar o bloco de imagens atual usando-se as informações de movimento alvo é o mínimo; ou o método é usado para decodificar o bloco de imagens atual, e a determinação de informações de movimento alvo inclui: determinar, na lista de informações de movimento de candidato, informações de movimento alvo indicadas por um quinto identificador de índice, onde o quinto identificador de índice é usado para indicar as informações de movimento alvo na lista de informações de movimento de candidato. Deve ser entendido que o quinto identificador de índice pode ser um do primeiro, segundo, terceiro ou quarto identificador de índice anterior, ou pode ser um identificador de índice diferente do primeiro, segundo, terceiro ou quarto identificador de índice anterior.
[0062] Deve ser observado que, se a lista de informações de movimento de candidato incluir apenas uma parte de informações de movimento de candidato, as informações de movimento de candidato exclusivas são determinadas como as informações de movimento alvo.
[0063] Pode ser aprendido que o método para predizer informações de movimento de um bloco de imagens nesta modalidade deste pedido não é apenas aplicável a um modo de predição de mesclagem (Merge) e/ou um modo de predição de vetor de movimento avançado (predição de vetor de movimento avançada, AMVP), mas também aplicável a outro modo em que as informações de movimento do bloco de imagens atual são prognosticadas usando-se as informações de movimento do bloco de referência de domínio espacial, das informações de movimento do bloco de referência de domínio de tempo, e/ou das informações de movimento do bloco intervisualização de referência, melhorando, desse modo, o desempenho da codificação e decodificação.
[0064] Um segundo aspecto desta aplicação fornece um aparelho para predizer informações de movimento de um bloco de imagens, onde as informações de movimento são usadas para intrapredição ou interpredição, e o aparelho inclui: uma unidade de determinação de lista de informações de movimento de candidato, configurada para determinar uma lista de informações de movimento de candidato de um bloco de imagens atual, onde a lista de informações de movimento de candidato inclui pelo menos uma parte de informações de movimento de candidato combinado, as primeiras informações de movimento de candidato combinado em pelo menos uma parte de informações de movimento de candidato combinado são obtidas ponderando as P partes de informações de movimento de candidato usando-se fatores de ponderação correspondentes, P é um número inteiro maior que ou igual a 2, e os fatores de ponderação wpi para pelo menos duas dentre as P partes de informações de movimento de candidato são, respectivamente, valores maiores que O e menores que 1; uma unidade de determinação de informações de movimento alvo, configurada para determinar as informações de movimento alvo na lista de informações de movimento de candidato; e uma unidade de predição, configurada para predizer informações de movimento do bloco de imagens atual com base nas informações de movimento alvo. Deve ser entendido que uma soma dos fatores de ponderação para as P partes de informações de movimento de candidato é 1. Preferivelmente, o fator de ponderação wpi para cada uma dentre as P partes de informações de movimento de candidato pode ser um valor maior que O e menor que 1.
[0065] O bloco de imagens atual (referido como um bloco atual, para abreviação) neste relatório, pode ser entendido como um bloco de codificação atual ou um bloco de decodificação atual.
[0066] Deve ser observado que a lista de informações de movimento de candidato inclui um ou mais tipos de informações de movimento de candidato, por exemplo, uma ou mais informações de movimento de domínio de tempo (também referidas como informações de movimento em uma direção de domínio de tempo), informações de movimento intervisualização (também referidas como informações de movimento em uma direção intervisualização) e/ou informações de intra-movimento.
[0067] Com referência ao segundo aspecto, em algumas implementações do segundo aspecto, pelo menos uma parte de informações de movimento de candidato combinado inclui adicionalmente segundas informações de movimento de candidato combinado, as segundas informações de movimento de candidato combinado são obtidas por ponderação de M partes de informações de movimento de candidato usando-se fatores de ponderação correspondentes, M é um número inteiro maior que ou igual a 2, e os fatores de ponderação wmi para pelo menos duas dentre as M partes de informações de movimento de candidato são, respectivamente, valores maiores que O e menores que 1. Por exemplo, um identificador de índice de pelo menos uma parte de informações de movimento de candidato em P identificadores de índice das P partes de informações de movimento de candidato é diferente de um identificador de índice de pelo menos uma parte de informações de movimento de candidato em M identificadores de índice das M partes de informações de movimento de candidato. Deve ser entendido que uma soma dos fatores de ponderação para as M partes de informações de movimento de candidato é 1.
[0068] Com referência ao segundo aspecto, em algumas implementações do segundo aspecto, cada uma dentre as P partes de informações de movimento de candidato inclui um vetor de movimento correspondente a uma primeira lista de referência e um índice de imagem de referência correspondente à primeira lista de referência; e/ou um vetor de movimento correspondente a uma segunda lista de referência e um índice de imagem de referência correspondente à segunda lista de referência; e P1 índices de imagem de referência que estão nas P partes de informações de movimento de candidato e que correspondem à primeira lista de referência são os mesmos, ou P1 índices de imagem de referência que estão nas P partes de informações de movimento de candidato e que correspondem à primeira lista de referência são os mesmos que um índice de uma primeira imagem de referência alvo; ou P2 índices de imagem de referência que estão nas P partes de informações de movimento de candidato e que correspondem à segunda lista de referência são os mesmos, ou P2 índices de imagem de referência que estão nas P partes de informações de movimento de candidato e que correspondem à segunda lista de referência são os mesmos que um índice de uma segunda imagem de referência alvo, onde 1<P1<P, 1<P2<P, e P1 ou P2 é um número inteiro maior que ou igual a
2.
[0069] Pode ser aprendido que, nas P partes de informações de movimento de candidato que são fornecidas nesta modalidade deste pedido e que são usadas para obter as primeiras informações de movimento de candidato combinado através do processamento de ponderação, as informações de movimento de candidato cujo índice de imagem de referência é diferente do índice da imagem de referência alvo podem não ser consideradas. Alternativamente, uma vez que as informações de movimento de candidato cujo Índice de imagem de referência é diferente do índice da imagem de referência alvo existem, um vetor de movimento nas informações de movimento de candidato precisa ser primeiro dimensionado, para obter um vetor de movimento que aponta para a imagem de referência alvo.
[0070] Com referência ao segundo aspecto, em algumas implementações do segundo aspecto, as primeiras informações de movimento de candidato combinado incluem: valores ponderados de P1 vetores de movimento de candidato que estão nas P partes de informações de movimento de candidato e que correspondem à primeira lista de referência, e/ou valores ponderados de P2 vetores de movimento de candidato que estão nas P partes de informações de movimento de candidato e que correspondem à segunda lista de referência, onde 1<P1<P, 1<P2<P, P1 ou P2 é um número inteiro maior que ou igual a 2, e fatores de ponderação wpi para pelo menos dois dentre os P1: ou P2 vetores de movimento de candidato são respectivamente valores maiores que O e menores que 1. Deve ser entendido que uma soma de fatores de ponderação para os P1 vetores de movimento de candidato é 1, e uma soma de fatores de ponderação para os P2 vetores de movimento de candidato é 1.
[0071] Com referência ao segundo aspecto, em algumas implementações do segundo aspecto, cada uma dentre as M partes de informações de movimento de candidato inclui um vetor de movimento correspondente à primeira lista de referência e um índice de imagem de referência correspondente à primeira lista de referência; e/ou um vetor de movimento correspondente à segunda lista de referência e um índice de imagem de referência correspondente à segunda lista de referência; e os M: índices de imagem de referência que estão nas M partes de informações de movimento de candidato e que correspondem à primeira lista de referência são os mesmos, ou os M: índices de imagem de referência que estão nas M partes de informações de movimento de candidato e que correspondem à primeira lista de referência são os mesmos como o índice da primeira imagem de referência alvo; ou os M>2 índices de imagem de referência que estão nas M partes de informações de movimento de candidato e que correspondem à segunda lista de referência são os mesmos, ou os M2 índices de imagem de referência que estão nas M partes de informações de movimento de candidato e que correspondem à segunda lista de referência são os mesmos como o Índice da segunda imagem de referência alvo, onde 1<M1SM, 1<M2<M, e M1 ou M? é um número inteiro maior que ou igual a2.
[0072] Pode ser aprendido que, nas M partes de informações de movimento de candidato que são fornecidas nesta modalidade deste pedido e que são usadas para obter as segundas informações de movimento de candidato combinado através do processamento de ponderação, as informações de movimento de candidato cujo índice de imagem de referência é diferente do Índice da imagem de referência alvo podem não ser consideradas. Alternativamente, uma vez que as informações de movimento de candidato cujo índice de imagem de referência é diferente do índice da imagem de referência alvo existem, um vetor de movimento nas informações de movimento de candidato precisa ser primeiro dimensionado, para obter um vetor de movimento que aponta para a imagem de referência alvo.
[0073] Com referência ao segundo aspecto, em algumas implementações do segundo aspecto, as segundas informações de movimento de candidato combinado incluem: valores ponderados de Mi: vetores de movimento de candidato que estão nas M partes de informações de movimento de candidato e que correspondem à primeira lista de referência, e/ou valores ponderados de M2 vetores de movimento de candidato que estão nas M partes de informações de movimento de candidato e que correspondem à segunda lista de referência, onde 1<M1:<M, 1<M2<M, M1: ou M2 é um número inteiro maior que ou igual a 2, e fatores de ponderação wmi para pelo menos dois dentre os M: ou M>2 vetores de movimento de candidato são respectivamente valores maiores que O e menores que 1. Deve ser entendido que uma soma de fatores de ponderação para os M: vetores de movimento de candidato é 1, e uma soma de fatores de ponderação para os M>2 vetores de movimento de candidato é 1.
[0074] Com referência ao segundo aspecto, em algumas implementações do segundo aspecto, as P partes de informações de movimento de candidato incluem as primeiras informações de movimento de candidato correspondentes a um primeiro identificador de índice e as segundas informações de movimento de candidato correspondentes a um segundo identificador de índice, o primeiro identificador de índice é menor que o segundo identificador de índice e, correspondentemente, um fator de ponderação para as primeiras informações de movimento de candidato é maior que ou igual a um fator de ponderação para as segundas informações de movimento de candidato.
[0075] Com referência ao segundo aspecto, em algumas implementações do segundo aspecto, as M partes de informações de movimento de candidato incluem terceiras informações de movimento de candidato correspondentes a um terceiro identificador de índice e quartas informações de movimento de candidato correspondentes a um quarto identificador de índice, o terceiro identificador de índice é menor que o quarto identificador de índice e, correspondentemente, um fator de ponderação para as terceiras informações de movimento de candidato é maior que ou igual a um fator de ponderação para as quartas informações de movimento de candidato.
[0076] Com referência ao segundo aspecto, em algumas implementações do segundo aspecto, as P partes de informações de movimento de candidato são P partes de informações de movimento de candidato original; ou as P partes de informações de movimento de candidato são (P-X) partes de informações de movimento de candidato original e X partes de informações de movimento de candidato não original, onde X é um número inteiro positivo menor que ou igual a P.
[0077] Com referência ao segundo aspecto, em algumas implementações do segundo aspecto, as M partes de informações de movimento de candidato são M partes de informações de movimento de candidato original; ou as M partes de informações de movimento de candidato são (M-Y) partes de informações de movimento de candidato original e Y partes de informações de movimento de candidato não original, onde Y é um número inteiro positivo menor que ou igual a M.
[0078] Com referência ao segundo aspecto, em algumas implementações do segundo aspecto, as informações de movimento de candidato original incluem informações de movimento de um ou mais blocos de referência de domínio espacial do bloco de imagens atual, informações de movimento de um ou mais blocos de referência de domínio de tempo do bloco de imagens atual, e/ou informações de movimento de um ou mais blocos de referência intervisualização do bloco de imagens atual; e as informações de movimento de candidato não original incluem informações de movimento de candidato dimensionado, as primeiras informações de movimento de candidato combinado, as segundas informações de movimento de candidato combinado, informações de movimento de candidato bipreditivo combinado, e/ou informações de movimento zero, onde cada uma das informações de movimento de candidato dimensionado inclui um vetor de movimento que aponta para o primeiro quadro de referência alvo e que está na primeira lista de referência, e/ou um vetor de movimento que aponta para o segundo quadro de referência alvo e que está na segunda lista de referência.
[0079] Com referência ao segundo aspecto, em algumas implementações do segundo aspecto, as informações de movimento de candidato dimensionado são obtidas pela unidade de determinação de lista de informações de movimento de candidato, realizando as seguintes etapas:
determinar o primeiro quadro de referência alvo que é do bloco de imagens atual e que corresponde à primeira lista de referência e/ou o segundo quadro de referência alvo que é do bloco de imagens atual e que corresponde à segunda lista de referência; determinar se uma imagem de referência que é incluída nas informações de movimento de candidato e que corresponde à primeira lista de referência é a mesma como o primeiro quadro de referência alvo, e/ou se uma imagem de referência que é incluída nas informações de movimento de candidato e que corresponde à segunda lista de referência é a mesma como o segundo quadro de referência alvo; e se a imagem de referência que é incluída nas informações de movimento de candidato e que corresponde à primeira lista de referência for diferente do primeiro quadro de referência alvo, dimensionar com base em uma distância de domínio de tempo ou uma distância intervisualização, o vetor de movimento que é incluído nas informações de movimento de candidato e que corresponde à primeira lista de imagem de referência, para obter o vetor de movimento que aponta para o primeiro quadro de referência alvo; e/ou se a imagem de referência que é incluída nas informações de movimento de candidato e que corresponde à segunda lista de referência for diferente do segundo quadro de referência alvo, dimensionar com base em uma distância de domínio de tempo ou uma distância intervisualização, o vetor de movimento que é incluído nas informações de movimento de candidato e que corresponde à segunda lista de imagem de referência, para obter o vetor de movimento que aponta para o segundo quadro de referência alvo.
[0080] Em um exemplo, o primeiro quadro de referência alvo é um quadro de referência que corresponde à primeira lista de referência e que é de informações de movimento de candidato usadas com mais frequência na lista de informações de movimento de candidato, ou um quadro de referência que corresponde à primeira lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice na lista de informações de movimento de candidato; alternativamente, o segundo quadro de referência alvo é um quadro de referência que corresponde à segunda lista de referência e que é de informações de movimento de candidato usadas com mais frequência na lista de informações de movimento de candidato, ou um quadro de referência que corresponde à segunda lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice na lista de informações de movimento de candidato.
[0081] Em outro exemplo, existem quatro candidatos de mesclagem originais na lista de informações de movimento de candidato; e, correspondentemente, a primeira imagem de referência alvo é uma imagem de referência que corresponde à primeira lista de referência e que é de um candidato de mesclagem original usado com mais frequência nos candidatos de mesclagem originais na lista de informações de movimento de candidato, ou uma imagem de referência que corresponde à primeira lista de referência e que é de um candidato de mesclagem original que tem um menor identificador de índice de imagem de referência nos candidatos de mesclagem originais na lista de informações de movimento de candidato, ou uma imagem de referência que corresponde à primeira lista de referência e que é de um candidato de mesclagem original que tem um menor identificador de índice nos candidatos de mesclagem originais na lista de informações de movimento de candidato; ou a segunda imagem de referência alvo é uma imagem de referência que corresponde à segunda lista de referência e que é de um candidato de mesclagem original usado com mais frequência nos candidatos de mesclagem originais na lista de informações de movimento de candidato, ou uma imagem de referência que corresponde à segunda lista de referência e que é de um candidato de mesclagem original que tem um menor identificador de índice de imagem de referência nos candidatos de mesclagem originais na lista de informações de movimento de candidato, ou uma imagem de referência que corresponde à segunda lista de referência e que é de um candidato de mesclagem original que tem um menor identificador de índice nos candidatos de mesclagem originais na lista de informações de movimento de candidato.
[0082] Ainda em outro exemplo, em termos de determinação da primeira imagem de referência alvo que é do bloco de imagens atual e que corresponde à primeira lista de referência, a unidade de determinação de lista de informações de movimento de candidato é, especificamente, configurada para: se uma quantidade de partes de informações de movimento de candidato na lista de informações de movimento de candidato for menor que ou igual a uma quantidade R pré-ajustada, determinar que a primeira imagem de referência alvo é uma imagem de referência que corresponde à primeira lista de referência e que é de informações de movimento de candidato usadas com mais frequência nas informações de movimento de candidato na lista de informações de movimento de candidato, ou uma imagem de referência que corresponde à primeira lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice de imagem de referência nas informações de movimento de candidato na lista de informações de movimento de candidato, ou uma imagem de referência que corresponde à primeira lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice nas informações de movimento de candidato na lista de informações de movimento de candidato; ou se uma quantidade de partes de informações de movimento de candidato na lista de informações de movimento de candidato for maior que uma quantidade R pré-ajustada (por exemplo, 4), determinar que a primeira imagem de referência alvo é uma imagem de referência que corresponde à primeira lista de referência e que é de informações de movimento de candidato usadas com mais frequência nas primeiras R partes de informações de movimento de candidato na lista de informações de movimento de candidato, ou uma imagem de referência que corresponde à primeira lista de referência e que é de informações de movimento de candidato que tem um menor identificador de Índice de imagem de referência nas primeiras R partes de informações de movimento de candidato na lista de informações de movimento de candidato, ou uma imagem de referência que corresponde à primeira lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice nas primeiras R partes de informações de movimento de candidato na lista de informações de movimento de candidato.
[0083] Além disso, em termos de determinação da segunda imagem de referência alvo que é do bloco de imagens atual e que corresponde à segunda lista de referência, a unidade de determinação de lista de informações de movimento de candidato é, especificamente, configurada para: se uma quantidade de partes de informações de movimento de candidato na lista de informações de movimento de candidato for menor que ou igual a uma quantidade R pré-ajustada, determinar que a segunda imagem de referência alvo é uma imagem de referência que corresponde à segunda lista de referência e que é de informações de movimento de candidato usadas com mais frequência nas informações de movimento de candidato na lista de informações de movimento de candidato, ou uma imagem de referência que corresponde à segunda lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice de imagem de referência nas informações de movimento de candidato na lista de informações de movimento de candidato, ou uma imagem de referência que corresponde à segunda lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice nas informações de movimento de candidato na lista de informações de movimento de candidato; ou se uma quantidade de partes de informações de movimento de candidato na lista de informações de movimento de candidato for maior que uma quantidade R pré-ajustada, determinar que a segunda imagem de referência alvo é uma imagem de referência que corresponde à segunda lista de referência e que é de informações de movimento de candidato usadas com mais frequência nas primeiras R partes de informações de movimento de candidato na lista de informações de movimento de candidato, ou uma imagem de referência que corresponde à segunda lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice de imagem de referência nas primeiras R partes de informações de movimento de candidato na lista de informações de movimento de candidato, ou uma imagem de referência que corresponde à segunda lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice nas primeiras R partes de informações de movimento de candidato na lista de informações de movimento de candidato.
[0084] Ainda em um outro exemplo, em termos de determinação da primeira imagem de referência alvo que é do bloco de imagens atual e que corresponde à primeira lista de referência e/ou da segunda imagem de referência alvo que é do bloco de imagens atual e que corresponde à segunda lista de referência, a unidade de determinação de lista de informações de movimento de candidato é, especificamente, configurada para: determinar que a primeira imagem de referência alvo é uma imagem de referência que corresponde à primeira lista de referência e que é de informações de movimento de candidato usadas com mais frequência nas P ou M partes de informações de movimento de candidato a serem combinadas, ou uma imagem de referência que corresponde à primeira lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice de imagem de referência nas P ou M partes de informações de movimento de candidato, ou uma imagem de referência que corresponde à primeira lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice nas P ou M partes de informações de movimento de candidato; e/ou determinar que a segunda imagem de referência alvo é uma imagem de referência que corresponde à segunda lista de referência e que é de informações de movimento de candidato usadas com mais frequência nas P ou M partes de informações de movimento de candidato a serem combinadas, ou uma imagem de referência que corresponde à segunda lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice de imagem de referência nas P ou M partes de informações de movimento de candidato, ou uma imagem de referência que corresponde à segunda lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice nas P ou M partes de informações de movimento de candidato.
[0085] Com referência ao segundo aspecto, em algumas implementações do segundo aspecto, uma quantidade de bits ocupada por um identificador de índice das informações de movimento de candidato combinado é maior que ou igual a uma quantidade de bits ocupada por um identificador de índice das informações de movimento de candidato original.
[0086] Com referência ao segundo aspecto, em algumas implementações do segundo aspecto, a quantidade de bits ocupada pelo identificador de índice das informações de movimento de candidato combinado é menor que ou igual à quantidade de bits ocupada pelo identificador de índice das informações de movimento de candidato original.
[0087] Com referência ao segundo aspecto, em algumas implementações do segundo aspecto, a unidade de predição é configurada, especificamente, para usar as informações de movimento alvo como as informações de movimento do bloco de imagens atual.
[0088] Com referência ao segundo aspecto, em algumas implementações do segundo aspecto, as informações de movimento incluem uma predição de vetor de movimento, e a unidade de predição é, especificamente, configurada para: analisar um fluxo de bits para obter uma diferença de vetor de movimento do bloco de imagens atual; e usar uma soma da predição de vetor de movimento nas informações de movimento alvo e a diferença de predição de vetor de movimento como um vetor de movimento do bloco de imagens atual.
[0089] Com referência ao segundo aspecto, em algumas implementações do segundo aspecto, o aparelho é configurado para codificar o bloco de imagens atual, e a unidade de determinação de informações de movimento alvo é configurada, especificamente, para determinar as informações de movimento alvo na lista de informações de movimento de candidato, onde um custo de distorção de taxa para codificar o bloco de imagens atual usando-se as informações de movimento alvo é o mínimo; ou o aparelho é configurado para decodificar o bloco de imagens atual, e a unidade de determinação de informações de movimento alvo é configurada, especificamente, para determinar, na lista de informações de movimento de candidato, informações de movimento alvo indicadas por um quinto identificador de índice, onde o quinto identificador de índice é usado para indicar as informações de movimento alvo na lista de informações de movimento de candidato.
[0090] Deve ser observado que se a lista de informações de movimento de candidato incluir apenas uma parte de informações de movimento de candidato, as informações de movimento de candidato exclusivas são determinadas como as informações de movimento alvo.
[0091] Um terceiro aspecto desta aplicação fornece um aparelho para predizer informações de movimento de um bloco de imagens, onde as informações de movimento são usadas para intrapredição ou interpredição, e o aparelho inclui um processador e uma memória acoplados ao processador, onde o processador é configurado para: determinar uma lista de informações de movimento de candidato de um bloco de imagens atual, onde a lista de informações de movimento de candidato inclui pelo menos uma parte de informações de movimento de candidato combinado, as primeiras informações de movimento de candidato combinado em pelo menos uma parte de informações de movimento de candidato combinado são obtidas ponderando P partes de informações de movimento de candidato usando-se fatores de ponderação correspondentes, P é um número inteiro maior que ou igual a 2, e os fatores de ponderação wpi para pelo menos duas dentre as P partes de informações de movimento de candidato são, respectivamente, valores maiores que O e menores que 1; determinar informações de movimento alvo na lista de informações de movimento de candidato; e predizer informações de movimento do bloco de imagens atual com base nas informações de movimento alvo. Deve ser entendido que uma soma dos fatores de ponderação para as P partes de informações de movimento de candidato é 1.
[0092] O bloco de imagens atual (referido como um bloco atual, para abreviação) neste relatório, pode ser entendido como um bloco de codificação atual ou um bloco de decodificação atual.
[0093] Deve ser observado que a lista de informações de movimento de candidato inclui um ou mais tipos de informações de movimento de candidato, por exemplo, uma ou mais informações de movimento de domínio de tempo (também referidas como informações de movimento em uma direção de domínio de tempo), informações de movimento intervisualização (também referidas como informações de movimento em uma direção intervisualização) e/ou informações de intra-movimento.
[0094] Com referência ao terceiro aspecto, em algumas implementações do terceiro aspecto, pelo menos uma parte de informações de movimento de candidato combinado inclui adicionalmente segundas informações de movimento de candidato combinado, as segundas informações de movimento de candidato combinado são obtidas por ponderação de M partes de informações de movimento de candidato usando-se fatores de ponderação correspondentes, M é um número inteiro maior que ou igual a 2, e os fatores de ponderação wmi para pelo menos duas dentre as M partes de informações de movimento de candidato são, respectivamente, valores maiores que O e menores que 1. Por exemplo, um identificador de índice de pelo menos uma parte de informações de movimento de candidato em P identificadores de índice das P partes de informações de movimento de candidato é diferente de um identificador de índice de pelo menos uma parte de informações de movimento de candidato em M identificadores de índice das M partes de informações de movimento de candidato.
[0095] Deve ser entendido que uma soma dos fatores de ponderação para as M partes de informações de movimento de candidato é 1.
[0096] Com referência ao terceiro aspecto, em algumas implementações do terceiro aspecto, cada uma dentre as P partes de informações de movimento de candidato inclui um vetor de movimento correspondente a uma primeira lista de referência e um índice de imagem de referência correspondente à primeira lista de referência; e/ou um vetor de movimento correspondente a uma segunda lista de referência e um índice de imagem de referência correspondente à segunda lista de referência; e P1 índices de imagem de referência que estão nas P partes de informações de movimento de candidato e que correspondem à primeira lista de referência são os mesmos, ou P1 índices de imagem de referência que estão nas P partes de informações de movimento de candidato e que correspondem à primeira lista de referência são os mesmos que um índice de uma primeira imagem de referência alvo; ou P2 índices de imagem de referência que estão nas P partes de informações de movimento de candidato e que correspondem à segunda lista de referência são os mesmos, ou P2 índices de imagem de referência que estão nas P partes de informações de movimento de candidato e que correspondem à segunda lista de referência são os mesmos que um índice de uma segunda imagem de referência alvo, onde 1<P1<P, 1<P2<P, e P1 ou P2 é um número inteiro maior que ou igual a
2.
[0097] Pode ser aprendido que, nas P partes de informações de movimento de candidato que são fornecidas nesta modalidade deste pedido e que são usadas para obter as primeiras informações de movimento de candidato combinado através do processamento de ponderação, informações de movimento de candidato cujo índice de imagem de referência é diferente do índice da imagem de referência alvo podem não ser consideradas. Alternativamente, uma vez que as informações de movimento de candidato cujo Índice de imagem de referência é diferente do índice da imagem de referência alvo existem, um vetor de movimento nas informações de movimento de candidato precisa ser primeiro dimensionado, para obter um vetor de movimento que aponta para a imagem de referência alvo.
[0098] Com referência ao terceiro aspecto, em algumas implementações do terceiro aspecto, as primeiras informações de movimento de candidato combinado incluem: valores ponderados de P1 vetores de movimento de candidato que estão nas P partes de informações de movimento de candidato e que correspondem à primeira lista de referência, e/ou valores ponderados de P2 vetores de movimento de candidato que estão nas P partes de informações de movimento de candidato e que correspondem à segunda lista de referência, onde 1<P1<P, 1<P2<P, P1 ou P2 é um número inteiro maior que ou igual a 2, e fatores de ponderação wpi para pelo menos dois dentre os P1: ou P2 vetores de movimento de candidato são respectivamente valores maiores que O e menores que 1. Deve ser entendido que uma soma dos fatores de ponderação para os P1 vetores de movimento de candidato é 1, e uma soma dos fatores de ponderação para os P2 vetores de movimento de candidato é 1.
[0099] Com referência ao terceiro aspecto, em algumas implementações do terceiro aspecto, cada uma dentre as M partes de informações de movimento de candidato inclui um vetor de movimento correspondente à primeira lista de referência e um índice de imagem de referência correspondente à primeira lista de referência; e/ou um vetor de movimento correspondente à segunda lista de referência e um índice de imagem de referência correspondente à segunda lista de referência; e os Mi índices de imagem de referência que estão nas M partes de informações de movimento de candidato e que correspondem à primeira lista de referência são os mesmos, ou M: índices de imagem de referência que estão nas M partes de informações de movimento de candidato e que correspondem à primeira lista de referência são os mesmos como o índice da primeira imagem de referência alvo; ou os M>2 índices de imagem de referência que estão nas M partes de informações de movimento de candidato e que correspondem à segunda lista de referência são os mesmos, ou os M>2 índices de imagem de referência que estão nas M partes de informações de movimento de candidato e que correspondem à segunda lista de referência são os mesmos como o Índice da segunda imagem de referência alvo, onde
1<M1<M, 1<M2<M, e M1: ou M? é um número inteiro maior que ou igual a2.
[0100] Pode ser aprendido que, nas M partes de informações de movimento de candidato que são fornecidas nesta modalidade deste pedido e que são usadas para obter as segundas informações de movimento de candidato combinado através do processamento de ponderação, as informações de movimento de candidato cujo índice de imagem de referência é diferente do índice da imagem de referência alvo podem não ser consideradas. Alternativamente, uma vez que as informações de movimento de candidato cujo Índice de imagem de referência é diferente do índice da imagem de referência alvo existem, um vetor de movimento nas informações de movimento de candidato precisa ser primeiro dimensionado, para obter um vetor de movimento que aponta para a imagem de referência alvo.
[0101] Com referência ao terceiro aspecto, em algumas implementações do terceiro aspecto, as segundas informações de movimento de candidato combinado incluem: valores ponderados de M: vetores de movimento de candidato que estão nas M partes de informações de movimento de candidato e que correspondem à primeira lista de referência, e/ou valores ponderados de M> vetores de movimento de candidato que estão nas M partes de informações de movimento de candidato e que correspondem à segunda lista de referência, onde 1<M1:<M, 1<M2<M, M1: ou M2 é um número inteiro maior que ou igual a 2, e fatores de ponderação wmi para pelo menos dois dentre os M: ou M>2 vetores de movimento de candidato são respectivamente valores maiores que O e menores que 1. Deve ser entendido que uma soma dos fatores de ponderação para os M: vetores de movimento de candidato é 1, e uma soma dos fatores de ponderação para os M> vetores de movimento de candidato é 1.
[0102] Com referência ao terceiro aspecto, em algumas implementações do terceiro aspecto, as P partes de informações de movimento de candidato incluem as primeiras informações de movimento de candidato correspondentes a um primeiro identificador de índice e as segundas informações de movimento de candidato correspondentes a um segundo identificador de índice, o primeiro identificador de índice é menor que o segundo identificador de índice, e um fator de ponderação para as primeiras informações de movimento de candidato é maior que ou igual a um fator de ponderação para as segundas informações de movimento de candidato.
[0103] Com referência ao terceiro aspecto, em algumas implementações do terceiro aspecto, as M partes de informações de movimento de candidato incluem as terceiras informações de movimento de candidato correspondentes a um terceiro identificador de índice e as quartas informações de movimento de candidato correspondentes a um quarto identificador de índice, o terceiro identificador de índice é menor que o quarto identificador de índice, e um fator de ponderação para as terceiras informações de movimento de candidato é maior que ou igual a um fator de ponderação para as quartas informações de movimento de candidato.
[0104] Com referência ao terceiro aspecto, em algumas implementações do terceiro aspecto, as P partes de informações de movimento de candidato são P partes de informações de movimento de candidato original; ou as P partes de informações de movimento de candidato são (P-X) partes de informações de movimento de candidato original e X partes de informações de movimento de candidato não original, onde X é um número inteiro positivo menor que ou igual a P.
[0105] Com referência ao terceiro aspecto, em algumas implementações do terceiro aspecto, as M partes de informações de movimento de candidato são M partes de informações de movimento de candidato original; ou as M partes de informações de movimento de candidato são (M-Y) partes de informações de movimento de candidato original e Y partes de informações de movimento de candidato não original, onde Y é um número inteiro positivo menor que ou igual a M.
[0106] Com referência ao terceiro aspecto, em algumas implementações do terceiro aspecto, as informações de movimento de candidato original incluem informações de movimento de um ou mais blocos de referência de domínio espacial do bloco de imagens atual, informações de movimento de um ou mais blocos de referência de domínio de tempo do bloco de imagens atual, e/ou informações de movimento de um ou mais blocos de referência intervisualização do bloco de imagens atual; e as informações de movimento de candidato não original incluem informações de movimento de candidato dimensionado, as primeiras informações de movimento de candidato combinado, as segundas informações de movimento de candidato combinado, as informações de movimento de candidato bipreditivo combinado, e/ou as informações de movimento zero, onde cada uma das informações de movimento de candidato dimensionado inclui um vetor de movimento que aponta para o primeiro quadro de referência alvo e que está na primeira lista de referência, e/ou um vetor de movimento que aponta para o segundo quadro de referência alvo e que está na segunda lista de referência.
[0107] Com referência ao terceiro aspecto, em algumas implementações do terceiro aspecto, as informações de movimento de candidato dimensionado são obtidas pelo processador, realizando as seguintes etapas: determinar o primeiro quadro de referência alvo que é do bloco de imagens atual e que corresponde à primeira lista de referência e/ou o segundo quadro de referência alvo que é do bloco de imagens atual e que corresponde à segunda lista de referência; determinar se uma imagem de referência que é incluída nas informações de movimento de candidato e que corresponde à primeira lista de referência é a mesmo como o primeiro quadro de referência alvo, e/ou se uma imagem de referência que é incluída nas informações de movimento de candidato e que corresponde à segunda lista de referência é a mesma como o segundo quadro de referência alvo; e se a imagem de referência que é incluída nas informações de movimento de candidato e que corresponde à primeira lista de referência for diferente do primeiro quadro de referência alvo, dimensionar com base em uma distância de domínio de tempo ou uma distância intervisualização, o vetor de movimento que é incluído nas informações de movimento de candidato e que corresponde à primeira lista de imagem de referência, para obter o vetor de movimento que aponta para o primeiro quadro de referência alvo; e/ou se a imagem de referência que é incluída nas informações de movimento de candidato e que corresponde à segunda lista de referência for diferente do segundo quadro de referência alvo, dimensionar com base em uma distância de domínio de tempo ou uma distância intervisualização, o vetor de movimento que é incluído nas informações de movimento de candidato e que corresponde à segunda lista de imagem de referência, para obter o vetor de movimento que aponta para o segundo quadro de referência alvo.
[0108] Em um exemplo, o primeiro quadro de referência alvo é um quadro de referência que corresponde à primeira lista de referência e que é de informações de movimento de candidato usadas com mais frequência na lista de informações de movimento de candidato, ou um quadro de referência que corresponde à primeira lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice na lista de informações de movimento de candidato; alternativamente, o segundo quadro de referência alvo é um quadro de referência que corresponde à segunda lista de referência e que é de informações de movimento de candidato usadas com mais frequência na lista de informações de movimento de candidato, ou um quadro de referência que corresponde à segunda lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice na lista de informações de movimento de candidato.
[0109] Em outro exemplo, existem quatro candidatos de mesclagem originais na lista de informações de movimento de candidato; e, correspondentemente, a primeira imagem de referência alvo é uma imagem de referência que corresponde à primeira lista de referência e que é de um candidato de mesclagem original usado com mais frequência nos candidatos de mesclagem originais na lista de informações de movimento de candidato, ou uma imagem de referência que corresponde à primeira lista de referência e que é de um candidato de mesclagem original que tem um menor identificador de índice de imagem de referência nos candidatos de mesclagem originais na lista de informações de movimento de candidato, ou uma imagem de referência que corresponde à primeira lista de referência e que é de um candidato de mesclagem original que tem um menor identificador de índice nos candidatos de mesclagem originais na lista de informações de movimento de candidato; ou a segunda imagem de referência alvo é uma imagem de referência que corresponde à segunda lista de referência e que é de um candidato de mesclagem original usado com mais frequência nos candidatos de mesclagem originais na lista de informações de movimento de candidato, ou uma imagem de referência que corresponde à segunda lista de referência e que é de um candidato de mesclagem original que tem um menor identificador de índice de imagem de referência nos candidatos de mesclagem originais na lista de informações de movimento de candidato, ou uma imagem de referência que corresponde à segunda lista de referência e que é de um candidato de mesclagem original que tem um menor identificador de índice nos candidatos de mesclagem originais na lista de informações de movimento de candidato.
[0110] Ainda em outro exemplo, se uma quantidade de partes de informações de movimento de candidato na lista de informações de movimento de candidato for menor que ou igual a uma quantidade R pré-ajustada, a primeira imagem de referência alvo é uma imagem de referência que corresponde à primeira lista de referência e que é de informações de movimento de candidato usadas com mais frequência nas informações de movimento de candidato na lista de informações de movimento de candidato, ou uma imagem de referência que corresponde à primeira lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice de imagem de referência nas informações de movimento de candidato na lista de informações de movimento de candidato, ou uma imagem de referência que corresponde à primeira lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice nas informações de movimento de candidato na lista de informações de movimento de candidato; ou se uma quantidade de partes de informações de movimento de candidato na lista de informações de movimento de candidato for maior que uma quantidade R pré-ajustada (por exemplo, 4), a primeira imagem de referência alvo é uma imagem de referência que corresponde à primeira lista de referência e que é de informações de movimento de candidato usadas com mais frequência nas primeiras R partes de informações de movimento de candidato na lista de informações de movimento de candidato, ou uma imagem de referência que corresponde à primeira lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice de imagem de referência nas primeiras R partes de informações de movimento de candidato na lista de informações de movimento de candidato, ou uma imagem de referência que corresponde à primeira lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice nas primeiras R partes de informações de movimento de candidato na lista de informações de movimento de candidato.
[0111] Além disso, se uma quantidade de partes de informações de movimento de candidato na lista de informações de movimento de candidato for menor que ou igual a uma quantidade R pré-ajustada, a segunda imagem de referência alvo é uma imagem de referência que corresponde à segunda lista de referência e que é de informações de movimento de candidato usadas com mais frequência nas informações de movimento de candidato na lista de informações de movimento de candidato, ou uma imagem de referência que corresponde à segunda lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice de imagem de referência nas informações de movimento de candidato na lista de informações de movimento de candidato, ou uma imagem de referência que corresponde à segunda lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice nas informações de movimento de candidato na lista de informações de movimento de candidato; ou se uma quantidade de partes de informações de movimento de candidato na lista de informações de movimento de candidato for maior que uma quantidade R pré-ajustada, a segunda imagem de referência alvo é uma imagem de referência que corresponde à segunda lista de referência e que é de informações de movimento de candidato usadas com mais frequência nas primeiras R partes de informações de movimento de candidato na lista de informações de movimento de candidato, ou uma imagem de referência que corresponde à segunda lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice de imagem de referência nas primeiras R partes de informações de movimento de candidato na lista de informações de movimento de candidato, ou uma imagem de referência que corresponde à segunda lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice nas primeiras R partes de informações de movimento de candidato na lista de informações de movimento de candidato.
[0112] Ainda em um outro exemplo, a primeira imagem de referência alvo é uma imagem de referência que corresponde à primeira lista de referência e que é de informações de movimento de candidato usadas com mais frequência nas P ou M partes de informações de movimento de candidato a serem combinadas, ou uma imagem de referência que corresponde à primeira lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice de imagem de referência nas P ou M partes de informações de movimento de candidato, ou uma imagem de referência que corresponde à primeira lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice nas P ou M partes de informações de movimento de candidato; e/ou a segunda imagem de referência alvo é uma imagem de referência que corresponde à segunda lista de referência e que é de informações de movimento de candidato usadas com mais frequência nas P ou M partes de informações de movimento de candidato a serem combinadas, ou uma imagem de referência que corresponde à segunda lista de referência e que é de informações de movimento de candidato que tem um menor identificador de Índice de imagem de referência nas P ou M partes de informações de movimento de candidato, ou uma imagem de referência que corresponde à segunda lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice nas P ou M partes de informações de movimento de candidato.
[0113] Com referência ao terceiro aspecto, em algumas implementações do terceiro aspecto, uma quantidade de bits ocupada por um identificador de índice das informações de movimento de candidato combinado é maior que ou igual a uma quantidade de bits ocupada por um identificador de índice das informações de movimento de candidato original.
[0114] Com referência ao terceiro aspecto, em algumas implementações do terceiro aspecto, a quantidade de bits ocupada pelo identificador de índice das informações de movimento de candidato combinado é menor que ou igual à quantidade de bits ocupada pelo identificador de índice das informações de movimento de candidato original.
[0115] Com referência ao terceiro aspecto, em algumas implementações do terceiro aspecto, o processador é configurado, especificamente, para usar as informações de movimento alvo como as informações de movimento do bloco de imagens atual.
[0116] Com referência ao terceiro aspecto, em algumas implementações do terceiro aspecto, as informações de movimento incluem uma predição de vetor de movimento, e o processador é configurado, especificamente, para: analisar um fluxo de bits para obter um diferença de vetor de movimento do bloco de imagens atual; e usar uma soma da predição de vetor de movimento nas informações de movimento alvo e a diferença de vetor de movimento como um vetor de movimento do bloco de imagens atual.
[0117] Com referência ao terceiro aspecto, em algumas implementações do terceiro aspecto, o aparelho é configurado para codificar o bloco de imagens atual, e o processador é configurado, especificamente, para determinar as informações de movimento alvo na lista de informações de movimento de candidato, onde um custo de distorção de taxa para codificar o bloco de imagens atual usando-se as informações de movimento alvo é o mínimo; ou o aparelho é configurado para decodificar o bloco de imagens atual, e o processador é configurado, especificamente, para determinar, na lista de informações de movimento de candidato, informações de movimento alvo indicadas por um quinto identificador de índice, onde o quinto identificador de Índice é usado para indicar as informações de movimento alvo na lista de informações de movimento de candidato.
[0118] Deve ser observado que, se a lista de informações de movimento de candidato incluir apenas uma parte de informações de movimento de candidato, as informações de movimento de candidato exclusivas são determinadas como as informações de movimento alvo.
[0119] Um quarto aspecto desta aplicação fornece um método para predizer informações de movimento de um bloco de imagens, onde as informações de movimento são usadas para intrapredição ou interpredição, e o método inclui: obter pelo menos uma parte de informações de movimento de candidato combinado, onde as primeiras informações de movimento de candidato combinado em pelo menos uma parte de informações de movimento de candidato combinado são obtida por ponderação de P partes de informações de movimento de candidato usando-se os fatores de ponderação correspondentes, P é um número inteiro maior que ou igual a 2, e os fatores de ponderação wpi para pelo menos duas dentre as P partes de informações de movimento de candidato são, respectivamente, valores maiores que O e menores que 1; determinar informações de movimento alvo, onde as informações de movimento alvo são uma parte de informações de movimento de candidato em pelo menos uma parte de informações de movimento de candidato combinado; e predizer informações de movimento de um bloco de imagens atual com base nas informações de movimento alvo. Deve ser entendido que uma soma dos fatores de ponderação para as P partes de informações de movimento de candidato é 1. Preferivelmente, o fator de ponderação wpi para cada uma dentre as P partes de informações de movimento de candidato pode ser um valor maior que O e menor que 1.
[0120] O bloco de imagens atual (referido como um bloco atual, para abreviação) neste relatório, pode ser entendido como um bloco de codificação atual ou um bloco de decodificação atual.
[0121] Além disso, deve ser entendido que, quando o método é usado para codificar o bloco de imagens a ser processado, se uma parte de informações de movimento de candidato combinado for obtida, é determinado que as informações de movimento de candidato exclusivas combinadas são as informações de movimento alvo; ou se mais do que uma parte de informações de movimento de candidato combinado for obtida, as informações de movimento alvo são determinadas em mais do que uma parte de informações de movimento de candidato combinado, onde um custo de distorção de taxa para codificar o bloco de imagens atual usando-se as informações de movimento alvo é o mínimo.
[0122] Quando o método é usado para decodificar o bloco de imagens a ser processado, se uma parte de informações de movimento de candidato combinado for obtida, é determinado que as informações de movimento de candidato exclusivas combinadas são as informações de movimento alvo; ou se mais do que uma parte de informações de movimento de candidato combinado for obtida, as informações de movimento alvo indicadas pelas informações de identificação em um fluxo de bits são determinadas em mais do que uma parte de informações de movimento de candidato combinado.
[0123] Com — referência ao quarto aspecto, em algumas implementações do quarto aspecto, as primeiras informações de movimento de candidato combinado incluem: valores ponderados de P1 vetores de movimento de candidato que estão nas P partes de informações de movimento de candidato e que são usados em uma direção de predição para frente; e/ou valores ponderados de P2 vetores de movimento de candidato que estão nas P partes de informações de movimento de candidato e que são usados em uma direção de predição para trás, onde 1<P1<P, 1<P2<P, P1: ou P2 é um número inteiro maior que ou igual a 2, e fatores de ponderação wpi para pelo menos dois dentre os P1 ou P2 vetores de movimento de candidato são respectivamente valores maiores que O e menores que 1. Deve ser entendido que uma soma dos fatores de ponderação para os P1 vetores de movimento de candidato é 1, e uma soma dos fatores de ponderação para os P2 vetores de movimento de candidato é 1.
[0124] Com — referência ao quarto aspecto, em algumas implementações do quarto aspecto, as segundas informações de movimento de candidato combinado incluem: valores ponderados de M: vetores de movimento de candidato que estão em M partes de informações de movimento de candidato e que são usados em uma direção de predição para frente; e/ou valores ponderados de M2 vetores de movimento de candidato que estão nas M partes de informações de movimento de candidato e que são usados em uma direção de predição para trás, onde 1<M1:<M, 1<M2<M, M: ou M2 é um número inteiro maior que ou igual a 2, e fatores de ponderação wmi para pelo menos dois dentre os M: ou M2 vetores de movimento de candidato são respectivamente valores maiores que O e menores que 1. Deve ser entendido que uma soma dos fatores de ponderação para os M1 vetores de movimento de candidato é 1, e uma soma dos fatores de ponderação para os M> vetores de movimento de candidato é 1.
[0125] Com — referência ao quarto aspecto, em algumas implementações do quarto aspecto, as P partes de informações de movimento de candidato incluem as primeiras informações de movimento de candidato correspondentes a um primeiro identificador de índice e as segundas informações de movimento de candidato correspondentes a um segundo identificador de índice, o primeiro identificador de índice é menor que o segundo identificador de índice, e um fator de ponderação para as primeiras informações de movimento de candidato é maior que ou igual a um fator de ponderação para as segundas informações de movimento de candidato.
[0126] Com — referência ao quarto aspecto, em algumas implementações do quarto aspecto, as M partes de informações de movimento de candidato incluem as terceiras informações de movimento de candidato correspondentes a um terceiro identificador de índice e quartas informações de movimento de candidato correspondentes a um quarto identificador de índice, o terceiro identificador de índice é menor que o quarto identificador de índice, e um fator de ponderação para as terceiras informações de movimento de candidato é maior que ou igual a um fator de ponderação para as quartas informações de movimento de candidato.
[0127] Com — referência ao quarto aspecto, em algumas implementações do quarto aspecto, as P partes de informações de movimento de candidato são P partes de informações de movimento de candidato original; ou as P partes de informações de movimento de candidato são (P-X) partes de informações de movimento de candidato original e X partes de informações de movimento de candidato não original, onde X é um número inteiro positivo menor que ou igual a P.
[0128] Com — referência ao quarto aspecto, em algumas implementações do quarto aspecto, as M partes de informações de movimento de candidato são M partes de informações de movimento de candidato original; ou as M partes de informações de movimento de candidato são (M-Y) partes de informações de movimento de candidato original e Y partes de informações de movimento de candidato não original, onde Y é um número inteiro positivo menor que ou igual a M.
[0129] Com referência ao quarto aspecto, em algumas implementações do quarto aspecto, as informações de movimento de candidato original incluem informações de movimento de um ou mais blocos de referência de domínio espacial do bloco de imagens atual, informações de movimento de um ou mais blocos de referência de domínio de tempo do bloco de imagens atual, e/ou informações de movimento de um ou mais blocos de referência intervisualização do bloco de imagens atual; e as informações de movimento de candidato não original incluem informações de movimento de candidato dimensionado, as primeiras informações de movimento de candidato combinado, as segundas informações de movimento de candidato combinado, informações de movimento de candidato bipreditivo combinado, e/ou informações de movimento zero, onde cada uma das informações de movimento de candidato dimensionado inclui um vetor de movimento que aponta para um primeiro quadro de referência alvo e que está em uma primeira lista de referência, e/ou um vetor de movimento que aponta para um segundo quadro de referência alvo e que está em uma segunda lista de referência.
[0130] Com — referência ao quarto aspecto, em algumas implementações do quarto aspecto, as informações de movimento de candidato dimensionado são obtidas usando-se o seguinte método:
determinar o primeiro quadro de referência alvo que é do bloco de imagens atual e que corresponde à primeira lista de referência e/ou o segundo quadro de referência alvo que é do bloco de imagens atual e que corresponde à segunda lista de referência; determinar se uma imagem de referência que é incluída nas informações de movimento de candidato e que corresponde à primeira lista de referência é a mesma como o primeiro quadro de referência alvo, e/ou se uma imagem de referência que é incluída nas informações de movimento de candidato e que corresponde à segunda lista de referência é a mesma como o segundo quadro de referência alvo; e se a imagem de referência que é incluída nas informações de movimento de candidato e que corresponde à primeira lista de referência for diferente do primeiro quadro de referência alvo, dimensionar com base em uma distância de domínio de tempo ou uma distância intervisualização, o vetor de movimento que é incluído nas informações de movimento de candidato e que corresponde à primeira lista de imagem de referência, para obter o vetor de movimento que aponta para o primeiro quadro de referência alvo; e/ou se a imagem de referência que é incluída nas informações de movimento de candidato e que corresponde à segunda lista de referência for diferente do segundo quadro de referência alvo, dimensionar com base em uma distância de domínio de tempo ou uma distância intervisualização, o vetor de movimento que é incluído nas informações de movimento de candidato e que corresponde à segunda lista de imagem de referência, para obter o vetor de movimento que aponta para o segundo quadro de referência alvo.
[0131] Em um exemplo, o primeiro quadro de referência alvo é um quadro de referência que corresponde à primeira lista de referência e que é de informações de movimento de candidato usadas com mais frequência na lista de informações de movimento de candidato, ou um quadro de referência que corresponde à primeira lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice na lista de informações de movimento de candidato; alternativamente, o segundo quadro de referência alvo é um quadro de referência que corresponde à segunda lista de referência e que é de informações de movimento de candidato usadas com mais frequência na lista de informações de movimento de candidato, ou um quadro de referência que corresponde à segunda lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice na lista de informações de movimento de candidato.
[0132] Em outro exemplo, existem quatro candidatos de mesclagem originais na lista de informações de movimento de candidato; e, correspondentemente, a primeira imagem de referência alvo é uma imagem de referência que corresponde à primeira lista de referência e que é de um candidato de mesclagem original usado com mais frequência nos candidatos de mesclagem originais na lista de informações de movimento de candidato, ou uma imagem de referência que corresponde à primeira lista de referência e que é de um candidato de mesclagem original que tem um menor identificador de índice de imagem de referência nos candidatos de mesclagem originais na lista de informações de movimento de candidato, ou uma imagem de referência que corresponde à primeira lista de referência e que é de um candidato de mesclagem original que tem um menor identificador de índice nos candidatos de mesclagem originais na lista de informações de movimento de candidato; ou a segunda imagem de referência alvo é uma imagem de referência que corresponde à segunda lista de referência e que é de um candidato de mesclagem original usado com mais frequência nos candidatos de mesclagem originais na lista de informações de movimento de candidato, ou uma imagem de referência que corresponde à segunda lista de referência e que é de um candidato de mesclagem original que tem um menor identificador de índice de imagem de referência nos candidatos de mesclagem originais na lista de informações de movimento de candidato, ou uma imagem de referência que corresponde à segunda lista de referência e que é de um candidato de mesclagem original que tem um menor identificador de índice nos candidatos de mesclagem originais na lista de informações de movimento de candidato.
[0133] Ainda em outro exemplo, se uma quantidade de partes de informações de movimento de candidato na lista de informações de movimento de candidato for menor que ou igual a uma quantidade R pré-ajustada, a primeira imagem de referência alvo é uma imagem de referência que corresponde à primeira lista de referência e que é de informações de movimento de candidato usadas com mais frequência nas informações de movimento de candidato na lista de informações de movimento de candidato, ou uma imagem de referência que corresponde à primeira lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice de imagem de referência nas informações de movimento de candidato na lista de informações de movimento de candidato, ou uma imagem de referência que corresponde à primeira lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice nas informações de movimento de candidato na lista de informações de movimento de candidato; ou se uma quantidade de partes de informações de movimento de candidato na lista de informações de movimento de candidato for maior que uma quantidade R pré-ajustada (por exemplo, 4), a primeira imagem de referência alvo é uma imagem de referência que corresponde à primeira lista de referência e que é de informações de movimento de candidato usadas com mais frequência nas primeiras R partes de informações de movimento de candidato na lista de informações de movimento de candidato, ou uma imagem de referência que corresponde à primeira lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice de imagem de referência nas primeiras R partes de informações de movimento de candidato na lista de informações de movimento de candidato, ou uma imagem de referência que corresponde à primeira lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice nas primeiras R partes de informações de movimento de candidato na lista de informações de movimento de candidato.
[0134] Além disso, se uma quantidade de partes de informações de movimento de candidato na lista de informações de movimento de candidato é menor que ou igual a uma quantidade R pré-ajustada, a segunda imagem de referência alvo é uma imagem de referência que corresponde à segunda lista de referência e que é de informações de movimento de candidato usadas com mais frequência nas informações de movimento de candidato na lista de informações de movimento de candidato, ou uma imagem de referência que corresponde à segunda lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice de imagem de referência nas informações de movimento de candidato na lista de informações de movimento de candidato, ou uma imagem de referência que corresponde à segunda lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice nas informações de movimento de candidato na lista de informações de movimento de candidato; ou se uma quantidade de partes de informações de movimento de candidato na lista de informações de movimento de candidato for maior que uma quantidade R pré-ajustada, a segunda imagem de referência alvo é uma imagem de referência que corresponde à segunda lista de referência e que é de informações de movimento de candidato usadas com mais frequência nas primeiras R partes de informações de movimento de candidato na lista de informações de movimento de candidato, ou uma imagem de referência que corresponde à segunda lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice de imagem de referência nas primeiras R partes de informações de movimento de candidato na lista de informações de movimento de candidato, ou uma imagem de referência que corresponde à segunda lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice nas primeiras R partes de informações de movimento de candidato na lista de informações de movimento de candidato.
[0135] Ainda em um outro exemplo, a primeira imagem de referência alvo é uma imagem de referência que corresponde à primeira lista de referência e que é de informações de movimento de candidato usadas com mais frequência nas P ou M partes de informações de movimento de candidato a serem combinadas, ou uma imagem de referência que corresponde à primeira lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice de imagem de referência nas P ou M partes de informações de movimento de candidato, ou uma imagem de referência que corresponde à primeira lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice nas P ou M partes de informações de movimento de candidato; e/ou a segunda imagem de referência alvo é uma imagem de referência que corresponde à segunda lista de referência e que é de informações de movimento de candidato usadas com mais frequência nas P ou M partes de informações de movimento de candidato a serem combinadas, ou uma imagem de referência que corresponde à segunda lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice de imagem de referência nas P ou M partes de informações de movimento de candidato, ou uma imagem de referência que corresponde à segunda lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice nas P ou M partes de informações de movimento de candidato.
[0136] Com — referência ao quarto aspecto, em algumas implementações do quarto aspecto, a predição de informações de movimento de um bloco de imagens atual com base nas informações de movimento alvo inclui: usar as informações de movimento alvo como as informações de movimento do bloco de imagens atual.
[0137] Com — referência ao quarto aspecto, em algumas implementações do quarto aspecto, as informações de movimento incluem uma predição de vetor de movimento, e a predição de informações de movimento de um bloco de imagens atual com base nas informações de movimento alvo inclui: analisar um fluxo de bits para obter uma diferença de predição de vetor de movimento do bloco de imagens atual; e usar uma soma da predição de vetor de movimento nas informações de movimento alvo e a diferença de predição de vetor de movimento como um vetor de movimento do bloco de imagens atual.
[0138] Um quinto aspecto desta aplicação fornece um aparelho para predizer informações de movimento de um bloco de imagens, e o aparelho inclui várias unidades funcionais configuradas para implementar o método, de acordo com qualquer um do quarto aspecto ou das implementações do mesmo. Por exemplo, o aparelho para predizer informações de movimento de um bloco de imagens pode incluir: uma unidade de obtenção de informações de movimento, configurada para obter pelo menos uma parte de informações de movimento de candidato combinado, onde as primeiras informações de movimento de candidato combinado em pelo menos uma parte de informações de movimento de candidato combinado são obtidas por ponderação de P partes de informações de movimento de candidato usando-se os fatores de ponderação correspondentes, P é um número inteiro maior que ou igual a 2, e os fatores de ponderação wpi para pelo menos duas dentre as P partes de informações de movimento de candidato são, respectivamente, valores maiores que O e menores que 1; uma unidade de determinação de informações de movimento, configurada para determinar informações de movimento alvo, onde as informações de movimento alvo são uma parte de informações de movimento de candidato em pelo menos uma parte de informações de movimento de candidato combinado; e uma unidade de predição, configurada para predizer informações de movimento de um bloco de imagens atual com base nas informações de movimento alvo.
[0139] Deve ser entendido que uma soma dos fatores de ponderação para as P partes de informações de movimento de candidato é 1. Além disso, o bloco de imagens atual (referido como um bloco atual, para abreviação) neste relatório, pode ser entendido como um bloco de codificação atual ou um bloco de decodificação atual.
[0140] O aparelho para predizer informações de movimento de um bloco de imagens é, por exemplo, aplicado a um aparelho de codificação de vídeo (um codificador de vídeo) ou um aparelho de decodificação de vídeo (um decodificador de vídeo).
[0141] Um sexto aspecto desta aplicação fornece um aparelho para as predizer informações de movimento de um bloco de imagens, onde as informações de movimento são usadas para intrapredição ou interpredição, e o aparelho inclui um processador e uma memória acoplados ao processador, onde o processador é configurado para: obter pelo menos uma parte de informações de movimento de candidato combinado, onde as primeiras informações de movimento de candidato combinado em pelo menos uma parte de informações de movimento de candidato combinado são obtidas por ponderação de P partes de informações de movimento de candidato usando-se os fatores de ponderação correspondentes, P é um número inteiro maior que ou igual a 2, e os fatores de ponderação wpi para pelo menos duas dentre as P partes de informações de movimento de candidato são, respectivamente, valores maiores que O e menores que 1; determinar as informações de movimento alvo, onde as informações de movimento alvo são uma parte de informações de movimento de candidato em pelo menos uma parte de informações de movimento de candidato combinado; e predizer informações de movimento de um bloco de imagens atual com base nas informações de movimento alvo. Deve ser entendido que uma soma dos fatores de ponderação para as P partes de informações de movimento de candidato é 1.
[0142] O bloco de imagens atual (referido como um bloco atual, para abreviação) neste relatório, pode ser entendido como um bloco de codificação atual ou um bloco de decodificação atual.
[0143] Um sétimo aspecto desta aplicação fornece um codificador de vídeo, onde o codificador de vídeo é configurado para codificar um bloco de imagens, e inclui: um interpreditor (também referido como uma unidade de interpredição), incluindo o aparelho para predizer informações de movimento de um bloco de imagens de acordo com o segundo aspecto, o terceiro aspecto, o quinto aspecto ou o sexto aspecto, onde o interpreditor é configurado para: predizer informações de movimento de um bloco de imagens atual com base em informações de movimento alvo; e determinar um bloco de predição de um bloco de codificação atual com base nas informações de movimento do bloco de imagens atual; um codificador de entropia (também referido como uma unidade de codificação de entropia), configurado para codificar um identificador de índice das informações de movimento alvo em um fluxo de bits, onde o identificador de Índice é usado para indicar as informações de movimento alvo usado para o bloco de codificação atual; e um reconstrutor (também referido como uma unidade de reconstrução), configurado para reconstruir o bloco de imagens com base no bloco de predição.
[0144] Com referência ao sétimo aspecto, em algumas implementações do sétimo aspecto, o interpreditor é configurado adicionalmente para selecionar, a partir de uma pluralidade de partes de informações de movimento de candidato incluídas em uma lista de informações de movimento de candidato, as informações de movimento alvo usadas para o bloco de codificação atual, onde um custo de distorção de taxa para codificar o bloco de codificação atual usando-se as informações de movimento alvo selecionadas é o mínimo.
[0145] Um oitavo aspecto desta aplicação fornece um codificador de vídeo, onde o codificador de vídeo é configurado para codificar um bloco de imagens, e inclui: um intra-preditor (também referido como uma unidade de intrapredição), incluindo o aparelho para predizer informações de movimento de um bloco de imagens de acordo com o segundo aspecto, o terceiro aspecto, o quinto aspecto ou o sexto aspecto, onde o intra-preditor é configurado para: predizer informações de intra-movimento de um bloco de imagens atual com base em informações de movimento alvo; e determinar um bloco de intrapredição de um bloco de codificação atual com base nas informações de intra-movimento do bloco de imagens atual; um codificador de entropia (também referido como uma unidade de codificação de entropia), configurado para codificar um identificador de índice das informações de movimento alvo em um fluxo de bits, onde o identificador de índice é usado para indicar as informações de movimento alvo usadas para o bloco de codificação atual; e um reconstrutor (também referido como uma unidade de reconstrução), configurado para reconstruir o bloco de imagens com base no bloco de intrapredição.
[0146] Com — referência ao oitavo aspecto, em algumas implementações do oitavo aspecto, o intra-preditor é configurado adicionalmente para selecionar, a partir de uma pluralidade de partes de informações de movimento de candidato incluídas em uma lista de informações de movimento de candidato, as informações de movimento alvo usadas para o bloco de codificação atual, onde um custo de distorção de taxa para codificar o bloco de codificação atual usando-se as informações de movimento alvo selecionadas é o mínimo.
[0147] Um nono aspecto desta aplicação fornece um decodificador de vídeo, onde o decodificador de vídeo é configurado para decodificar um fluxo de bits para obter um bloco de imagens, e inclui: um decodificador de entropia (também referido como uma unidade de decodificação de entropia), configurado para decodificar o fluxo de bits para obter um identificador de índice, onde o identificador de índice é usado para indicar informações de movimento alvo para um bloco de decodificação atual; um interpreditor (também referido como uma unidade de interpredição), incluindo o aparelho para predizer informações de movimento de um bloco de imagens de acordo com o segundo aspecto, o terceiro aspecto, o quinto aspecto ou o sexto aspecto, onde o interpreditor é configurado para: predizer informações de movimento de um bloco de imagens atual com base nas informações de movimento alvo indicadas pelo identificador de índice, e determinar um bloco de predição do bloco de decodificação atual com base nas informações de movimento do bloco de imagens atual; e um reconstrutor (também referido como uma unidade de reconstrução), configurado para reconstruir o bloco de imagens com base no bloco de predição.
[0148] Um décimo aspecto desta aplicação fornece um decodificador de vídeo, onde o decodificador de vídeo é configurado para decodificar um fluxo de bits para obter um bloco de imagens, e inclui: um decodificador de entropia (também referido como uma unidade de decodificação de entropia), configurado para decodificar o fluxo de bits para obter um identificador de índice, onde o identificador de índice é usado para indicar informações de movimento alvo para um bloco de decodificação atual; um intra-preditor (também referido como uma unidade de intrapredição), incluindo o aparelho para predizer informações de movimento de um bloco de imagens de acordo com o segundo aspecto, o terceiro aspecto, o quinto aspecto ou o sexto aspecto, onde o intra-preditor é configurado para: predizer informações de movimento de um bloco de imagens atual com base nas informações de movimento alvo indicadas pelo identificador de índice, e determinar um bloco de predição do bloco de decodificação atual com base nas informações de movimento do bloco de imagens atual; e um reconstrutor (também referido como uma unidade de reconstrução), configurado para reconstruir o bloco de imagens com base no bloco de predição.
[0149] Um décimo primeiro aspecto desta aplicação fornece uma mídia de armazenamento legível por computador, onde a mídia de armazenamento legível por computador armazena uma instrução, e quando a instrução é executada em um computador, o computador é habilitado para realizar o método, de acordo com o primeiro aspecto, o quarto aspecto, o décimo sexto aspecto, o décimo oitavo aspecto ou o décimo nono aspecto.
[0150] Um décimo segundo aspecto desta aplicação fornece um produto de programa de computador incluindo uma instrução. Quando o produto de programa de computador é executado em um computador, o computador é habilitado para realizar o método, de acordo com o primeiro aspecto, o quarto aspecto, o décimo sexto aspecto, o décimo oitavo aspecto ou o décimo nono aspecto.
[0151] Um décimo terceiro aspecto desta aplicação fornece um dispositivo eletrônico, incluindo o codificador de vídeo de acordo com o sétimo aspecto ou o oitavo aspecto, o decodificador de vídeo de acordo com o nono aspecto ou o décimo aspecto, ou o aparelho para predizer informações de movimento de um bloco de imagens de acordo com o segundo aspecto, o terceiro aspecto, o quinto aspecto, o sexto aspecto, o décimo sétimo aspecto, ou o vigésimo aspecto.
[0152] UM décimo quarto aspecto desta aplicação fornece um dispositivo de codificação, incluindo uma memória não volátil e um processador que são acoplados um ao outro, onde o processador chama o código de programa armazenado na memória para realizar algumas ou todas as etapas do método, de acordo com o primeiro aspecto, o quarto aspecto, o décimo sexto aspecto, o décimo oitavo aspecto ou o décimo nono aspecto.
[0153] UM décimo quinto aspecto desta aplicação fornece um dispositivo de decodificação, incluindo uma memória não volátil e um processador que são acoplados um ao outro, onde o processador chama o código de programa armazenado na memória para realizar algumas ou todas as etapas do método, de acordo com o primeiro aspecto, o quarto aspecto, o décimo sexto aspecto, o décimo oitavo aspecto ou o décimo nono aspecto.
[0154] Um décimo sexto aspecto desta aplicação fornece um método para predizer informações de movimento de um bloco de imagens, onde as informações de movimento são usadas para intrapredição ou interpredição, e o método inclui: determinar uma primeira imagem de referência alvo que é de um bloco de imagens atual e que corresponde a uma primeira lista de referência e/ou uma segunda imagem de referência alvo que é do bloco de imagens atual e que corresponde a uma segunda lista de referência; determinar se uma imagem de referência que é incluída em P ou (P-1) partes de informações de movimento de candidato e que corresponde à primeira lista de referência é a mesma que a primeira imagem de referência alvo; e/ou se uma imagem de referência que é incluída nas P ou (P-1) partes de informações de movimento de candidato e que corresponde à segunda lista de referência é a mesma que a segunda imagem de referência alvo; se a imagem de referência que é incluída nas P ou (P-1) partes de informações de movimento de candidato e que corresponde à primeira lista de referência é a mesma que a primeira imagem de referência alvo, ponderando, usando-se um fator de ponderação correspondente, um vetor de movimento que é incluído nas P partes de informações de movimento de candidato e que corresponde à primeira lista de imagem de referência, para obter um vetor de movimento que está nas primeiras informações de movimento de candidato combinado e que corresponde à primeira lista de imagem de referência; e/ou se a imagem de referência que é incluída nas P ou (P-1) partes de informações de movimento de candidato e que corresponde à segunda lista de referência é a mesma que a segunda imagem de referência alvo, ponderando, usando-se um fator de ponderação correspondente, um vetor de movimento que é incluído nas P partes de informações de movimento de candidato e que corresponde à segunda lista de imagem de referência, para obter um vetor de movimento que está nas primeiras informações de movimento de candidato combinado e que corresponde à segunda lista de imagem de referência; determinar informações de movimento alvo em uma lista de informações de movimento de candidato do bloco de imagens atual, onde a lista de informações de movimento de candidato inclui as primeiras informações de movimento de candidato combinado; e predizer informações de movimento do bloco de imagens atual com base nas informações de movimento alvo.
[0155] Se a primeira imagem de referência alvo for uma imagem de referência que corresponde à primeira lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice nas P partes de informações de movimento de candidato, é determinado se uma imagem de referência que é incluída nas (P-1) partes de informações de movimento de candidato e que corresponde à primeira lista de referência é a mesma que a primeira imagem de referência alvo; ou se a segunda imagem de referência alvo for uma imagem de referência que corresponde à segunda lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice nas P partes de informações de movimento de candidato, é determinado se uma imagem de referência que é incluída nas (P-1) partes de informações de movimento de candidato e que corresponde à segunda lista de referência é a mesma que a segunda imagem de referência alvo.
[0156] Um décimo sétimo aspecto desta aplicação fornece um aparelho para predizer informações de movimento de um bloco de imagens, onde as informações de movimento são usadas para intrapredição ou interpredição, e o aparelho inclui um processador e uma memória acoplados ao processador, onde o processador é configurado para: determinar uma primeira imagem de referência alvo que é de um bloco de imagens atual e que corresponde a uma primeira lista de referência e/ou uma segunda imagem de referência alvo que é do bloco de imagens atual e que corresponde a uma segunda lista de referência; determinar se uma imagem de referência que é incluída em P ou (P-1) partes de informações de movimento de candidato e que corresponde à primeira lista de referência é a mesma que a primeira imagem de referência alvo; e/ou se uma imagem de referência que é incluída nas P ou (P-1) partes de informações de movimento de candidato e que corresponde à segunda lista de referência é a mesma que a segunda imagem de referência alvo; se a imagem de referência que é incluída nas P ou (P-1) partes de informações de movimento de candidato e que corresponde à primeira lista de referência for a mesma como a primeira imagem de referência alvo, ponderar, usando-se um fator de ponderação correspondente, um vetor de movimento que é incluído nas P partes de informações de movimento de candidato e que corresponde à primeira lista de imagem de referência, para obter um vetor de movimento que está nas primeiras informações de movimento de candidato combinado e que corresponde à primeira lista de imagem de referência; e/ou se a imagem de referência que é incluída nas P ou (P-1) partes de informações de movimento de candidato e que corresponde à segunda lista de referência for a mesma como a segunda imagem de referência alvo, ponderar, usando-se um fator de ponderação correspondente, um vetor de movimento que é incluído nas P partes de informações de movimento de candidato e que corresponde à segunda lista de imagem de referência, para obter um vetor de movimento que está nas primeiras informações de movimento de candidato combinado e que corresponde à segunda lista de imagem de referência; determinar informações de movimento alvo em uma lista de informações de movimento de candidato do bloco de imagens atual, onde a lista de informações de movimento de candidato inclui as primeiras informações de movimento de candidato combinado; e predizer informações de movimento do bloco de imagens atual com base nas informações de movimento alvo.
[0157] Se a primeira imagem de referência alvo for uma imagem de referência que corresponde à primeira lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice nas P partes de informações de movimento de candidato, é determinado se uma imagem de referência que é incluída nas (P-1) partes de informações de movimento de candidato e que corresponde à primeira lista de referência é a mesma que a primeira imagem de referência alvo; ou se a segunda imagem de referência alvo for uma imagem de referência que corresponde à segunda lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice nas P partes de informações de movimento de candidato, é determinado se uma imagem de referência que é incluída nas (P-1) partes de informações de movimento de candidato e que corresponde à segunda lista de referência é a mesma que a segunda imagem de referência alvo.
[0158] Um décimo oitavo aspecto desta aplicação fornece um método para a obtenção de informações de movimento de candidato combinado, onde o método inclui: determinar uma primeira imagem de referência alvo que é de um bloco de imagens atual e que corresponde a uma primeira lista de referência e/ou uma segunda imagem de referência alvo que é do bloco de imagens atual e que corresponde a uma segunda lista de referência; determinar se uma imagem de referência que é incluída em P ou (P-1) partes de informações de movimento de candidato e que corresponde à primeira lista de referência é a mesma que a primeira imagem de referência alvo; e/ou se uma imagem de referência que é incluída nas P ou (P-1) partes de informações de movimento de candidato e que corresponde à segunda lista de referência é a mesma que a segunda imagem de referência alvo; se a imagem de referência que é incluída nas P ou (P-1) partes de informações de movimento de candidato e que corresponde à primeira lista de referência for a mesma como a primeira imagem de referência alvo, ponderando, usando-se um fator de ponderação correspondente, um vetor de movimento que é incluído nas P partes de informações de movimento de candidato e que corresponde à primeira lista de imagem de referência, para obter um vetor de movimento que está nas primeiras informações de movimento de candidato combinado e que corresponde à primeira lista de imagem de referência; e/ou se a imagem de referência que é incluída nas P ou (P-1) partes de informações de movimento de candidato e que corresponde à segunda lista de referência for a mesma como a segunda imagem de referência alvo, ponderando, usando-se um fator de ponderação correspondente, um vetor de movimento que é incluído nas P partes de informações de movimento de candidato e que corresponde à segunda lista de imagem de referência, para obter um vetor de movimento que está nas primeiras informações de movimento de candidato combinado e que corresponde à segunda lista de imagem de referência.
[0159] Um décimo nono aspecto desta aplicação fornece um método para predizer informações de movimento de um bloco de imagens, onde as informações de movimento são usadas para intrapredição ou interpredição, e o método inclui: determinar uma primeira imagem de referência alvo que é de um bloco de imagens atual e que corresponde a uma primeira lista de referência e/ou uma segunda imagem de referência alvo que é do bloco de imagens atual e que corresponde a uma segunda lista de referência; ponderar, usando-se um fator de ponderação correspondente, um vetor de movimento que é incluído em P partes de informações de movimento de candidato e que corresponde à primeira lista de imagem de referência, para obter um vetor de movimento que está nas primeiras informações de movimento de candidato combinado e que corresponde à primeira lista de imagem de referência, onde uma imagem de referência que é incluída nas P partes de informações de movimento de candidato e que corresponde à primeira lista de referência é a mesma que a primeira imagem de referência alvo; e/ou ponderar, usando-se um fator de ponderação correspondente, um vetor de movimento que é incluído nas P partes de informações de movimento de candidato e que corresponde à segunda lista de imagem de referência, para obter um vetor de movimento que está nas primeiras informações de movimento de candidato combinado e que corresponde à segunda lista de imagem de referência, onde uma imagem de referência que é incluída nas P partes de informações de movimento de candidato e que corresponde à segunda lista de referência é a mesma que a segunda imagem de referência alvo; determinar informações de movimento alvo em uma lista de informações de movimento de candidato do bloco de imagens atual, onde a lista de informações de movimento de candidato inclui as primeiras informações de movimento de candidato combinado; e predizer informações de movimento do bloco de imagens atual com base nas informações de movimento alvo.
[0160] Um vigésimo aspecto desta aplicação fornece um aparelho para predizer informações de movimento de um bloco de imagens, onde as informações de movimento são usadas para intrapredição ou interpredição, e o aparelho inclui um processador e uma memória acoplados ao processador, onde o processador é configurado para: determinar uma primeira imagem de referência alvo que é de um bloco de imagens atual e que corresponde a uma primeira lista de referência e/ou uma segunda imagem de referência alvo que é do bloco de imagens atual e que corresponde a uma segunda lista de referência; ponderar, usando-se um fator de ponderação correspondente, um vetor de movimento que é incluído em P partes de informações de movimento de candidato e que corresponde à primeira lista de imagem de referência, para obter um vetor de movimento que está nas primeiras informações de movimento de candidato combinado e que corresponde à primeira lista de imagem de referência, onde uma imagem de referência que é incluída nas P partes de informações de movimento de candidato e que corresponde à primeira lista de referência é a mesma que a primeira imagem de referência alvo; e/ou ponderar, usando-se um fator de ponderação correspondente, um vetor de movimento que é incluído nas P partes de informações de movimento de candidato e que corresponde à segunda lista de imagem de referência, para obter um vetor de movimento que está nas primeiras informações de movimento de candidato combinado e que corresponde à segunda lista de imagem de referência, onde uma imagem de referência que é incluída nas P partes de informações de movimento de candidato e que corresponde à segunda lista de referência é a mesma que a segunda imagem de referência alvo; determinar informações de movimento alvo em uma lista de informações de movimento de candidato do bloco de imagens atual, onde a lista de informações de movimento de candidato inclui as primeiras informações de movimento de candidato combinado; e predizer informações de movimento do bloco de imagens atual com base nas informações de movimento alvo.
[0161] Um vigésimo primeiro aspecto desta aplicação fornece um método para as predizer informações de movimento de um bloco de imagens, onde as informações de movimento são usadas para intrapredição ou interpredição, e o método inclui: ponderar, usando-se um fator de ponderação correspondente, um vetor de movimento que é incluído em P partes de informações de movimento de candidato e que corresponde a uma primeira lista de imagem de referência, para obter um vetor de movimento que está nas primeiras informações de movimento de candidato combinado e que corresponde à primeira lista de imagem de referência; e/ou ponderar, usando-se um fator de ponderação correspondente, um vetor de movimento que é incluído nas P partes de informações de movimento de candidato e que corresponde a uma segunda lista de imagem de referência, para obter um vetor de movimento que está nas primeiras informações de movimento de candidato combinado e que corresponde à segunda lista de imagem de referência; determinar informações de movimento alvo em uma lista de informações de movimento de candidato de um bloco de imagens atual, onde a lista de informações de movimento de candidato inclui as primeiras informações de movimento de candidato combinado; e predizer informações de movimento do bloco de imagens atual com base nas informações de movimento alvo.
[0162] Um vigésimo segundo aspecto desta aplicação fornece um aparelho para as predizer informações de movimento de um bloco de imagens, onde as informações de movimento são usadas para intrapredição ou interpredição, e o aparelho inclui um processador e uma memória acoplados ao processador, onde o processador é configurado para: ponderar, usando-se um fator de ponderação correspondente, um vetor de movimento que é incluído em P partes de informações de movimento de candidato e que corresponde a uma primeira lista de imagem de referência, para obter um vetor de movimento que está nas primeiras informações de movimento de candidato combinado e que corresponde à primeira lista de imagem de referência; e/ou ponderar, usando-se um fator de ponderação correspondente, um vetor de movimento que é incluído nas P partes de informações de movimento de candidato e que corresponde a uma segunda lista de imagem de referência, para obter um vetor de movimento que está nas primeiras informações de movimento de candidato combinado e que corresponde à segunda lista de imagem de referência; determinar informações de movimento alvo em uma lista de informações de movimento de candidato de um bloco de imagens atual, onde a lista de informações de movimento de candidato inclui as primeiras informações de movimento de candidato combinado; e predizer informações de movimento do bloco de imagens atual com base nas informações de movimento alvo.
[0163] Deve ser entendido que, as soluções técnicas no segundo aspecto ao vigésimo segundo aspecto desta aplicação são compatíveis com a solução técnica no primeiro aspecto desta aplicação. Os efeitos benéficos obtido pelos vários aspectos e implementações possíveis correspondentes são similares, e os detalhes não são descritos novamente.
[0164] Para descrever as soluções técnicas nas modalidades deste pedido ou nos fundamentos mais claramente, o seguinte descreve brevemente os desenhos anexos necessários para descrever as modalidades deste pedido ou os fundamentos.
[0165] A FIG. 1 é um diagrama de bloco esquemático de um sistema de codificação e decodificação de vídeo de acordo com uma modalidade deste pedido;
[0166] A FIG. 2 é um diagrama de bloco esquemático de um codificador de vídeo de acordo com uma modalidade deste pedido;
[0167] A FIG. 3 é um diagrama de bloco esquemático de um decodificador de vídeo de acordo com uma modalidade deste pedido;
[0168] A FIG. 4A é um fluxograma do exemplo de um método de codificação realizado por um codificador de vídeo em um modo de mesclagem de acordo com uma modalidade deste pedido;
[0169] A FIG. 4B é um fluxograma do exemplo de um método de codificação realizado por um codificador de vídeo em um modo de predição de vetor de movimento avançado de acordo com uma modalidade deste pedido;
[0170] A FIG. 5 é um fluxograma do exemplo de compensação de movimento realizada por um decodificador de vídeo de acordo com uma modalidade deste pedido;
[0171] A FIG. 6A e FIG. 6B, cada uma é um diagrama esquemático do exemplo de uma unidade de codificação e um bloco de referência de domínio espacial e um bloco de referência de domínio de tempo que são associados à unidade de codificação de acordo com uma modalidade deste pedido;
[0172] A FIG. 6C é um diagrama esquemático do exemplo de uma unidade de codificação e um bloco intervisualização correspondente associado à unidade de codificação de acordo com uma modalidade deste pedido;
[0173] A FIG. 7 é um fluxograma de um método para predizer informações de movimento de um bloco de imagens de acordo com uma modalidade deste pedido;
[0174] A FIG. 8A é um diagrama esquemático do exemplo de adição de informações de movimento de candidato combinado a uma lista de candidatos do modo de mesclagem de acordo com uma modalidade deste pedido;
[0175] A FIG. 8B é outro diagrama esquemático do exemplo de adição de informações de movimento de candidato combinado a uma lista de candidatos do modo de mesclagem de acordo com uma modalidade deste pedido;
[0176] A FIG. 9 é um diagrama esquemático do exemplo do processamento de dimensão de acordo com uma modalidade deste pedido;
[0177] A FIG. 10 é um diagrama esquemático do exemplo de adição de informações de movimento de candidato combinado a uma lista de candidatos do modo AMVP de acordo com uma modalidade deste pedido;
[0178] A FIG. 11 é um fluxograma do exemplo de construção de uma lista de vetores de movimento preditivo de candidato de acordo com uma modalidade deste pedido;
[0179] A FIG. 12 é um diagrama esquemático do exemplo de adição de informações de movimento de candidato bipreditivo combinado a uma lista de candidatos do modo de mesclagem de acordo com uma modalidade deste pedido;
[0180] A FIG. 13 é um diagrama esquemático do exemplo de adição de um vetor de movimento zero a uma lista de candidatos do modo de mesclagem de acordo com uma modalidade deste pedido;
[0181] A FIG. 14 é um diagrama de bloco esquemático de um aparelho para predizer informações de movimento de um bloco de imagens de acordo com uma modalidade deste pedido;
[0182] A FIG. 15 é um diagrama de bloco esquemático de um dispositivo de codificação ou um dispositivo de decodificação de acordo com uma modalidade deste pedido; e
[0183] A FIG. 16 é um diagrama esquemático de um ganho de desempenho da codificação e decodificação de acordo com uma modalidade deste pedido.
[0184] A seguir, são descrita clara e completamente as soluções técnicas nas modalidades deste pedido com referência aos desenhos anexos nas modalidades deste pedido.
[0185] A FIG. 1 é um diagrama de bloco esquemático de um sistema de codificação e decodificação de vídeo 10 de acordo com uma modalidade deste pedido. Como mostrado na FIG. 1, o sistema 10 inclui um aparelho de origem 12, e o aparelho de origem 12 gera dados de vídeo codificados a serem decodificados por um aparelho de destino 14. O aparelho de origem 12 e o aparelho de destino 14 podem incluir qualquer um de uma ampla gama de aparelhos, incluindo um computador de mesa, um computador laptop, um computador tablet, um decodificador, um telefone celular, tal como um telefone “inteligente”, um painel de toque “inteligente”, uma televisão, uma câmera, um aparelho de exibição, um reprodutor de mídia digital, um console de videogame, um aparelho de transmissão de streaming de vídeo ou semelhantes. Em algumas aplicações, o aparelho de origem 12 e o aparelho de destino 14 podem ser equipados para a comunicação sem fio.
[0186] O aparelho de destino 14 pode receber os dados de vídeo codificados a serem decodificados através de uma ligação 16. A ligação 16 pode incluir qualquer tipo de mídia ou aparelho capaz de transmitir os dados de vídeo codificados a partir do aparelho de origem 12 para o aparelho de destino 14. Em uma implementação possível, a ligação 16 pode incluir uma mídia de comunicações habilitando o aparelho de origem 12 a transmitir diretamente os dados de vídeo codificados para o aparelho de destino 14 em tempo real. Os dados de vídeo codificados podem ser modulados de acordo com um padrão de comunicação (por exemplo, um protocolo de comunicação sem fio) e transmitidos para o aparelho de destino 14. A mídia de comunicações pode incluir qualquer mídia de comunicações com fio ou sem fio, por exemplo, um espectro de frequência de rádio ou um ou mais cabos de transmissão física. À mídia de comunicações pode ser uma parte de uma rede com base em pacotes (por exemplo, uma rede de área local, uma rede de área ampla ou uma rede global da internet). A mídia de comunicações pode incluir um roteador, um comutador, uma estação de base, ou qualquer outro dispositivo que facilite a comunicação do aparelho de origem 12 com o aparelho de destino 14.
[0187] Alternativamente, os dados codificados podem ser emitidos para um aparelho de armazenamento 24 através de uma interface de saída 22. Similarmente, os dados codificados podem ser acessados a partir do aparelho de armazenamento 24 através de uma interface de entrada. O aparelho de armazenamento 24 pode incluir qualquer uma de uma pluralidade de mídias de armazenamento de dados de acesso local ou disperso, por exemplo, uma unidade de disco rígido, um disco Blu-ray, um DVD, um CD-ROM, uma memória flash, uma memória volátil ou não volátil, ou qualquer outra mídia de armazenamento de dados apropriada configurada para armazenar os dados de vídeo codificados. Em outra implementação possível, o aparelho de armazenamento 24 pode corresponder a um servidor de arquivos ou outro aparelho de armazenamento intermediário capaz de armazenar um vídeo codificado gerado pelo aparelho de origem 12. O aparelho de destino 14 pode acessar os dados de vídeo armazenados a partir do aparelho de armazenamento 24 através da transmissão ou download de streaming. O servidor de arquivos pode ser qualquer tipo de servidor capaz de armazenar os dados de vídeo codificados e transmitir os dados de vídeo codificados para o aparelho de destino
14. Em uma implementação possível, o servidor de arquivos inclui um servidor de website, um servidor de protocolo de transferência de arquivos, um aparelho de armazenamento acoplado à rede ou uma unidade de disco local. O aparelho de destino 14 pode acessar os dados de vídeo codificados através de qualquer conexão de dados padrão incluindo uma conexão à internet. A conexão de dados pode incluir um canal sem fio (por exemplo, uma conexão Wi-Fi), uma conexão com fio (por exemplo, um modem a cabo), ou uma combinação dos mesmos, que é adequada para acessar os dados de vídeo codificados armazenados no servidor de arquivos. A transmissão dos dados de vídeo codificados a partir do aparelho de armazenamento 24 pode ser a transmissão de streaming, transmissão de download ou uma combinação dos mesmos.
[0188] As tecnologias deste pedido não são necessariamente limitadas a aplicações ou configurações sem fio. As tecnologias podem ser aplicadas à decodificação de vídeo, para suportar qualquer uma de uma pluralidade de aplicações multimídia, por exemplo, transmissão de televisão pelo ar, transmissão de televisão a cabo, transmissão de televisão por satélite, transmissão de video em fluxo contínuo (por exemplo, através da internet), codificação de vídeo digital para armazenamento em uma mídia de armazenamento de dados, decodificação de um vídeo digital armazenado em uma mídia de armazenamento de dados ou outras aplicações. Em algumas implementações possíveis, o sistema 10 pode ser configurado para suportar a transmissão de video unidirecional ou bidirecional, para suportar aplicações, tais como transmissão de vídeo de fluxo contínuo, reprodução de vídeo, dispersão de vídeo e/ou videotelefonia.
[0189] Em uma implementação possível da FIG. 1, o aparelho de origem 12 pode incluir uma fonte de vídeo 18, um codificador de vídeo 20 e a interface de saída 22. Em algumas aplicações, a interface de saída 22 pode incluir um modulador/demodulador (um modem) e/ou um transmissor. No aparelho de origem 12, a fonte de vídeo 18 inclui, por exemplo, fontes de um aparelho de captura de vídeo (por exemplo, uma câmera de vídeo), um arquivo de vídeo incluindo um video capturado previamente, uma interface de entrada de video para receber um vídeo a partir de um provedor de conteúdo de vídeo, e/ou um sistema de gráficos de computador para gerar dados de gráficos de computador como um vídeo de origem, ou uma combinação das fontes. Em uma implementação possível, se a fonte de vídeo 18 é uma câmera de vídeo, o aparelho de origem 12 e o aparelho de destino 14 podem constituir um telefone com câmera ou um telefone com vídeo. As tecnologias descritas neste pedido podem ser, por exemplo, aplicadas a decodificação de vídeo, e podem ser aplicadas a aplicações sem fio e/ou com fio.
[0190] O codificador de vídeo 20 pode codificar um video que é capturado, pré-capturado ou gerado por um computador. Os dados de vídeo codificados podem ser diretamente transmitidos para o aparelho de destino 14 através da interface de saída 22 do aparelho de origem 12. Os dados de vídeo codificados também podem (ou alternativamente) ser armazenados no aparelho de armazenamento 24 para acesso subsequente do aparelho de destino 14 ou outro aparelho para decodificação e/ou reprodução.
[0191] O aparelho de destino 14 inclui uma interface de entrada 28, um decodificador de vídeo 30 e um aparelho de exibição 32. Em algumas aplicações, a interface de entrada 28 pode incluir um receptor e/ou um modem. A interface de entrada 28 do aparelho de destino 14 recebe os dados de vídeo codificados através da ligação 16. Os dados de vídeo codificados transmitidos ou fornecidos para o aparelho de armazenamento 24 através da ligação 16 podem incluir uma pluralidade de elementos de sintaxe gerados pelo codificador de vídeo 20 para o decodificador de vídeo 30 para decodificar os dados de vídeo. Estes elementos de sintaxe podem ser incluídos com os dados de vídeo codificados transmitidos na mídia de comunicações, armazenados na mídia de armazenamento ou armazenados no servidor de arquivos.
[0192] O aparelho de exibição 32 pode ser integrado com o aparelho de destino 14 ou disposto fora do aparelho de destino 14. Em algumas implementações possíveis, o aparelho de destino 14 pode incluir um aparelho de exibição integrado e também ser configurado para conectar a uma interface de um aparelho de exibição externo. Em outra implementação possível, o aparelho de destino 14 pode ser um aparelho de exibição. Usualmente, o aparelho de exibição 32 exibe os dados de vídeo decodificados para um usuário, e pode incluir qualquer um de uma pluralidade de aparelhos de exibição, por exemplo, uma tela de cristal líquido, uma tela de plasma, uma tela de diodo emitindo luz orgânica ou um aparelho de exibição de outro tipo.
[0193] O codificador de vídeo 20 e o decodificador de vídeo 30 podem operar de acordo com, por exemplo, um padrão de compressão de codificação e decodificação de vídeo da próxima geração (H.266) atualmente em desenvolvimento, e pode estar em conformidade com um modelo de teste H.266 (JEM). Alternativamente, o codificador de vídeo 20 e o decodificador de vídeo 30 podem operar de acordo com, o padrão ITU-TH.265, também referido como o padrão de codificação de vídeo de alta eficiência, ou outro padrão industrial ou dedicado do padrão ITU-TH.264, ou uma extensão destes padrões. O ITU- TH.264 é alternativamente referido como MPEG Part 10, ou codificação de vídeo avançada (advanced video coding, AVC). Entretanto, as tecnologias deste pedido não são limitadas a qualquer padrão de decodificação particular. Outras implementações possíveis do padrão de compressão de vídeo incluem MPEG-2 e ITU-T H.263.
[0194] Embora não mostrado na FIG. 1, em alguns aspectos, o codificador de vídeo 20 e o decodificador de vídeo 30 podem ser,
respectivamente, integrados com um codificador de áudio e um decodificador de áudio, e cada um pode incluir uma unidade multiplexadora-desmultiplexadora apropriada (MUX-DEMUX) ou outro hardware e software para codificar tanto o áudio quanto um vídeo em um fluxo de bits comum ou um fluxo de bits separado. Se aplicável, em algumas implementações possíveis, a unidade MUX-DEMUX pode condescender com o protocolo multiplexador ITU H.223 ou outro protocolo, tal como o protocolo de datagrama de usuário (UDP).
[0195] O codificador de vídeo 20 e o decodificador de vídeo 30 podem ser implementados como qualquer um de uma pluralidade de circuitos de codificador apropriado, por exemplo, um ou mais microprocessadores, processadores de sinal digital (DSP), circuitos integrados específicos da aplicação (ASIC), arranjo de portas programáveis em campo (FPGA), lógica discreta, software, hardware, firmware ou qualquer combinação dos mesmos. Quando as tecnologias são parcialmente implementadas por software, um aparelho pode armazenar uma instrução do software em uma mídia legível por computador não transitória apropriada, e executar a instrução em uma forma de hardware usando-se um ou mais processadores, para implementar as tecnologias deste pedido. Cada um do codificador de vídeo 20 e do decodificador de vídeo 30, pode ser incluído em um ou mais codificadores ou decodificador, e qualquer um do codificador de vídeo 20 ou do decodificador de vídeo 30 pode ser integrado em um aparelho correspondente como uma parte de um codificador/decodificador combinado (CODEC).
[0196] Nesta aplicação, por exemplo, o codificador de vídeo 20 pode “sinalizar” informações particulares para outro aparelho, tal como o decodificador de vídeo 30. Entretanto, deve ser entendido que o codificador de vídeo 20 pode associar elementos de sintaxe particulares a várias partes codificadas dos dados de vídeo, para sinalizar informações. Em outras palavras, o codificador de vídeo pode armazenar os elementos de sintaxe particulares em informações de cabeçalho das várias partes codificadas dos dados de vídeo, para “sinalizar” dados. Em algumas aplicações, os elementos de sintaxe podem ser codificados e armazenados (por exemplo, armazenados em um sistema de armazenamento 34 ou um servidor de arquivos 36) antes de serem recebidos e decodificados pelo decodificador de vídeo 30. Portanto, o termo “sinalizar” pode significar, por exemplo, transmissão de dados de sintaxe ou outros dados usados para decodificar dados de video compactados, independentemente de a transmissão ser realizada em tempo real, quase em tempo real ou dentro de um período de tempo. Por exemplo, a transmissão pode ser realizada quando um elemento de sintaxe é armazenado em uma mídia durante a codificação e, em seguida, o elemento de sintaxe pode ser recuperado por um aparelho de decodificação a qualquer momento depois de ser armazenado na mídia.
[0197] O JCT-VC desenvolveu o padrão H.265 (HEVC). A padronização HEVC é fundamentada em um modelo evoluído de um aparelho de decodificação de vídeo referido como um modelo de teste HEVC (HM). O ultimo documento padrão H.265 está disponível em http://www.itu.int/rec/T-REC- H.265. A última versão do documento padrão é H.265 (12/16), que é integralmente incorporada neste relatório à título referência. O HM assume que o aparelho de decodificação de vídeo tem vários recursos adicionais comparados com algoritmos existentes de ITU-TH.264/AVC. Por exemplo, H.264 fornece nove modos de codificação de intrapredição, enquanto o HM pode fornecer até 35 modos de codificação de intrapredição.
[0198] O JVET está comprometido em desenvolver o padrão H.266. Um processo de padronização H.266 é fundamentado em um modelo evoluído de um aparelho de decodificação de vídeo que é referido como um modelo de teste H.266. As descrições do algoritmo H.266 estão disponíveis em http://phenix.int-evry.fr/jvet, e as últimas descrições do algoritmo são incluídas em JVET-F1001-v2. Este documento de descrição de algoritmo é integralmente incorporado neste relatório à título de referência. Além disso, o software de referência para um modelo de teste JEM está disponível em https://jvet.hhi.fraunhofer.de/svn/svn HMJEMSoftware/(, que também é integralmente incorporado neste relatório à título de referência.
[0199] Usualmente, nas descrições dos modelos de trabalho HM, um quadro ou imagem de vídeo pode ser dividido em uma sequência de um bloco de árvore ou uma maior unidade de codificação (largest coding unit, LCU) incluindo tanto amostras de luma quanto croma, onde a LCU também é referida como uma CTU. Um bloco de árvore tem propósitos similares àqueles de um macrobloco no padrão H.264. Uma fatia inclui vários bloco de árvores consecutivos em uma ordem de decodificação. Um quadro ou imagem de vídeo pode ser particionado em uma ou mais fatia. Cada bloco de árvore pode ser dividido em unidade de codificação com base em um quadtree. Por exemplo, um bloco de árvore que atua como um nó raiz do quadtree pode ser dividido em quatro nós filhos, e cada nó filho pode atuar como um nó pai e ser dividido em quatro outros nós filhos. Um nó filho final não divisível que atua como um nó folha do quadtree inclui um nó de decodificação, por exemplo, um bloco de vídeo decodificado. Os dados de sintaxe associados a um fluxo de bits decodificado podem definir uma quantidade máximo de tempo divisíveis do bloco de árvore, e também podem definir um tamanho mínimo do nós de decodificação.
[0200] A unidade de decodificação inclui um nó de decodificação, uma unidade de predição (prediction unit, PU), e um unidade de transformada (transform unit, TU) associados ao nó de decodificação. A CU tem um tamanho correspondente a um tamanho do nó de decodificação, e precisa ter uma forma quadrada. O tamanho da CU pode variar de 8 x 8 pixels para um máximo de 64 x 64 pixels ou um tamanho de bloco de árvore maior. Cada CU pode incluir uma ou mais PUs e uma ou mais TUs. Por exemplo, os dados de sintaxe associados à CU podem descrever o particionamento da CU em uma ou mais PUs. Os modos de particionamento podem variar quando a CU é pulada ou codificada em um modo direto, um modo intrapredição ou um modo de interpredição. A PU pode ter uma forma não quadrada depois de ser particionada. Por exemplo, os dados de sintaxe associados à CU também podem ser o particionamento da CU em uma ou mais TUs com base no quadtree. A TU pode ter uma forma quadrada ou não quadrada.
[0201] O padrão HEVC permite a transformada com base em TU, e TUs podem ser diferentes para diferentes CUs. Um tamanho da TU é usualmente definido com base em um tamanho de uma PU dentro de uma determinada CU definida para uma LCU particionada. Entretanto, um caso nem sempre pode ser assim. O tamanho da TU é usualmente o mesmo ou menor que o tamanho da PU. Em algumas implementações possíveis, uma estrutura de quadtree referida como um “quaditree residual” (residual qualtree, RQT) pode ser usada para dividir uma amostra residual correspondente à CU em unidades menores. Um nó folha do RQT pode ser referido como uma TU. As diferenças de pixel associadas à TU podem ser transformadas para gerar coeficientes de transformada, e os coeficientes de transformada podem ser quantizados.
[0202] Usualmente, a PU inclui dados relacionados a um processo de predição. Por exemplo, quando a PU é codificada no modo intra, a PU pode incluir dados que descrevem o modo de intrapredição da PU. Em outra implementação possível, quando a PU é codificada no modo inter, a PU pode incluir dados que definem um vetor de movimento para a PU. Por exemplo, os dados que definem o vetor de movimento da PU podem descrever um componente horizontal do vetor de movimento, um componente vertical do vetor de movimento, uma resolução (por exemplo, precisão de um quarto pixel ou precisão de um oitavo pixel) do vetor de movimento, uma imagem de referência para a qual o vetor de movimento aponta, e/ou uma lista de imagens de referência de vetor de movimento (por exemplo, uma lista 0, uma lista 1 ou uma lista C).
[0203] Usualmente, a TU realiza processos de transformada e quantização. Uma determinada CU que tem uma ou mais PUs também pode incluir uma ou mais TUs. Depois da predição, o codificador de vídeo 20 pode calcular um valor residual correspondente à PU. O valor residual inclui uma diferença de pixel, e a diferença de pixel pode ser transformada em um coeficiente de transformada, e o coeficiente de transformada é quantizado, e sujeito à varredura de TU para gerar um coeficiente de transformada serializado para a decodificação de entropia. Nesta aplicação, o termo “bloco de vídeo” é usualmente usado para indicar um nó de decodificação de uma CU. Em algumas aplicações particulares, neste pedido, o termo “bloco de vídeo” também pode ser usado para indicar um bloco de árvore incluindo um nó de decodificação, uma PU e uma TU, por exemplo, uma LCU ou uma CU.
[0204] Uma sequência de vídeos usualmente inclui uma série de quadros ou imagens de vídeo. Por exemplo, um grupo de imagens (group of pictures, GOP) inclui uma série de imagens de vídeo, e uma ou mais imagens de vídeo. O GOP pode incluir dados de sintaxe em informações de cabeçalho do GOP, em informações de cabeçalho de uma ou mais da imagens, ou em outro local, e os dados de sintaxe descrevem uma quantidade de imagens incluídas no GOP. Cada fatia de uma imagem pode incluir dados de sintaxe da fatia que descrevem um modo de codificação da imagem correspondente. O codificador de vídeo 20 usualmente realiza uma operação em um bloco de vídeo em uma fatia de vídeo, para codificar dados de vídeo. O bloco de vídeo pode corresponder ao nó de decodificação na CU. Um tamanho do bloco de vídeo pode ser fixo ou alterável, e pode variar de acordo com um padrão de decodificação especificado.
[0205] Em uma implementação possível, o HM suporta a predição para uma variedade de tamanhos de PU. É considerado que um tamanho de uma CU particular é 2N x 2N, e o HM suporta a intrapredição para um tamanho de PU de 2N x 2N ou N x N, e a interpredição para um tamanho de PU simétrica de 2N x 2N, 2N x N, Nx 2N, ou Nx N. O HM também suporta o particionamento assimétrico para a interpredição para tamanhos de PU, tais como 2N x nU, 2N x nD, nL x 2N, e nR x 2N. No particionamento assimétrico, a CU não é particionada em uma direção, e é particionada em 25 % e 75 % na outra direção. Uma porção da CU que corresponde à partição de 25 % é indicada por um indicador incluindo “n” seguido por “U (Up)”, “D (Down)", “L (Left)” ou “R (Right). Portanto, por exemplo, “2N x nU” refere-se a 2N x 2NCU particionados horizontalmente com 2N x 0,5NPU na parte superior e 2N x 1,5SNPU na parte inferior.
[0206] Nesta aplicação, “N x Nº e “N multiplicado por Nº pode ser usado permutavelmente para indicar um tamanho de pixel de um bloco de vídeo em uma dimensão vertical e uma dimensão horizontal, por exemplo, 16 x 16 pixels ou 16 multiplicado por 16 pixels. Usualmente, um bloco de 16 x 16 tem 16 pixels (y=16) em uma direção vertical e 16 pixels (x=16) em uma direção horizontal. Similarmente, um bloco N x N tem N pixels na direção vertical e N pixels na direção horizontal, onde N indica um número inteiro não negativo. Os pixels em um bloco podem ser organizados em linhas e colunas. Além disso, em um bloco, uma quantidade de pixels na direção horizontal e uma quantidade de pixels na direção vertical, podem não precisar ser iguais. Por exemplo, um bloco pode incluir N x M pixels, onde M não é necessariamente igual a N.
[0207] Depois da decodificação intra-preditiva ou interpreditiva na PU na CU, o codificador de vídeo 20 pode calcular os dados residuais da TU na CU. A PU pode incluir dados de pixel no domínio espacial (também referido como domínio de pixel), e a TU pode incluir um coeficiente no domínio de transformada depois da transformada (por exemplo, transformada discreta de cosseno (discrete cosine transform, DCT), transformada de número inteiro, transformada de wavelet ou outra transformada conceitualmente similar) ser aplicada aos dados de vídeo residuais. Os dados residuais podem corresponder a uma diferença de pixel entre pixels de uma imagem não codificada e um preditor correspondente à PU. O codificador de vídeo 20 pode gerar uma TU incluindo os dados residuais da CU e, em seguida, transformar a TU para gerar um coeficiente de transformada da CU.
[0208] Depois de realizar qualquer transformada para gerar os coeficientes de transformada, o codificador de vídeo 20 pode quantizar os coeficientes de transformada. A quantização é, por exemplo, um processo de quantização dos coeficientes, para reduzir uma quantidade de dados usados para representar os coeficientes e implementar a compressão adicional. O processo de quantização pode reduzir uma profundidade de bits associada a alguns ou todos os coeficientes. Por exemplo, durante a quantização, um valor de n bits pode ser reduzido para um valor de m bits, onde n é maior que m.
[0209] O modelo JEM melhora adicionalmente uma estrutura de codificação de imagem de vídeo. Especificamente, uma estrutura de codificação de bloco referida como um “quadtree plus binary tree" (QTBT) é introduzida. Sem usar tais conceito como CU, PU e TU no HEVC, a estrutura QTBT suporta formas de CU particionadas mais flexíveis. Uma CU pode ter uma forma quadrada ou retangular. O particionamento de quadtree é realizado primeiro em uma CTU, e o particionamento de árvore binária é realizado adicionalmente em nós folha de um quadtree. Além disso, existem dois modos de particionamento de árvore binária: particionamento horizontal simétrico e particionamento vertical simétrico. Um nó folha de uma árvore binária é referido como uma CU. A CU no modelo JEM não pode ser particionada adicionalmente durante a predição e transformada. Em outras palavras, uma CU, PU e TU no JEM modelo têm um mesmo tamanho de bloco. Em um modelo JEM em uma fase atual, um tamanho máximo da CTU é 256 x 256 pixels luma.
[0210] Em algumas implementações possíveis, o codificador de vídeo pode varrer o coeficiente de transformada quantizado em uma ordem de varredura pré-definida para gerar um vetor serializado que pode ser codificado por entropia. Em algumas outras implementações possíveis, o codificador de vídeo 20 pode realizar a varredura adaptativa. Depois da varredura do coeficiente de transformada quantizado para formar um vetor unidimensional, o codificador de vídeo 20 pode decodificar a entropia do vetor unidimensional através de codificação de comprimento variável adaptável ao contexto (CAVLC), codificação aritmética binária adaptativa ao contexto (CABAC), codificação aritmética binária adaptativa ao contexto com base em sintaxe (SBAC), codificação por entropia por partição com intervalo de probabilidade (PIPE), ou outro método de codificação por entropia. O codificador de vídeo 20 pode codificar adicionalmente a entropia dos elementos de sintaxe associados aos dados de vídeo codificados para o decodificador de vídeo 30 para decodificar os dados de vídeo.
[0211] Para realizar CABAC, o codificador de vídeo 20 pode atribuir um contexto em um modelo de contexto para um símbolo a ser transmitidos. O contexto pode estar relacionado ao fato de um valor adjacente do símbolo ser diferente de zero. Para realizar CAVLC, o codificador de vídeo 20 pode selecionar um código de comprimento variável do símbolo a ser transmitido. Uma palavra de código no código de comprimento variável (VLC) pode ser construído, de modo que um código mais curto corresponda a um símbolo mais provável, e um código mais longo corresponda a um símbolo menos provável. Desta maneira, comparado ao uso de palavras de código de comprimento igual para todos os símbolos a serem transmitidos, o uso de VLC pode reduzir uma taxa de bit. Uma probabilidade em CABAC pode ser determinada com base no contexto atribuído ao símbolo.
[0212] Nesta modalidade deste pedido, o codificador de vídeo pode realizar a interpredição para reduzir a redundância temporal entre as imagens. Como descrito acima, uma CU pode ter uma ou mais PUs de unidades de predição dependendo da estipulação de diferentes padrões de codificação e decodificação de compressão. Em outras palavras, uma pluralidade de PUs pode pertencer a uma CU, ou a PU e a CU têm um mesmo tamanho. Nesta especificação, quando a PU e a CU têm um mesmo tamanho, um modo de partição da CU não é partição, ou a CU é particionada em uma PU, e a PU é uniformemente usada para a descrição. Quando o codificador de vídeo realiza a interpredição, o codificador de vídeo pode sinalizar informações de movimento para a PU para o decodificador de vídeo. Por exemplo, as informações de movimento para a PU podem incluir: um índice de imagem de referência, um vetor de movimento e um identificador de direção de predição. O vetor de movimento pode indicar deslocamento entre um bloco de imagens (também referido como um bloco de vídeo, um bloco de pixel, um conjunto de pixels ou semelhantes) da PU e um bloco de referência da PU. O bloco de referência da
PU pode ser uma parte similar a uma imagem de referência de um bloco de imagens correspondente à PU. O bloco de referência pode estar localizado em uma imagem de referência indicada pelo índice de imagem de referência e pelo identificador de direção de predição.
[0213] Para reduzir uma quantidade de bits codificados necessários para representar as informações de movimento para a PU, o codificador de vídeo pode gerar uma lista de informações de movimento de candidato (referido como uma lista de candidatos abaixo) para cada PU com base em um processo em um modo de predição de mesclagem ou um modo de predição de vetor de movimento avançado. Cada candidato na lista de candidatos para a PU pode indicar um grupo de informações de movimento. As informações de movimento podem incluir um vetor de movimento MV e informações de indicação de imagem de referência. Certamente, as informações de movimento podem, alternativamente, incluir um ou tanto o vetor de movimento MV quanto as informações de indicação de imagem de referência. Por exemplo, quando um lado do codificador e um lado do decodificador concordam juntos com uma imagem de referência, as informações de movimento podem incluir apenas o vetor de movimento MV. As informações de movimento indicadas por alguns candidatos na lista de candidatos podem ser com base em informações de movimento para outras PUs. Se o candidato indicar informações de movimento de uma das posições espaciais especificadas do candidato (spatial candidate positions) ou uma posição temporal de candidato (temporal candidate positions), o candidato pode ser referido como informações de movimento de candidato “original” neste pedido. Por exemplo, para um modo de mesclagem, também referido como o modo de predição de mesclagem neste pedido, podem haver cinco posições espaciais de candidato original e uma posição temporal de candidato original. Em alguns exemplos, o codificador de vídeo pode gerar adicionalmente informações de movimento de candidato adicionais ou extras usando-se alguns meios. Por exemplo, um vetor zero de movimento é inserido como informações de movimento de candidato para gerar informações de movimento de candidato extras. As informações de movimento de candidato extras não são consideradas como as informações de movimento de candidato original, e podem ser referidas como informações de movimento de candidato geradas posteriormente ou artificialmente neste pedido.
[0214] As tecnologias deste pedido incluem usualmente uma tecnologia para gerar uma lista de candidatos no codificador de vídeo e uma tecnologia para gerar a mesma lista de candidatos no decodificador de vídeo. O codificador de vídeo e o decodificador de vídeo podem gerar a mesma lista de candidatos para implementar uma mesma tecnologia para construir a lista de candidatos. Por exemplo, tanto o codificador de vídeo quanto o decodificador de vídeo podem construir a lista incluindo as mesmas quantidades de candidatos (por exemplo, cinco candidatos). O codificador de vídeo e o decodificador de vídeo podem considerar primeiro candidatos espaciais (por exemplo, blocos adjacentes em uma mesma imagem), em seguida, candidatos temporais (por exemplo, candidatos em diferentes imagens), e finalmente, podem considerar candidatos artificialmente gerados até que a quantidade esperada de candidatos seja adicionada à lista. De acordo com as tecnologias deste pedido, durante a construção da lista de candidatos, operações de remoção podem ser realizadas para tipos particulares de informações de movimento de candidato para remover informações de movimento de candidato repetidas a partir da lista de candidatos, enquanto as operações de remoção podem não ser realizadas para outros tipos de candidatos para reduzir a complexidade do decodificador. Por exemplo, para um conjunto de candidatos espaciais e para um candidato temporal, uma operação remoção pode ser realizadas para excluir um candidato com informações de movimento repetidas de uma lista de candidatos.
[0215] Depois de gerar a lista de candidatos para a PU da CU, o codificador de vídeo pode selecionar informações de movimento de candidato a partir da lista de candidatos e emitir, em um fluxo de bits, um identificador de índice indicando as informações de movimento de candidato selecionadas. As informações de movimento de candidato selecionadas podem ser informações de movimento de um bloco de predição que mais se aproximam da PU que está sendo decodificada. O identificador de índice pode indicar uma posição das informações de movimento de candidato selecionada a partir da lista de candidatos. O codificador de vídeo pode gerar adicionalmente, com base em um bloco de referência indicado pelas informações de movimento para a PU, um bloco de predição usado para a PU. As informações de movimento para a PU podem ser determinadas com base nas informações de movimento de candidato selecionadas. Por exemplo, no modo de mesclagem, é determinado que as informações de movimento de candidato selecionadas são as informações de movimento para a PU. No modo AMVP, as informações de movimento para a PU podem ser determinadas com base em uma diferença de vetor de movimento para a PU e em informações de movimento de candidato selecionadas. O codificador de vídeo pode gerar um ou mais blocos de imagem residuais (referidos como blocos residuais) para a CU com base em um bloco de imagens preditivo (referido como um bloco de predição) para a PU da CU e um original bloco de imagens para a CU. Em seguida, o codificador de vídeo pode codificar um ou mais blocos residuais e emitir um fluxo de bits.
[0216] O fluxo de bits pode incluir dados usados para identificar as informações de movimento de candidato selecionadas a partir da lista de candidatos para a PU. O decodificador de vídeo pode determinar as informações de movimento para a PU com base nas informações de movimento de candidato selecionadas a partir da lista de candidatos para a PU. O decodificador de vídeo pode identificar, com base nas informações de movimento para a PU, um ou mais blocos de referência para a PU. Depois de identificar um ou mais blocos de referência para a PU, o decodificador de vídeo pode gerar, com base em um ou mais blocos de referência para a PU, o bloco de predição para a PU. O decodificador de vídeo pode reconstruir, com base no bloco de predição para a PU da CU e um ou mais blocos de imagem residuais para a CU, um bloco de imagens para a CU.
[0217] Para facilitar a explicação, nesta aplicação, a posição ou o bloco de imagens pode ser descrita como que tem várias relações espaciais com a CU ou a PU. Tais descrições podem ser explicadas como a seguir: A posição ou o bloco de imagens tem várias relações espaciais com o bloco de imagens associado à CU ou à PU. Além disso, nesta aplicação, uma PU que está sendo decodificada pelo decodificador de vídeo pode ser referida como uma PU atual, e também pode ser referida como um bloco de imagens atual a ser processado; Uma CU que está sendo decodificada pelo decodificador de vídeo pode ser referida como uma CU atual. Uma imagem que está sendo decodificada pelo decodificador de vídeo pode ser referida como um imagem atual. Deve ser entendido que está aplicação é aplicável a um caso em que uma PU e uma CU têm um mesmo tamanho, ou um caso em que uma PU é uma CU, e uma PU e uma CU são uniformemente representadas por uma PU.
[0218] Como descrito brevemente acima, o codificador de vídeo 20 pode usar a interpredição para gerar o bloco de predição e as informações de movimento usadas para a PU da CU. Em alguns exemplos, as informações de movimento para a PU podem ser iguais ou similares às informações de movimento para uma ou mais PUs adjacentes (por exemplo, PUs cujos blocos de imagem são espacialmente ou temporariamente adjacentes ao bloco de imagens correspondentes à PU). Pelo fato de que a PU adjacente frequentemente tem informações de movimento similares, o codificador de vídeo pode codificar as informações de movimento para a PU com base nas informações de movimento para a PU adjacente. A codificação das informações de movimento para a PU com base nas informações de movimento para a PU adjacente podem reduzir a quantidade de bits codificados necessários no fluxo de bits para indicar as informações de movimento para a PU.
[0219] O codificador de vídeo 20 pode codificar as informações de movimento para a PU com base nas informações de movimento para a PU adjacente de várias maneiras. Por exemplo, o codificador de vídeo 20 pode indicar que as informações de movimento para a PU são iguais as informações de movimento para PU adjacente. Nesta aplicação, o modo de mesclagem pode ser usado para indicar que as informações de movimento para a PU são iguais ou podem ser derivadas das informações de movimento para a PU adjacente. Em outra implementação possível, o codificador de vídeo 20 pode calcular uma diferença de vetor de movimento (motion vector difference, MVD) para a PU. À MVOD indica uma diferença entre o vetor de movimento para a PU e um vetor de movimento para a PU adjacente. O codificador de vídeo 20 pode incluir a MVD em vez do vetor de movimento para a PU nas informações de movimento para a PU. No fluxo de bits, os bits codificados necessários para representar a MVD são menores que os bits codificados necessários para representar o vetor de movimento para a PU. Nesta aplicação, o modo de predição de vetor de movimento avançado pode ser usado para indicar que o lado do decodificador é notificado das informações de movimento para a PU usando-se a MVD e um valor de índice para identificar um candidato (isto é, informações de movimento de candidato).
[0220] Para sinalizar, no modo de mesclagem ou no modo AMVP, informações de movimento para a PU para o lado do decodificador, o codificador de vídeo 20 pode gerar uma lista de candidatos usada para a PU, A lista de candidatos pode incluir um ou mais candidatos (isto é, um ou mais grupos de informações de movimento de candidato). Cada candidato na lista de candidatos para a PU indica um grupo de informações de movimento. Um grupo de informações de movimento pode incluir um vetor de movimento, uma lista de imagem de referência, e um índice de imagem de referência correspondente à lista de imagem de referência.
[0221] Depois de gerar a lista de candidatos para a PU, o codificador de vídeo 20 pode selecionar um de uma pluralidade de candidatos a partir da lista de candidatos para a PU. Por exemplo, o codificador de vídeo pode comparar cada candidato com uma PU sendo decodificada e pode selecionar um candidato com um custo de distorção de taxa necessário. O codificador de vídeo 20 pode emitir um índice de candidato para a PU. O índice de candidato pode identificar uma posição do candidato selecionado na lista de candidatos.
[0222] Além disso, o codificador de vídeo 20 pode gerar, com base no bloco de referência indicado pelas informações de movimento para a PU, o bloco de predição para a PU. As informações de movimento para a PU podem ser determinadas com base nas informações de movimento de candidato selecionadas a partir da lista de candidatos para a PU.
[0223] Quando o decodificador de vídeo 30 recebe o fluxo de bits, o decodificador de vídeo 30 pode gerar uma lista de candidatos para cada uma dentre as PUs da CU. A lista de candidatos gerada pelo decodificador de vídeo para a PU pode ser a mesma como a lista de candidatos gerada pelo codificador de vídeo 20 para a PU. Um elemento de sintaxe obtido pela análise do fluxo de bits pode indicar a posição das informações de movimento de candidato selecionadas a partir da lista de candidatos para a PU. Depois de gerar a lista de candidatos para a PU, o codificador de vídeo 30 pode gerar, com base em um ou mais blocos de referência indicados pelas informações de movimento para a PU, um bloco de predição para a PU. O decodificador de vídeo 30 pode determinar as informações de movimento para a PU com base nas informações de movimento de candidato selecionadas a partir da lista de candidatos para a PU. O decodificador de vídeo 30 pode reconstruir, com base no bloco de predição para a PU e no bloco residual para a CU, um bloco de imagens para a Cu.
[0224] Deve ser entendido que, em uma implementação possível, no lado do decodificador, a construção da lista de candidatos é independente da análise do fluxo de bits para obter a posição do candidato selecionado na lista de candidatos, e pode ser realizada em qualquer ordem ou em paralelo.
[0225] Em outra implementação possível, no lado do decodificador, o fluxo de bits é analisado primeiro para obter a posição do candidato selecionado na lista de candidatos, e a lista de candidatos é construída com base na posição obtida através da análise. Nesta implementação, não é necessário construir uma lista de candidatos completa, apenas uma lista de candidatos finalizada na posição obtida através da análise precisa ser construída, para ser específico, desde que o candidato na posição possa ser determinado. Por exemplo, quando é obtido, analisando o fluxo de bits, que o candidato selecionado é um candidato cujo identificador de índice é 3 na lista de candidatos, apenas uma lista de candidatos a partir dos identificadores de índice O a 3 precisa ser construída, e o candidato cujo identificador de índice é 3 pode ser determinado. Isso pode alcançar efeitos técnicos, reduzindo a complexidade e melhorando a eficiência da decodificação.
[0226] A FIG. 2 é um diagrama de bloco esquemático de um codificador de vídeo 20 de acordo com uma modalidade deste pedido. O codificador de vídeo 20 pode realizar intra-decodificação e interdecodificação em um bloco de vídeo em uma fatia de vídeo. A intra-decodificação depende da predição espacial para reduzir ou remover a redundância espacial de um vídeo em um determinado quadro ou imagem de vídeo. A decodificação entre quadro depende da predição temporal para reduzir ou remover a redundância temporal de um vídeo em um quadro ou imagem adjacente de uma sequência de vídeo. Um modo intra (modo |) pode ser qualquer um de vários modos de compressão com base em espaço. Um modo inter, tal como predição unidirecional (modo P) ou predição bidirecional (modo B), pode ser qualquer um dos vários modos de compressão com base em tempo.
[0227] Em uma implementação possível da FIG. 2, o codificador de vídeo 20 inclui uma unidade de particionamento 35, uma unidade de predição 41, uma memória de imagem de referência 64, um somador 50, uma unidade de processamento de transformada 52, uma unidade de quantização 54, e uma unidade de codificação de entropia 56. A unidade de predição 41 inclui uma unidade de interpredição (não mostrada) e uma unidade de intrapredição 46. À unidade de interpredição pode incluir uma unidade de estimativa de movimento 42 e uma unidade de compensação de movimento 44. Para a reconstrução do bloco de vídeo, o codificador de vídeo 20 pode incluir adicionalmente uma unidade de quantização inversa 58, uma unidade de transformada inversa 60, e um somador (também referido como um reconstrutor) 62. O codificador de vídeo pode incluir adicionalmente um filtro de desbloqueio (não mostrado na FIG. 2), para filtrar um limite de bloco, para remover o bloqueio de artefato de um vídeo reconstruído. Quando necessário, o filtro de desbloqueio usualmente filtra a saída do somador 62. Além do filtro de desbloqueio, um filtro de loop adicional (dentro ou depois de um loop) pode ser usado adicionalmente.
[0228] Como mostrado na FIG. 2, o codificador de vídeo 20 recebe dados de vídeo, e a unidade de particionamento 35 particiona os dados em bloco de vídeos. Tal particionamento pode incluir adicionalmente o particionamento em fatias, blocos de imagem, ou outras unidades relativamente grandes, e (por exemplo) particionamento de bloco de vídeo com base em estruturas de quadtree de uma LCU e uma CU. Por exemplo, para o codificador de vídeo 20, componentes para codificar os blocos de vídeo em uma fatia de vídeo a ser codificada são descritos. Usualmente, uma fatia pode ser particionada em uma pluralidade de bloco de vídeos (e pode ser particionada em conjuntos de blocos de vídeo que são referidos como blocos de imagem).
[0229] A unidade de predição 41 pode selecionar um de uma pluralidade de modos de decodificação possíveis, por exemplo, um de uma pluralidade de modos de intra-decodificação ou um de uma pluralidade de modos de interdecodificação, de um bloco de vídeo atual com base na qualidade da codificação e um resultado de cálculo de custo (por exemplo, um custo de distorção de taxa, custo RD). A unidade de predição 41 pode fornecer um bloco intra-decodificado ou interdecodificado para o somador 50 para gerar dados do bloco residual, e fornecer o bloco intra-decodificado ou interdecodificado para o somador 62 para reconstruir um bloco codificado e usar o bloco codificado reconstruído como uma imagem de referência.
[0230] A unidade de interpredição (tal como a unidade de estimativa de movimento 42 e a unidade de compensação de movimento 44) na unidade de predição 41 realiza a decodificação interpreditiva no bloco de vídeo atual em relação a um ou mais blocos de predição de uma ou mais imagens de referência, para fornecer a compressão de tempo. A unidade de estimativa de movimento 42 é configurada para determinar um modo de interpredição para uma fatia de vídeo com base em um modo pré-ajustado de uma sequência de vídeo. No modo pré-ajustado, a fatia de vídeo na sequência pode ser especificada como uma fatia P, uma fatia B, ou uma fatia GPB. A unidade de estimativa de movimento 42 e a unidade de compensação de movimento 44 podem ser altamente integradas, e são separadamente descritas neste relatório para facilitar os conceitos de entendimento. A unidade de estimativa de movimento 42 realiza a estimativa de movimento para gerar um processo de estimativa de um vetor de movimento do bloco de vídeo (também referido como um bloco de imagens). Por exemplo, o vetor de movimento pode indicar o deslocamento de uma PU do bloco de vídeo em um quadro ou imagem de vídeo atual em relação ao bloco de predição na imagem de referência.
[0231] Um bloco de predição é um bloco em uma PU que é encontrada, com base em uma diferença de pixel, é parecido com um bloco de vídeo a ser decodificado, e a diferença de pixel pode ser determinada com base em uma soma de diferenças absolutas (SAD), uma soma de diferenças ao quadrado (SSD), ou outras métricas de diferenças. Em algumas implementações possíveis, o codificador de vídeo 20 pode calcular um valor de uma posição de pixel de um sub-número inteiro (sub-integer) de uma imagem de referência armazenada na memória da imagem de referência 64. Por exemplo, o codificador de vídeo 20 pode interpolar um valor de uma quarta posição de pixel, uma oitava posição de pixel, ou outra posição de pixel parcial da imagem de referência. Portanto, a unidade de estimativa de movimento 42 pode realizar um movimento, em relação a uma posição de pixel completa e uma posição de pixel parcial, e emitir um vetor de movimento com precisão de pixel parcial.
[0232] A unidade de estimativa de movimento 42 calcula um vetor de movimento para a PU do bloco de vídeo na fatia interdecodificada comparando uma posição da PU e uma posição do bloco de predição na imagem de referência. A imagem de referência pode ser selecionada a partir de uma primeira lista de imagem de referência (uma lista 0) ou uma segunda lista de imagem de referência (uma lista 1). Cada lista identifica uma ou mais imagens de referência armazenadas na imagem de referência memória 64. A unidade de estimativa de movimento 42 envia o vetor de movimento calculado para a unidade de codificação de entropia 56 e a unidade de compensação de movimento 44.
[0233] A compensação de movimento realizada pela unidade de compensação de movimento 44 pode incluir a extração ou geração de um bloco de predição com base no vetor de movimento determinado através da estimativa de movimento. Depois de receber o vetor de movimento para a PU do bloco de vídeo atual, a unidade de compensação de movimento 44 pode posicionar um bloco de predição apontado pelo vetor de movimento em uma das listas de imagem de referência. O codificador de vídeo 20 subtrai um valor de pixel do bloco de predição de um valor de pixel do bloco de vídeo atual sendo decodificado, para obter um bloco residual de vídeo, e para obter uma diferença de pixel. As formas de diferença de pixel bloqueiam dados residuais, e podem incluir um componente de diferença de luma e um componente de diferença de croma. O somador 50 é um ou mais componentes que realiza a operação de subtração. A unidade de compensação de movimento 44 pode gerar adicionalmente um elemento de sintaxe associado ao bloco de vídeo e a fatia de vídeo para um decodificador de vídeo 30 para decodificar o bloco de vídeo na fatia de vídeo.
[0234] Se a PU estiver na fatia B, uma imagem incluindo a PU pode ser associada com aa duas listas de imagem de referência referidas como a “lista 0" e a “lista 1”. Em algumas implementações possíveis, uma imagem incluindo a fatia B pode ser associada com uma combinação de lista da lista O e da lista 1.
[0235] Além disso, se a PU estiver na fatia B, a unidade de estimativa de movimento 42 pode realizar a predição unidirecional ou predição bidirecional para a PU. Em algumas implementações possíveis, a predição bidirecional é a predição respectivamente realizada com base em imagens nas listas de imagem de referência: a lista O e a lista 1. Em algumas outras implementações possíveis, predição bidirecional é a predição respectivamente realizada com base em um futuro quadro reconstruído e um antigo quadro reconstruído do quadro atual em uma ordem de exibição. Quando a unidade de estimativa de movimento 42 realiza a predição unidirecional para a PU, a unidade de estimativa de movimento 42 pode pesquisar as imagens de referência na lista O ou na lista 1 para um bloco de referência para a PU. Em seguida, a unidade de estimativa de movimento 42 pode gerar um índice de quadro de referência indicando uma imagem de referência incluindo o bloco de referência na lista O ou na lista 1, e um vetor de movimento indicando deslocamento espacial entre a PU e o bloco de referência. A unidade de estimativa de movimento 42 pode emitir o índice de quadro de referência, um identificador de direção de predição, e o vetor de movimento como informações de movimento para a PU. O identificador de direção de predição pode indicar que o índice de quadro de referência indica a imagem de referência na lista O ou na lista 1. Por exemplo, um identificador de direção de predição 1 indica a lista O, um identificador de direção de predição 2 indica a lista 1, e um identificador de direção de predição 3 indica a predição bidirecional, isto é, a lista O e a lista 1. A unidade de compensação de movimento 44 pode gerar um bloco de imagens preditivo para a PU com base no bloco de referência indicado pelas informações de movimento para a PU.
[0236] Quando a unidade de estimativa de movimento 42 realiza a predição bidirecional para a PU, a unidade de estimativa de movimento 42 pode pesquisar as imagens de referência na lista O para um bloco de referência para a PU, e pode pesquisar adicionalmente as imagens de referência na lista 1 para outro bloco de referência para a PU. Em seguida, a unidade de estimativa de movimento 42 pode gerar índices de referência indicando imagens de referência incluindo os blocos de referência na lista O e na lista 1, e vetores de movimento indicando deslocamento espacial entre os blocos de referência e a PU. A unidade de estimativa de movimento 42 pode emitir o índice de referência e o vetor de movimento para a PU como informações de movimento para a PU. À unidade de compensação de movimento 44 pode gerar um bloco de imagens preditivo para a PU com base no bloco de referência indicado pelas informações de movimento para a PU.
[0237] EM algumas implementações possíveis, a unidade de estimativa de movimento 42 não emite um conjunto inteiro de informações de movimento para a PU para o modulo de codificação de entropia 56. Em vez disso, a unidade de estimativa de movimento 42 pode sinalizar as informações de movimento para a PU com referência às informações de movimento para outra PU. Por exemplo, a unidade de estimativa de movimento 42 pode determinar que as informações de movimento para a PU é muito similares às informações de movimento para uma PU adjacente. Nesta implementação, a unidade de estimativa de movimento 42 pode indicar um valor do indicador em uma estrutura de sintaxe associada à PU, e o valor do indicador indica, para o decodificador de vídeo 30, que as informações de movimento para a PU são iguais ou podem ser derivadas das informações de movimento para a PU adjacente. Em outra implementação, a unidade de estimativa de movimento 42 pode identificar, a partir da estrutura de sintaxe associada à PU, um candidato associado à PU adjacente e uma diferença de vetor de movimento (MVD). A MVD indica uma diferença entre o vetor de movimento para a PU e o candidato indicado associado à PU adjacente. O decodificador de vídeo 30 pode determinar o vetor de movimento para a PU usando-se o candidato indicado e da MVD.
[0238] Como descrito acima, a unidade de predição 41 pode gerar uma lista de candidatos para cada PU de uma CU. Uma ou mais da lista de candidatos pode incluir um ou mais grupos de informações de movimento de candidato original e um ou mais grupos de informações de movimento de candidato adicionais derivadas das informações de movimento de candidato original.
[0239] A unidade de intrapredição 46 na unidade de predição 41 pode realizar a decodificação intra-preditiva para um bloco de vídeo atual em relação a um ou mais blocos adjacentes em uma imagem ou fatia que são iguais ao bloco atual a ser decodificado, para fornecer a compressão espacial. Portanto, como uma alternativa de interpredição (como descrito acima) realizada pela unidade de estimativa de movimento 42 e a unidade de compensação de movimento 44, a unidade de intrapredição 46 pode realizar intrapredição para o bloco atual. Especificamente, a unidade de intrapredição 46 pode determinar um modo de intrapredição para codificar o bloco atual. Em algumas implementações possíveis, a unidade de intrapredição 46 pode (por exemplo) usar vários modos de intrapredição para codificar o bloco atual durante a codificação transversal, e a unidade de intrapredição 46 (ou em algumas implementações possíveis, uma unidade de seleção de modo 40) pode selecionar um modo de intrapredição apropriado a partir dos modos testados.
[0240] Depois da unidade de predição 41 gerar um bloco de predição do bloco de vídeo atual através da interpredição ou intrapredição, o codificador de vídeo 20 subtrai o bloco de predição a partir do bloco de vídeo atual, para obter um bloco de vídeo residual. Os dados de vídeo residuais no bloco residual podem ser incluídos em uma ou mais TUs, e aplicado à unidade de processamento de transformada 52. A unidade de processamento de transformada 52 aplica a transformada, por exemplo, transformada discreta de cosseno (DCT) ou outra transformada conceitualmente similar (por exemplo, transformada discrete de seno DST) para transformar os dados de vídeo residuais em coeficientes de transformada residuais. A unidade de processamento de transformada 52 pode transformar os dados de vídeo residuais a partir de um domínio de pixel para um domínio de transformada (por exemplo, um domínio de frequência).
[0241] A unidade de processamento de transformada 52 pode enviar os coeficientes de transformada obtidos para a unidade de quantização 54. À unidade de quantização 54 quantiza o coeficientes de transformada para reduzir adicionalmente uma taxa de bits. O processo de quantização pode reduzir uma profundidade de bits associada a alguns ou todos os coeficientes. Um grau de quantização pode ser modificado por ajuste de um parâmetro de quantização. Em algumas implementações possíveis, a unidade de quantização 54 pode, em seguida, varrer uma matriz incluindo o coeficiente de transformada quantizado. Alternativamente, a unidade de codificação de entropia 56 pode realizar a varredura.
[0242] Depois da quantização, a unidade de codificação de entropia 56 pode codificar a entropia do coeficiente de transformada quantizado. Por exemplo, a unidade de codificação de entropia 56 pode realizar codificação de comprimento variável adaptável ao contexto (CAVLC), codificação aritmética binária adaptativa ao contexto (CABAC), codificação aritmética binária adaptativa ao contexto com base em sintaxe (SBAC), codificação por entropia por partição de intervalo de probabilidade (PIPE), ou outro método ou tecnologia de codificação por entropia. A unidade de codificação de entropia 56 pode codificar adicionalmente a entropia do vetor de movimento e outro elemento de sintaxe da fatia de vídeo atualmente decodificada. Depois da entropia ser codificada pela unidade de codificação de entropia 56, um fluxo de bits codificado pode ser transmitido para o decodificador de vídeo 30 ou arquivado para a transmissão ou recuperação subsequente pelo decodificador de vídeo 30.
[0243] A unidade de codificação de entropia 56 pode codificar informações indicando, de acordo com a tecnologia neste pedido, o modo de intrapredição selecionado. O codificador de vídeo 20 pode incluir, nos dados de configuração de fluxo de bits transmitidos que podem incluir uma pluralidade de tabelas de índice do modo de intrapredição e uma pluralidade de tabelas de Índice do modo de intrapredição modificado (também referido como tabelas de mapeamento de palavras de código), definições de contextos de codificação de vários blocos, e indicações de um MPM, uma tabela de índice de modo de intrapredição, e uma tabela de índice de modo de intrapredição para cada um dos contextos.
[0244] A unidade de quantização inversa 58 e a unidade de transformada inversa 60, respectivamente, aplicam-se à quantização inversa e à transformada inversa, para reconstruir um bloco residual no domínio de pixel para serem usadas subsequentemente como um bloco de referência de uma imagem de referência. A unidade de compensação de movimento 44 pode calcular o bloco reconstruído somando o bloco residual e um bloco de predição de uma das imagens de referência em uma das listas de imagem de referência. A unidade de compensação de movimento 44 também pode aplicar-se a um ou mais filtros de interpolação para o bloco residual reconstruído, para calcular um valor de pixel do sub-número inteiro para a estimativa de movimento. O somador 62 soma o bloco residual reconstruído e um bloco de predição compensando pelo movimento gerado pela unidade de compensação de movimento 44 para gerar o bloco reconstruído, e o bloco reconstruído é armazenado na memória de imagem de referência 64 como o bloco de referência. O bloco de referência pode ser usado pela unidade de estimativa de movimento 42 e a unidade de compensação de movimento 44 como um bloco de referência para realizar a interpredição para um bloco em um quadro ou imagem de vídeo subsequente.
[0245] Deve ser entendido que outras variantes estruturais do codificador de vídeo 20 podem ser usadas para codificar um vídeo atual. Por exemplo, para alguns blocos de imagem ou quadros de imagens, o codificador de vídeo 20 pode quantizar diretamente um sinal residual sem ser processado pela unidade de transformada 52 e, correspondentemente, o sinal residual não precisa ser processado pela unidade de transformada inversa 60. Alternativamente, para alguns blocos de imagem ou quadros de imagem, o codificador de vídeo 20 não gera os dados residuais, e correspondentemente não requer o processamento pela unidade de transformada 52, a unidade de quantização 54, a unidade de quantização inversa 58, e a unidade de transformada inversa 60. Alternativamente, a unidade de quantização 54 e a unidade de desquantização 58 no codificador de vídeo 20 podem ser combinadas.
[0246] A FIG. 3 é um diagrama de bloco esquemático do decodificador de vídeo 30 de acordo com uma modalidade deste pedido. Em uma implementação possível da FIG. 3, o decodificador de vídeo 30 inclui uma unidade de codificação de entropia 80, uma unidade de predição 81, uma unidade de quantização inversa 86, uma unidade de transformada inversa 88, um somador 90 (isto é, um reconstrutor), e uma memória de imagem de referência 92. Em uma variante, a memória de imagem de referência 92 pode ser disposta alternativamente fora do decodificador de vídeo 30. A unidade de predição 81 inclui uma unidade de interpredição (não mostrada) e uma unidade de intrapredição 84. A unidade de interpredição pode ser, por exemplo, uma unidade de compensação de movimento 82. Em algumas implementações possíveis, o decodificador de vídeo 30 pode realizar um procedimento de decodificação inverso do exemplo em relação a um procedimento de decodificação realizado pelo codificador de vídeo 20 na FIG. 4A ou FIG. 4B.
[0247] Durante a codificação, o decodificador de vídeo 30 recebe, a partir do codificador de vídeo 20, um fluxo de bits de vídeo codificado indicando um bloco de vídeo de uma fatia de vídeo codificada e associada a elementos de sintaxe. A unidade de codificação de entropia 80 do decodificador de vídeo 30 decodifica a entropia do fluxo de bits, para gerar um coeficiente quantizado, um vetor de movimento, e outro elementos de sintaxe. A unidade de codificação de entropia 80 envia o vetor de movimento e os outro elementos de sintaxe para a unidade de predição 81. O decodificador de vídeo 30 pode receber os elementos de sintaxe em um nível de fatia de vídeo e/ou um nível do bloco de vídeo.
[0248] Quando a fatia de vídeo é decodificada em uma fatia intra- decodificada (1), a unidade de intrapredição 84 da unidade de predição 81 pode gerar dados de predição do bloco de vídeo da fatia de vídeo atual com base em um modo de intrapredição sinalizado e os dados de um bloco previamente decodificado de um quadro ou imagem atual.
[0249] Quando a imagem de vídeo é decodificada em uma fatia interdecodificada (por exemplo, uma fatia B, uma fatia P, ou uma fatia GPB), a unidade de compensação de movimento 82 da unidade de predição 81 gera um bloco de predição do bloco de vídeo da imagem de vídeo atual com base no vetor de movimento e nos outros elementos de sintaxe que são recebidos a partir da unidade de codificação de entropia 80. O bloco de predição pode ser gerado a partir de uma das imagens de referência em uma das listas de imagem de referência. O decodificador de vídeo 30 pode usar uma tecnologia de construção padrão para construir as listas de imagem de referência (uma lista O e uma lista 1) com base em uma imagem de referência armazenada na memória de imagem de referência 92.
[0250] A unidade de compensação de movimento 82 determina informações de predição do bloco de vídeo da fatia de vídeo atual pela análise do vetor de movimento e de outros elementos de sintaxe, e usa as informações de predição para gerar o bloco de predição do bloco de vídeo sendo decodificado. Por exemplo, a unidade de compensação de movimento 82 usa alguns dos elementos de sintaxe recebidos para determinar um modo de predição (por exemplo, intrapredição ou interpredição) para decodificar o bloco de vídeo da fatia de vídeo, um tipo de fatia de interpredição (por exemplo, uma fatia B, uma fatia P, ou uma fatia GPB), informações de construção de uma ou mais das listas de imagem de referência para a fatia, um vetor de movimento para cada bloco de vídeo intercodificado da fatias, um estado de interpredição para cada bloco de vídeo interdecodificado da fatia, e outras informações para decodificar o bloco de vídeo n fatia de vídeo atual.
[0251] A unidade de compensação de movimento 82 pode realizar adicionalmente a interpolação usando-se um filtro de interpolação. A unidade de compensação de movimento 82 pode usar o filtro de interpolação usado pelo codificador de vídeo 20 durante a codificação do bloco de vídeo, para calcular um valor de interpolação de um pixel do sub-número inteiro de um bloco de referência. Nesta aplicação, a unidade de compensação de movimento 82 pode determinar, com base nos elementos de sintaxe recebidos, o filtro de interpolação usado pelo codificador de vídeo 20, e usar o filtro de interpolação para gerar o bloco de predição.
[0252] Se uma PU é codificada através da interpredição, a unidade de compensação de movimento 82 pode gerar uma lista de candidatos para a PU. O fluxo de bits pode incluir dados para identificar uma posição de um candidato selecionado na lista de candidatos para a PU. Depois de gerar a lista de candidatos para a PU, a unidade de compensação de movimento 82 pode gerar um bloco de imagens preditivo para a PU com base em um ou mais blocos de referência indicados pelas informações de movimento para a PU. O bloco de referência da PU pode ser em uma imagem de tempo diferente daquela da PU. A unidade de compensação de movimento 82 pode determinar as informações de movimento para a PU com base em informações de movimento selecionadas a partir da lista de candidatos para a PU.
[0253] A unidade de quantização inversa 86 realiza a quantização inversa (por exemplo, desquantização) para um coeficiente de transformada quantizado fornecido no fluxo de bits e decodificado pela unidade de codificação de entropia 80. O processo de quantização inverso pode incluir determinar um grau de quantização usando-se um parâmetro de quantização calculado pelo codificador de vídeo 20 para cada bloco de vídeo na fatia de vídeo, e determinar um grau de quantização inverso para ser aplicado. A unidade de transformada inversa 88 aplica a transformada (por exemplo, DCT inversa, transformada de número inteiro inversa, ou um processo de transformada inversa conceitualmente similar) para o coeficiente de transformada para gerar um bloco residual no domínio de pixel.
[0254] Depois da unidade de compensação de movimento 82 gerar o bloco de predição do bloco de vídeo atual com base no vetor de movimento e nos outros elementos de sintaxe, o decodificador de vídeo 30 soma o bloco residual a partir da unidade de transformada inversa 88 e o bloco de predição correspondente gerado pela unidade de compensação de movimento 82, para formar o bloco de vídeo decodificado. O somador 90 (isto é, o reconstrutor) é um ou mais componentes que realiza a operação de soma. Quando necessário, um filtro de desbloqueio pode ser usado adicionalmente para filtrar o bloco decodificado para remover o artefato de bloqueio. Outro filtro de loop (em um loop de decodificação ou depois de um loop de decodificação) pode ser usado adicionalmente para suavizar a transformada de pixel, ou a qualidade de vídeo é melhorada de outra maneira. Em seguida, o bloco de vídeo decodificado em um determinado quadro ou imagem é armazenado na memória de imagem de referência 92. A memória de imagem de referência 92 armazena uma imagem de referência usada para a compensação de movimento subsequente. À memória de imagem de referência 92 armazena adicionalmente um vídeo decodificado a ser apresentado posteriormente em um aparelho de exibição, tal como o aparelho de exibição 32 na FIG. 1.
[0255] Como descrito acima, as tecnologias neste pedido referem-se, por exemplo, a interdecodificação. Deve ser entendido que as tecnologias neste pedido podem ser implementada por qualquer decodificador de vídeo descrito neste aplicação, e o decodificador de vídeo inclui (por exemplo) o codificador de vídeo 20 e o decodificador de vídeo 30 mostrados e descritos na FIG. 1 à FIG.
3. Para ser específico, em uma implementação possível, a unidade de predição 41 descrita na FIG. 2 pode realizar um tecnologia particular descrita abaixo quando a interpredição é realizada durante a codificação em um bloco de dados de vídeo. Em outra implementação possível, a unidade de predição 81 descrita na FIG. 3 pode realizar uma tecnologia particular descrita abaixo quando a interpredição é realizada durante a decodificação em um bloco de dados de vídeo. Portanto, uma referência a um “codificador de vídeo” ou “decodificador de vídeo” geral pode incluir o codificador de vídeo 20, o decodificador de vídeo 30 ou outra unidade de codificação ou unidade de codificação de vídeo.
[0256] Deve ser entendido que outras variantes estruturais do decodificador de vídeo 30 podem ser usadas para decodificar o fluxo de bits de vídeo decodificado. Por exemplo, para alguns blocos de imagem ou quadros de imagem, a unidade de decodificação de entropia 80 do decodificador de vídeo não decodifica os coeficientes quantizados e, correspondentemente, não requer o processamento pela unidade de quantização inversa 86 e a unidade de transformada inversa 88.
[0257] A FIG. 4A é um fluxograma do exemplo de um modo de mesclagem (Merge) de acordo com uma modalidade deste pedido. Um codificador de vídeo (por exemplo, o codificador de vídeo 20) pode realizar uma operação de mesclagem 200. Em outra implementação possível, o codificador de vídeo pode realizar uma operação de mesclagem diferente da operação de mesclagem 200. Por exemplo, em outra implementação possível, o codificador de vídeo pode realizar uma operação de mesclagem, e o codificador de vídeo realiza etapas maiores ou menores que as etapas da operação de mesclagem 200 ou etapas diferentes das etapas da operação de mesclagem 200. Em outra implementação possível, o codificador de vídeo pode realizar as etapas de operação de mesclagem 200 em diferentes ordens ou em paralelo. O codificador pode realizar adicionalmente a operação de mesclagem 200 em uma PU codificada em um modo de pular (skip).
[0258] Depois do codificador de vídeo iniciar a operação de mesclagem 200, o codificador de vídeo pode gerar uma lista de candidatos para a PU atual (202). O codificador de vídeo pode gerar uma lista de candidatos para a PU atual de várias maneiras. Por exemplo, o codificador de vídeo pode gerar, de acordo com uma das tecnologias do exemplo descrito abaixo na FIG. 7 à FIG. 13, a lista de candidatos para a PU atual.
[0259] Como descrito acima, a lista de candidatos para a PU atual pode incluir informações de movimento de candidato temporais (um candidato temporal, para abreviação). As informações de movimento de candidato temporais podem indicar informações de movimento para uma PU de domínio de tempo correspondente (co-localizada)) A PU co-localizada pode ser espacialmente localizada em uma mesma posição como a PU atual em um quadro de imagem, em uma imagem de referência em vez de uma imagem atual. Nesta aplicação, a imagem de referência que inclui a PU do domínio de tempo correspondente pode ser referida como uma imagem de referência relacionada. Nesta aplicação, um índice de imagem de referência da imagem de referência relacionada pode ser referido como um índice de imagem de referência relacionado. Como descrito acima, a imagem atual pode ser associada a uma ou mais listas de imagem de referência (por exemplo, uma lista O e uma lista 1). O Índice de imagem de referência pode indicar a imagem de referência indicando uma posição da imagem de referência em uma lista de imagem de referência. Em algumas implementações possíveis, a imagem atual pode ser associada a uma lista de imagem de referência combinada.
[0260] Em alguns codificadores de vídeo, o índice de imagem de referência relacionado é um índice de imagem de referência que cobre uma PU em uma posição de origem do índice de referência associada à PU atual. Nestes codificadores de vídeo, a posição de origem do índice de referência associada à PU atual é adjacente à esquerda da PU atual ou adjacente à parte superior da PU atual. Nesta aplicação, se um bloco de imagens associado a um PU incluir uma posição particular, a PU pode “cobrir” a posição particular.
[0261] Entretanto, pode haver o seguinte exemplo: A posição de origem do índice de referência associada à PU atual está dentro de uma CU atual. Nestes exemplos, uma PU que cobre a posição de origem da índice de referência associada à PU atual pode ser considerada disponível se a PU estiver na parte superior ou esquerda da CU atual. Entretanto, o codificador de vídeo pode precisar acessar informações de movimento para outra PU da CU atual para determinar a imagem de referência incluindo a PU co-localizada. Portanto, estes codificadores de vídeo podem usar informações de movimento (por exemplo, um índice de imagem de referência) para a PU da CU atual para gerar um candidato temporal para a PU atual. Em outras palavras, estes codificadores de vídeo podem usar as informações de movimento para a PU pertencente à CU atual para gerar o candidato temporal. Portanto, o codificador de vídeo não gera, em paralelo, a lista de candidatos para a PU atual e a PU que cobre a posição de origem da índice de referência associada à PU atual.
[0262] De acordo com as tecnologias deste pedido, o codificador de vídeo pode definir explicitamente o índice de imagem de referência relacionado, sem se referir a um índice de imagem de referência de qualquer outra PU. Desta maneira, o codificador de vídeo pode gerar, em paralelo, a lista de candidatos para a PU atual e outra PU da CU atual. Pelo fato de que o codificador de vídeo define explicitamente o índice de imagem de referência relacionado, o índice de imagem de referência relacionado não é com base em informações de movimento de qualquer outra PU da CU atual. Em algumas implementações possíveis em que o codificador de vídeo define explicitamente o índice de imagem de referência relacionado, o codificador de vídeo sempre pode definir o índice de imagem de referência relacionado a um índice de imagem de referência pré-definido fixo pré-ajustado (por exemplo, 0). Desta maneira, o codificador de vídeo pode gerar um candidato temporal com base em informações de movimento para uma PU co-localizada em um quadro de referência indicado pelo Índice de imagem de referência pré-ajustado, e o candidato temporal pode ser incluído em uma lista de candidatos da CU atual.
[0263] Em uma implementação possível em que o codificador de vídeo define explicitamente o índice de imagem de referência relacionado, o codificador de vídeo pode sinalizar explicitamente o índice de imagem de referência relacionado em uma estrutura de sintaxe (por exemplo, uma cabeçalho de imagem, um cabeçalho de fatia, um APS, ou outra estrutura de sintaxe). Nesta implementação possível, o codificador de vídeo pode sinalizar, para um lado do decodificador, um índice de imagem de referência relacionado para cada LCU (isto é, uma CTU), uma CU, uma PU, uma TU, ou outro tipo de sub-bloco. Por exemplo, o codificador de vídeo pode sinalizar que um índice de imagem de referência relacionado para cada PU da CU é igual a “1”.
[0264] Em algumas implementações possíveis, o índice de imagem de referência relacionado pode ser definido implicitamente e não explicitamente. Nestas implementações possíveis, o codificador de vídeo pode gerar, usando- se informações de movimento para uma PU em uma imagem de referência indicada por um índice de imagem de referência de uma PU que cobre as posições for a da CU atual, cada candidato temporal na lista de candidatos para a PU da CU atual, mesmo se estas posições não sejam estritamente adjacentes à PU atual.
[0265] Depois de gerar a lista de candidatos para a PU atual, o codificador de vídeo pode gerar um bloco de imagens preditivo associado a um candidato na lista de candidatos (204). O codificador de vídeo pode determinar informações de movimento para a PU atual com base em informações de movimento do candidato indicado e, em seguida, gerar um bloco de imagens preditivo com base em um ou mais blocos de referência indicados pelas informações de movimento para a PU atual, para gerar o bloco de imagens preditivo associado ao candidato. O codificador de vídeo pode selecionar um dos candidatos a partir da lista de candidatos (206). O codificador de vídeo pode selecionar o candidato de várias maneiras. Por exemplo, o codificador de vídeo pode selecionar um dos candidatos com base na análise de um custo de distorção de taxa de cada um dos blocos de imagem preditivos associados aos candidatos.
[0266] Depois de selecionar o candidato, o codificador de vídeo pode emitir um índice do candidato (208). O índice pode indicar uma posição do candidato selecionado na lista de candidatos. Em algumas implementações possíveis, o índice pode ser representado como “merge idx”.
[0267] A FIG. 4B é um fluxograma do exemplo de um modo avançado de predição de vetor de movimento (AMVP) de acordo com uma modalidade deste pedido. Um codificador de vídeo (por exemplo, o codificador de vídeo 20) pode realizar uma operação AMVP 210.
[0268] Depois do codificador de vídeo iniciar a operação AMVP 210, o codificador de vídeo pode gerar um ou mais vetores de movimento para uma PU atual (211). O codificador de vídeo pode realizar a estimativa de movimento de número inteiro e estimativa de movimento de fração, para gerar o vetor de movimento para a PU atual. Como descrito acima, uma imagem atual pode ser associada às listas de imagem de referência (por exemplo, uma lista O e uma lista 1). Se a predição unidirecional for realizada na PU atual, o codificador de vídeo pode gerar um vetor de movimento da lista O ou um vetor de movimento da lista 1 para a PU atual. O vetor de movimento da lista O pode indicar o deslocamento espacial entre um bloco de imagens correspondente à PU atual e um bloco de referência em uma imagem de referência na lista O. A vetor de movimento da lista 1 pode indicar o deslocamento espacial entre o bloco de imagens correspondente à PU atual e um bloco de referência em uma imagem de referência na lista 1. Se a predição bidirecional for realizada na PU atual, o codificador de vídeo pode gerar um vetor de movimento da lista O e um vetor de movimento da lista 1 para a PU atual.
[0269] Depois de gerar um ou mais vetores de movimento para a PU atual, o codificador de vídeo pode gerar um bloco de imagens preditivo (referido como um bloco de predição) para a PU atual (212). O codificador de vídeo pode gerar, com base em um ou mais blocos de referência indicados por um ou mais vetores de movimento para a PU atual, o bloco de imagens preditivo para a PU atual.
[0270] Além disso, o codificador de vídeo pode gerar uma lista de candidatos para a PU atual (213). Um decodificador de vídeo pode gerar uma lista de vetores de movimento preditivo de candidato para a PU atual de várias maneiras. Por exemplo, o codificador de vídeo pode gerar a lista de candidatos para a PU atual de acordo com uma ou mais das implementações possíveis descritas abaixo em relação à FIG. 6A até a FIG. 13. Em algumas implementações possíveis, quando o codificador de vídeo gera a lista de candidatos na operação AMVP 210, a lista de vetores de movimento preditivo de candidato pode incluir dois ou três vetores de movimento preditivo de candidato. Ao contrário, quando o codificador de vídeo gera a lista de vetores de movimento preditivo de candidato na operação de mesclagem, a lista de vetores de movimento preditivo de candidato pode incluir mais vetores de movimento preditivo de candidato (por exemplo, cinco ou sete vetores de movimento preditivo de candidato).
[0271] Depois de gerar a lista de candidatos para a PU atual, o codificador de vídeo pode gerar um ou mais valores residuais do vetor de movimento de predição (também referidos como diferenças de vetor de movimento MVD) para cada vetor de movimento preditivo de candidato na lista de candidatos (214). O codificador de vídeo pode determinar uma diferença entre um vetor de movimento indicado pelo vetor de movimento preditivo de candidato e um vetor de movimento correspondente para a PU atual, para gerar uma diferença de vetor de movimento para o vetor de movimento preditivo de candidato.
[0272] Se a predição unidirecional for realizada na PU atual, o codificador de vídeo pode gerar uma única MVD para cada vetor de movimento preditivo de candidato. Se a predição bidirecional for realizada na PU atual, o codificador de vídeo pode gerar duas MVDs para cada vetor de movimento preditivo de candidato. Uma primeira MVD pode indicar uma diferença entre um vetor de movimento indicado pelo vetor de movimento preditivo de candidato e um vetor de movimento da lista O para a PU atual. Uma segunda MVD pode indicar uma diferença entre o vetor de movimento indicado pelo vetor de movimento preditivo de candidato e um vetor de movimento da lista 1 para a PU atual.
[0273] O codificador de vídeo pode selecionar um ou mais vetores de movimento preditivo de candidato a partir da lista de vetores de movimento preditivo de candidato (215). O codificador de vídeo pode selecionar um ou mais vetores de movimento preditivo de candidato de várias maneiras. Por exemplo, o codificador de vídeo pode selecionar um vetor de movimento preditivo de candidato correspondente, com um erro mínimo, a um vetor de movimento associado de um vetor de movimento a ser codificado, e este pode reduzir uma quantidade de bits necessária para representar a diferença de vetor de movimento para o vetor de movimento preditivo de candidato.
[0274] Depois de selecionar um ou mais vetores de movimento preditivo de candidato, o codificador de vídeo pode emitir um ou mais índices de imagem de referência para a PU atual, um ou mais índices de vetor de movimento preditivo de candidato para a PU atual, e uma ou mais diferenças de vetor de movimento para um ou mais vetores de movimento preditivo de candidato selecionado (216).
[0275] Em um exemplo em que a imagem atual é associada as duas listas de imagem de referência (a lista O e a lista 1) e a predição unidirecional é realizada na PU atual, o codificador de vídeo pode emitir um índice de imagem de referência (“ref idx 10") para a lista O ou um índice de imagem de referência (“ref idx 11”) para a lista 1. O codificador de vídeo pode emitir adicionalmente um índice de vetor de movimento preditivo de candidato (“mvp 10 flag”) indicando uma posição do vetor de movimento preditivo do candidato selecionado para o vetor de movimento da lista O para a PU atual na lista de candidatos do vetor de movimento preditivo. O codificador de vídeo pode emitir, alternativamente, um índice de vetor de movimento preditivo de candidato (“mvp 11 flag”) indicando uma posição do vetor de movimento preditivo do candidato selecionado para o vetor de movimento da lista 1 para a PU atual na lista de candidatos do vetor de movimento preditivo. O codificador de vídeo pode emitir, alternativamente, uma MVD para o vetor de movimento da lista O ou o vetor de movimento da lista 1 para a PU atual.
[0276] Em um exemplo em que a imagem atual é associada as duas listas de imagem de referência (a lista O e a lista 1) e a predição bidirecional é realizada na PU atual, o codificador de vídeo pode emitir um índice de imagem de referência (“ref idx 10”) para a lista O e um índice de imagem de referência (“ref idx 11”) para a lista 1. O codificador de vídeo pode emitir adicionalmente um índice de vetor de movimento preditivo de candidato (“mvp 10 flag”) indicando uma posição do vetor de movimento preditivo do candidato selecionado para o vetor de movimento da lista O para a PU atual na lista de vetores de movimento preditivo de candidato. O codificador de vídeo pode emitir, alternativamente, um índice de vetor de movimento preditivo de candidato (“mvp 11 flag”) indicando uma posição do vetor de movimento preditivo do candidato selecionado para o vetor de movimento da lista 1 para a PU atual na lista de vetores de movimento preditivo de candidato. O codificador de vídeo pode emitir adicionalmente uma MVD para o vetor de movimento da lista O para a PU atual ou uma MVD para o vetor de movimento da lista O para a PU atual.
[0277] A FIG. 5 é um fluxograma do exemplo de compensação de movimento realizado por um decodificador de vídeo (por exemplo, o decodificador de vídeo 30) de acordo com uma modalidade deste pedido.
[0278] Quando o decodificador de vídeo realiza uma operação de compensação de movimento 220, o decodificador de vídeo pode receber uma indicação para um candidato selecionado para uma PU atual (222). Por exemplo, o decodificador de vídeo pode receber um índice de candidato indicando uma posição do candidato selecionado em uma lista de candidatos para a PU atual.
[0279] Se as informações de movimento para a PU atual forem decodificadas em um modo de mesclagem e a predição bidirecional for realizada na PU atual, o decodificador de vídeo pode receber um primeiro índice de candidato e um segundo índice de candidato. O primeiro índice de candidato indica uma posição de um candidato selecionado de um vetor de movimento da lista O para a PU atual na lista de candidatos. O segundo índice de candidato indica uma posição de um candidato selecionado de um vetor de movimento da lista 1 para a PU atual na lista de candidatos. Em algumas implementações possíveis, um único elemento de sintaxe pode ser usado para identificar os dois índices de candidato.
[0280] Além disso, o decodificador de vídeo pode gerar a lista de candidatos para a PU atual (224). O decodificador de vídeo pode gerar a lista de candidatos para a PU atual de várias maneiras. Por exemplo, o decodificador de vídeo pode gerar a lista de candidatos para a PU atual usando-se tecnologias descritas abaixo com referência à FIG. 6A, FIG. 6B até a FIG. 10. Quando o decodificador de vídeo gera um candidato temporal para a lista de candidatos, o decodificador de vídeo pode definir explicitamente ou implicitamente um índice de imagem de referência para identificar uma imagem de referência incluindo uma PU co-localizada, como descrito acima em relação à FIG. 4A ou à FIG. 4B.
[0281] Depois de gerar a lista de candidatos para a PU atual, o decodificador de vídeo pode determinar as informações de movimento para a PU atual com base em informações de movimento indicadas por um ou mais candidatos selecionados na lista de candidatos para a PU atual (225). Por exemplo, se as informações de movimento para a PU atual forem codificadas no modo de mesclagem, as informações de movimento para a PU atual podem ser iguais as informações de movimento indicadas pelo candidato selecionado. Se as informações de movimento para a PU atual forem codificadas em um modo AMVP, o decodificador de vídeo pode reconstruir um ou mais vetores de movimento para a PU atual usando-se um ou mais vetores de movimento indicados pelo candidato selecionado e uma ou mais MVDs indicadas em um fluxo de bits. Um índice de imagem de referência e um identificador de direção de predição da PU atual podem ser iguais aos índices de imagem de referência e aos identificadores de direção de predição dos um ou mais candidatos selecionados. Depois de determinar as informações de movimento para a PU atual, o decodificador de vídeo pode gerar, com base em um ou mais blocos de referência indicados pelas informações de movimento para a PU atual, um bloco de imagens preditivo para a PU atual (226).
[0282] A FIG. 6A é um diagrama esquemático do exemplo de uma unidade de decodificação (CU), um bloco de imagens adjacente ao domínio espacial associado à CU, e um bloco de imagens adjacente ao domínio de tempo associado à CU de acordo com uma modalidade deste pedido. A FIG. 6A é um diagrama esquemático de uma CU 600 e das posições do candidato esquemáticas 1 a 10 associadas à CU 600. As posições de candidato 1 a 5 indicam os candidatos espaciais em um mesma imagem como a CU 600. À posição de candidato 1 está localizada à esquerda da CU 600. A posição de candidato 2 está localizada acima da CU 600. A posição de candidato 3 está localizada na parte superior direita da CU 600. A posição de candidato 4 está localizada na parte inferior esquerda da CU 600. A posição de candidato 5 está localizada na parte superior esquerda da CU 600. As posições do candidato 6 e 7 indicam candidatos temporais associados a um bloco co-localizado 602 da CU 600, e o bloco co-localizado é um bloco de imagens cujo tamanho, forma e coordenadas são os mesmos como àqueles da CU 600 em uma imagem de referência (isto é, uma imagem codificada adjacente). A posição de candidato 6 está localizada no canto inferior direto do bloco co-localizado 602. A posição de candidato 7 está localizada na posição central inferior direita do bloco co- localizado 602, ou na posição central superior esquerda do bloco co-localizado
602. A FIG. 6A é uma implementação esquemática de uma posição de candidato que é fornecida para um módulo de interpredição (por exemplo, especificamente a unidade de estimativa de movimento 42 ou a unidade de compensação de movimento 82) para gerar uma lista de candidatos. As posições de candidato 1 a 5 na FIG. 6A são implementações esquemáticas de uma posição de candidato que é fornecida para um módulo de intrapredição para gerar uma lista de candidatos.
[0283] Deve ser observado que a posição de candidato especial e a posição de candidato temporal na FIG. 6A são meramente exemplos, e as posições de candidato incluem, mas não são limitadas aos exemplos anteriores. Em algumas implementações possíveis, a posição de candidato especial pode incluir adicionalmente, por exemplo, uma posição que está dentro de uma distância pré-ajustada a partir de um bloco de imagens a ser processado, mas não é adjacente ao bloco de imagens a ser processado. Por exemplo, este tipo de posição pode ser mostrado em 6 a 27 na FIG. 6B. Deve ser entendido que a FIG. 6B é um diagrama esquemático do exemplo de uma unidade de decodificação e um bloco de imagens adjacente ao domínio espacial associados à unidade de decodificação de acordo com uma modalidade deste pedido. Uma posição de um bloco de imagens que está localizada em um mesmo quadro de imagem como o bloco de imagens a ser processado, que foi reconstruído quando o bloco de imagens a ser processado é processado, e que não é adjacente ao bloco de imagens a ser processado também está dentro de um intervalo da posição de candidato. Neste relatório, tais posições são referidas como blocos de imagem não adjacentes ao domínio espacial. Deve ser entendido que o candidato especial pode ser selecionado a partir de uma ou mais posições mostradas na FIG. 6B.
[0284] Em algumas implementações possíveis, a posição de candidato pode ser alternativamente, por exemplo, selecionada a partir de uma ou mais posições mostradas na FIG. 6C, por exemplo, um bloco intervisualização de referência mostrado na FIG. 6C.
[0285] Um método para predizer informações de movimento de um bloco de imagens nas modalidades deste pedido não é apenas aplicável a um modo de predição de mesclagem (Merge) e/ou um modo de predição de vetor de movimento avançado (advanced motion vector preciction, AMVP), mas também é aplicável a outro modo em que as informações de movimento de um bloco de imagens atual são prognosticadas usando-se informações de movimento de um bloco de referência de domínio espacial, um bloco de referência de domínio de tempo e/ou um bloco intervisualização de referência, melhorando, desse modo, o desempenho da codificação e decodificação.
[0286] A FIG. 7 é um fluxograma do exemplo de um método para predizer informações de movimento de um bloco de imagens de acordo com uma modalidade deste pedido. O método é usado para intrapredição ou interpredição. O método pode ser realizado por um codificador de vídeo (por exemplo, o codificador de vídeo 20), um decodificador de vídeo (por exemplo, o decodificador de vídeo 30), ou um dispositivo eletrônico (por exemplo, um dispositivo 1500) que tem uma função de codificação e decodificação de vídeo. O método pode incluir as seguintes etapas.
[0287] S701: Determinar/construir uma lista de informações de movimento de candidato de um bloco de imagens atual, onde a lista de informações de movimento de candidato inclui pelo menos uma parte de informações de movimento de candidato combinado, as primeiras informações de movimento de candidato combinado em pelo menos uma parte de informações de movimento de candidato combinado são obtidas por ponderação de P partes de informações de movimento de candidato (que também podem ser referidas como P grupos de informações de movimento preditivo de candidato) usando-se os fatores de ponderação correspondentes, P é um número inteiro maior que ou igual a 2, os fatores de ponderação wpi para pelo menos duas dentre as P partes de informações de movimento de candidato são, respectivamente, valores maiores que O e menores que 1, e uma soma dos fatores de ponderação para as P partes de informações de movimento de candidato é 1.
[0288] S702: Determinar informações de movimento alvo na lista de informações de movimento de candidato.
[0289] S703: Predizer informações de movimento do bloco de imagens atual com base nas informações de movimento alvo.
[0290] Deve ser observado que, nesta modalidade deste pedido, as P partes de informações de movimento de candidato em que o processamento de ponderação é realizado (ou a ponderação deve ser realizada) podem ser P partes de informações de movimento de candidato original que são previamente obtidas, ou P partes de informações de movimento de candidato não original que são previamente obtidas, ou P partes de informações de movimento de candidato que são previamente obtidas e que incluem informações de movimento de candidato original e informações de movimento de candidato não original, ou P partes de informações de movimento de candidato que foram colocadas na lista de informações de movimento de candidato, ou P partes de informações de movimento de candidato antes de serem colocadas na lista de informações de movimento de candidato. Isto não é limitado nesta modalidade deste pedido. A seguir, é utilizado um exemplo para a descrição com referência à FIG. 12, e os detalhes não são descritos neste relatório novamente.
[0291] Em algumas implementações possíveis, pelo menos uma parte de informações de movimento de candidato combinado inclui adicionalmente segundas informações de movimento de candidato combinado, as segundas informações de movimento de candidato combinado são obtidas por ponderação de M partes de informações de movimento de candidato usando-se os fatores de ponderação correspondentes, M é um número inteiro maior que ou igual a 2, os fatores de ponderação wmi para pelo menos duas dentre as M partes de informações de movimento de candidato são, respectivamente, valores maiores que O e menores que 1, pelo menos uma das P partes de informações de movimento de candidato é diferente de pelo menos uma das M partes de informações de movimento de candidato, e uma soma dos fatores de ponderação para as M partes de informações de movimento de candidato é 1.
[0292] Em um exemplo, se existem quatro candidatos de mesclagem originais, existem seis combinações das informações de movimento de candidato combinado (referidas como um candidato de mesclagem de ponderação “combinado abaixo) fornecidas nesta aplicação. As seis combinações são descritas como a seguir: Merge idx0[6]=(0, O, 1,0, 1,2): e Merge idx1[6]=(1, 2, 2, 3, 3, 3).
[0293] O, 1, 2, e 3 indicam números do índice dos candidatos de mesclagem originais na lista de informações de movimento de candidato (lista de candidatos). Por exemplo, O indica um candidato em uma posição de índice O na lista de candidatos. Correspondentemente, uma primeira combinação é uma combinação de um vetor de movimento candidato correspondente ao número do índice de mesclagem O e um vetor de movimento candidato correspondente ao número de índice de mesclagem 1, para ser específico, um candidato de mesclagem de ponderação combinado é obtido por ponderação do vetor de movimento de candidato correspondente ao número de índice de mesclagem O e o vetor de movimento de candidato correspondente ao número de índice de mesclagem 1. Uma segunda combinação é uma combinação do vetor de movimento de candidato correspondente ao número de índice de mesclagem O e um vetor de movimento de candidato correspondente ao número de índice de mesclagem 2, para ser específico, outro candidato de mesclagem preditivo de ponderação combinada é obtido por ponderação do vetor de movimento de candidato correspondente ao número de índice de mesclagem O e o vetor de movimento de candidato correspondente ao número de índice de mesclagem 2. Os outros quatro candidatos de mesclagem preditivos de ponderação combinada não são listados neste relatório.
[0294] EM algumas implementações possíveis, as primeiras informações de movimento de candidato combinado incluem: valores ponderados de P1 vetores de movimento de candidato que estão nas P partes de informações de movimento de candidato e que correspondem a uma primeira lista de referência, e/ou valores ponderados de P2 vetores de movimento de candidato que estão nas P partes de informações de movimento de candidato e que correspondem a uma segunda lista de referência, onde 1<P1<P, 1<P2<P, P1 ou P? é um número inteiro maior que ou igual a 2, fatores de ponderação wpi para pelo menos duas dentre as P: ou P2 partes de informações de movimento de candidato são respectivamente valores maiores que O e menores que 1, uma soma dos fatores de ponderação para os P vetores de movimento de candidato é 1, e uma soma dos fatores de ponderação para os P2 vetores de movimento de candidato é 1
[0295] As segundas informações de movimento de candidato combinado incluem: valores ponderados de M: vetores de movimento de candidato que estão nas M partes de informações de movimento de candidato e que correspondem à primeira lista de referência, e/ou valores ponderados de M2 vetores de movimento de candidato que estão nas M partes de informações de movimento de candidato e que correspondem à segunda lista de referência, onde 1<M1<M, 1<M2<M, M: ou M>2 é um número inteiro maior que ou igual a 2, fatores de ponderação wmi para pelo menos duas dentre as M1: ou M2 partes de informações de movimento de candidato são respectivamente valores maiores que O e menores que 1, uma soma dos fatores de ponderação para os M: vetores de movimento de candidato é 1, e uma soma dos fatores de ponderação para os M,> vetores de movimento de candidato é 1
[0296] Em algumas implementações possíveis, as P partes de informações de movimento de candidato incluem as primeiras informações de movimento de candidato correspondentes a um primeiro identificador de índice e as segundas informações de movimento de candidato correspondentes a um segundo identificador de índice, o primeiro identificador de índice (também referido como um primeiro valor de índice) é menor que o segundo identificador de índice (também referido como um segundo valor de índice) e, correspondentemente, um fator de ponderação para as primeiras informações de movimento de candidato é maior que ou igual a um fator de ponderação para as segundas informações de movimento de candidato. Por exemplo, para a primeira combinação mencionada acima, isto é, a combinação dos números de índice de mesclagem O e 1, os fatores de ponderação (pesos) para os vetores de movimento dos candidatos de mesclagem correspondentes são (2/3, 1/3). Se os fatores de ponderação para todas as P partes de informações de movimento de candidato forem os mesmos, e a soma dos fatores de ponderação para as P partes de informações de movimento de candidato for 1, que as P partes de informações de movimento de candidato são ponderadas para obter as primeiras informações de movimento de candidato combinado podem ser entendidas como que um valor médio das P partes de informações de movimento de candidato é calculado para obter as primeiras informações de movimento de candidato combinado.
[0297] Em algumas implementações possíveis, as M partes de informações de movimento de candidato incluem as terceiras informações de movimento de candidato correspondentes a um terceiro identificador de índice e as quartas informações de movimento de candidato correspondentes a um quarto identificador de índice, o terceiro identificador de índice é menor que o quarto identificador de índice e, correspondentemente, um fator de ponderação para as terceiras informações de movimento de candidato é maior que ou igual a um fator de ponderação para as quartas informações de movimento de candidato. Se os fatores de ponderação para todas as M partes de informações de movimento de candidato forem iguais, e a soma dos fatores de ponderação para as M partes de informações de movimento de candidato for 1, que as M partes de informações de movimento de candidato são ponderadas para obter as segundas informações de movimento de candidato combinado podem ser entendidas como que um valor médio das M partes de informações de movimento de candidato é calculado para obter as segundas informações de movimento de candidato combinado.
[0298] Em várias modalidades deste pedido, as P partes de informações de movimento de candidato usadas para o processamento de ponderação têm uma pluralidade de formas. Por exemplo, as P partes de informações de movimento de candidato são P partes de informações de movimento de candidato original; ou as P partes de informações de movimento de candidato são (P-X) partes de informações de movimento de candidato original e X partes de informações de movimento de candidato não original, onde X é um número inteiro positivo menor que ou igual a P.
[0299] Em várias modalidades deste pedido, as M partes de informações de movimento de candidato usadas para o processamento de ponderação têm uma pluralidade de formas. Por exemplo, as M partes de informações de movimento de candidato são M partes de informações de movimento de candidato original; ou as M partes de informações de movimento de candidato são (M-Y) partes de informações de movimento de candidato original e Y partes de informações de movimento de candidato não original, onde Y é um número inteiro positivo menor que ou igual a M.
[0300] Em várias modalidades deste pedido, as informações de movimento de candidato original incluem informações de movimento de um ou mais blocos de referência de domínio espacial do bloco de imagens atual, informações de movimento de um ou mais blocos de referência de domínio de tempo do bloco de imagens atual, e/ou informações de movimento de um ou mais blocos de referência intervisualização do bloco de imagens atual; e as informações de movimento de candidato não original incluem informações de movimento de candidato dimensionado, as primeiras informações de movimento de candidato combinado, as segundas informações de movimento de candidato combinado, informações de movimento de candidato bipreditivo combinado, e/ou informações de movimento zero, onde cada uma das informações de movimento de candidato dimensionado inclui um vetor de movimento que aponta para um primeiro quadro de referência alvo e que está na primeira lista de referência, e/ou um vetor de movimento que aponta para um segundo quadro de referência alvo e que está na segunda lista de referência.
[0301] A FIG. 8A é um diagrama esquemático do exemplo de adição de informações de candidato combinado para uma lista de candidatos do modo de mesclagem de acordo com uma modalidade deste pedido. Três candidatos cujo Merge idx são O, 1, e 2 são informações de movimento de candidato de mesclagem origina, e três candidatos cujo Merge idx é 3, 4, e 5 são informações de movimento de candidato de mesclagem combinadas adicionadas (referidas como candidatos médios de mesclagem combinados abaixo) fornecidas nesta aplicação.
[0302] Para cada lista de referência (LO ou L1), um valor médio de vetores de movimento de dois candidatos de mesclagem originais em uma lista de referência é um vetor de movimento do candidato médio de mesclagem combinado na lista de referência. Se os dois candidatos de mesclagem originais tiverem apenas um vetor de movimento na lista de referência, o vetor de movimento é o vetor de movimento do candidato médio de mesclagem combinado na lista de referência. De outro modo, um valor médio dos dois vetores de movimento precisa ser calculado.
[0303] A FIG. 8B é outro diagrama esquemático do exemplo de adição de informações de movimento de candidato combinado a uma lista de candidatos do modo de mesclagem de acordo com uma modalidade deste pedido. Três candidatos cujo Merge idx são O, 1, e 2 são informações de movimento de candidato de mesclagem original, e três candidatos cujo Merge idx é 3,4,e 5 são informações de movimento de candidato de mesclagem combinadas adicionadas (referidas como o candidato médio de mesclagem combinados abaixo) fornecidas nesta aplicação. Diferente da FIG. 8A, antes que a média seja realizada, o processamento de dimensão é realizado primeiro em vetores de movimento mvLO A de alguns candidatos de mesclagem originais (por exemplo, mvLO A, ref0') em uma lista de referência (por exemplo, LO), para obter um vetor de movimento (mvLO A') que aponta para um quadro de referência alvo (por exemplo, refO).
[0304] Com referência à FIG. 9, as informações de movimento de candidato dimensionado são obtidas usando-se o seguinte método: determinar o primeiro quadro de referência alvo (por exemplo, refO) que é do bloco de imagens atual e que corresponde à primeira lista de referência (por exemplo, LO) e/ou o segundo quadro de referência alvo (por exemplo, L1)
que é do bloco de imagens atual e que corresponde à segunda lista de referência (por exemplo, ref1), onde o primeiro quadro de referência alvo é um quadro de referência que corresponde à primeira lista de referência e que é de informações de movimento de candidato usadas com mais frequência na lista de informações de movimento de candidato, ou um quadro de referência que corresponde à primeira lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice na lista de informações de movimento de candidato; alternativamente, o segundo quadro de referência alvo é um quadro de referência que corresponde à segunda lista de referência e que é de informações de movimento de candidato usadas com mais frequência na lista de informações de movimento de candidato, ou um quadro de referência que corresponde à segunda lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice na lista de informações de movimento de candidato;
determinar se uma imagem de referência que é incluída em particular informações de movimento de candidato (por exemplo, as informações de movimento de candidato cuja posição de índice é O na FIG. 8B) e que corresponde à primeira lista de referência é a mesma como o primeiro quadro de referência alvo, e/ou se uma imagem de referência que é incluída em informações de movimento de candidato particulares e que corresponde à segunda lista de referência é a mesma como o segundo quadro de referência alvo; e se a imagem de referência que é incluída nas informações de movimento de candidato e que corresponde à primeira lista de referência for diferente do primeiro quadro de referência alvo, dimensionar com base em uma distância de domínio de tempo ou uma distância intervisualização, o vetor de movimento (por exemplo, mvLO A na FIG. 8B) que é incluído nas informações de movimento de candidato e que corresponde à primeira lista de imagem de referência, para obter o vetor de movimento (por exemplo, mvLO A' na FIG. 8B) que aponta para o primeiro quadro de referência alvo; e/ou se a imagem de referência que é incluída nas informações de movimento de candidato e que corresponde à segunda lista de referência for diferente do segundo quadro de referência alvo, dimensionar com base em uma distância de domínio de tempo ou uma distância intervisualização, o vetor de movimento (por exemplo, mvL1 A na FIG. 8B) que é incluído nas informações de movimento de candidato e que corresponde à segunda lista de imagem de referência, para obter o vetor de movimento (por exemplo, FIG. 8B mvL1 A') que aponta para o segundo quadro de referência alvo, de modo que as informações de movimento de candidato dimensionado (por exemplo, mvLO A', refo; mvL1 A', ref1 na FIG. 8B) sejam obtidas.
[0305] As informações de movimento de candidato mencionadas neste relatório pode ser uma das P partes de informações de movimento de candidato ou as M partes de informações de movimento de candidato mencionadas acima. Isto não é limitado nesta aplicação.
[0306] Como mostrado na FIG. 9, se as informações de movimento de candidato a serem dimensionadas forem informações de movimento em uma direção de domínio de tempo, o processamento de dimensão com base em uma distância de domínio de tempo pode ser descrito como a seguir: MVast =tast * MVcantcan tast=currPicPOC-dstRefPicPOC tcan=currPicPOC-CanRefPicPOC
[0307] MVast representa um vetor de movimento dimensionado, MVcan representa um vetor de movimento incluído nas informações de movimento de candidato a serem dimensionadas, tas: representa uma distância de contagem de ordem de imagem (picture order count, POC) entre um quadro atual e um quadro de referência alvo, e tcan representa uma distância POC entre o quadro atual e um quadro de referência correspondente a um índice de quadro de referência incluído nas informações de movimento de candidato.
[0308] Com referência à FIG. 9, se as informações de movimento de candidato a serem dimensionadas forem informações de movimento em uma direção intervisualização, o processamento de dimensão com base em uma distância intervisualização pode ser descrito como a seguir: MVast=tast * MVcantcan tasi=currPicVOl-dstRefPicVO! tean=currPicVOl-CanRefPicVOl
[0309] MVas representa um vetor de movimento dimensionado, MVcan representa um vetor de movimento incluído nas informações de movimento de candidato a serem dimensionadas, tast representa uma distância de índice de ordem de exibição (view order index, VOI) entre um quadro atual e um quadro de referência alvo, e tcan representa uma distância VOI entre o quadro atual e um quadro de referência correspondente a um índice de quadro de referência incluído nas informações de movimento de candidato.
[0310] A FIG. 10 é um diagrama esquemático do exemplo de adição de informações de movimento de candidato combinado a uma lista de candidatos do modo AMVP de acordo com uma modalidade deste pedido. Especificamente, um índice de quadro de referência RefO de uma lista de referência LO é usado como um exemplo para descrição. É considerado que uma quantidade máxima de candidatos na lista de candidatos AMVP é 4. Se as informações de movimento de candidato original não preencherem a lista de candidatos AMVP, as informações de movimento de candidato combinado fornecidas nesta aplicação podem ser adicionadas depois das informações de movimento de candidato original. Se a lista de candidatos AMVP não estiver preenchida, um vetor de movimento zero é adicionado. Dois candidatos cujo Merge idkx é 0 e 1 são informações de movimento de candidato original AMVP, e um candidato cujo Merge idx é 2 é adicionado às informações de movimento de candidato combinado AMVP (também referidas como um candidato médio combinado AMVP) fornecidas nesta aplicação, e um candidato cujo Merge idx é 3 é um vetor de movimento zero adicionado.
[0311] Pode ser aprendido que no método para predizer informações de movimento de um bloco de imagens nesta modalidade deste pedido, uma ou mais partes de informações de movimento de candidato combinado podem ser construídas por ponderação de uma pluralidade de partes de informações de movimento de candidato, de modo que mais informações de movimento de candidato usadas para referência possam ser encontradas o máximo possível, enriquecendo, desse modo, as informações de movimento de candidato, e reduzindo ou evitando, até certo ponto, o preenchimento da lista de informações de movimento de candidato com informações de movimento de candidato com vetor zero. Isto melhora a precisão da predição de vetor de movimento até certo, melhorando, desse modo, o desempenho da codificação e decodificação.
[0312] A FIG. 11 é um fluxograma do exemplo de um método para a construção de uma lista de candidatos de mesclagem de acordo com uma modalidade deste pedido. Como mostrado na FIG. 11, as informações de movimento de candidato combinado (também referidas como candidato de mesclagem de ponderação combinado ou candidato médio de mesclagem combinado) fornecidas nesta aplicação podem ser colocadas depois de todas as informações de movimento de candidato original ou algumas informações de movimento de candidato original, para substituírem ou serem compatíveis com um vetor de movimento de candidato de mesclagem bipreditivo combinado (combined bi-predictive merge candidate) ou um vetor de movimento zero, ou serve como outro vetor de movimento preditivo de candidato adicional diferente de um vetor de movimento preditivo de candidato original. Um processo 1100 pode ser realizado pelo codificador de vídeo 20 ou pelo decodificador de vídeo 30, e por exemplo, pode ser realizado por uma unidade de interpredição do codificador de vídeo 20 ou uma unidade de interpredição do decodificador de vídeo 30. No codificador de vídeo 20, por exemplo, a unidade de interpredição pode incluir uma unidade de estimativa de movimento 42 e uma unidade de compensação de movimento 44. No decodificador de vídeo 30, por exemplo, a unidade de interpredição pode incluir uma unidade de compensação de movimento 82. A unidade de interpredição pode gerar uma lista de informações de movimento de candidato para uma PU. A lista de informações de movimento de candidato pode incluir uma ou mais partes de informações de movimento de candidato original e uma ou mais partes de informações de movimento de candidato adicionais derivadas das informações de movimento de candidato original. Em outras palavras, o processo 1100 pode incluir um processo 1110 para obter as informações de movimento de candidato original e um processo 1130 para obter as informações de movimento de candidato adicionais. O processo 1100 é descrito como um séries de etapas ou operações. Deve ser entendido que o processo 1100 pode ser realizado em várias ordens e/ou no mesmo momento, que não é limitado a uma sequência de execução mostrada na FIG. 11. É considerado que um codificador de vídeo ou um decodificador de vídeo está sendo usado para os dados de vídeo atual que tem uma pluralidade de quadros de vídeo, para realizar o processo 1100 incluindo as seguintes etapas, para construir uma lista de informações de movimento de candidato de um bloco de imagens atual de um quadro de vídeo atual.
[0313] Etapa 1111: Detectar um ou mais blocos de referência de domínio espacial do bloco de imagens atual em uma primeira ordem pré-ajustada,
para obter Q partes de informações de movimento de candidato original em uma lista de candidatos de um bloco de imagens a ser processado (ou obter Q partes de informações de movimento de candidato original usadas para construir uma lista de candidatos de um bloco de imagens a ser processado), onde Q é um número inteiro maior que ou igual a O.
[0314] Deve ser entendido que a detecção neste relatório pode incluir um processo de verificação “disponível” mencionado em outras partes nesta especificação, ou a detecção neste relatório pode incluir um processo de verificação “disponível” e um processo de remoção (por exemplo, remoção de redundância) mencionados em outras partes nesta especificação. Os detalhes não são descritos novamente.
[0315] Com referência à FIG. 6A e FIG. 6B, um ou mais blocos de referência de domínio espacial do bloco de imagens atual incluem: um ou mais blocos de referência de domínio espacial que estão em uma imagem em que o bloco de imagens atual está localizado e que é adjacente ao bloco de imagens atual, e/ou um ou mais blocos de referência de domínio espacial que estão em uma imagem em que o bloco de imagens atual está localizado e que não é adjacente ao bloco de imagens atual. Como mostrado na FIG. 6A, um ou mais blocos de referência de domínio espacial que estão na imagem em que o bloco de imagens atual está localizado e que é adjacente ao bloco de imagens atual podem incluir um quarto bloco adjacente ao domínio espacial AO localizado no lado inferior esquerdo do bloco de imagens atual, um primeiro bloco adjacente ao domínio espacial A1 localizado no lado esquerdo do bloco de imagens atual, um terceiro bloco adjacente ao domínio espacial BO localizado no lado superior direito do bloco de imagens atual, um segundo bloco adjacente ao domínio espacial B1 localizado no lado superior do bloco de imagens atual, ou um quinto bloco adjacente ao domínio espacial B2 localizado no lado superior esquerdo do bloco de imagens atual. Como mostrado na FIG. 6B, um ou mais blocos de referência de domínio espacial que estão na imagem em que o bloco de imagens atual está localizado e que não é adjacente ao bloco de imagens a ser processado podem incluir um primeiro bloco de imagens não adjacente ao domínio espacial, um segundo bloco de imagens não adjacente ao domínio espacial, um terceiro bloco de imagens não adjacente ao domínio espacial e semelhantes.
[0316] Em uma implementação, na etapa 1111, se o primeiro bloco adjacente ao domínio espacial A1, o segundo bloco adjacente ao domínio espacial B1, o terceiro bloco adjacente ao domínio espacial BO, o quarto bloco adjacente ao domínio espacial AO, e o quinto bloco adjacente ao domínio espacial B2 disponíveis forem detectados sequencialmente, para obter informações de movimento de blocos de imagem de vetor de movimento determinado Q1 no primeiro bloco adjacente ao domínio espacial A1, o segundo bloco adjacente ao domínio espacial B1, o terceiro bloco adjacente ao domínio espacial BO, o quarto bloco adjacente ao domínio espacial AO, e o quinto bloco adjacente ao domínio espacial B2, onde Q1 é um número inteiro maior que ou iguala 0; e adicionar, à lista de candidatos, Q grupos de informações de movimento nas informações de movimento dos blocos de imagem de vetor de movimento determinado Q1 que são obtidos através da detecção de informações de movimento de candidato, onde Q1 é maior que ou igual a Q.
[0317] Uma condição de detecção do quinto bloco adjacente ao domínio espacial B2 inclui: Quando qualquer um do primeiro bloco adjacente ao domínio espacial A1, do segundo bloco adjacente ao domínio espacial B1, do terceiro bloco adjacente ao domínio espacial BO, e do quarto bloco adjacente ao domínio espacial AO não está disponível, o quinto bloco adjacente ao domínio espacial B2 é detectado.
[0318] Etapa 1113: Detectar um ou mais blocos de referência de domínio de tempo do bloco de imagens atual em uma segunda ordem pré- ajustada (por exemplo, 6 a 7 na figura), para obter S partes de informações de movimento de candidato original na lista de candidatos do bloco de imagens a ser processado (ou obter S partes de informações de movimento de candidato original usadas para construir a lista de candidatos do bloco de imagens a ser processado), onde S é um número inteiro maior que ou igual a O.
[0319] Com referência à FIG. 6A, um ou mais blocos de referência de domínio de tempo do bloco de imagens atual pode ser entendido como um bloco de imagens em um bloco co-localizado do bloco de imagens atual ou um bloco adjacente ao domínio espacial de um bloco co-localizado do bloco de imagens atual. Por exemplo, o bloco de referência de domínio de tempo pode incluir um bloco adjacente ao domínio espacial inferior direito H de um bloco co-localizado
(co-located block) do bloco de imagens atual, um bloco médio superior esquerdo do bloco co-localizado, ou um bloco inferior direito Ctr do bloco co-localizado. O bloco co-localizado é um bloco de imagens que está em uma imagem de referência e cujo tamanho, forma e coordenadas são iguais como àqueles do bloco de imagens atual, ou o bloco co-localizado é um bloco de imagens que está na imagem de referência, que deriva a partir de uma posição especificada do bloco de imagens atual por um deslocamento, e cujo tamanho e forma são iguais como àqueles do bloco de imagens atual.
[0320] Etapa 1131: Quando uma quantidade de partes de informações de movimento de candidato na lista de candidatos do bloco de imagens a ser processado é menor que uma quantidade alvo, obter T partes de informações de movimento de candidato combinado, onde as primeiras informações de movimento de candidato combinado nas T informações de movimento de candidato combinado são obtidas pr ponderação, usando-se os fatores de ponderação correspondentes, P partes de informações de movimento de candidato que são previamente obtidas, P é um número inteiro maior que ou igual a 2, os fatores de ponderação wpi para pelo menos duas dentre as P partes de informações de movimento de candidato são, respectivamente, valores maiores que O e menores que 1, e uma soma dos fatores de ponderação para as P partes de informações de movimento de candidato é 1, de modo que as T partes de novas informações de movimento de candidato combinado construídas na lista de candidatos do bloco de imagens atual sejam obtidas, onde T é um número inteiro maior que ou igual a 1. Preferivelmente, o fator de ponderação Wpi para cada uma dentre as P partes de informações de movimento de candidato pode ser um valor maior que O e menor que 1.
[0321] A quantidade alvo é uma quantidade máxima pré-ajustada de partes de informações de movimento de candidato na lista de candidatos do bloco de imagens atual; ou a quantidade alvo é uma quantidade de partes de informações de movimento de candidato determinada usando-se um identificador de índice obtido para analisar um fluxo de bits.
[0322] Deve ser entendido que as P partes de informações de movimento de candidato podem ser P partes de informações de movimento de candidato original obtidas, por exemplo, no processo 1110. Alternativamente, as P partes de informações de movimento de candidato podem ser (P-X) partes de informações de movimento de candidato original e X partes de informações de movimento de candidato não original (por exemplo, as informações de movimento de candidato combinado previamente obtidas), onde X é um número inteiro positivo menor que ou igual a P.
[0323] Opcionalmente, nesta modalidade da presente invenção, o método pode incluir adicionalmente:
[0324] Etapa 1133: Quando uma quantidade de partes de informações de movimento de candidato na lista de candidatos do bloco de imagens a ser processado é menor que um quantidade alvo, combinar dois grupos de informações de movimento de candidato do tipo original preditivo unidirecional que são incluídos na lista de candidatos, para obter informações de movimento de candidato bipreditivo combinado na lista de candidatos do bloco de imagens a ser processado.
[0325] Deve ser observado que a etapa 1133 pode ser realizada antes da etapa 1131, ou pode ser realizada depois da etapa 1131. Isto não é limitado nesta aplicação.
[0326] A FIG. 12 é um diagrama esquemático do exemplo de adição de informações de movimento de candidato bipreditivo combinado (candidato de mesclagem bipreditivo combinado) a uma lista de candidatos do modo de mesclagem de acordo com uma modalidade deste pedido. Especificamente, dois dos candidatos originais (que têm mvLO e refldxLO ou mvL1 e refldxL1) podem ser usados para gerar um candidato de mesclagem bipreditivo combinado. Na FIG. 12, os dois candidatos são incluídos em uma lista de candidatos de mesclagem original. Um tipo preditivo de um candidato é preditivo unidirecional da lista O, e um tipo preditivo do outro candidato é preditivo unidirecional da lista
1. Nesta implementação possível, mvLO A e refO são obtidos a partir de uma lista O, e mvL1 B e refO são obtidos a partir de uma lista 1. Em seguida, um candidato de mesclagem preditivo bidirecional (que tem mvLO A e refO na lista O e mvL1 B e refO0 na lista 1) pode ser gerado, e se o candidato de mesclagem preditivo bidirecional for diferente de um candidato que foi incluído na lista de candidatos é verificado. Se o candidato de mesclagem preditivo bidirecional for diferente do candidato que foi incluído na lista de candidatos, o decodificador de vídeo pode incluir o candidato de mesclagem preditivo bidirecional na lista de candidatos.
[0327] Opcionalmente, em algumas implementações possíveis, nesta modalidade da presente invenção, o método pode incluir adicionalmente:
[0328] Etapa 1135: Quando a quantidade de partes de informações de movimento de candidato na lista de candidatos do bloco de imagens a ser processado é ainda menor que a quantidade alvo, por exemplo, se os candidatos adicionais gerados na maneira anterior ainda forem insuficientes, o codificador de vídeo ou decodificador de vídeo podem inserir adicionalmente um vetor de movimento zero como informações de movimento de candidato para gerar um candidato adicional ou extra.
[0329] A FIG. 13 é um diagrama esquemático do exemplo de adição de um vetor de movimento zero a uma lista de vetores de movimento preditivo de candidato do modo de mesclagem de acordo com uma modalidade deste pedido. Um vetor de movimento preditivo de candidato de mesclagem do vetor zero pode ser gerado combinando-se um vetor zero e um índice de referência que podem ser referenciados. Se um vetor de movimento preditivo de candidato do vetor zero não for repetido, o vetor de movimento preditivo de candidato do vetor zero pode ser adicionado a uma lista de vetores de movimento preditivo de candidato de mesclagem.
[0330] Deve ser entendido que a lista de candidatos pode ser usada no modo de mesclagem anterior ou outro modo preditivo para obter um vetor de movimento preditivo do bloco de imagens a ser processado, e pode ser usada em um lado do codificador, ou pode ser usada em um lado do decodificador em consistência com um lado do codificador correspondente. Por exemplo, uma quantidade de candidatos na lista de candidatos também é uma quantidade máxima pré-ajustada, e é compatível em um lado do codificador e um lado do decodificador. Uma quantidade específica não é limitada. Neste caso, para uma operação no lado do decodificador, consultar a operação no lado do codificador. Os detalhes não são descritos neste relatório novamente.
[0331] Pode ser aprendido que nesta modalidade, não apenas mais informações de movimento de candidato original (por exemplo, um vetor de movimento de um bloco de imagens não adjacente ao domínio espacial é usado como informações de movimento de candidato na lista de candidatos do bloco a ser processado) podem ser expandidas, mas também mais informações de movimento de candidato adicionais podem ser expandidas, para obter mais informações de movimento de candidato disponíveis usadas para construir a lista de candidatos, evitando ou reduzindo, desse modo, até certo ponto, a adição manual de um vetor zero para fazer com que a quantidade de candidatos na lista de candidatos atenda a quantidade alvo (por exemplo, a quantidade máxima pré- ajustada de partes de informações de movimento de candidato na lista de candidatos, ou a quantidade de partes de informações de movimento de candidato determinada usando-se o identificador de índice obtido pena análise do fluxo de bits), melhorando, desse modo, o desempenho da codificação.
[0332] A FIG. 14 é um diagrama de bloco esquemático de um aparelho 1400 para predizer informações de movimento de um bloco de imagens de acordo com uma modalidade deste pedido. Deve ser observado que o aparelho de predição 1400 é aplicável tanto para a intra quanto para a interpredição para a decodificação de uma imagem de vídeo e intra ou interpredição para a codificação de uma imagem de vídeo. Deve ser entendido que, o aparelho de predição 1400 neste relatório pode corresponder à unidade de intrapredição 46 ou à unidade de estimativa de movimento 42 na FIG. 2, ou pode corresponder à unidade de intrapredição 84 ou à unidade de compensação de movimento 82 na FIG. 3. O aparelho de predição 1400 pode incluir: uma unidade de determinação de lista de informações de movimento de candidato 1401, configurada para determinar uma lista de informações de movimento de candidato de um bloco de imagens atual, onde a lista de informações de movimento de candidato inclui pelo menos uma parte de informações de movimento de candidato combinado, as primeiras informações de movimento de candidato combinado em pelo menos uma parte de informações de movimento de candidato combinado são obtidas por ponderação de P partes de informações de movimento de candidato usando-se os fatores de ponderação correspondentes, P é um número inteiro maior que ou igual a 2, os fatores de ponderação w,6i para pelo menos duas dentre as P partes de informações de movimento de candidato são, respectivamente, valores maiores que O e menores que 1, uma soma dos fatores de ponderação para as P partes de informações de movimento de candidato é 1, e preferivelmente, o fator de ponderação wpi para cada uma dentre as P partes de informações de movimento de candidato pode ser um valor maior que O e menor que 1; uma unidade de determinação de informações de movimento alvo
1402, configurada para determinar informações de movimento alvo na lista de informações de movimento de candidato; e uma unidade de predição 1403, configurada para predizer informações de movimento do bloco de imagens atual com base nas informações de movimento alvo.
[0333] Em uma implementação possível, pelo menos uma parte de informações de movimento de candidato combinado inclui adicionalmente segundas informações de movimento de candidato combinado, as segundas informações de movimento de candidato combinado são obtidas por ponderação de M partes de informações de movimento de candidato usando-se os fatores de ponderação correspondentes, M é um número inteiro maior que ou igual a 2, os fatores de ponderação wmi para pelo menos duas dentre as M partes de informações de movimento de candidato são, respectivamente, valores maiores que O e menores que 1, pelo menos uma das P partes de informações de movimento de candidato é diferente de pelo menos uma das M partes de informações de movimento de candidato, e uma soma dos fatores de ponderação para as M partes de informações de movimento de candidato é 1.
[0334] Em uma implementação possível, as primeiras informações de movimento de candidato combinado incluem: valores ponderados de P1 vetores de movimento de candidato que estão nas P partes de informações de movimento de candidato e que correspondem a uma primeira lista de referência, e/ou valores ponderados de P2 vetores de movimento de candidato que estão nas P partes de informações de movimento de candidato e que correspondem a uma segunda lista de referência, onde 1<P1<P, 1<P2<P, P1: ou P2 é um número inteiro maior que ou igual a 2, e fatores de ponderação wpi para pelo menos duas dentre as P1 ou P2 partes de informações de movimento de candidato são respectivamente valores maiores que O e menores que 1. Deve ser entendido que uma soma dos fatores de ponderação dos P1: vetores de movimento de candidato é 1, e uma soma dos fatores de ponderação para os P2 vetores de movimento de candidato é 1.
[0335] As segundas informações de movimento de candidato combinado incluem: valores ponderados de M': vetores de movimento de candidato que estão nas M partes de informações de movimento de candidato e que correspondem à primeira lista de referência, e/ou valores ponderados de M2 vetores de movimento de candidato que estão nas M partes de informações de movimento de candidato e que correspondem à segunda lista de referência, onde 1<M1:<SM, 1<M2SM, M1: ou M2 é um número inteiro maior que ou igual a 2, e fatores de ponderação wmi para pelo menos duas dentre as M: ou M2 partes de informações de movimento de candidato são respectivamente valores maiores que O e menores que 1. Deve ser entendido que uma soma dos fatores de ponderação para os M: vetores de movimento de candidato é 1, e uma soma dos fatores de ponderação para os M>2 vetores de movimento de candidato é 1.
[0336] Em uma implementação possível, as P partes de informações de movimento de candidato incluem as primeiras informações de movimento de candidato correspondentes a um primeiro identificador de índice e as segundas informações de movimento de candidato correspondentes a um segundo identificador de índice, o primeiro identificador de índice é menor que o segundo identificador de índice e, correspondentemente, um fator de ponderação para as primeiras informações de movimento de candidato é maior que ou igual a um fator de ponderação para as segundas informações de movimento de candidato.
[0337] As M partes de informações de movimento de candidato incluem as terceiras informações de movimento de candidato correspondentes a um terceiro identificador de índice e as quartas informações de movimento de candidato correspondentes a um quarto identificador de índice, o terceiro identificador de índice é menor que o quarto identificador de índice e, correspondentemente, um fator de ponderação para as terceiras informações de movimento de candidato é maior que ou igual a um fator de ponderação para as quartas informações de movimento de candidato.
[0338] Em uma implementação possível, as P partes de informações de movimento de candidato são P partes de informações de movimento de candidato original; ou as P partes de informações de movimento de candidato são (P-X) partes de informações de movimento de candidato original e X partes de informações de movimento de candidato não original, onde X é um número inteiro positivo menor que ou igual a P.
[0339] As M partes de informações de movimento de candidato são M partes de informações de movimento de candidato original; ou as M partes de informações de movimento de candidato são (M-Y) partes de informações de movimento de candidato original e Y partes de informações de movimento de candidato não original, onde Y é um número inteiro positivo menor que ou igual aM.
[0340] As informações de movimento de candidato original incluem informações de movimento de um ou mais blocos de referência de domínio espacial do bloco de imagens atual, informações de movimento de um ou mais blocos de referência de domínio de tempo do bloco de imagens atual, e/ou informações de movimento de um ou mais blocos de referência intervisualização do bloco de imagens atual; e as informações de movimento de candidato não original incluem informações de movimento de candidato dimensionado, as primeiras informações de movimento de candidato combinado, as segundas informações de movimento de candidato combinado, informações de movimento de candidato bipreditivo combinado, e/ou informações de movimento zero, onde cada uma das informações de movimento de candidato dimensionado inclui um vetor de movimento que aponta para um primeiro quadro de referência alvo e que está na primeira lista de referência, e/ou um vetor de movimento que aponta para um segundo quadro de referência alvo e que está na segunda lista de referência.
[0341] EM uma implementação possível, as informações de movimento de candidato dimensionado são obtidas pelo unidade de determinação de lista de informações de movimento de candidato 1401 usando- Se as seguintes etapas: determinar o primeiro quadro de referência alvo que é do bloco de imagens atual e que corresponde à primeira lista de referência e/ou o segundo quadro de referência alvo que é do bloco de imagens atual e que corresponde à segunda lista de referência; determinar se uma imagem de referência que é incluída em particular informações de movimento de candidato e que corresponde à primeira lista de referência é a mesma como o primeiro quadro de referência alvo, e/ou se uma imagem de referência que é incluída em informações de movimento de candidato particulares e que corresponde à segunda lista de referência é a mesma como o segundo quadro de referência alvo; e se a imagem de referência que é incluída nas informações de movimento de candidato e que corresponde à primeira lista de referência for diferente do primeiro quadro de referência alvo, dimensionar com base em uma distância de domínio de tempo ou uma distância intervisualização, um vetor de movimento que é incluído nas informações de movimento de candidato e que corresponde à primeira lista de imagem de referência, para obter o vetor de movimento que aponta para o primeiro quadro de referência alvo; e/ou se a imagem de referência que é incluída nas informações de movimento de candidato e que corresponde à segunda lista de referência for diferente do segundo quadro de referência alvo, dimensionar com base em uma distância de domínio de tempo ou uma distância intervisualização, um vetor de movimento que é incluído nas informações de movimento de candidato e que corresponde à segunda lista de imagem de referência, para obter o vetor de movimento que aponta para o segundo quadro de referência alvo.
[0342] O primeiro quadro de referência alvo é um quadro de referência que corresponde à primeira lista de referência e que é de informações de movimento de candidato usadas com mais frequência na lista de informações de movimento de candidato, ou um quadro de referência que corresponde à primeira lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice na lista de informações de movimento de candidato; alternativamente, o segundo quadro de referência alvo é um quadro de referência que corresponde à segunda lista de referência e que é de informações de movimento de candidato usadas com mais frequência na lista de informações de movimento de candidato, ou um quadro de referência que corresponde à segunda lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice na lista de informações de movimento de candidato.
[0343] Em uma implementação possível, por exemplo, para um modo de mesclagem, a unidade de predição é configurada, especificamente, para usar as informações de movimento alvo como as informações de movimento do bloco de imagens atual.
[0344] Em outra implementação possível, por exemplo, para um modo AMVP, as informações de movimento incluem uma predição de vetor de movimento, e a unidade de predição é, especificamente, configurada para: analisar um fluxo de bits para obter uma diferença de predição de vetor de movimento do bloco de imagens atual; e usar uma soma da predição de vetor de movimento nas informações de movimento alvo e a diferença de predição de vetor de movimento como um vetor de movimento do bloco de imagens atual.
[0345] Quando o aparelho é configurado para codificar o bloco de imagens atual, a unidade de determinação de informações de movimento alvo é configurada, especificamente, para determinar as informações de movimento alvo na lista de informações de movimento de candidato, onde um custo de distorção de taxa para codificar o bloco de imagens atual usando-se as informações de movimento alvo é o mínimo; ou quando o aparelho é configurado para decodificar o bloco de imagens atual, a unidade de determinação de informações de movimento alvo é, especificamente, configurada para determinar, na lista de informações de movimento de candidato, informações de movimento alvo indicadas por um quinto identificador de índice, onde o quinto identificador de índice é usado para indicar as informações de movimento alvo na lista de informações de movimento de candidato.
[0346] Deve ser observado que a lista de informações de movimento de candidato inclui um ou mais tipos de informações de movimento de candidato, por exemplo, uma ou mais informações de movimento de domínio de tempo (também referido como informações de movimento em uma direção de domínio de tempo), informações de movimento intervisualização (também referidas como informações de movimento em uma direção intervisualização), e/ou informações de intra-movimento.
[0347] Para HEVC, as informações de movimento de candidato neste relatório são informações de movimento em uma direção de domínio de tempo, em outras palavras, o vetor de movimento aponta para os quadros de referência de um mesmo ponto de vista em diferentes momentos.
[0348] Para 3D-HEVC (extensão 3D de HEVC), as informações de movimento de candidato podem não apenas se referir às informações de movimento em uma direção de domínio de tempo, mas também se referir às informações de movimento em uma direção intervisualização, em outras palavras, o vetor de movimento aponta para os quadros de referência de diferentes pontos de vista em um mesmo momento/diferentes momentos.
[0349] Para HEVC SCC (extensões de codificação de conteúdo de tela HEVC, HEVC Screen Content Coding Extensions), as informações de movimento de candidato podem não apenas se referir às informações de movimento em uma direção de domínio de tempo, mas também se referir às informações de intra-movimento, em outras palavras, o vetor de movimento aponta para um quadro atual reconstuído.
[0350] Portanto, uma lista de informações de movimento de candidato em um modo de mesclagem/pular/AMVP pode incluir informações de movimento em uma direção de domínio de tempo, informações de movimento em uma direção intervisualização, ou informações de intra-movimento. Especificamente, uma lista de mesclagem/pular pode incluir uma pluralidade de tipos de informações de movimento (domínio de tempo/intervisualização/intra). Entretanto, uma lista AMVP usualmente inclui apenas um tipo de informações de movimento.
[0351] Pode ser aprendido que no aparelho de predição nesta modalidade deste pedido, pelo menos uma parte de informações de movimento de candidato combinado pode ser construída por ponderação de uma pluralidade de partes de informações de movimento de candidato, de modo que mais informações de movimento de candidato usadas para referência possam ser encontradas o máximo possível, enriquecendo, desse modo, as informações de movimento de candidato, e reduzindo ou evitando, até certo ponto, o preenchimento da lista de informações de movimento de candidato com informações de movimento de candidato com vetor zero. Isto melhora a precisão da predição de vetor de movimento até certo ponto, melhorando, desse modo, o desempenho da codificação e decodificação.
[0352] A FIG. 15 é um diagrama de bloco esquemático de uma implementação de um dispositivo de codificação ou um dispositivo de decodificação (referido como um dispositivo de decodificação 1500, para abreviação) de acordo com uma modalidade deste pedido. O dispositivo de decodificação 1500 pode incluir um processador 1510, uma memória 1530, e um sistema de barramento 1550. O processador e a memória são conectados um ao outro usando-se o Sistema de barramento. A memória é configurada para armazenar uma instrução. O processador é configurado para executar a instrução armazenada na memória. Uma memória do dispositivo de codificação armazena código de programa, e um processador pode chamar o código de programa armazenado na memória, para realizar vários métodos de codificação ou decodificação de vídeo descritos nesta aplicação, particularmente os métodos de codificação ou decodificação de vídeo em vários modos de interpredição ou modos de intrapredição, e métodos de predição de informações de movimento em vários modos de interpredição ou modos de intrapredição. Os detalhes não são descritos novamente neste relatório para evitar a repetição.
[0353] Nesta modalidade deste pedido, o processador 1510 pode ser uma unidade de processamento (Central Processing Unit, “CPU” para abreviação), ou o processador 1510 pode ser outro processador de uso geral, um processador de sinal digital (DSP), um circuito integrado específico da aplicação (ASIC), um arranjo de portas programáveis (FPGA) ou outro dispositivo lógico programável, uma porta discreta ou dispositivo lógico do transistor, um componente de hardware discreto ou semelhantes. O processador de uso geral pode ser um microprocessador, o processador pode ser qualquer processador convencional ou semelhantes.
[0354] A memória 1530 pode incluir um dispositivo de memória somente de leitura (ROM) ou um dispositivo de memória de acesso aleatório (RAM). Qualquer outro tipo apropriado de dispositivo de armazenamento também pode ser usado como a memória 1530. A memória 1530 pode incluir código e dados 1531 que são acessado pelo processador 1510 usando-se o barramento 1550. A memória 1530 pode incluir adicionalmente um sistema operacional 1533 e um programa de aplicação 1535. O programa de aplicação 1535 inclui pelo menos um programa que permite que o processador 1510 realize o método de codificação e decodificação de vídeo descrito nesta aplicação (particularmente, o método para predizer informações de movimento de um bloco de imagens descrito nesta aplicação). Por exemplo, o programa de aplicação 1535 pode incluir as aplicações 1 a N, e incluir adicionalmente uma aplicação de codificação e decodificação de vídeo (referida como uma aplicação de decodificação de vídeo, para abreviação) que realiza o método de codificação e decodificação de vídeo descrito nesta aplicação.
[0355] Além de um barramento de dados, o sistema de barramento 1550 pode incluir adicionalmente um barramento de energia, um barramento de controle, um barramento de sinal de estado e semelhantes. Entretanto, para a descrição clara, os barramentos são todos marcados como o sistema de barramento 1550 na figura.
[0356] Opcionalmente, o dispositivo de decodificação 1500 pode incluir adicionalmente um ou mais dispositivos de entrada, por exemplo, uma tela
1570. Em um exemplo, a tela 1570 pode ser uma tela sensível ou uma tela sensível ao toque que combina uma tela e uma unidade de toque que de maneira operável detecta a entrada do toque. A tela 1570 pode ser conectada ao processador 1510 usando-se o barramento 1550.
[0357] A FIG. 16 mostra os ganhos de desempenho da codificação e decodificação trazidos pela solução nesta modalidade deste pedido em uma configuração RA de acesso aleatório e uma configuração LP de baixo atraso. À solução nesta modalidade deste pedido ajuda a melhorar a precisão da predição de informações de movimento (por exemplo, um vetor de movimento) de um bloco de imagens, e economizar uma taxa de bits quando a qualidade do vídeo é a mesma, melhorando, desse modo, o desempenho da codificação e decodificação.
[0358] Um técnico no assunto pode entender que, as funções descritas com referência a vários blocos lógicos ilustrativos, módulos e etapas de algoritmos divulgados e descritos nesta especificação podem ser implementados por hardware, software, firmware, ou qualquer combinação dos mesmos. Se as funções forem implementadas por software, as funções descritas com referência a vários blocos lógicos ilustrativos, módulos e etapas podem ser armazenados em ou transmitidos em uma mídia legível por computador como uma ou mais instruções ou códigos e executados por uma unidade de processamento com base em hardware. A mídia legível por computador pode incluir uma mídia de armazenamento legível por computador, que corresponde a uma mídia tangível, tal como uma mídia de armazenamento de dados, ou uma mídia de comunicações incluindo qualquer mídia que facilite a transferência de um programa de computador a partir de um local para outro (por exemplo, de acordo com um protocolo de comunicações). Desta maneira, a mídia legível por computador usualmente pode corresponder a (1) uma mídia de armazenamento legível por computador tangível não transitória ou (2) uma mídia de comunicações, tais como um sinal ou uma portadora. A mídia de armazenamento de dados pode ser qualquer mídia disponível que possa ser acessada por um ou mais computadores ou um ou mais processadores para recuperar instruções, código, e/ou estruturas de dados para implementar as tecnologias descritas neste pedido. Um produto de programa de computador pode incluir a mídia legível por computador.
[0359] A título do exemplo, e não como limitação, tal mídia de armazenamento legível por computador pode incluir uma RAM, uma ROM, uma EEPROM, uma CD-ROM ou outro aparelho de armazenamentode disco compacto, um aparelho de armazenamento de disco magnético ou outro aparelho de armazenamento magnético, uma memória flash, ou qualquer outra mídia pode ser usada para armazenar o código de programa desejado em uma forma de uma instrução ou uma estrutura de dados e que pode ser acessada por um computador. Além disso, qualquer conexão é adequadamente denominada uma mídia legível por computador. Por exemplo, se uma instrução for transmitida a partir de um website, servidor, ou outra fonte remota através de um cabo coaxial, uma fibra óptica, um par trançado, uma linha de assinante digital (DSL), ou tecnologias sem fio, tais como infravermelho, rádio, e micro-ondas, o cabo coaxial, fibra óptica, par trançado, DSL, ou tecnologias sem fio, tais como infravermelho, rádio, e micro-ondas são incluídas na definição de mídia. Entretanto, deve ser entendido que a mídia de armazenamento legível por computador e a mídia de armazenamento de dados não incluem conexões, portadoras, sinais, ou outras mídias transitórias, mas realmente significa mídia de armazenamento tangível não transitória. Os discos ou disquetes usados nesta especificação incluem um disco compacto (CD), um disco laser, um disco óptico, um disco versátil digital (DVD), e um disco Blu-ray. Os disquetes usualmente reproduzem os dados magneticamente, enquanto os discos reproduzem os dados opticamente a laser. As combinações do precedente também devem ser incluídas no escopo da mídia legível por computador.
[0360] Uma função correspondente pode ser realizada por um ou mais processadores, tais como um ou mais processadores de sinal digital (DSP), microprocessadores de uso geral, circuitos integrados específicos da aplicação (ASIC), arranjo de portas programáveis em campo (FPGA), ou outros circuitos lógicos discretos ou integrados equivalentes. Portanto, o termo “processador” usado nesta especificação pode referir-se a qualquer uma das estruturas anteriores ou qualquer outra estrutura adequada para implementar as tecnologias descritas nesta especificação. Além disso, em alguns aspectos, as funções descritas com referência aos vários blocos lógicos ilustrativos, módulos, e etapas descritos nesta especificação podem ser fornecidos dentro de módulos de hardware e/ou software dedicados configurados para codificação e decodificação, ou podem ser integralmente incorporados em um codec combinado. Além disso, as tecnologias podem ser completamente implementadas em um ou mais circuitos ou elementos lógicos. Em um exemplo, vários blocos lógicos ilustrativos, unidades, e módulos no codificador de vídeo e no decodificador de vídeo 30 podem ser entendidos como dispositivos ou elementos lógicos de circuito correspondentes.
[0361] As tecnologias deste pedido podem ser implementadas em vários aparelhos ou dispositivos, incluindo um monofone sem fio, um circuito integrado (IC), ou um grupo de ICs (por exemplo, um conjunto de chips). Vários componentes, módulos, ou unidades descritos neste pedido são intencionados a enfatizar um aspecto de função de um aparelho configurado para realizar a tecnologia divulgado, mas não necessariamente precisam ser implementados por diferentes unidades de hardware. Realmente, como descrito acima, várias unidades podem ser combinadas, em combinação com software e/ou firmware apropriado, em unidades de hardware de um codec, ou ser fornecidas por unidades de hardware interoperáveis (incluindo um ou mais processadores descritos acima).
[0362] As descrições anteriores são meramente exemplos de implementações específicas desta aplicação, mas não são intencionadas a limitar o escopo de proteção deste pedido. Qualquer variação ou substituição prontamente identificada por um técnico no assunto dentro do escopo técnico divulgado neste pedido pode ser feita, todos devem estar dentro do escopo de proteção deste pedido. Portanto, o escopo de proteção deste pedido deve estar sujeito ao escopo de proteção das reivindicações.
Claims (56)
1. Método para predição de informações de movimento de um bloco de imagens para uso em um aparelho de codificação de vídeo, e o método compreende: determinar uma lista de informações de movimento de candidato de um bloco de imagens atual, em que a lista de informações de movimento de candidato compreende pelo menos uma parte de informações de movimento de candidato combinado, primeiras informações de movimento de candidato combinado em pelo menos uma parte de informações de movimento de candidato combinado são obtidas por ponderação de P partes de informações de movimento de candidato usando-se fatores de ponderação correspondentes, P é um número inteiro maior que ou igual a 2, e fatores de ponderação wpi para pelo menos duas dentre as P partes de informações de movimento de candidato são respectivamente valores maiores que O e menores que 1; determinar informações de movimento alvo na lista de informações de movimento de candidato; e predizer informações de movimento do bloco de imagens atual com base nas informações de movimento alvo, em que as informações de movimento são usadas para intrapredição do bloco de imagens atual ou interpredição do bloco de imagens atual.
2. Método, de acordo com a reivindicação 1, em que a pelo menos uma parte de informações de movimento de candidato combinado compreende adicionalmente segundas informações de movimento de candidato combinado, as segundas informações de movimento de candidato combinado são obtidas por ponderação de M partes de informações de movimento de candidato usando- se fatores de ponderação correspondentes, M é um número inteiro maior que ou igual a 2, e fatores de ponderação wmi para pelo menos duas dentre as M partes de informações de movimento de candidato são respectivamente valores maiores que O e menores que 1.
3. Método, de acordo com a reivindicação 1, em que cada uma dentre as P partes de informações de movimento de candidato compreende um vetor de movimento correspondente a uma primeira lista de referência e um índice de imagem de referência correspondente à primeira lista de referência; e/ou um vetor de movimento correspondente a uma segunda lista de referência e um
Índice de imagem de referência correspondente à segunda lista de referência; e P1 índices de imagem de referência que estão nas P partes de informações de movimento de candidato e que correspondem à primeira lista de referência são os mesmos, ou P1 índices de imagem de referência que estão nas P partes de informações de movimento de candidato e que correspondem à primeira lista de referência são os mesmos que um índice de uma primeira imagem de referência alvo; ou P2 índices de imagem de referência que estão nas P partes de informações de movimento de candidato e que correspondem à segunda lista de referência são os mesmos, ou P2 índices de imagem de referência que estão nas P partes de informações de movimento de candidato e que correspondem à segunda lista de referência são os mesmos que um índice de uma segunda imagem de referência alvo, em que 1<P1<P, 1<P2<P e P1: ou P2 é um número inteiro maior que ou igual a
2.
4. Método, de acordo com a reivindicação 1, 2 ou 3, em que as primeiras informações de movimento de candidato combinado compreendem: valores ponderados de vetores de movimento de candidato P1 que estão nas P partes de informações de movimento de candidato e que correspondem à primeira lista de referência, e/ou valores ponderados de P2 vetores de movimento de candidato que estão nas P partes de informações de movimento de candidato e que correspondem à segunda lista de referência, em que 1<P1<P, 1<P2<P, P1 ou P2 é um número inteiro maior que ou igual a 2, fatores de ponderação wpi para pelo menos dois dentre os P1: vetores de movimento de candidato são respectivamente valores maiores que O e menores que 1, e fatores de ponderação wpi para pelo menos dois dentre os P2 vetores de movimento de candidato são respectivamente valores maiores que O e menores que 1.
5. Método, de acordo com a reivindicação 2, em que as segundas informações de movimento de candidato combinado compreendem: valores ponderados de M: vetores de movimento de candidato que estão nas M partes de informações de movimento de candidato e que correspondem à primeira lista de referência, e/ou valores ponderados de M2 vetores de movimento de candidato que estão nas M partes de informações de movimento de candidato e que correspondem à segunda lista de referência, em que 1<M1<SM, 1<M2<SM, M1 ou M> é um número inteiro maior que ou igual a 2, fatores de ponderação wmi para pelo menos dois dentre os M': vetores de movimento de candidato são respectivamente valores maiores que O e menores que 1, e fatores de ponderação wmi para pelo menos dois dentre os M> vetores de movimento de candidato são respectivamente valores maiores que O e menores que 1.
6. Método, de acordo com qualquer uma das reivindicações 1 a 4, em que as P partes de informações de movimento de candidato compreendem primeiras informações de movimento de candidato correspondentes a um primeiro identificador de índice e segundas informações de movimento de candidato correspondentes a um segundo identificador de Índice, o primeiro identificador de índice é menor que o segundo identificador de Índice, e um fator de ponderação para as primeiras informações de movimento de candidato é maior que ou igual a um fator de ponderação para as segundas informações de movimento de candidato.
7. Método, de acordo com a reivindicação 2, 3 ou 5, em que as M partes de informações de movimento de candidato compreendem terceiras informações de movimento de candidato correspondentes a um terceiro identificador de índice e quartas informações de movimento de candidato correspondentes a um quarto identificador de índice, o terceiro identificador de índice é menor que o quarto identificador de índice, e um fator de ponderação para as terceiras informações de movimento de candidato é maior que ou igual a um fator de ponderação para as quartas informações de movimento de candidato.
8. Método, de acordo com a reivindicação 1, 2, 3, 4 ou 6, em que as P partes de informações de movimento de candidato são P partes de informações de movimento de candidato original; ou as P partes de informações de movimento de candidato são (P-X) partes de informações de movimento de candidato original e X partes de informações de movimento de candidato não original, em que X é um número inteiro positivo menor que ou igual a P.
9. Método, de acordo com a reivindicação 2, 3, 5 ou 7, em que as M partes de informações de movimento de candidato são M partes de informações de movimento de candidato original; ou as M partes de informações de movimento de candidato são (M-Y) partes de informações de movimento de candidato original e Y partes de informações de movimento de candidato não original, em que Y é um número inteiro positivo menor que ou igual a M.
10. Método, de acordo com a reivindicação 8 ou 9, em que as informações de movimento de candidato original compreendem informações de movimento de um ou mais blocos de referência de domínio espacial do bloco de imagens atual, informações de movimento de um ou mais blocos de referência de domínio de tempo do bloco de imagens atual, e/ou informações de movimento de um ou mais blocos de referência intervisualização do bloco de imagens atual; e as informações de movimento de candidato não original compreendem informações de movimento de candidato dimensionado, as primeiras informações de movimento de candidato combinado, as segundas informações de movimento de candidato combinado, informações de movimento de candidato bipreditivo combinado, e/ou informações de movimento zero, em que cada uma das informações de movimento de candidato dimensionado compreende um vetor de movimento que aponta para a primeira imagem de referência alvo e que está na primeira lista de referência, e/ou um vetor de movimento que aponta para a segunda imagem de referência alvo e que está na segunda lista de referência.
11. Método, de acordo com a reivindicação 10, em que as informações de movimento de candidato dimensionado são obtidas usando-se o seguinte método: determinar a primeira imagem de referência alvo que é do bloco de imagens atual e que corresponde à primeira lista de referência e/ou a segunda imagem de referência alvo que é do bloco de imagens atual e que corresponde à segunda lista de referência; determinar se uma imagem de referência que está compreendida nas informações de movimento de candidato e que corresponde à primeira lista de referência é a mesma que a primeira imagem de referência alvo, e/ou se uma imagem de referência que está compreendida nas informações de movimento de candidato e que corresponde à segunda lista de referência é a mesma que a segunda imagem de referência alvo; e se a imagem de referência que está compreendida nas informações de movimento de candidato e que corresponde à primeira lista de referência for diferente da primeira imagem de referência alvo, dimensionar com base em uma distância de domínio de tempo ou em uma distância de inter-visualização, o vetor de movimento que está compreendido nas informações de movimento de candidato e que corresponde à primeira lista de referência, para obter o vetor de movimento que aponta para a primeira imagem de referência alvo; e/ou se a imagem de referência que está compreendida nas informações de movimento de candidato e que corresponde à segunda lista de referência for diferente da segunda imagem de referência alvo, dimensionar, com base em uma distância de domínio de tempo ou em uma distância de inter-visualização, o vetor de movimento que está compreendido nas informações de movimento de candidato e que corresponde à segunda lista de referência, para obter o vetor de movimento que aponta para a segunda imagem de referência alvo.
12. Método, de acordo com a reivindicação 11, em que existem quatro candidatos de mesclagem originais na lista de informações de movimento de candidato; e correspondentemente, a primeira imagem de referência alvo é uma imagem de referência que corresponde à primeira lista de referência e que é de um candidato de mesclagem original usado com mais frequência nos candidatos de mesclagem originais na lista de informações de movimento de candidato, ou uma imagem de referência que corresponde à primeira lista de referência e que é de um candidato de mesclagem original que tem um menor identificador de Índice de imagem de referência nos candidatos de mesclagem originais na lista de informações de movimento de candidato, ou uma imagem de referência que corresponde à primeira lista de referência e que é de um candidato de mesclagem original que tem um menor identificador de índice nos candidatos de mesclagem originais na lista de informações de movimento de candidato; ou a segunda imagem de referência alvo é uma imagem de referência que corresponde à segunda lista de referência e que é de um candidato de mesclagem original usado com mais frequência nos candidatos de mesclagem originais na lista de informações de movimento de candidato, ou uma imagem de referência que corresponde à segunda lista de referência e que é de um candidato de mesclagem original que tem um menor identificador de índice de imagem de referência nos candidatos de mesclagem originais na lista de informações de movimento de candidato, ou uma imagem de referência que corresponde à segunda lista de referência e que é de um candidato de mesclagem original que tem um menor identificador de índice nos candidatos de mesclagem originais na lista de informações de movimento de candidato.
13. Método, de acordo com a reivindicação 11, em que a determinação da primeira imagem de referência alvo que é do bloco de imagens atual e que corresponde à primeira lista de referência compreende: se uma quantidade de partes de informações de movimento de candidato na lista de informações de movimento de candidato for menor que ou igual a uma quantidade R predefinida, determinar que a primeira imagem de referência alvo é uma imagem de referência que corresponde à primeira lista de referência e que é de informações de movimento de candidato usadas com mais frequência nas informações de movimento de candidato na lista de informações de movimento de candidato, ou uma imagem de referência que corresponde à primeira lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice de imagem de referência nas informações de movimento de candidato na lista de informações de movimento de candidato, ou uma imagem de referência que corresponde à primeira lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice nas informações de movimento de candidato na lista de informações de movimento de candidato; ou se uma quantidade de partes de informações de movimento de candidato na lista de informações de movimento de candidato for maior que uma quantidade R predefinida (por exemplo, 4), determinar que a primeira imagem de referência alvo é uma imagem de referência que corresponde à primeira lista de referência e que é de informações de movimento de candidato usadas com mais frequência nas primeiras R partes de informações de movimento de candidato na lista de informações de movimento de candidato, ou uma imagem de referência que corresponde à primeira lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice de imagem de referência nas primeiras R partes de informações de movimento de candidato na lista de informações de movimento de candidato, ou uma imagem de referência que corresponde à primeira lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice nas primeiras R partes de informações de movimento de candidato na lista de informações de movimento de candidato.
14. Método, de acordo com a reivindicação 11, em que a determinação da segunda imagem de referência alvo que é do bloco de imagens atual e que corresponde à segunda lista de referência compreende: se uma quantidade de partes de informações de movimento de candidato na lista de informações de movimento de candidato for menor que ou igual a uma quantidade R predefinida, determinar que a segunda imagem de referência alvo é uma imagem de referência que corresponde à segunda lista de referência e que é de informações de movimento de candidato usadas com mais frequência nas informações de movimento de candidato na lista de informações de movimento de candidato, ou uma imagem de referência que corresponde à segunda lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice de imagem de referência nas informações de movimento de candidato na lista de informações de movimento de candidato, ou uma imagem de referência que corresponde à segunda lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice nas informações de movimento de candidato na lista de informações de movimento de candidato; ou se uma quantidade de partes de informações de movimento de candidato na lista de informações de movimento de candidato for maior que uma quantidade R predefinida, determinar que a segunda imagem de referência alvo é uma imagem de referência que corresponde à segunda lista de referência e que é de informações de movimento de candidato usadas com mais frequência nas primeiras R partes de informações de movimento de candidato na lista de informações de movimento de candidato, ou uma imagem de referência que corresponde à segunda lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice de imagem de referência nas primeiras R partes de informações de movimento de candidato na lista de informações de movimento de candidato, ou uma imagem de referência que corresponde à segunda lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice nas primeiras R partes de informações de movimento de candidato na lista de informações de movimento de candidato.
15. Método, de acordo com a reivindicação 11, em que a determinação da primeira imagem de referência alvo que é do bloco de imagens atual e que corresponde à primeira lista de referência e/ou da segunda imagem de referência alvo que é do bloco de imagens atual e que corresponde à segunda lista de referência compreende: determinar que a primeira imagem de referência alvo é uma imagem de referência que corresponde à primeira lista de referência e que é de informações de movimento de candidato usadas com mais frequência nas P ou M partes de informações de movimento de candidato a serem combinadas, ou uma imagem de referência que corresponde à primeira lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice de imagem de referência nas P ou M partes de informações de movimento de candidato, ou uma imagem de referência que corresponde à primeira lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice nas P ou M partes de informações de movimento de candidato; e/ou determinar que a segunda imagem de referência alvo é uma imagem de referência que corresponde à segunda lista de referência e que é de informações de movimento de candidato usadas com mais frequência nas P ou M partes de informações de movimento de candidato a serem combinadas, ou uma imagem de referência que corresponde à segunda lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice de imagem de referência nas P ou M partes de informações de movimento de candidato, ou uma imagem de referência que corresponde à segunda lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice nas partes P ou M de informações de movimento de candidato.
16. Método, de acordo com qualquer uma das reivindicações 1 a 15, em que a predição de informações de movimento do bloco de imagens atual com base nas informações de movimento alvo compreende: usar as informações de movimento alvo como as informações de movimento do bloco de imagens atual.
17. Método, de acordo com qualquer uma das reivindicações 1 a 15, em que as informações de movimento compreendem uma predição de vetor de movimento, e a predição de informações de movimento do bloco de imagens atual com base nas informações de movimento alvo compreende: analisar um fluxo de bits para obter uma diferença de vetor de movimento do bloco de imagens atual; e usar uma soma da predição de vetor de movimento nas informações de movimento alvo e a diferença de vetor de movimento como um vetor de movimento do bloco de imagens atual.
18. Método, de acordo com qualquer uma das reivindicações 1 a 17, em que o método é usado para codificar o bloco de imagens atual, e a determinação de informações de movimento alvo compreende: determinar as informações de movimento alvo na lista de informações de movimento de candidato, em que um custo de distorção de taxa para codificar o bloco de imagens atual usando-se as informações de movimento alvo é o mínimo; ou o método é usado para decodificar o bloco de imagens atual, e a determinação de informações de movimento alvo compreende: determinar, na lista de informações de movimento de candidato, informações de movimento alvo indicadas por um quinto identificador de índice, em que o quinto identificador de índice é usado para indicar as informações de movimento alvo na lista de informações de movimento de candidato.
19. Aparelho para predição de informações de movimento de um bloco de imagens para uso em um aparelho de codificação de vídeo, em que as informações de movimento são usadas para intrapredição ou interpredição, e o aparelho compreende: uma unidade de determinação de lista de informações de movimento de candidato, configurada para determinar uma lista de informações de movimento de candidato de um bloco de imagens atual, em que a lista de informações de movimento de candidato compreende pelo menos uma parte de informações de movimento de candidato combinado, as primeiras informações de movimento de candidato combinado na pelo menos uma parte de informações de movimento de candidato combinado são obtidas pela ponderação de P partes de informações de movimento de candidato usando-se fatores de ponderação correspondentes, P é um número inteiro maior que ou igual a 2, e fatores de ponderação wpi para pelo menos duas dentre as P partes de informações de movimento de candidato são respectivamente valores maiores que O e menores que 1; uma unidade de determinação de informações de movimento alvo, configurada para determinar informações de movimento alvo na lista de informações de movimento de candidato; e uma unidade de predição, configurada para predizer informações de movimento do bloco de imagens atual com base nas informações de movimento alvo.
20. Aparelho, de acordo com a reivindicação 19, em que a pelo menos uma parte de informações de movimento de candidato combinado compreende adicionalmente segundas informações de movimento de candidato combinado, as segundas informações de movimento de candidato combinado são obtidas pela ponderação de M partes de informações de movimento de candidato usando-se fatores de ponderação correspondentes, M é um número inteiro maior que ou igual a 2, e fatores de ponderação wmi para pelo menos duas dentre as M partes de informações de movimento de candidato são respectivamente valores maiores que O e menores que 1.
21. Aparelho, de acordo com a reivindicação 19, em que cada uma dentre as P partes de informações de movimento de candidato compreende um vetor de movimento correspondente a uma primeira lista de referência e um índice de imagem de referência correspondente à primeira lista de referência; e/ou um vetor de movimento correspondente a uma segunda lista de referência e um índice de imagem de referência correspondente à segunda lista de referência; e P1 índices de imagem de referência que estão nas P partes de informações de movimento de candidato e que correspondem à primeira lista de referência são os mesmos, ou P1 índices de imagem de referência que estão nas P partes de informações de movimento de candidato e que correspondem à primeira lista de referência são os mesmos que um índice de uma primeira imagem de referência alvo; ou P2 índices de imagem de referência que estão nas P partes de informações de movimento de candidato e que correspondem à segunda lista de referência são os mesmos, ou P2 índices de imagem de referência que estão nas P partes de informações de movimento de candidato e que correspondem à segunda lista de referência são os mesmos que um índice de uma segunda imagem de referência alvo, em que 1<P1<P, 1<P2<P, e P1: ou P2 é um número inteiro maior que ou igual a
2.
22. Aparelho, de acordo com a reivindicação 19, 20, ou 21, em que as primeiras informações de movimento de candidato combinado compreendem: valores ponderados de P1 vetores de movimento de candidato que estão nas P partes de informações de movimento de candidato e que correspondem à primeira lista de referência, e/ou valores ponderados de P2 vetores de movimento de candidato que estão nas P partes de informações de movimento de candidato e que correspondem à segunda lista de referência, em que 1<P1<P, 1<P2<P, P1 ou P2> é um número inteiro maior que ou igual a 2, fatores de ponderação wpi para pelo menos dois dentre os P1 vetores de movimento de candidato são respectivamente valores maiores que O e menores que 1, e fatores de ponderação wpi para pelo menos dois dentre os P2 vetores de movimento de candidato são respectivamente valores maiores que O e menores que 1.
23. Aparelho, de acordo com a reivindicação 20, em que as segundas informações de movimento de candidato combinado compreendem: valores ponderados de M: vetores de movimento de candidato que estão nas M partes de informações de movimento de candidato e que correspondem à primeira lista de referência, e/ou valores ponderados de M2 vetores de movimento de candidato que estão nas M partes de informações de movimento de candidato e que correspondem à segunda lista de referência, em que 1<M1<M, 1<M2<M, M: ou M>2 é um número inteiro maior que ou igual a 2, fatores de ponderação wmi para pelo menos dois dentre os M': vetores de movimento de candidato são respectivamente valores maiores que O e menores que 1, e fatores de ponderação wmi para pelo menos dois dentre os M2 vetores de movimento de candidato são respectivamente valores maiores que O e menores que 1.
24. Aparelho, de acordo com qualquer uma das reivindicações 19 a 22, em que as P partes de informações de movimento de candidato compreendem primeiras informações de movimento de candidato correspondentes a um primeiro identificador de índice e segundas informações de movimento de candidato correspondentes a um segundo identificador de Índice, o primeiro identificador de índice é menor que o segundo identificador de Índice, e um fator de ponderação para as primeiras informações de movimento de candidato é maior que ou igual a um fator de ponderação para as segundas informações de movimento de candidato.
25. Aparelho, de acordo com a reivindicação 20, 21, ou 23, em que as M partes de informações de movimento de candidato compreendem terceiras informações de movimento de candidato correspondentes a um terceiro identificador de índice e quartas informações de movimento de candidato correspondentes a um quarto identificador de índice, o terceiro identificador de índice é menor que o quarto identificador de índice, e um fator de ponderação para as terceiras informações de movimento de candidato é maior que ou igual a um fator de ponderação para as quartas informações de movimento de candidato.
26. Aparelho, de acordo com a reivindicação 19, 20, 21, 22, ou 24, em que as P partes de informações de movimento de candidato são P partes de informações de movimento de candidato original; ou as P partes de informações de movimento de candidato são (P-X) partes de informações de movimento de candidato original e X partes de informações de movimento de candidato não original, em que X é um número inteiro positivo menor que ou igual a P.
27. Aparelho, de acordo com a reivindicação 20, 21, 23, ou 25, em que as M partes de informações de movimento de candidato são M partes de informações de movimento de candidato original; ou as M partes de informações de movimento de candidato são (M-Y) partes de informações de movimento de candidato original e Y partes de informações de movimento de candidato não original, em que Y é um número inteiro positivo menor que ou igual a M.
28. Aparelho, de acordo com a reivindicação 26 ou 27, em que as informações de movimento de candidato original compreendem informações de movimento de um ou mais blocos de referência de domínio espacial do bloco de imagens atual, informações de movimento de um ou mais blocos de referência de domínio de tempo do bloco de imagens atual, e/ou informações de movimento de um ou mais blocos de referência intervisualização do bloco de imagens atual; e as informações de movimento de candidato não original compreendem informações de movimento de candidato dimensionado, as primeiras informações de movimento de candidato combinado, as segundas informações de movimento de candidato combinado, informações de movimento de candidato bipreditivo combinado, e/ou informações de movimento zero, em que cada uma de informações de movimento de candidato dimensionado compreende um vetor de movimento que aponta para a primeira imagem de referência alvo e que está na primeira lista de referência, e/ou um vetor de movimento que aponta para a segunda imagem de referência alvo e que está na segunda lista de referência.
29. Aparelho, de acordo com a reivindicação 28, em que as informações de movimento de candidato dimensionado são obtidas pela unidade de determinação de lista de informações de movimento de candidato, realizando- se as seguintes etapas: determinar a primeira imagem de referência alvo que é do bloco de imagens atual e que corresponde à primeira lista de referência e/ou a segunda imagem de referência alvo que é do bloco de imagens atual e que corresponde à segunda lista de referência determinar se uma imagem de referência que está compreendida nas informações de movimento de candidato e que corresponde à primeira lista de referência é a mesma que a primeira imagem de referência alvo, e/ou se uma imagem de referência que está compreendida nas informações de movimento de candidato e que corresponde à segunda lista de referência é a mesma que a segunda imagem de referência alvo; e se a imagem de referência que está compreendida nas informações de movimento de candidato e que corresponde à primeira lista de referência for diferente da primeira imagem de referência alvo, dimensionar, com base em uma distância de domínio de tempo ou em uma distância de inter-visualização, o vetor de movimento que está compreendido nas informações de movimento de candidato e que corresponde à primeira lista de referência, para obter o vetor de movimento que aponta para a primeira imagem de referência alvo; e/ou se a imagem de referência que está compreendida nas informações de movimento de candidato e que corresponde à segunda lista de referência for diferente da segunda imagem de referência alvo, dimensionar, com base em uma distância de domínio de tempo ou em uma distância de inter-visualização, o vetor de movimento que está compreendido nas informações de movimento de candidato e que corresponde à segunda lista de referência, para obter o vetor de movimento que aponta para a segunda imagem de referência alvo.
30. Aparelho, de acordo com a reivindicação 29, em que existem quatro candidatos de mesclagem originais na lista de informações de movimento de candidato; e correspondentemente, a primeira imagem de referência alvo é uma imagem de referência que corresponde à primeira lista de referência e que é de um candidato de mesclagem original usado com mais frequência nos candidatos de mesclagem originais na lista de informações de movimento de candidato, ou uma imagem de referência que corresponde à primeira lista de referência e que é de um candidato de mesclagem original que tem um menor identificador de índice de imagem de referência nos candidatos de mesclagem originais na lista de informações de movimento de candidato, ou uma imagem de referência que corresponde à primeira lista de referência e que é de um candidato de mesclagem original que tem um menor identificador de índice nos candidatos de mesclagem originais na lista de informações de movimento de candidato; ou a segunda imagem de referência alvo é uma imagem de referência que corresponde à segunda lista de referência e que é de um candidato de mesclagem original usado com mais frequência nos candidatos de mesclagem originais na lista de informações de movimento de candidato, ou uma imagem de referência que corresponde à segunda lista de referência e que é de um candidato de mesclagem original que tem um menor identificador de índice de imagem de referência nos candidatos de mesclagem originais na lista de informações de movimento de candidato, ou uma imagem de referência que corresponde à segunda lista de referência e que é de um candidato de mesclagem original que tem um menor identificador de índice nos candidatos de mesclagem originais na lista de informações de movimento de candidato.
31. Aparelho, de acordo com a reivindicação 29, em que em termos de determinação da primeira imagem de referência alvo que é do bloco de imagens atual e que corresponde à primeira lista de referência, a unidade de determinação de lista de informações de movimento de candidato é especificamente configurada para: se uma quantidade de partes de informações de movimento de candidato na lista de informações de movimento de candidato for menor que ou igual a uma quantidade R predefinida, determinar que a primeira imagem de referência alvo é uma imagem de referência que corresponde à primeira lista de referência e que é de informações de movimento de candidato usadas com mais frequência nas informações de movimento de candidato na lista de informações de movimento de candidato, ou uma imagem de referência que corresponde à primeira lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice de imagem de referência nas informações de movimento de candidato na lista de informações de movimento de candidato, ou uma imagem de referência que corresponde à primeira lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice nas informações de movimento de candidato na lista de informações de movimento de candidato; ou se uma quantidade de partes de informações de movimento de candidato na lista de informações de movimento de candidato for maior que uma quantidade R predefinida (por exemplo, 4), determinar que a primeira imagem de referência alvo é uma imagem de referência que corresponde à primeira lista de referência e que é de informações de movimento de candidato usadas com mais frequência nas primeiras R partes de informações de movimento de candidato na lista de informações de movimento de candidato, ou uma imagem de referência que corresponde à primeira lista de referência e que é de informações de movimento de candidato que tem um menor identificador de Índice de imagem de referência nas primeiras R partes de informações de movimento de candidato na lista de informações de movimento de candidato, ou uma imagem de referência que corresponde à primeira lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice nas primeiras R partes de informações de movimento de candidato na lista de informações de movimento de candidato.
32. Aparelho, de acordo com a reivindicação 29, em que em termos de determinação da segunda imagem de referência alvo que é do bloco de imagens atual e que corresponde à segunda lista de referência, a unidade de determinação de lista de informações de movimento de candidato é especificamente configurada para: se uma quantidade de partes de informações de movimento de candidato na lista de informações de movimento de candidato for menor que ou igual a uma quantidade R predefinida, determinar que a segunda imagem de referência alvo é uma imagem de referência que corresponde à segunda lista de referência e que é de informações de movimento de candidato usadas com mais frequência nas informações de movimento de candidato na lista de informações de movimento de candidato, ou uma imagem de referência que corresponde à segunda lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice de imagem de referência nas informações de movimento de candidato na lista de informações de movimento de candidato, ou uma imagem de referência que corresponde à segunda lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice nas informações de movimento de candidato na lista de informações de movimento de candidato; ou se uma quantidade de partes de informações de movimento de candidato na lista de informações de movimento de candidato for maior que uma quantidade R predefinida, determinar que a segunda imagem de referência alvo é uma imagem de referência que corresponde à segunda lista de referência e que é de informações de movimento de candidato usadas com mais frequência nas primeiras R partes de informações de movimento de candidato na lista de informações de movimento de candidato, ou uma imagem de referência que corresponde à segunda lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice de imagem de referência nas primeiras R partes de informações de movimento de candidato na lista de informações de movimento de candidato, ou uma imagem de referência que corresponde à segunda lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice nas primeiras R partes de informações de movimento de candidato na lista de informações de movimento de candidato.
33. Aparelho, de acordo com a reivindicação 29, em que em termos de determinação da primeira imagem de referência alvo que é do bloco de imagens atual e que corresponde à primeira lista de referência e/ou a segunda imagem de referência alvo que é do bloco de imagens atual e que corresponde à segunda lista de referência, a unidade determinação de lista de informações de movimento de candidato é especificamente configurada para: determinar que a primeira imagem de referência alvo é uma imagem de referência que corresponde à primeira lista de referência e que é de informações de movimento de candidato usadas com mais frequência nas P ou M partes de informações de movimento de candidato a serem combinadas, ou uma imagem de referência que corresponde à primeira lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice de imagem de referência nas P ou M partes de informações de movimento de candidato, ou uma imagem de referência que corresponde à primeira lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice nas P ou M partes de informações de movimento de candidato; e/ou determinar que a segunda imagem de referência alvo é uma imagem de referência que corresponde à segunda lista de referência e que é de informações de movimento de candidato usadas com mais frequência nas P ou M partes de informações de movimento de candidato a serem combinadas, ou uma imagem de referência que corresponde à segunda lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice de imagem de referência nas P ou M partes de informações de movimento de candidato, ou uma imagem de referência que corresponde à segunda lista de referência e que é de informações de movimento de candidato que tem um menor identificador de índice nas P ou M partes de informações de movimento de candidato.
34. Aparelho, de acordo com qualquer uma das reivindicações 19 a 33, em que a unidade de predição é configurada especificamente para usar as informações de movimento alvo como as informações de movimento do bloco de imagens atual.
35. Aparelho, de acordo com qualquer uma das reivindicações 19 a 33, em que as informações de movimento compreendem uma predição de vetor de movimento, e a unidade de predição é especificamente configurada para:
analisar um fluxo de bits para obter uma diferença de predição de vetor de movimento do bloco de imagens atual; e usar uma soma da predição de vetor de movimento nas informações de movimento alvo e a diferença de predição de vetor de movimento como um vetor de movimento do bloco de imagens atual.
36. Aparelho, de acordo com qualquer uma das reivindicações 19 a 35, em que o aparelho é configurado para codificar o bloco de imagens atual, e a unidade de determinação de informações de movimento alvo é configurada especificamente para determinar as informações de movimento alvo na lista de informações de movimento de candidato, em que um custo de distorção de taxa para codificar o bloco de imagens atual usando-se as informações de movimento alvo é o mínimo; ou o aparelho é configurado para decodificar o bloco de imagens atual, em que a unidade de determinação de informações de movimento alvo é configurada especificamente para determinar, na lista de informações de movimento de candidato, informações de movimento alvo indicadas por um quinto identificador de índice, em que o quinto identificador de índice é usado para indicar as informações de movimento alvo na lista de informações de movimento de candidato.
37. Método para interpredição de um bloco de imagens atual, em que o método compreende: determinar uma lista de informações de movimento de candidato de mesclagem do bloco de imagens atual, em que a lista de informações de movimento de candidato de mesclagem compreende pelo menos uma parte de informações de movimento de candidato combinado, e primeiras informações de movimento de candidato combinado na pelo menos uma parte de informações de movimento de candidato combinado são obtidas por média de P partes de informações de movimento de candidato na lista de informações de movimento de candidato de mesclagem, em que P é um número inteiro maior que ou igual a2; determinar, na lista de informações de movimento de candidato, informações de movimento alvo correspondentes a um identificador de índice alvo; e predizer informações de movimento do bloco de imagens atual com base nas informações de movimento alvo, em que as informações de movimento do bloco de imagens atual é usado para interpredição do bloco de imagens atual.
38. Método, de acordo com a reivindicação 37, em que as primeiras informações de movimento de candidato combinado compreendem um valor médio de P1 vetores de movimento de candidato que estão nas P partes de informações de movimento de candidato e que correspondem a uma primeira lista de referência, e/ou um valor médio de P2 vetores de movimento de candidato que estão nas P partes de informações de movimento de candidato e que correspondem a uma segunda lista de referência, em que 1<P1<P, 1<P2<P, e P1 ou P2 é um número inteiro maior que ou igual a 2.
39. Método, de acordo com a reivindicação 37, em que as P partes de informações de movimento de candidato compreendem primeiras informações de movimento de candidato correspondentes a um primeiro identificador de índice e segundas informações de movimento de candidato correspondentes a um segundo identificador de índice; as primeiras informações de movimento de candidato compreendem um vetor de movimento correspondente à primeira lista de referência (LO) e um índice de imagem de referência (refo0) correspondente à primeira lista de referência (LO), e/ou um vetor de movimento correspondente à segunda lista de referência (L1) e um índice de imagem de referência (ref1) correspondente à segunda lista de referência (L1); e as segundas informações de movimento de candidato compreendem um vetor de movimento correspondente à primeira lista de referência (LO) e um índice de imagem de referência (refo0) correspondente à primeira lista de referência (LO), e/ou um vetor de movimento correspondente à segunda lista de referência (L1) e um índice de imagem de referência (ref1) correspondente à segunda lista de referência (L1).
40. Método, de acordo com a reivindicação 39, em que as primeiras informações de movimento de candidato combinado compreendem um primeiro vetor de movimento combinado correspondente à primeira lista de referência (LO), e/ou um segundo vetor de movimento combinado correspondente à segunda lista de referência (L1), em que o primeiro vetor de movimento combinado que está nas primeiras informações de movimento de candidato combinado e que corresponde à primeira lista de referência (LO) é um valor médio do vetor de movimento que está nas primeiras informações de movimento de candidato correspondentes ao primeiro identificador de índice e que corresponde à primeira lista de referência (LO) e o vetor de movimento que está nas segundas informações de movimento de candidato correspondentes ao segundo identificador de índice e que corresponde à primeira lista de referência (LO); e o segundo vetor de movimento combinado que está nas primeiras informações de movimento de candidato combinado e que corresponde à segunda lista de referência (L1) é um valor médio do vetor de movimento que está nas primeiras informações de movimento de candidato correspondentes ao primeiro identificador de índice e que corresponde à segunda lista de referência (L1) e o vetor de movimento que está nas segundas informações de movimento de candidato correspondentes ao segundo identificador de índice e que corresponde à segunda lista de referência (L1).
41. Método, de acordo com a reivindicação 40, em que as primeiras informações de movimento de candidato combinado compreendem adicionalmente um primeiro índice de imagem de referência (refO) correspondente à primeira lista de referência (LO), e/ou um segundo índice de imagem de referência (ref1) correspondente à segunda lista de referência (L1), em que o primeiro índice de imagem de referência (ref0) que está nas primeiras informações de movimento de candidato combinado e que corresponde à primeira lista de referência (LO) é um índice de imagem de referência (refO) que está nas primeiras informações de movimento de candidato correspondentes ao primeiro identificador de índice e que corresponde à primeira lista de referência (LO); e o segundo índice de imagem de referência (ref1l) que está nas primeiras informações de movimento de candidato combinado e que corresponde à segunda lista de referência (L1) é um índice de imagem de referência (ref1) que está nas primeiras informações de movimento de candidato correspondentes ao primeiro identificador de índice e que corresponde à segunda lista de referência (L1).
42. Método, de acordo com a reivindicação 39, em que o primeiro identificador de índice indica uma posição das primeiras informações de movimento de candidato na lista de informações de movimento de candidato de mesclagem, e o segundo identificador de índice indica uma posição das segundas informações de movimento de candidato na lista de informações de movimento de candidato de mesclagem.
43. Método, de acordo com a reivindicação 39, em que o primeiro identificador de índice é menor que o segundo identificador de índice.
44. Método, de acordo com a reivindicação 39, em que o primeiro identificador de índice é igual a O, e o segundo identificador de índice é igual a 1.
45. Aparelho de codificação de vídeo, compreendendo: um ou mais processadores; e uma mídia de armazenamento legível por computador não transitória acoplada aos processadores e armazenando programação para execução pelos processadores, em que a programação, quando executada pelos processadores, configura o decodificador para realizar o método para interpredição de um bloco de imagens atual compreendendo: determinar uma lista de informações de movimento de candidato de mesclagem do bloco de imagens atual, em que a lista de informações de movimento de candidato de mesclagem compreende pelo menos uma parte de informações de movimento de candidato combinado, e primeiras informações de movimento de candidato combinado na pelo menos uma parte de informações de movimento de candidato combinado são obtidas por média de P partes de informações de movimento de candidato na lista de informações de movimento de candidato de mesclagem, em que P é um número inteiro maior que ou igual a2; determinar, na lista de informações de movimento de candidato, informações de movimento alvo correspondentes a um identificador de índice alvo; e predizer informações de movimento do bloco de imagens atual com base nas informações de movimento alvo, em que as informações de movimento do bloco de imagens atual são usadas para interpredição do bloco de imagens atual.
46. Aparelho, de acordo com a reivindicação 45, em que as primeiras informações de movimento de candidato combinado compreendem um valor médio de P1 vetores de movimento de candidato que estão nas P partes de informações de movimento de candidato e que correspondem a uma primeira lista de referência, e/ou um valor médio de P2 vetores de movimento de candidato que estão nas P partes de informações de movimento de candidato e que correspondem a uma segunda lista de referência, em que 1<P1<P, 1<P2<P, e P1 ou P2 é um número inteiro maior que ou igual a 2.
47. Aparelho, de acordo com a reivindicação 45, em que as P partes de informações de movimento de candidato compreendem primeiras informações de movimento de candidato correspondentes a um primeiro identificador de índice e segundas informações de movimento de candidato correspondentes a um segundo identificador de índice; as primeiras informações de movimento de candidato compreendem um vetor de movimento correspondente à primeira lista de referência (LO) e um índice de imagem de referência (refo0) correspondente à primeira lista de referência (LO), e/ou um vetor de movimento correspondente à segunda lista de referência (L1) e um índice de imagem de referência (ref1) correspondente à segunda lista de referência (L1); e as segundas informações de movimento de candidato compreendem um vetor de movimento correspondente à primeira lista de referência (LO) e um índice de imagem de referência (refo0) correspondente à primeira lista de referência (LO), e/ou um vetor de movimento correspondente à segunda lista de referência (L1) e um índice de imagem de referência (ref1) correspondente à segunda lista de referência (L1).
48. Aparelho, de acordo com a reivindicação 47, em que as primeiras informações de movimento de candidato combinado compreendem um primeiro vetor de movimento combinado correspondente à primeira lista de referência (LO), e/ou um segundo vetor de movimento combinado correspondente à segunda lista de referência (L1), em que o primeiro vetor de movimento combinado que está nas primeiras informações de movimento de candidato combinado e que corresponde à primeira lista de referência (LO) é um valor médio do vetor de movimento que está nas primeiras informações de movimento de candidato correspondentes ao primeiro identificador de índice e que corresponde à primeira lista de referência (LO) e o vetor de movimento que está nas segundas informações de movimento de candidato correspondentes ao segundo identificador de índice e que corresponde à primeira lista de referência (LO); e o segundo vetor de movimento combinado que está nas primeiras informações de movimento de candidato combinado e que corresponde à segunda lista de referência (L1) é um valor médio do vetor de movimento que está nas primeiras informações de movimento de candidato correspondentes ao primeiro identificador de índice e que corresponde à segunda lista de referência (L1) e o vetor de movimento que está nas segundas informações de movimento de candidato correspondentes ao segundo identificador de índice e que corresponde à segunda lista de referência (L1).
49. Aparelho, de acordo com a reivindicação 48, em que as primeiras informações de movimento de candidato combinado compreendem adicionalmente um primeiro índice de imagem de referência (refO) correspondente à primeira lista de referência (LO), e/ou um segundo índice de imagem de referência (ref1) correspondente à segunda lista de referência (L1), em que o primeiro índice de imagem de referência (refO0) que está nas primeiras informações de movimento de candidato combinado e que corresponde à primeira lista de referência (LO) é um índice de imagem de referência (refO) que está nas primeiras informações de movimento de candidato correspondentes ao primeiro identificador de índice e que corresponde à primeira lista de referência (LO); e o segundo índice de imagem de referência (ref1l) que está nas primeiras informações de movimento de candidato combinado e que corresponde à segunda lista de referência (L1) é um índice de imagem de referência (ref1) que está nas primeiras informações de movimento de candidato correspondentes ao primeiro identificador de índice e que corresponde à segunda lista de referência (L1).
50. Aparelho, de acordo com a reivindicação 47, em que o primeiro identificador de índice indica uma posição das primeiras informações de movimento de candidato na lista de informações de movimento de candidato de mesclagem, e o segundo identificador de índice indica uma posição das segundas informações de movimento de candidato na lista de informações de movimento de candidato de mesclagem.
51. Aparelho, de acordo com a reivindicação 47, em que o primeiro identificador de índice é menor que o segundo identificador de índice.
52. Aparelho, de acordo com a reivindicação 47, em que o primeiro identificador de índice é igual a O, e o segundo identificador de índice é igual a 1.
53. Codificador de vídeo, em que o codificador de vídeo é configurado para codificar um bloco de imagens, e compreende: um interpreditor, compreendendo o aparelho para predizer informações de movimento de um bloco de imagens conforme definido em qualquer uma das reivindicações 19 a 35, em que o interpreditor é configurado para: predizer informações de movimento de um bloco de codificação atual com base em informações de movimento alvo; e determinar um bloco de predição do bloco de codificação atual com base nas informações de movimento do bloco de codificação atual; um codificador de entropia, configurado para codificar um identificador de índice das informações de movimento alvo em um fluxo de bits, em que o identificador de índice é usado para indicar as informações de movimento alvo usadas para o bloco de codificação atual; e um reconstrutor, configurado para reconstruir o bloco de imagens com base no bloco de predição.
54. Decodificador de vídeo, em que o decodificador de vídeo é configurado para decodificar um fluxo de bits para obter um bloco de imagens, e compreende: um decodificador de entropia, configurado para decodificar um fluxo de bits para obter um identificador de índice, em que o identificador de índice é usado para indicar informações de movimento alvo para um bloco de decodificação atual; um interpreditor, compreendendo o aparelho para predizer informações de movimento de um bloco de imagens conforme definido em qualquer uma das reivindicações 19 a 35, em que o interpreditor é configurado para: predizer informações de movimento do bloco de decodificação atual com base nas informações de movimento alvo indicadas pelo identificador de índice; e determinar um bloco de predição do bloco de decodificação atual com base nas informações de movimento do bloco de decodificação atual; e um reconstrutor, configurado para reconstruir o bloco de imagens com base no bloco de predição.
55. Mídia legível por computador não transitória portando um código de programa que, quando executado por um dispositivo de computador, faz com que o dispositivo de computador realize o método conforme definido em qualquer uma das reivindicações anteriores.
56. Mídia de armazenamento não transitória compreendendo um fluxo de bits codificado pelo método conforme definido em qualquer uma das reivindicações anteriores.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711411690.X | 2017-12-23 | ||
CN201711411690.XA CN109963155B (zh) | 2017-12-23 | 2017-12-23 | 图像块的运动信息的预测方法、装置及编解码器 |
PCT/CN2018/107094 WO2019119909A1 (zh) | 2017-12-23 | 2018-09-21 | 图像块的运动信息的预测方法、装置及编解码器 |
Publications (1)
Publication Number | Publication Date |
---|---|
BR112020012732A2 true BR112020012732A2 (pt) | 2020-12-01 |
Family
ID=66993054
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
BR112020012732-9A BR112020012732A2 (pt) | 2017-12-23 | 2018-09-21 | método e aparelho para predição de informações de movimento de bloco de imagens, codificador, e decodificador |
Country Status (7)
Country | Link |
---|---|
US (2) | US11297326B2 (pt) |
EP (1) | EP3731526A4 (pt) |
JP (1) | JP2021507639A (pt) |
KR (1) | KR20200108856A (pt) |
CN (2) | CN109963155B (pt) |
BR (1) | BR112020012732A2 (pt) |
WO (2) | WO2019119909A1 (pt) |
Families Citing this family (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20190110044A (ko) * | 2018-03-19 | 2019-09-27 | 주식회사 케이티 | 비디오 신호 처리 방법 및 장치 |
KR20210016581A (ko) | 2018-06-05 | 2021-02-16 | 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 | Ibc 및 atmvp 간의 상호 작용 |
WO2019244117A1 (en) | 2018-06-21 | 2019-12-26 | Beijing Bytedance Network Technology Co., Ltd. | Unified constrains for the merge affine mode and the non-merge affine mode |
KR102701593B1 (ko) | 2018-06-21 | 2024-08-30 | 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 | 칼라 컴포넌트 간의 서브 블록 mv 상속 |
CN110662059B (zh) | 2018-06-29 | 2021-04-20 | 北京字节跳动网络技术有限公司 | 使用查找表存储先前编码的运动信息并用其编码后续块的方法和装置 |
WO2020003261A1 (en) | 2018-06-29 | 2020-01-02 | Beijing Bytedance Network Technology Co., Ltd. | Selection from multiple luts |
CN114845108A (zh) | 2018-06-29 | 2022-08-02 | 抖音视界(北京)有限公司 | 查找表的更新:fifo、约束的fifo |
WO2020003284A1 (en) | 2018-06-29 | 2020-01-02 | Beijing Bytedance Network Technology Co., Ltd. | Interaction between lut and amvp |
WO2020003270A1 (en) | 2018-06-29 | 2020-01-02 | Beijing Bytedance Network Technology Co., Ltd. | Number of motion candidates in a look up table to be checked according to mode |
CN115134599A (zh) | 2018-06-29 | 2022-09-30 | 抖音视界有限公司 | 更新查找表(lut)的条件 |
KR20210024502A (ko) | 2018-06-29 | 2021-03-05 | 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 | Hmvp 후보를 병합/amvp에 추가할 때의 부분/풀 프루닝 |
KR102646649B1 (ko) | 2018-06-29 | 2024-03-13 | 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 | Lut에서의 모션 후보들의 검사 순서 |
JP7181395B2 (ja) | 2018-07-02 | 2022-11-30 | 北京字節跳動網絡技術有限公司 | イントラ予測モードを有するルックアップテーブルおよび非隣接ブロックからのイントラモード予測 |
TWI820211B (zh) | 2018-09-12 | 2023-11-01 | 大陸商北京字節跳動網絡技術有限公司 | 取決於總數減去k的開始檢查hmvp候選的條件 |
CN117768651A (zh) * | 2018-09-24 | 2024-03-26 | 北京字节跳动网络技术有限公司 | 处理视频数据的方法、装置、介质、以及比特流存储方法 |
EP3861723A4 (en) | 2018-11-10 | 2022-04-20 | Beijing Bytedance Network Technology Co., Ltd. | ROUNDS IN PAIRS OF MEDIUM CANDIDATE BILLS |
WO2020143741A1 (en) | 2019-01-10 | 2020-07-16 | Beijing Bytedance Network Technology Co., Ltd. | Invoke of lut updating |
CN113383554B (zh) | 2019-01-13 | 2022-12-16 | 北京字节跳动网络技术有限公司 | LUT和共享Merge列表之间的交互 |
WO2020147772A1 (en) | 2019-01-16 | 2020-07-23 | Beijing Bytedance Network Technology Co., Ltd. | Motion candidates derivation |
WO2020192611A1 (en) | 2019-03-22 | 2020-10-01 | Beijing Bytedance Network Technology Co., Ltd. | Interaction between merge list construction and other tools |
CN110460859B (zh) * | 2019-08-21 | 2022-03-25 | 浙江大华技术股份有限公司 | 历史运动矢量列表的使用方法、编解码器及存储装置 |
CN112449180B (zh) * | 2019-08-27 | 2023-02-28 | 杭州海康威视数字技术股份有限公司 | 一种编解码方法、装置及其设备 |
CN110611820A (zh) * | 2019-09-11 | 2019-12-24 | 北京达佳互联信息技术有限公司 | 视频编码方法、装置、电子设备及存储介质 |
CN110636311B (zh) * | 2019-09-18 | 2021-10-15 | 浙江大华技术股份有限公司 | 运动矢量的获取方法及相关预测方法、装置 |
CN113261285B (zh) * | 2019-09-24 | 2023-06-02 | Oppo广东移动通信有限公司 | 编码方法、解码方法、编码器、解码器以及存储介质 |
BR112022006694A2 (pt) * | 2019-10-10 | 2022-07-26 | Huawei Tech Co Ltd | Codificador, decodificador e métodos correspondentes para simplificar sinalização de cabeçalho de imagem |
CN113453005B (zh) * | 2020-03-26 | 2022-11-01 | 杭州海康威视数字技术股份有限公司 | 解码方法、编码方法、装置及设备 |
CN113709498B (zh) * | 2020-05-20 | 2023-06-02 | Oppo广东移动通信有限公司 | 帧间预测方法、编码器、解码器以及计算机存储介质 |
CN113766245A (zh) * | 2020-06-05 | 2021-12-07 | Oppo广东移动通信有限公司 | 帧间预测方法、解码器、编码器及计算机存储介质 |
CN114071159B (zh) * | 2020-07-29 | 2023-06-30 | Oppo广东移动通信有限公司 | 帧间预测方法、编码器、解码器及计算机可读存储介质 |
CN113709499B (zh) * | 2020-08-20 | 2022-12-23 | 杭州海康威视数字技术股份有限公司 | 一种编解码方法、装置及其设备 |
CN112905817B (zh) * | 2021-05-08 | 2021-07-06 | 深圳市安软科技股份有限公司 | 基于排序算法的图像检索方法、装置及相关设备 |
Family Cites Families (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9161057B2 (en) | 2009-07-09 | 2015-10-13 | Qualcomm Incorporated | Non-zero rounding and prediction mode selection techniques in video encoding |
CN101610413B (zh) * | 2009-07-29 | 2011-04-27 | 清华大学 | 一种视频的编码/解码方法及装置 |
EP2938082B1 (en) * | 2011-01-07 | 2017-03-22 | Ntt Docomo, Inc. | Predictive encoding method, predictive encoding device, and predictive encoding program of motion vector, and predictive decoding method, predictive decoding device, and predictive decoding program of motion vector |
PL3739884T3 (pl) * | 2011-06-27 | 2021-11-22 | Samsung Electronics Co., Ltd. | Kodowanie i dekodowanie informacji o ruchu |
CN105245874B (zh) * | 2011-06-30 | 2017-05-24 | Jvc建伍株式会社 | 图像解码装置和图像解码方法 |
JP2013018369A (ja) | 2011-07-11 | 2013-01-31 | Kinki Sharyo Co Ltd | 鉄道車両の構体構造 |
EP2741499A4 (en) * | 2011-08-03 | 2014-12-10 | Panasonic Ip Corp America | VIDEO CODING METHOD, VIDEO CODING METHOD, VIDEO CODING DEVICE, VIDEO ENCODING DEVICE AND VIDEO ENCODING / DECODING DEVICE |
JP5768662B2 (ja) * | 2011-10-31 | 2015-08-26 | 富士通株式会社 | 動画像復号装置、動画像符号化装置、動画像復号方法、動画像符号化方法、動画像復号プログラム及び動画像符号化プログラム |
KR20130050405A (ko) * | 2011-11-07 | 2013-05-16 | 오수미 | 인터 모드에서의 시간 후보자 결정방법 |
CN104160706B (zh) * | 2012-01-20 | 2018-12-28 | 诺基亚技术有限公司 | 对图像进行编码的方法和装置以及对图像比特流进行解码的方法和装置 |
US9674527B2 (en) * | 2012-01-31 | 2017-06-06 | Qualcomm Incorporated | Implicit derivation of parallel motion estimation range size |
CN103916673B (zh) * | 2013-01-06 | 2017-12-22 | 华为技术有限公司 | 基于双向预测的编码方法、解码方法和装置 |
GB2514334B (en) * | 2013-05-13 | 2020-04-22 | Snell Advanced Media Ltd | Video processing |
KR102034938B1 (ko) * | 2014-09-01 | 2019-10-21 | 에이치에프아이 이노베이션 인크. | 스크린 콘텐츠 및 비디오 코딩을 위한 인트라 픽처 블록 카피의 방법 |
CN114554199B (zh) * | 2014-09-30 | 2023-11-10 | 寰发股份有限公司 | 用于视频编码的自适应运动向量分辨率的方法 |
WO2016056822A1 (ko) * | 2014-10-08 | 2016-04-14 | 엘지전자 주식회사 | 3d 비디오 코딩 방법 및 장치 |
KR20180020965A (ko) * | 2015-04-27 | 2018-02-28 | 엘지전자 주식회사 | 비디오 신호의 처리 방법 및 이를 위한 장치 |
CN108353184B (zh) | 2015-11-05 | 2022-02-01 | 联发科技股份有限公司 | 一种视频编解码的方法及装置 |
WO2017105097A1 (ko) * | 2015-12-17 | 2017-06-22 | 삼성전자 주식회사 | 머지 후보 리스트를 이용한 비디오 복호화 방법 및 비디오 복호화 장치 |
EP3456049B1 (en) * | 2016-05-13 | 2022-05-04 | VID SCALE, Inc. | Systems and methods for generalized multi-hypothesis prediction for video coding |
CN116567262A (zh) * | 2016-05-24 | 2023-08-08 | 韩国电子通信研究院 | 图像编码/解码方法和用于所述方法的记录介质 |
CN116600109A (zh) * | 2016-08-11 | 2023-08-15 | Lx 半导体科技有限公司 | 图像编码/解码方法和图像数据的发送方法 |
US10715827B2 (en) * | 2017-01-06 | 2020-07-14 | Mediatek Inc. | Multi-hypotheses merge mode |
US20180310017A1 (en) * | 2017-04-21 | 2018-10-25 | Mediatek Inc. | Sub-prediction unit temporal motion vector prediction (sub-pu tmvp) for video coding |
-
2017
- 2017-12-23 CN CN201711411690.XA patent/CN109963155B/zh active Active
-
2018
- 2018-09-21 EP EP18893007.7A patent/EP3731526A4/en not_active Withdrawn
- 2018-09-21 WO PCT/CN2018/107094 patent/WO2019119909A1/zh unknown
- 2018-09-21 BR BR112020012732-9A patent/BR112020012732A2/pt unknown
- 2018-09-21 KR KR1020207021531A patent/KR20200108856A/ko not_active Application Discontinuation
- 2018-09-21 JP JP2020535069A patent/JP2021507639A/ja active Pending
- 2018-09-21 CN CN201880083601.XA patent/CN111512630A/zh active Pending
- 2018-12-22 WO PCT/CN2018/122951 patent/WO2019120305A1/zh active Application Filing
-
2020
- 2020-06-22 US US16/907,660 patent/US11297326B2/en active Active
-
2022
- 2022-03-16 US US17/696,132 patent/US12088819B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
WO2019120305A1 (zh) | 2019-06-27 |
US20200396462A1 (en) | 2020-12-17 |
JP2021507639A (ja) | 2021-02-22 |
CN111512630A (zh) | 2020-08-07 |
CN109963155A (zh) | 2019-07-02 |
US12088819B2 (en) | 2024-09-10 |
US11297326B2 (en) | 2022-04-05 |
EP3731526A1 (en) | 2020-10-28 |
WO2019119909A1 (zh) | 2019-06-27 |
US20220345716A1 (en) | 2022-10-27 |
KR20200108856A (ko) | 2020-09-21 |
EP3731526A4 (en) | 2020-12-30 |
CN109963155B (zh) | 2023-06-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
BR112020012732A2 (pt) | método e aparelho para predição de informações de movimento de bloco de imagens, codificador, e decodificador | |
US12069294B2 (en) | Picture prediction method and apparatus, and codec | |
BR112020014522A2 (pt) | Derivação aprimorada de vetor de movimento no lado de decodificador | |
BR112019019423A2 (pt) | propagação de modo de intrapredição | |
BR112017003073B1 (pt) | Unificação de cópia de intrabloco e interpredição | |
BR112016023406B1 (pt) | Método e dispositivo para codificar ou decodificar dados de vídeo, e memória legível por computador | |
BR112014010326B1 (pt) | Codificação de vídeo intramodo | |
BR112014010046B1 (pt) | Método para decodificar dados de vídeo, método e dispositivo para codificar dados de vídeo e memória legível por computador | |
CN110868587B (zh) | 一种视频图像预测方法及装置 | |
BR112013032040B1 (pt) | Método e aparelho para codificação de vídeo, e memória legível por computador | |
BR112014015056B1 (pt) | Realizando predição de vetor de movimento para codificação de vídeo | |
BR112014019444B1 (pt) | Restrição de unidades de predição em fatias b para interpredição unidirecional | |
BR112015016256B1 (pt) | Sinalização de contagem de ordem de imagens para relações de informação de temporização para temporização de vídeo em codificação de vídeo | |
BR112014006842B1 (pt) | Método e dispositivo para codificar dados de vídeo e mídia de armazenamento não transitório legível por computador | |
BR112015025639B1 (pt) | Alinhamento poc de camada cruzada para fluxos de bits de várias camadas que podem incluir imagens irap não alinhadas | |
BR112015007116B1 (pt) | Aparelho configurado para decodificar e codificar dados de vídeo, método de decodificação e codificação de dados de vídeo, e, memória legível por computador | |
BR112020011099A2 (pt) | intra-predição com pixels vizinhos distantes | |
BR112020026992A2 (pt) | Método de predição de vetor de movimento e aparelho relacionado | |
CN110868602B (zh) | 视频编码器、视频解码器及相应方法 | |
BR112021004124A2 (pt) | método de decodificação de vídeo e decodificador de vídeo | |
BR112020022246A2 (pt) | método de codificação de vídeo, aparelho, dispositivo e mídia de armazenamento legível por computador | |
US11575928B2 (en) | Video encoder, video decoder, and corresponding method | |
BR112021003965A2 (pt) | método e aparelho de obtenção de vetor de movimento, dispositivo de computador, e meio de armazenamento | |
BR112021004429A2 (pt) | método de decodificação e aparelho de decodificação para predizer informações de movimento | |
BR122023022737A2 (pt) | Método para determinar segunda informação de movimento candidata, dispositivo e mídia de armazenamento legível por computador |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
B350 | Update of information on the portal [chapter 15.35 patent gazette] |