BR112012015001B1 - Método em um decodificador de vídeo para decodificar informação, disposição em um decodificador de vídeo, meio não transitório legível por computador para controlar um decodificador de vídeo, método em um codificador de vídeo para codificar informação, disposição em um codificador de vídeo, e, meio não transitório legível por computador para controlar um codificador de vídeo - Google Patents
Método em um decodificador de vídeo para decodificar informação, disposição em um decodificador de vídeo, meio não transitório legível por computador para controlar um decodificador de vídeo, método em um codificador de vídeo para codificar informação, disposição em um codificador de vídeo, e, meio não transitório legível por computador para controlar um codificador de vídeo Download PDFInfo
- Publication number
- BR112012015001B1 BR112012015001B1 BR112012015001-4A BR112012015001A BR112012015001B1 BR 112012015001 B1 BR112012015001 B1 BR 112012015001B1 BR 112012015001 A BR112012015001 A BR 112012015001A BR 112012015001 B1 BR112012015001 B1 BR 112012015001B1
- Authority
- BR
- Brazil
- Prior art keywords
- syntax element
- block
- mode
- list
- arrangement
- Prior art date
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/573—Motion compensation with multiple frame prediction using two or more reference frames in a given prediction direction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/105—Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/107—Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/154—Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
- H04N19/159—Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/513—Processing of motion vectors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
método e disposição para codificação de vídeo métodos e disposições na codificação de vídeo e entidades de decodificação. os métodos e disposições referem-se à codificação de união de informação de referência associada com vídeo codificado. o método e a disposição em uma entidade de decodificação referem-se à obtenção (402) de um elemento de sintaxe único associado com um bloco codificado be, e à identificação (404) de um modo de referência e uma ou mais imagens de referência baseada no elemento de sintaxe obtido. o método e a disposição ainda referem-se à decodificação (406) do bloco be baseada no modo de referência identificado e uma ou mais imagens de referência, assim fornecendo um bloco decodificado, b, de pixels.
Description
[001] A invenção refere-se geralmente a um método e a uma disposição para codificação de informação relacionada à codificação de vídeo.
[002] Codificação de vídeo pode ser executada no modo intra e/ou modo inter. Modo intra explora redundâncias dentro de um quadro de vídeo, e modo inter explora redundâncias entre quadros de vídeo. No modo inter, luminância de pixel/ previsões de croma são obtidas a partir de imagens já codificadas/ decodificadas chamadas imagens de referência. Dependendo do número de imagens de referência usadas para previsão, modo inter é categorizado em modo de uni-previsão (ou modo de uni-direção), modo de bi- previsão (B modo), e possivelmente modo de tri-previsão, etc., onde, respectivamente, 1, 2 e 3 imagens de referência são usadas. Dentro dos documentos, estes diferentes modos, isto é, uni-previsão, bi-previsão, etc., serão referidos como “modos de referência”.
[003] Codificação de vídeo avançada (AVC), que é também conhecida como H.264 e MPEG-4 Parte 10, é o estado da técnica padrão para codificação de vídeo 2D a partir de ITU-T (União Internacional de Telecomunicação - Setor de Padronização de Telecomunicação) e MPEG (Grupo Especialista de Imagem em Movimento). O codec AVC é um codec híbrido, que leva vantagem de eliminação da redundância entre quadros e dentro de um quadro.
[004] No AVC, indicadores das imagens de referência relevantes são colocados em ordem em duas listas de referência. Os indicadores são índices de referência denotados, e são numerados de 0 a N, por exemplo (0,1,...,N). A primeira lista, Lista 0 (L0), principalmente gerencia as imagens de referência passadas, isto é, imagens de referência anteriores a uma imagem corrente no tempo, e a segunda lista, Lista 1 (L1), tipicamente gerencia as futuras imagens de referência, isto é, imagens de referência subsequentes a uma imagem corrente no tempo. Para codificação de vídeo de baixo retardo, L1 pode também gerenciar imagens de referência passadas. Cada lista pode conter índices de até 15 imagens de referência, isto é, N=14.
[005] Além disso, no AVC, um indicador, ou índice de modo de referência, especificando a seleção de uma das listas de imagens de referência (por exemplo, para uni-previsão), ou ambas as listas de imagens de referência (por exemplo, para bi-previsão), é codificado junto com a estrutura da partição no modo Bloco Macro (MB)/ modo sub-MD, enquanto os indicadores, ou índices de imagens de referência, especificando as imagens de referência selecionadas nas listas respectivas são codificados como elementos de sintaxe separados. “Estrutura de partição” refere-se a partições, tal como, por exemplo, 16x16, 16x8 ou 8x16, de um 16x16 MB. Uma partição, por exemplo, 16x16, é tipicamente associada com um vetor de movimento (MV) e um índice de referência quando uni-previsão é usada, e com dois MVs e dois índices de referência quando bi-previsão é usada. Um MV tem um componente horizontal MVx e um componente vertical MVy que descreve como pixels da partição corrente são produzidos a partir da imagem de referência correspondente, tal como Ipred (x,y)=Iref(x-MVx,y-MVy) .
[006] O número de imagens de referência associado com uma imagem ou partição depende do modo de referência associado com a mesma partição, isto é, se ele for uni-previsão ou bi-previsão, etc. Quando da decodificação da informação de referência em um decodificador, ambos os índices do modo de referência e de um ou mais índices de imagem de referência associados com uma imagem ou partição devem ser corretamente decodificados, a fim de que o decodificador seja capaz de decodificar a imagem ou partição corretamente. Decodificação incorreta de qualquer dos índices do modo de referência e de um ou mais índices de imagem de referência pode resultar em interpretações errôneas da informação de referência.
[007] Os métodos correntes de codificação da informação de referência, tal como o método e AVC descrito acima, exigem um número relativamente grande de bits a fim de transmitir a informação de referência associada com cada bloco. Isto é identificado como ineficiente em termos de eficiência de codificação.
[008] Seria desejável permitir uma eficiência de codificação melhorada para informação de referência, isto é, a informação identificando uma ou mais imagens de referência usada para previsão de um quadro corrente. É um objetivo da invenção permitir uma eficiência de codificação melhorada para informação de referência. Além disso, é um objetivo da invenção fornecer um método e uma disposição para permitir uma codificação melhorada de informação de referência. Estes objetivos podem ser satisfeitos por um método e uma disposição de acordo com as reivindicações independentes anexas. Modalidades opcionais são definidas pelas reivindicações dependentes. A previsão, a codificação e a decodificação descritas abaixo podem ser executadas dentro da mesma entidade ou nó, ou em diferentes entidades ou nós.
[009] De acordo com um primeiro aspecto, um método é fornecido em uma entidade de decodificação de vídeo. O método compreende a obtenção de um elemento de sintaxe único associado com um bloco codificado Be. O método compreende ainda a identificação de um modo de referência e uma ou mais imagens de referência baseada no elemento de sintaxe obtido, e a decodificação do bloco Be, baseada no modo de referência identificado e uma ou mais imagens de referência, assim fornecendo um bloco decodificado, B, de pixels.
[0010] De acordo com um segundo aspecto, uma disposição é fornecida em uma entidade de decodificação de vídeo. A disposição compreende uma unidade funcional, que é adaptada para obter um elemento de sintaxe único associado com um bloco codificado Be. A disposição compreende ainda a unidade funcional, que é adaptada para identificar um modo de referência e uma ou mais imagens de referência com base no elemento de sintaxe obtido. A disposição compreende ainda uma unidade funcional, que é adaptada para decodificar o bloco Be com base no modo de referência identificado e uma ou mais imagens de referência, assim fornecendo um bloco decodificado B de pixels.
[0011] De acordo com um terceiro aspecto, um método é fornecido em uma entidade de codificação de vídeo. O método compreende a codificação de um bloco B de pixels usando um modo de referência e uma ou mais imagens de referência, assim fornecendo um bloco codificado Be. O método compreende ainda derivar um elemento de sintaxe único, identificando o modo de referência e uma ou mais imagens de referência (s) e fornecendo o elemento de sintaxe único a um decodificador do bloco Be.
[0012] De acordo com um quarto aspecto, uma disposição é fornecida em uma entidade de codificação de vídeo. A disposição compreende uma unidade funcional, que é adaptada para codificar um bloco B de pixels usando um modo de referência e uma ou mais imagens de referência, assim fornecendo um bloco codificado Be. A disposição compreende ainda uma unidade funcional, que é adaptada para derivar um elemento de sintaxe único identificando o modo de referência e uma ou mais imagens de referência. A disposição compreende ainda uma unidade funcional, que é adaptada para fornecer o elemento de sintaxe único a um decodificador do bloco Be.
[0013] Os métodos e disposições acima podem ser usados para melhorar a eficiência de codificação. A eficiência de codificação pode ser melhorada, devido ao fato que o uso de menos bits a fim de identificar uma ou mais imagens de referência usadas para previsão de um quadro corrente é habilitado. Os métodos e disposições acima podem ainda permitir um desempenho de resiliência de erro melhorado. Além disso, pelo agrupamento de informação de referência para formar um elemento de sintaxe único, fácil manipulação de índice de números de referência torna-se possível. Além disso, o uso de um elemento de sintaxe como descrito acima irá permitir a utilização de que algumas combinações de índice de referência e modo de referência são mais prováveis do que outras, permitindo codificação eficiente destas combinações. Por exemplo, palavras código menores poderiam ser designadas a mais combinações prováveis de índice de referência e modo de referência.
[0014] Os métodos e disposições acima podem ser implementados em diferentes modalidades. Em algumas modalidades, a identificação de um modo de referência e uma ou mais imagens de referência é baseada em um mapeamento pré-definido entre o elemento de sintaxe e o modo de referência e uma ou mais imagens de referência específicas. Em algumas modalidades, o elemento de sintaxe único representa uma entrada em uma primeira lista de referência predefinida, que pode compreender um ou mais entradas. Uma entrada pode identificar uma pluralidade de imagens de referência ou uma imagem de referência única, e pode também ainda identificar um modo de referência.
[0015] O elemento de sintaxe único pode ainda representar um modo de referência e uma entrada em uma segunda lista de referência pré-definida, que pode compreender uma ou mais entradas identificando uma imagem de referência única, respectivamente.
[0016] As entradas nas listas podem ser identificadas pelos índices da lista. Além disso, o número de bits representando o elemento de sintaxe obtido pode ser relacionado à probabilidade dos valores específicos do elemento de sintaxe.
[0017] Em algumas modalidades, previsão de informação de referência pode ser executada para Be (ou B quando na codificação de entidade), baseada nos elementos de sintaxe únicos associados com blocos vizinhos de Be (ou B). Além disso, em algumas modalidades, sub-regiões de um bloco associado com multi-previsão podem ser identificadas, para que as sub-regiões das regiões correspondentes respectivas dos blocos de referência multi-previsão tenham uma correlação relativamente baixa entre elas, e então uma previsão alternativa, ao invés de multi-previsão, pode ser usada para as sub-regiões identificadas.
[0018] As modalidades acima têm sido principalmente descritas em termos de um método. Entretanto, a descrição acima é também destinada a englobar modalidades das disposições, adaptadas para permitir o desempenho das características acima descritas. As diferentes características das modalidades exemplares acima podem ser combinadas em diferentes maneiras de acordo com a necessidade, exigência ou preferência.
[0019] De acordo com ainda outro aspecto, um programa de computador é fornecido, que compreende meios de código legível por computador, que quando executados em uma ou mais unidades de processamento, fazem com que qualquer das disposições descritas acima realize o procedimento correspondente de acordo com um dos métodos descritos acima.
[0020] De acordo com ainda outro aspecto, um produto de programa de computador é fornecido, que compreende o programa de computador de cima.
[0021] A invenção irá agora ser descrita em maiores detalhes por meio de modalidades exemplares e com referência aos desenhos anexos, em que: Figura 1 é uma vista esquemática ilustrando uma conversão a partir de uma representação da informação de referência de acordo com a técnica anterior para uma representação da informação de referência de acordo com uma modalidade exemplar.
[0022] Figura 2 é uma tabela mostrando diferenças entre uma representação do índice de referência AVC e uma representação do índice de referência de acordo com uma modalidade exemplar.
[0023] Figura 3 é uma vista esquemática ilustrando a designação da informação de referência indicadora de acordo com uma modalidade exemplar.
[0024] Figura 4 é um fluxograma ilustrando um procedimento para decodificação do conjunto da informação codificada relacionada a um modo de referência e uma ou mais imagens de referência em uma entidade de decodificação de vídeo, de acordo com uma modalidade exemplar.
[0025] Figura 5 é um diagrama de blocos ilustrando uma disposição adaptada para decodificação do conjunto de informação codificada relacionada a um modo de referência e uma ou mais imagens de referência em uma entidade de decodificação de vídeo, de acordo com uma modalidade exemplar.
[0026] Figuras 6 é um fluxograma ilustrando um procedimento para codificação de união de informação relacionada a um modo de referência e uma ou mais imagens de referência em uma entidade de codificação de vídeo, de acordo com uma modalidade exemplar.
[0027] Figura 7 é um diagrama de blocos ilustrando uma disposição adaptada para codificação de união de informação relacionada a um modo de referência e uma ou mais imagens de referência em uma entidade de codificação de vídeo, de acordo com uma modalidade exemplar.
[0028] Figura 8 é uma vista esquemática ilustrando uma disposição em uma entrada de codificação/decodificação de vídeo, de acordo com uma modalidade exemplar.
[0029] Figuras 9 e 10 são vistas esquemáticas ilustrando a determinação da frequência da ocorrência de diferentes combinações de um modo de referência e uma ou mais imagens de referência associadas com blocos vizinhos de um bloco corrente, de acordo com modalidades exemplificativas.
[0030] Figura 11 é uma vista esquemática ilustrando designação de indicadores (palavras código) para diferentes símbolos do índice, de acordo com a técnica anterior.
[0031] Figura 12 é uma vista esquemática ilustrando designação de indicadores (palavras código), de acordo com uma modalidade exemplificativa.
[0032] Figura 13 é uma vista esquemática ilustrando partição baseada na informação implícita, de acordo com uma modalidade exemplificativa.
[0033] Brevemente descrito, um novo procedimento para representar e transmitir informação de referência, isto, é modo(s) de referência e imagens de referência são fornecidos para a inter previsão de codificação e decodificação. O procedimento pode ser referido como Sinalização de Índice de Referência, ou Sinalização de Indicador de Informação de Referência (RIS).
[0034] Dentro deste documento, o termo “blocos vizinhos de bloco X” é usado como referência para blocos que são vizinhos ao bloco X, isto é, localizados vizinhos a ou nos arredores do bloco X. Além disso, dentro deste documento, o termo “bloco” é usado como referência a uma unidade de pixels. O termo “imagem de referência” ou “bloco de referência” é usado como referência a uma imagem codificada/ decodificada previamente, um bloco, uma região ou uma área de uma imagem, esta imagem, bloco, região, etc., usada como referência para a previsão.
[0035] Quando usando RIS, ao invés de, por exemplo, codificar0 um indicador do modo de referência em associação próxima com um indicador da estrutura de partição, e codificar indicadores de imagens de referência separadamente, por exemplo, como no AVC, o indicador do modo de referência e os indicadores de imagens de referências associados com um bloco codificado são “empacotados juntos em um só lugar”, isto é são codificados em conjunto. A codificação de união dos indicadores do modo de referência e imagens de referência, isto é, informação de referência, resulta em que um elemento de sintaxe único, ou indicador, representa toda informação nos modos de referência e imagens de referência necessários, a fim de decodificar o bloco codificado em uma maneira satisfatória. Isto é, uma vez que este elemento de sintaxe único é dado para um bloco codificado, um decodificador deve ser capaz de identificar as imagens de referência exigidas para decodificação do bloco. O “elemento de sintaxe” pode também ser denotado, por exemplo, “unidade de sintaxe”, “unidade de indicação conjunta” ou “unidade de identificação conjunta”.
[0036] Uma maneira de descrever RIS é descrever uma “conversão” ou mapeamento a partir de uma representação tradicional, tal como, por exemplo, a representação AVC da informação de referência usando duas listas separadas, para uma representação ilustrativa da informação de referência de acordo com RIS. Tal conversão para representação RIS poderia basicamente ser feita em três etapas, como ilustrado na figura 1.
[0037] A primeira etapa 102 poderia ser para formar uma única lista de índice de referência a partir de múltiplas listas de índice. Por exemplo, ao invés de gerenciar duas listas de índice de referência, como no AVC, todos os índices de imagem de referência podem ser classificados em uma certa ordem em uma lista conjunta única, como uma alternativa ou um complemento para duas listas de AVC. Isto é ilustrado na figura 1, onde as listas de índice de referência de imagem L0 e L1 são fundidas, ou multiplexadas, em uma nova lista LRIS, em uma maneira intercalada. Além disso, em uma segunda etapa, 104, os números de índice podem ser redesignados consequentemente, para seguir uma ordem consecutiva, isto é, 0-5 na nova lista LRIS.
[0038] Os números do índice, ou entradas, na lista LRIS após a etapa 104, representam informações a respeito de ambos um modo de referência (uni-previsão para trás ou para frente) e uma imagem de referência. Um índice para uma entrada na LRIS pode ser denotado, por exemplo, um “índice RIS” ou um “parâmetro do índice”. Os números do índice RIS 0-5 em LRIS, após a etapa 104 neste exemplo, representam uni-previsão a partir de quatro imagens passadas (originalmente em L0 = (0,1,2,3)), e duas imagens futuras (originalmente em L1= (0,1)).
[0039] Além disso, um ou mais entradas da lista representando bi- previsão podem ser adicionadas a LRIS, por exemplo, por inserção ou anexação. Assim, índices RIS indicativos das entradas representando bi- previsão não apontam para uma imagem de referência única, mas, em vez disso, duas imagens de referência. Assim, um índice RIS pode identificar uma combinação de um modo de referência e uma ou mais imagens de referência .
[0040] Consequentemente, em uma etapa final 106, entradas relacionadas ao modo bi-previsão, onde duas imagens de referência são usadas para previsão, podem ser anexadas consecutivamente a LRIS, e ser indicadas ou representadas pelos índices RIS. Por exemplo, a entrada com número do índice RIS 7 pode ser configurada para sinalizar ou sugerir que a imagem corrente está usando número da imagem 0 e número da imagem 1 como referências de bi-previsão. Assim, esta informação é inerente no índice RIS 7. Número do índice 8 pode, de um modo semelhante, ser configurado para sugerir que a imagem corrente está usando número da imagem 0 e número da imagem 2 como referências de bi-previsão. Analogamente, a lista LRIS pode ainda ser estendida com entradas representando tri-previsão, identificando três imagens de referência, e assim por diante.
[0041] Alternativamente, as etapas 104 e 106 podem ser executadas na ordem reversa, tal que as entradas relacionadas ao modo de bi-previsão sejam adicionadas primeiro, por exemplo, inseridas ou anexadas, e então os números do índice são redesignados consequentemente. Como previamente descrito, as entradas relacionadas ao modo de bi-previsão poderiam também ser inseridas, por exemplo, entre as entradas relacionadas a uni-previsão, que seria exigido que a redesignação de números do índice seja executada após a inserção, como um complemento ou alternativa à etapa 104. Neste exemplo, o mapeamento é representado por uma lista de referência única, da qual os índices das diferentes entradas representam um modo de referência e uma ou mais imagens de referência. Deve ser observado que isto é apenas um exemplo opcional, e que o mapeamento pode envolver diversas etapas, e que nenhuma lista expressa ou registro do tipo exemplificado é requisito para execução do mapeamento.
[0042] Um exemplo da diferença entre uma representação do índice de referência AVC e uma representação do índice RIS, de acordo com uma modalidade exemplo, é mostrado em uma tabela na figura 2. Neste exemplo, é assumido que existem quatro imagens de referência disponíveis para codificação de uma imagem corrente, das quais duas imagens de referência são imagens de referência passadas e duas são imagens de referência futuras. Nesta representação RIS exemplificativa, os índices 0, 1, 3 e 4 são definidos para indicar uni-previsão a partir de uma respectiva das quatro imagens de referência. Os índices 2 e 5 são definidos para indicar bi-previsão a partir de um par respectivo de quatro imagens de referência. Deve ser observado que uma sinalização AVC dos índices de referência também compreenderia informação relacionada a partições, uma vez que esta informação é codificada junto com o modo de índice de referência, tal como, por exemplo, “INTER_16x16_L0”. Isto não é, entretanto, mostrado na figura 2.
[0043] No exemplo mostrado na tabela na figura 2, alguns dos índices RIS indicando ou representando bi-previsão são colocados imediatamente após os índices RIS de uni-previsão “mais próximos”, isto é, intercalados com os índices representando uni-previsão. Esta representação do índice RIS é ainda ilustrada na figura 3, que mostra um assim chamado Grupo Hierárquico de Imagens 7B (BGOP). Na figura, o assim chamado “quadro corrente”, isto é, o quadro a ser codificado, é o quadro 3 no GOP 7B. Os índices RIS mostrados na figura 3 correspondem aos índices RIS 0-7 na tabela na figura 2. Uma representação alternativa RIS poderia ser deixar os índices RISs 0-3 indicarem uni-previsão, e os índices RIS seguintes indicarem bi-previsão, como no exemplo ilustrado na figura 1.
[0044] As maneiras para definir o significado de um índice RIS, ou parâmetro RIS, não são limitadas pelo exemplo dado neste documento. Por exemplo, uma fórmula matemática poderia ser definida para interpretar o significado do índice RIS, por exemplo, uma função com 2 variáveis f (RIS_índice, corrente_quadro_num) que retorna a identificação de 2 índices de imagem de referência para um índice RIS de bi-previsão e identifica um índice de imagem de referência para um índice RIS unidirecional, e assim por diante. Em um exemplo, corrente_quadro_num corresponde ao número do quadro dentro de um BGOP de 7B imagens, onde 0 é o primeiro quadro em ordem de exibição e 8 é o último quadro no BGOP. Em outro exemplo, índice RIS é sempre designado usando a fórmula:
[0045] Onde refidx0 e refidx1 são os índices na lista de referência L0 e L1 respectivamente. L0_len e L1_len são o comprimento da lista L0 e L1 respectivamente.
[0046] Alternativamente, uma tabela pode ser usada para casar o índice RIS com dois índices unidirecionais correspondentes no caso de bi- previsão e um índice unidirecional para o caso de uma previsão única. Que método selecionar depende, por exemplo, de restrições de hardware/ software.
[0047] Entretanto, independentemente de qual método que é usado para a derivação de um elemento de sintaxe, o método deve ser conhecido por ambos o codificador e o decodificador, tal que o codificador seja habilitado para derivar e fornecer um elemento de sintaxe correto, e o decodificador seja habilitado para interpretar o elemento de sintaxe corretamente e, assim, identificar a informação de referência necessária para decodificar o bloco codificado ou quadro em questão.
[0048] O índice RIS pode aplicar a diferentes níveis de codificação de vídeo, por exemplo, nível de quadro, nível MB maior, nível MB ou nível sub MB.
[0049] Uma modalidade da parte de decodificação do procedimento de transmissão de informação de referência será agora descrita com referência À figura 4. O procedimento poderia ser executado em uma entidade de decodificação de vídeo, que poderia ser um decodificador de vídeo ou uma entidade compreendendo ainda unidades funcionais além de um decodificador de vídeo. Inicialmente, um elemento de sintaxe único associado com um bloco codificado Be é obtido em uma ação 402. O elemento de sintaxe único pode ser uma unidade, por exemplo, um símbolo, em “o fluxo de bits”, isto é, a representação codificada de, por exemplo, uma sequência de vídeo, ou ser uma unidade, que é decodificada a partir do fluxo de bits. O elemento de sintaxe é um ou mais bits representando um número que corresponde à informação de referência, tal como, por exemplo, um índice RIS. Tipicamente, menos bits são usados para representar índices RIS que são relativamente comuns quando comparado ao número de bits usados para representar índices RIS que são menos comuns. O elemento de sintaxe é decodificado a partir do fluxo de bits para obter o número, por exemplo, índice RIS, que ele representa. Decodificação pode ser feita de acordo com VLC (Codificação de Comprimento Variável) ou codificação aritmética, tal como CABAC (Codificação Aritmética de Binário Adaptado de Contexto), por exemplo.
[0050] Então, em uma ação 404, um modo de referência e uma ou mais imagens de referência a serem usados quando decodificando o bloco Be são identificados com base no elemento de sintaxe obtido. O modo de referência identificado e uma ou mais imagens de referência correspondem ao modo e imagens de referência usados quando codificando o bloco em um codificador. A identificação pode envolver, por exemplo, demapear, decifrar ou “decodificar” o elemento de sintaxe usando uma tabela de mapeamento, uma lista de referência ou outra informação predefinida ou função, pelo uso dos quais um modo de referência e uma ou mais imagens de referência podem ser identificados, dado um elemento de sintaxe. Além disso, quando tendo identificado o modo de referência e uma ou mais imagens de referência necessários, o bloco codificado Be, que é assumido para ser obtido usando métodos convencionais, é decodificado em uma ação 406.
[0051] O elemento de sintaxe único pode ser um indicador ou índice, por exemplo, denotados índice RIS, de uma entrada em uma lista de referência, que lista de referência pode compreende uma pluralidade de entradas, cada entrada representando ou identificando um ou mais modos de referência e uma ou mais imagens de referência. Alternativamente, o elemento de sintaxe é uma palavra código correspondente a uma entrada em uma tabela de pesquisa. A tabela de pesquisa pode ligar a palavra código, por exemplo, a um modo de referência e um ou mais entradas em uma ou mais lista de referência, tal como, por exemplo, L0 e L1 in AVC. O modo de referência pode definir que lista de referência única ou múltiplas lista de referência que deve ser usada na decodificação do bloco.
[0052] Abaixo, um exemplo da disposição 500, adaptada para permitir o desempenho do procedimento acima descrito de decodificação, irá ser descrita com referência à figura 5. A disposição é ilustrada como sendo localizada em uma entidade de decodificação de vídeo, 501, que poderia ser um decodificador de vídeo ou uma entidade compreendendo ainda unidade funcional além de um decodificador de vídeo, tal como, por exemplo, um computador, um terminal móvel ou um dispositivo de vídeo dedicado. A disposição 500 é ainda ilustrada para se comunicar com outras entidades através de uma unidade de comunicação 502, que pode ser considerada para compreender meios convencionais para qualquer tipo de comunicação com fio ou sem fio. Vídeo codificado a ser decodificado é assumido como sendo obtido a partir da unidade de comunicação 502 ou uma memória por uma unidade de obtenção 504, e blocos codificados são assumidos como sendo decodificados em uma unidade de decodificação 508, onde a unidade funcional 508 usa métodos de decodificação convencional.
[0053] A unidade de obtenção 504 é adaptada para obter um elemento de sintaxe único associado com um bloco codificado Be. A disposição 500 compreende ainda uma unidade de identificação 506, que é adaptada para identificar um modo de referência e uma ou mais imagens de referência para ser usado quando da decodificação do bloco Be, baseada no elemento de sintaxe obtido. Como previamente descrito, a disposição 500 compreende ainda uma unidade de decodificação 508, que é adaptada para decodificar o bloco Be baseada no modo determinado de referência e imagens de referência, assim fornecendo um bloco decodificado B de pixels.
[0054] Nesta disposição, o elemento de sintaxe pode ser um indicador ou índice de uma entrada em uma lista de referência, lista de referência podendo compreender uma pluralidade de entradas, cada entrada representando ou identificando um ou mais modos de referência e uma ou mais imagens de referência. Alternativamente, a disposição pode ser adaptada a outro caso quando o elemento de sintaxe é uma palavra código correspondente a uma entrada em uma tabela de pesquisa. A tabela de pesquisa pode ligar a palavra código, por exemplo, a um modo de referência e uma ou mais entradas em uma ou mais listas de referência, tal como, por exemplo, L0 e L1 em AVC.
[0055] A entidade de decodificação de vídeo 501 pode ainda compreender, por exemplo, uma unidade de exibição 510, adaptada para exibir o vídeo decodificado.
[0056] Uma modalidade da parte de codificação do procedimento de transmissão da informação de referência irá agora ser descrita com referência à figura 6. O procedimento poderia ser executado em uma entidade de codificação de vídeo, que poderia ser um codificador de vídeo, ou uma entidade compreendendo ainda unidade funcional além de um codificador de vídeo. Inicialmente, um bloco B de pixels é codificado em uma ação 602, usando um modo de referência e uma ou mais imagens de referência, assim fornecendo um bloco codificado Be.
[0057] Então, um elemento de sintaxe único é derivado, em uma ação 604, baseada no modo de referência e uma ou mais imagens de referência usados para codificação, o elemento de sintaxe assim identificando, diretamente ou indiretamente, o modo de referência e as uma ou mais imagens de referência usados para codificação do bloco B. O elemento de sintaxe poderia, por exemplo, ser derivado localizando uma entrada da lista, correspondente ao modo de referência e imagens de referência usados, em uma lista de referência pré-definida, e então definindo o número do índice da referida entrada para constituir o elemento de sintaxe. Alternativamente, uma tabela de mapeamento ou tabela de pesquisa predefinida poderia fornecer um mapeamento entre diferentes combinações de modos de referência e imagens de referência e diferentes elementos de sintaxes. O elemento de sintaxe poderia ainda ser um argumento para uma função predefinida, função que retorna um indicador de modo de referência e um ou mais indicadores de imagens de referência. Um tal elemento de sintaxe “argumento” poderia ser derivado, por exemplo, por meio de uma “função reversa” predefinida, tomando um indicador de modo de referência e um ou mais indicadores de imagem referência como argumentos e retornando um elemento de sintaxe único.
[0058] Além disso, o elemento de sintaxe derivado é fornecido a um decodificador do bloco Be, em associação com o bloco Be, em uma ação 606. Assim, a informação de referência, isto é, a informação no modo de referência e nas uma ou mais imagens de referência usadas quando da codificação do bloco B, também a ser usado quando da decodificação do bloco codificado Be, pode ser transmitida a um decodificador de uma maneira compacta e resiliente de erro. O elemento de sintaxe poderia, por exemplo, ser fornecido sendo transmitido através de um canal de rádio para uma entidade ou nó compreendendo um decodificador. Além disso, o elemento de sintaxe poderia, por exemplo, ser armazenado em uma memória junto com o vídeo codificado associado e ser acessado por uma entidade de decodificação em outro ponto no tempo.
[0059] Abaixo, uma disposição exemplo 700, adaptada para permitir o desempenho do procedimento acima descrito relacionado à codificação, será descrita com referência à figura 7. A disposição é ilustrada como sendo localizada em uma entidade de codificação de vídeo, 701, que poderia ser um codificador de vídeo ou uma entidade compreendendo ainda unidades funcionais além de um codificador de vídeo, tal como, por exemplo, um computador, um terminal móvel ou um dispositivo de vídeo dedicado. A disposição 700 pode se comunicar com outras entidades através de uma unidade de comunicação (não mostrada), que pode ser considerada para compreender meios convencionais para qualquer tipo de comunicação com fio ou sem fio. Vídeo decodificado a ser codificado é assumido como sendo obtido, por exemplo, a partir da unidade de comunicação ou uma memória.
[0060] A disposição 700 compreende uma unidade de codificação 702, que é adaptada para codificar um bloco, B, de pixels usando um modo de referência e uma ou mais imagens de referência, assim fornecendo um bloco codificado Be. A disposição 700 compreende ainda uma unidade de derivação 704, que é adaptada para derivar um elemento de sintaxe único, que identifica, diretamente ou indiretamente, o modo de referência e as uma ou mais imagens de referência usadas quando da codificação do bloco B. O elemento do índice poderia ser derivado de diferentes maneiras, como previamente descrito, e poderia ser, por exemplo, um indicador, tal como, por exemplo, um índice, ou uma palavra código, etc.
[0061] A disposição 700 compreende ainda uma unidade de fornecimento 706, que é adaptada para fornecer o elemento de sintaxe único a um decodificador do bloco Be, possivelmente através de uma unidade de comunicação. O elemento de sintaxe único pode ser fornecido, por exemplo, através da transmissão sobre um canal de rádio para uma entidade ou nó compreendendo um decodificador.
[0062] A Figura 8 mostra esquematicamente uma modalidade de uma disposição 800 em uma entidade de decodificação de vídeo, que também pode ser uma maneira alternativa de divulgação de uma modalidade da disposição para decodificação em uma entidade de decodificação de vídeo ilustrada na figura 5. Compreendidos na disposição 800, estão aqui uma unidade de processamento 806, por exemplo, com um DSP (Processador de Sinal Digital). A unidade de processamento 806 pode ser uma unidade única ou uma pluralidade de unidades para realizar diferentes ações de procedimentos descritos aqui. A disposição 800 pode também compreender uma unidade de entrada 802 para receber sinais a partir de outras entidades, e uma unidade de saída 804 para fornecer sinais para outras entidades. A unidade de entrada 802 e a unidade de saída 804 podem ser dispostas como uma entidade integrada.
[0063] Ademais, a disposição 800 compreende pelo menos um produto de programa de computador 808 na forma de uma memória não volátil, por exemplo, uma EEPROM (Memória de Apenas Leitura Programável Apagável Eletricamente), uma memória flash e um disco rígido. O produto de programa de computador 808 compreende um programa de computador 810, que compreende meios de código, que quando executados na unidade de processamento 806 na disposição 800 fazem com que a disposição e/ou a entidade de decodificação de vídeo realizem as ações dos procedimentos descritos anteriormente em conjunção com a figura 4.
[0064] O programa de computador 810 pode ser configurado como um código de programa de computador estruturado em módulos de programa de computador. Consequentemente, nas modalidades exemplares descritas, os meios de código no programa de computador 810 da disposição 800 compreendem um módulo de obtenção 810a para obtenção de um elemento de sintaxe único associado com uma unidade/bloco de vídeo codificado, por exemplo, através da decodificação a partir de um fluxo de bit originando-se a partir de uma entidade de transmissão de dados ou a partir de um armazenamento, por exemplo, uma memória. O programa de computador compreende ainda um módulo de identificação 810b para identificação de um modo de referência e uma ou mais imagens de referência com base no elemento de sintaxe obtido. O programa de computador 810 compreende ainda um módulo de decodificação 810c para decodificação do bloco codificado.
[0065] Os módulos 810a-c poderiam essencialmente realizar as ações do fluxo ilustrado na figura 4, para imitar a disposição em uma entidade de decodificação de vídeo ilustrada na figura 5. Em outras palavras, quando os diferentes módulos 810a-c são executados na unidade de processamento 806, eles correspondem às unidades 502-506 da figura 5.
[0066] Similarmente, uma alternativa correspondente para a disposição ilustrada na figura 7 é possível.
[0067] Embora os meios de código na modalidade descrita acima em conjunção com a figura 8 sejam implementados como módulos de programa de computador que, quando executados na unidade de processamento, fazem com que a disposição e/ou entidade de tratamento/ apresentação de vídeo realize as ações descritas acima na conjunção com a figura mencionada acima, pelo menos um dos meios de código pode em modalidades alternativas ser implementado pelo menos em parte como circuitos de hardware.
[0068] O processador pode ser uma única CPU (Unidade central de processamento), mas poderia também compreender duas ou mais unidades de processamento. Por exemplo, o processador pode incluem microprocessadores de uso geral; processadores de conjunto de instruções e/ou conjuntos de chips relacionados e/ou microprocessadores de finalidade especial tal como ASICs (Circuito Integrado de Aplicação Específica). O processador pode também compreender memória de placa para propósito de cache. O produto de programa de computador pode ser portado por um produto de programa de computador conectado ao processador. O produto de programa de computador compreende um meio legível por computador no qual o programa de computador é armazenado. Por exemplo, o produto de programa de computador pode ser a memória flash, uma RAM (Memória de acesso aleatório), ROM (Memória de apensa leitura) ou uma EEPROM, e os módulos do programa de computador descritos acima poderiam, nas modalidades alternativas, ser distribuídos em diferentes produtos de programas de computador na forma de memórias dentro da unidade de recebimento de dados.
[0069] Além disso, percebe-se que um problema com a tecnologia de codificação de vídeo existente é que nenhum esquema da previsão de modo de referência /imagem de referência satisfatório é definido ou aplicado. Abaixo, um tal esquema de previsão será descrito. Percebe-se que em, por exemplo, uma cena de corte /desbotamento /cenário flash, é bastante comum que a mesma, por exemplo, combinação do modo de referência e imagens de referência seja usada para a previsão de MBs vizinhos ou adjacentes. Além disso, percebe-se que os métodos de codificação correntes não tiram vantagem da correlação entre os modos de referência/ imagens de referência usados para MBs vizinhos. Em soluções anteriores, os componentes de identificação separados da informação de referência MB são codificados independente e transmitidos para um decodificador de vídeo.
[0070] Um esquema de previsão exemplificado no nível MB poderia ser descrito como segue. O esquema de previsão exemplificado se aplica a ambos codificador e decodificador, e poderia ser aplicado a qualquer tamanho do bloco.
[0071] Em associação com a codificação/decodificação de um MB corrente, o codificador /decodificador é disposto para analisar os indicadores de referência dos MBs codificados em torno, também chamado “o contexto” do MB. Estes blocos em torno poderiam também ser denotados os “blocos vizinhos” do bloco corrente. O codificador/decodificador conta o número de vezes cada um fora de um conjunto de indicadores candidatos ou índices aparece entre os blocos vizinhos, e seleciona um, por exemplo, de acordo com um esquema predefinido, com a maior contagem, como sendo uma previsão ou estimativa. O indicador de referência selecionado deve ser relacionado à previsão inter. O indicador de referência selecionado é definido por uma previsão ou estimativa de quais imagens de referência (e modo de referência) que podem ser adequadas para uso quando da codificação/decodificação do MB corrente. A previsão é derivada através da análise da informação relacionada aos blocos vizinhos codificados/ decodificados do MB, em vez de através da análise do MB corrente do mesmo. Em um codificador, o MB pode ou ser codificado ou decodificado durante esta seleção de uma previsão, uma vez que neste exemplo, a previsão não é para ser usada para seleção de imagens de referência (e modo de referência) para uso quando da codificação do MB corrente. Em um decodificador, o MB corrente é codificado durante a previsão.
[0072] Uma análise e uma seleção de indicador de referência de bloco vizinho exemplificativas de uma estimativa são ilustradas na figura 9. No exemplo ilustrado na figura 9, quatro blocos vizinhos de um bloco corrente são considerados. Entretanto, o método é aplicado também a outros conjuntos ou subconjuntos de blocos vizinhos considerados. Um exemplo de conjunto ou blocos vizinhos poderia consistir de, por exemplo, um bloco à esquerda, um bloco à esquerda no topo e um bloco acima em relação ao bloco corrente. Outros exemplos de conjunto poderiam compreender apenas o bloco à esquerda e bloco acima. Na figura 9, os blocos vizinhos do bloco corrente são associados com os indicadores de referência respectivos, ou índices, 1, 1, 2 e 0. Assim, o indicador de referência “1” tem a maior contagem, isto é, a maior frequência de ocorrência, por aparecer duas vezes entre os blocos vizinhos. Assim, o indicador de referência “1” é selecionado para representar a previsão ou estimativa das imagens de referência (e modo) usadas, ou a ser usadas, quando da codificação de um bloco corrente, ou, quando a previsão ocorre em um decodificador, a previsão das imagens de referência (e modo) a ser usadas quando da decodificação do bloco corrente.
[0073] Quando da contagem do número de ocorrências de um certo indicador de referência entre os blocos vizinhos, mais de um candidato pode ter o mesmo número de contagem mais alto. Isto é ilustrado na figura 10, onde os indicadores de referência “1” e “2” ambos aparecem quatro vezes. Isto poderia ser resolvido, por exemplo, selecionando os indicadores de referência de acordo com um esquema de posição predefinido. Por exemplo, quando os indicadores de referência são representados pelos números 0-2, como ilustrado nas figuras 9 e 10, o indicador de referência representado pelo maior, ou menor, número poderia ser selecionado como previsto.
[0074] A diferença entre um bloco de valores de pixel previstos e os valores de pixel originais, isto é, a fonte antes de ser codificada, é codificada por codificação de transformada, por exemplo, DCT (Transformada Discreta de Cosseno). A saída de transformada compreende coeficientes de transformada, que são então quantizados. O número de coeficientes de transformada associados com um bloco reflete como é bom o casamento entre o bloco previsto e o bloco geral, para a dada quantização. Relativamente poucos coeficientes de transformada indica que existe um bom casamento. Consequentemente, indicadores de referência associados com blocos tendo poucos coeficientes de transformada poderiam ser considerados mais confiáveis.
[0075] Assim, a contagem das ocorrências poderia também ser ponderada de acordo com, por exemplo, os coeficientes de transformada codificados associados com os blocos de referência. Como descrito acima, um índice de referência associado com um bloco vizinho com poucos coeficientes de transformada codificados poderia ser considerado uma previsão mais confiável do que um índice de referência associado com um bloco vizinho com muitos coeficientes de transformada, e pode assim ser atribuído um peso maior para a previsão de índice de referência. Em outro exemplo, blocos com coeficientes codificados podem ter peso maior que blocos sem coeficientes codificados, isto é, blocos pulados. Em outro exemplo, um índice de referência associado com um bloco vizinho que tem uma grande partição MV, por exemplo, um grande MB, poderia ser considerado mais confiável do que um bloco vizinho com uma menor partição MV, e seria assim designado um peso maior para a previsão de índice de referência. O uso de pesos que são múltiplos de 2 é benéfico em vista da complexidade. A contagem ponderada poderia também ser implementada pelo uso de uma tabela de pesquisa.
[0076] Alguns indicadores de referência podem ser mais relacionados a cada outro do que outros. Por exemplo, quando usando juntamente informação codificada de referência, o indicador de referência representando bi-previsão usando os quadros de referência ref0 e ref1 será mais relacionado ao indicador de referência representando uni-previsão usando um de ref0 e ref1, que, por exemplo, a um indicador de referência representando uni- previsão usando quadro de referência ref2. Assim, quando contando um indicador bi-previsão, os indicadores correspondentes representando uni- previsão usando os mesmos quadros de referência poderiam ser atualizados com algum valor de contagem menor, isto é, menor que o valor de contagem para um “casamento total”. Similarmente, indicadores de referência representando uni-previsão usando, por exemplo, ref0 e ref1, são mais relacionados ao indicador de referência correspondente representando bi- previsão usando ref0 e ref1, do que outros indicadores de referência de bi- previsão. Assim, quando contando um indicador de referência unidirecional, a contagem de indicadores de referência correspondente a uma multi-previsão onde o quadro de referência em questão é usado pode também ser atualizada com algum valor menor.
[0077] A Figura 10 ilustra outra modalidade exemplificativa de determinação da frequência da ocorrência de certos indicadores de referência para um bloco corrente, pela contagem de indicadores de referência associados com os blocos vizinhos do bloco corrente. Aqui, um bloco corrente é um MB grande, e os blocos vizinhos são menores em tamanho do que o bloco corrente. Em alguns casos, pode ser de interesse ter o mesmo número de blocos vizinhos no contexto independentemente do tamanho do bloco dos blocos em questão.
[0078] Uma vantagem de introduzir a previsão do indicador de referência, ou previsão do índice de referência, é permitir um mapeamento mais eficiente de uma tabela VLC. Ao considerar a previsão e a tabela VLC juntas, maior compressão pode ser obtida. Por exemplo, quando assumindo codificação de 3 índices, por exemplo, (0,1,2), sem o uso de previsão, uma tabela VLC fixada pode ser atribuída, como a ilustrada na figura 11. Assumindo que o símbolo do índice “2” ocorre mais frequentemente, a tabela ilustrada na figura 11 teria um projeto sub-ideal, uma vez que “2” é codificado usando uma palavra código com dois bits, isto é, “11”, enquanto o menos frequente “0” é codificada usando um bit, isto é, “0”.
[0079] Quando a previsão é adicionada, um projeto melhor da tabela VLC é habilitado. Um exemplo de um tal projeto melhorado da tabela VLC é ilustrado na figura 12. Em um tal projeto melhorado VLC, os bits gastos para codificação de um indicador de referência ou símbolo do índice podem ser adaptados com base na previsão e assim sobre o contexto do bloco corrente. Na tabela ilustrada na figura 12, o indicador de referência ocorrendo mais frequentemente no contexto do bloco corrente é codificado usando uma palavra código de bit único, neste exemplo, “0”. As palavras de código “10”, e “11”, compreendendo dois bits, poderiam ser definidas para identificar, por exemplo, o indicador de referência tendo a segunda maior frequência de ocorrência e o indicador de referência tendo uma terceira maior frequência de ocorrência, respectivamente. Ambos o codificador e o decodificador de indicadores de referência devem estar cientes de, e concordam, como realizar a previsão e como interpretar as palavras código.
[0080] O exemplo descrito acima é apenas um exemplo simples, e deve ser observado que o projeto possível não é limitado a este. Existem várias maneiras de atribuir diferentes tabelas VLC para indicadores de referência ou símbolos do índice, por exemplo, quando mais indicadores de referência ou símbolos do índice são envolvidos. Um exemplo de abordagem poderia ser variar a indexação com a probabilidade de ocorrência dos índices, de modo que um indicador de referência ocorrendo frequentemente seja designado um baixo número de índice, e vice versa, e que um baixo número do índice custa menos bits para codificar do que um alto número de índice. Codificação Aritmética Binária Adaptativa de Contexto (CABAC) pode ser usada para obter custo de bit variável para representar indicadores de referência ou índices de acordo com sua probabilidade. Alguns exemplos de diferentes contextos são, por exemplo, os indicadores de referência associados com os blocos vizinhos, um número de contagem de indicadores de referência, ou um número de contagem ponderada de indicadores de referência, como descrito acima.
[0081] No estado da técnica, por exemplo, usando H.264, a geração de um bloco de bi-previsão usando dois MVs/ imagens de referência, blocos ou áreas, envolve uma média sobre as duas áreas de referência. Quando MV aponta para uma posição sub-pel (sub-pixel) em uma área de referência, os valores de pixel da posição sub-pel necessitam ser primeiro gerados, antes da média. A geração de valores de pixel da posição sub-pel é referida como “filtragem espacial”, isto é, o processo de geração envolve a filtragem espacial das áreas de referência respectivas. Assim, o processo do estado da técnica para geração de um bloco de bi-previsão usando duas áreas de referência envolve filtragem espacial da primeira área; filtragem espacial da segunda área, e finalmente a média sobre as áreas filtradas. Filtragem espacial é relativamente exigente em termos de complexidade computacional.
[0082] Percebe-se que esta complexidade computacional poderia ser reduzida, o que será descrito abaixo. A fim de reduzir a complexidade, um bloco pode primeiro ser construído baseado no movimento inteiro, por exemplo, adicionando os dois blocos de referência juntos (sem execução da filtragem espacial). Esta adição é uma operação que é relativamente barata em termos de complexidade computacional. Então, o bloco resultante pode ser filtrado, por exemplo, interpolado, a fim de obter, por exemplo, metade ou quarto-pel da resolução. O ajuste sub-pel pode ser executado de acordo com um dos MVs, ou baseado em, por exemplo, informação adicional codificada/ decodificada separadamente.
[0083] Quando um bloco é associado com mais que um MV e o índice de referência, que é aqui referido como “multi-previsão”, os respectivos componentes de previsão unidirecional da multi-previsão podem ser determinados. Uni-previsão pode ser referida como “única-previsão”, como pode também, por exemplo, intra previsão. Percebe-se que a partição da informação poderia ser derivada baseada na diferença absoluta entre estas previsões unidirecionais. A partição da informação poderia ser derivada tanto sobre o codificador e o decodificador, a fim de evitar a sobrecarga quando transmitindo informação de partição de fina granulação.
[0084] Em regiões onde a diferença absoluta entre as previsões unidirecionais é relativamente maior, uma única previsão unidirecional ou uma bi-previsão espacial poderia ser usada. A única previsão unidirecional poderia ser feita de acordo com o índice de referência e MV indicado no fluxo de bits para um dos componentes de bi-previsão da bi-previsão (ou multi- previsão). Em outras regiões do bloco, onde a diferença absoluta entre as previsões unidirecionais é relativamente menor, bi-previsão pode ser usada como indicada no fluxo de bits para o bloco. A decisão de se usar uma única bi-previsão /bi-previsão espacial para uma região, ou uso da bi-previsão indicada no fluxo de bits, poderia ser baseada por exemplo sobre uma comparação da diferença absoluta entre as previsões unidirecionais associadas com a região e um limite predefinido.
[0085] Assumindo um bloco de bi-previsão associado com 2 MVs e 2 áreas de referência. Convencionalmente, neste estágio, este bloco não é ainda dividido, mas é codificado como está. Entretanto, percebe-se que a informação “implícita” obtida a partir de análise de diferenças absolutas ou o “mapa de diferença” poderia ser usada para dividir o bloco em mais partições, tanto no codificador quanto no decodificador.
[0086] Quando a diferença absoluta de 2 áreas de referência ou previsões é calculada, haverá alguma(s) região(s) no mapa de diferença com mais elevado(s) valor(es) absoluto(s) e alguma(s) região(ões) com menor(es) valor(es) absoluto(s). Um baixo valor da diferença absoluta em uma região geralmente representa que o mesmo objeto é representado nesta região em ambas as áreas de referência. Se diferentes objetos estariam representados na região nas áreas de referência respectivas, a diferença absoluta seria grande. Se o mesmo objeto é representado em uma correspondente região nas áreas de referência respectivas, ele é adequado e apropriado para média das regiões. Se as regiões correspondentes representam diferentes objetos, não faz sentido fazer a média delas.
[0087] Por exemplo, um limite poderia ser definido, onde valores de diferença mais elevados do que o limite representam “diferentes regiões de objetos”, e valores de diferença menores que o limite representam “algumas regiões do objeto”. O bloco poderia ser particionado de acordo com estas regiões, de acordo com um esquema predefinido. Como afirmado previamente, a partição poderia ser executada baseada na informação implícita, isto é, sem sinalização explícita descrevendo o particionamento. Outra vantagem disso é que “particionamento não quadrado” pode ser suportado. Por exemplo, quando a metade de uma bola é representada em um bloco, a partição do bloco poderia ser feita muito precisa em torno da borda da bola.
[0088] O codificador pode sinalizar ao decodificador se a abordagem de partição descrita acima deve ser usada. Quando sinalizado que a abordagem de partição deve ser usada, o codificador pode opcionalmente sinalizar, para regiões tendo um valor absoluto de diferença relativamente alto, quais das previsões unidirecionais usar ou que bi-previsão espacial usar. Por exemplo, bi-previsão ponderada (diferente da média e possivelmente com offset DC) poderia ser usada. Em alguns casos, pode ser necessário codificar/ decodificar alguma informação adicional para determinar parâmetros locais para ser capaz de produzir a bi-previsão espacial. A informação de partição obtida pode também ser usada para previsão de informação de partição e o codificador pode codificar mudanças comparadas à partição prevista a ser decodificada e usada pelo decodificador. A derivação de informação de partição baseada na diferença entre as áreas de referência pode dar uma indicação aproximada de como a partição deve ser feita. Refinamento adicional pelo envio de refinamentos da informação de partição prevista é também possível.
[0089] Um exemplo para obter a informação de partição consiste em dividir o bloco em 4 sub-blocos de tamanhos iguais. O sub-bloco com maior SAD normalizado ((Soma das diferenças absolutas) (divididas pelo número de pixels sobre os quais foi calculado)) normalizado é iterativamente dividido em 4 regiões de tamanhos iguais se o SAD normalizado do sub-bloco for, por exemplo, igual a ou maior que o SAD normalizado do bloco “principal” 4 vezes maior. O SAD normalizado refere-se a SAD por pixel ou SAD por um tamanho do sub-bloco específico. Ao invés de SAD, outras métricas de pixels diferentes poderiam alternativamente ser usadas. Um exemplo é uma métrica com mais peso na estrutura da imagem local forte, por exemplo, bordas/ linhas. Um sub-bloco restante, que não é dividido ainda, é então definido para ser a partição que deve usar, por exemplo, alguma modificação da bi- previsão.
[0090] A figura 13 mostra uma modalidade exemplificativa do método de partição. O bloco no lado esquerdo, 1302:a, é bi-previsto. Cálculo SAD é executado sobre o bloco (agora denotado 1302:b), e as áreas SAD altas são identificadas e selecionadas fora, e são tratadas consequentemente. Neste exemplo, a área SAD alta é tratada mudando para previsão unidirecional com apenas MV para trás. Assim, o bloco geral pode ser particionado em duas partições, das quais uma usa a bi-previsão indicada no fluxo de bits, e uma (ilustrada como compreendendo círculos) usa uni-previsão (um dos componentes da bi-previsão). Optimização da Distorção da Taxa (RDO) poderia ser usada para selecionar a melhor uni-previsão (componente da bi- previsão).
[0091] Outro exemplo de como obter informação de partição consiste em dividir, por exemplo, um bloco de bi-previsão em um número de, por exemplo, tamanhos iguais de sub-blocos; determinar o SAD máximo do sub- tamanho do bloco em questão, e selecionar os sub-blocos tendo um SAD “fechado” para, por exemplo, dentro de um certo intervalo a partir, deste valor máximo, para fazer parte de uma região que é para usar alguma versão modificada da bi-previsão, ou uma previsão unidirecional.
[0092] Além de particionamento, esta abordagem pode ser usada, por exemplo, para determinar o índice RIS previamente descrito ou índices de referência do estado da técnica, quando um modo de bi-previsão é usado. Por exemplo, um mapa de diferença suave para uma região pode sugerir, e ser interpretado como, que a região é possivelmente associada com um “índice bi-RIS”. A abordagem poderia ainda ser usada como uma previsão alternativa ou em combinação com o Indicador de previsão de índice de referência previamente descrito. A seleção pode ser feita em ambos o codificador e o decodificador baseada no SAD entre possíveis candidatos de bi-previsão para selecionar a combinação com SAD mínimo.
[0093] Deve ser observado que com a multi-previsão acima descrita baseada na partição aproximada, ao invés de derivar um particionamento baseado em bloco, outros tipos de particionamento poderiam ser derivados tanto no codificador e no decodificador. Isto inclui partição linear (por exemplo, horizontal, vertical, ou diagonal) ou não-linear de bloco em duas ou mais partições, por exemplo de acordo com métodos de processamento de imagem não-linear tal como detecção de borda e/ou segmentação. Por exemplo, o sinal de diferença de multi-previsão pode ser segmentado de acordo com um método de segmentação de imagem tal como detecção de borda ou região crescente, e então a partição do bloco é derivada baseada no sinal de diferença segmentado.
[0094] O número de sub-partições poderia ser derivado através de quaisquer métodos de processamento de imagem tal como segmentação de imagem, ou poderia ser sinalizado do codificador para o decodificador. Como uma alternativa para particionamento linear ou não linear, também partição baseada em pixel pode ser aplicada. Uma variante seria para sinalizar a partir do codificador para o decodificador em que método de partição é usado, outra variante seria que o método de partição é acordado entre o codificador e o decodificador através de outros meios de sinalização. A vantagem com métodos baseados em multi-previsão é que a informação de partição pode ser derivada baseada na informação que já está disponível no codificador e no decodificador, isto é, ela não tem de ser explicitamente sinalizada, reduzindo assim o número de bits usados para codificação.
[0095] Deve ser observado que, de acordo com particionamento baseado em multi-previsão, ao invés de comutação de bi-previsão para uni- previsão com MVs unidirecionais derivados dos MVs usados para bi- previsão, é também possível sinalizar MVs e/ou modos de previsão adicionais (previsão de inter-imagem unidirecional, previsão de inter-imagem bidirecional, ou previsão de intra-imagem) para sub-partições. Em outras palavras, o número e formas das partições para um bloco poderiam ou ser sinalizados explicitamente e/ou ser derivados a partir de informação implícita, com base em, por exemplo, um método de segmentação. Além disso, MVs e/ou modo de previsão podem ser sinalizados por alguma ou todas das sub- partições resultantes.
[0096] Enquanto o procedimento como sugerido acima foi descrito com referência às modalidades específicas fornecidas como exemplo, a descrição geralmente apenas pretende ilustrar o conceito inventivo e não deve ser tomada como limitativa do âmbito dos métodos e disposições sugeridos, que são definidos pelas reivindicações anexas. Enquanto descrito em termos gerais, os métodos e as disposições podem ser aplicados, por exemplo, para diferentes tipos de sistemas de comunicação, usando tecnologias de comunicação comumente disponíveis, tal como, por exemplo, tecnologias GSM/EDGE, WCDMA ou LTE ou broadcast por satélite, terrestre, ou cabo, por exemplo, DVB-S, DVB-T, ou DVB-C, mas também para armazenamento/ recuperação de vídeo para/a partir de memória.
[0097] Deve também ser entendido que a escolha de unidade de interação ou módulos, assim como a nomeação das unidades são apenas para exemplificar propósitos, e entidades de manipulação de vídeo adequadas para executar quaisquer dos métodos descritos acima podem ser configuradas em uma pluralidade de maneiras alternativas a fim de ser capaz de executar os processos das ações sugeridas.
[0098] Deve ser observado que as unidades ou módulos descritos neste relatório devem ser considerados como entidades lógicas e não com necessidade como entidades físicas separadas.
[0099] AVC Codificação de Vídeo Avançada CABAC Codificação Aritmética do Contexto Binário Adaptado GOP Grupo de Imagens MB Bloco Macro MV Vetor de Movimento RIS Sinalização do Índice de Referência/ Informação de sinalização de Referência do Indicador SAD Soma de Diferença Absoluta VLC Codificação do Comprimento Variável
Claims (28)
1. Método em um decodificador de vídeo para decodificar informação, o método caracterizado pelo fato de compreender: obter (402) um elemento de sintaxe único associado com um bloco codificado Be, em que o elemento de sintaxe único representa uma entrada em uma primeira lista de referência predefinida e em que a primeira lista compreende uma ou mais entradas identificando pelo menos uma de uma pluralidade de imagens de referência e uma única imagem de referência; identificar (404) um modo de referência e uma ou mais imagens de referência com base no elemento de sintaxe obtido; e decodificar (406) o bloco Be com base no modo de referência identificado e uma ou mais imagens de referência, assim fornecendo um bloco decodificado, B, de pixels.
2. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a identificação de um modo de referência e as uma ou mais imagens de referência são baseadas em um mapeamento predefinido entre o elemento de sintaxe obtido e o modo de referência e uma ou mais imagens de referência específicas a serem usadas quando da decodificação do bloco Be.
3. Método, de acordo com qualquer uma das reivindicações 1 ou 2, caracterizadopelo fato de que cada entrada na primeira lista ainda identifica um modo de referência.
4. Método, de acordo com qualquer uma das reivindicações 1 a 3, caracterizado pelo fato de que o elemento de sintaxe ainda representa um modo de referência e uma entrada em uma segunda lista de referência predefinida.
5. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que uma ou mais figuras de referência incluem uma figura de referência do passado e uma figura de referência do futuro.
6. Disposição (500) em um decodificador de vídeo compreendendo um processador e uma memória, a memória contendo instruções executáveis pelo processador, a disposição caracterizada pelo fato de ser operada para: obter um elemento de sintaxe único associado com um bloco codificado Be, em que o elemento de sintaxe único representa uma entrada em uma primeira lista de referência predefinida e em que a primeira lista compreende uma ou mais entradas identificando pelo menos uma de uma pluralidade de imagens de referência e uma única imagem de referência; identificar um modo de referência e as uma ou mais imagens de referência com base no elemento de sintaxe obtido; e decodificar o bloco Be com base no modo de referência identificado e uma ou mais imagens de referência, assim fornecendo um bloco decodificado B de pixels.
7. Disposição, de acordo com a reivindicação 6, caracterizada pelo fato de ser ainda operada para identificar o modo de referência e as uma ou mais imagens de referência com base em um mapeamento predefinido entre o elemento de sintaxe obtido e o modo de referência e as uma ou mais imagens de referência específicas a serem usadas quando da decodificação do bloco Be.
8. Disposição, de acordo com qualquer uma das reivindicações 6 ou 7, caracterizadapelo fato de que cada entrada na primeira lista ainda identifica um modo de referência.
9. Disposição, de acordo com a reivindicação 6, caracterizada pelo fato de ser ainda operada para interpretar o elemento de sintaxe como representando ainda um modo de referência e uma entrada em uma segunda lista de referência predefinida.
10. Disposição, de acordo com a reivindicação 9, caracterizada pelo fato de a segunda lista compreender uma ou mais entradas identificando uma imagem de referência única.
11. Disposição, de acordo com a reivindicação 6, caracterizada pelo fato de que as uma ou mais entradas de lista são identificadas por um índice de lista.
12. Disposição de acordo com qualquer uma das reivindicações 6, caracterizada pelo fato de ser operada ainda para interpretar o número de bits representando o elemento de sintaxe obtido como correlacionado à probabilidade dos valores específicos do elemento de sintaxe, de tal forma que poucos bits impliquem valores prováveis, e mais bits impliquem valores menos prováveis.
13. Disposição, de acordo com a reivindicação 6, caracterizada pelo fato de ser operada ainda para realizar previsão de informação de referência para Be, com base em elementos de sintaxe únicos associados com blocos vizinhos.
14. Disposição, de acordo com a reivindicação 6, caracterizada pelo fato de ser operada ainda para identificar uma ou mais sub-regiões de um bloco associado com multi-previsão, para que sub-regiões das respectivas regiões correspondentes dos blocos de referência de multi-previsão possuem uma correlação baixa entre eles.
15. Disposição, de acordo com a reivindicação 6, caracterizada pelo fato de que uma ou mais figuras de referência incluem uma figura de referência do passado e uma figura de referência do futuro.
16. Meio não transitório legível por computador para controlar um decodificador de vídeo, o meio não transitório legível por computador caracterizado por compreender instruções que, quando executadas no decodificador de vídeo, fazem com que o decodificador de vídeo: obtenha um elemento de sintaxe único associado a um bloco codificado Be, em que o elemento de sintaxe único representa uma entrada em uma primeira lista de referência predefinida e em que a primeira lista compreende uma ou mais entradas que identifique pelo menos uma dentre uma pluralidade de imagens de referência e uma única imagem de referência; identifique um modo de referência e as uma ou mais imagens de referência com base no elemento de sintaxe obtido; e decodificar o bloco Be baseado no modo de referência identificado e nas uma ou mais imagens de referência, fornecendo um bloco decodificado, B, de pixels.
17. Método em um codificador de vídeo para codificar informação, o método caracterizado pelo fato de compreender as etapas de: codificar (602) um bloco B de pixels usando um modo de referência e uma ou mais imagens de referência, assim fornecendo um bloco codificado Be; derivar (604) um elemento de sintaxe único identificando o modo de referência e as uma ou mais imagens de referência, em que o elemento de sintaxe representa uma entrada em uma primeira lista de referência predefinida e em que a primeira lista compreende uma ou mais entradas identificando pelo menos uma de uma pluralidade de imagens de referência e uma única imagem de referência; - fornecer (606) o elemento de sintaxe a um decodificador do bloco Be.
18. Método, de acordo com a reivindicação 17, caracterizado pelo fato de que o elemento de sintaxe é derivado pelo modo de referência usado e as uma ou mais imagens de referência são mapeadas para o elemento de sintaxe de acordo com um esquema de mapeamento predefinido.
19. Método, de acordo com a reivindicação 17, caracterizado pelo fato de que cada entrada na primeira lista ainda identifica um modo de referência.
20. Disposição (700) em um codificador de vídeo compreendendo um processador e uma memória, a memória contendo instruções executáveis pelo processador, a disposição caracterizadapelo fato de ser operada para: codificar um bloco B de pixels usando um modo de referência e uma ou mais imagens de referência, assim fornecendo um bloco codificado Be; derivar um elemento de sintaxe único identificando o modo de referência e as uma ou mais imagens de referência, em que o elemento de sintaxe representa uma entrada em uma primeira lista de referência predefinida e em que a primeira lista compreende uma ou mais entradas identificando pelo menos uma de uma pluralidade de imagens de referência e uma única imagem de referência; e fornecer o elemento de sintaxe a um decodificador do bloco Be.
21. Disposição, de acordo com a reivindicação 20, caracterizada pelo fato de ser operada ainda para derivar o elemento de sintaxe a partir de um mapeamento predeterminado entre o modo de referência e uma ou mais imagens de referência e o elemento de sintaxe.
22. Disposição, de acordo com a reivindicação 20, caracterizada pelo fato de que cada entrada na primeira lista ainda identifica um modo de referência.
23. Disposição, de acordo com a reivindicação 20, caracterizada pelo fato de ser operada ainda para derivar o elemento de sintaxe de tal modo a ainda representar um modo de referência e uma entrada em uma segunda lista de referência predefinida.
24. Disposição, de acordo com a reivindicação 23, caracterizada pelo fato de a segunda lista compreender uma ou mais entradas identificando uma respectiva imagem de referência única.
25. Disposição, de acordo com a reivindicação 20, caracterizada pelo fato de ser operada ainda para derivar o elemento de sintaxe pela seleção de um índice de lista identificando uma ou mais entradas em uma ou mais listas de referência predefinidas.
26. Disposição, de acordo com a reivindicação 20, caracterizada pelo fato de ser operada ainda para selecionar o número de bits representando o elemento de sintaxe de tal forma a ser correlacionado à probabilidade dos modos e imagens específicos, que o elemento de sintaxe identifica, de modo que probabilidade mais elevada corresponda a poucos bits, e probabilidade mais baixa corresponda a mais bits.
27. Disposição, de acordo com a reivindicação 20, caracterizada pelo fato de ser operada ainda para realizar previsão de informação de referência para B ou Be, com base em elementos de sintaxe únicos associados com blocos vizinhos.
28. Meio não transitório legível por computador para controlar um codificador de vídeo, o meio não transitório legível por computador caracterizado por compreender instruções que, quando executadas no codificador de vídeo, fazem o codificador de vídeo: codificar um bloco B de pixels usando um modo de referência e uma ou mais imagens de referência, fornecendo assim um bloco codificado Be; derivar um único elemento de sintaxe identificando o modo de referência e as uma ou mais imagens de referência, em que o elemento de sintaxe representa uma entrada em uma primeira lista de referências predefinida e em que a primeira lista compreende uma ou mais entradas que identificam pelo menos uma dentre uma pluralidade de imagens de referência e uma única imagem de referência; e fornecer o elemento de sintaxe para um decodificador do bloco Be.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US28724209P | 2009-12-17 | 2009-12-17 | |
US61/287,242 | 2009-12-17 | ||
PCT/SE2010/051412 WO2011075071A1 (en) | 2009-12-17 | 2010-12-17 | Method and arrangement for video coding |
Publications (2)
Publication Number | Publication Date |
---|---|
BR112012015001A2 BR112012015001A2 (pt) | 2016-11-29 |
BR112012015001B1 true BR112012015001B1 (pt) | 2021-06-29 |
Family
ID=44167578
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
BR112012015001-4A BR112012015001B1 (pt) | 2009-12-17 | 2010-12-17 | Método em um decodificador de vídeo para decodificar informação, disposição em um decodificador de vídeo, meio não transitório legível por computador para controlar um decodificador de vídeo, método em um codificador de vídeo para codificar informação, disposição em um codificador de vídeo, e, meio não transitório legível por computador para controlar um codificador de vídeo |
Country Status (8)
Country | Link |
---|---|
US (3) | US9100658B2 (pt) |
EP (2) | EP2514209A4 (pt) |
JP (2) | JP5855013B2 (pt) |
CN (2) | CN102656890B (pt) |
BR (1) | BR112012015001B1 (pt) |
CA (2) | CA2784515A1 (pt) |
RU (1) | RU2551207C2 (pt) |
WO (2) | WO2011075071A1 (pt) |
Families Citing this family (44)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103385002A (zh) * | 2010-02-17 | 2013-11-06 | 韩国电子通信研究院 | 用于对超高清图像进行编码的装置及其方法、以及解码装置及其方法 |
US20110310976A1 (en) * | 2010-06-17 | 2011-12-22 | Qualcomm Incorporated | Joint Coding of Partition Information in Video Coding |
JP2012023651A (ja) * | 2010-07-16 | 2012-02-02 | Sony Corp | 画像処理装置と画像処理方法 |
KR20130036768A (ko) | 2010-07-28 | 2013-04-12 | 노키아 코포레이션 | 복잡도 균형 엔트로피 코딩을 제공하는 방법 및 장치 |
US9398308B2 (en) * | 2010-07-28 | 2016-07-19 | Qualcomm Incorporated | Coding motion prediction direction in video coding |
US9025661B2 (en) | 2010-10-01 | 2015-05-05 | Qualcomm Incorporated | Indicating intra-prediction mode selection for video coding |
TW201230818A (en) * | 2010-11-26 | 2012-07-16 | Panasonic Corp | Image encoding method, image decoding method, image encoding device, image decoding device, program, and integrated circuit |
US8913662B2 (en) * | 2011-01-06 | 2014-12-16 | Qualcomm Incorporated | Indicating intra-prediction mode selection for video coding using CABAC |
US9008176B2 (en) * | 2011-01-22 | 2015-04-14 | Qualcomm Incorporated | Combined reference picture list construction for video coding |
US9008181B2 (en) * | 2011-01-24 | 2015-04-14 | Qualcomm Incorporated | Single reference picture list utilization for interprediction video coding |
WO2012124961A2 (ko) * | 2011-03-11 | 2012-09-20 | 삼성전자 주식회사 | 영상의 부호화 방법 및 장치, 그 복호화 방법 및 장치 |
US8934552B2 (en) | 2011-03-31 | 2015-01-13 | Qualcomm Incorporated | Combined reference picture list construction and mapping |
US9485518B2 (en) * | 2011-05-27 | 2016-11-01 | Sun Patent Trust | Decoding method and apparatus with candidate motion vectors |
TR201819396T4 (tr) | 2011-05-27 | 2019-01-21 | Sun Patent Trust | Görüntü Kod Çözme Metodu Ve Görüntü Kod Çözme Cihazı |
MX2013012209A (es) | 2011-05-31 | 2013-11-01 | Panasonic Corp | Metodo de codificacion de video, aparato de codificacion de video, metodo de decodificacion de video, aparato de decodificacion de video y aparato de codificacion/decodificacion de video. |
KR20120140592A (ko) | 2011-06-21 | 2012-12-31 | 한국전자통신연구원 | 움직임 보상의 계산 복잡도 감소 및 부호화 효율을 증가시키는 방법 및 장치 |
WO2012177052A2 (ko) | 2011-06-21 | 2012-12-27 | 한국전자통신연구원 | 인터 예측 방법 및 그 장치 |
GB2492337B (en) * | 2011-06-27 | 2018-05-09 | British Broadcasting Corp | Video encoding and decoding using reference pictures |
US9699456B2 (en) | 2011-07-20 | 2017-07-04 | Qualcomm Incorporated | Buffering prediction data in video coding |
AU2012291454B2 (en) | 2011-08-03 | 2016-11-17 | Sun Patent Trust | Video encoding method, video encoding apparatus, video decoding method, video decoding apparatus, and video encoding/decoding apparatus |
WO2013057877A1 (ja) | 2011-10-19 | 2013-04-25 | パナソニック株式会社 | 画像符号化方法、画像符号化装置、画像復号方法、および、画像復号装置 |
JP2013126093A (ja) * | 2011-12-14 | 2013-06-24 | Sony Corp | 画像処理装置及び画像処理方法 |
JPWO2013108690A1 (ja) * | 2012-01-19 | 2015-05-11 | ソニー株式会社 | 画像処理装置および方法 |
US9467695B2 (en) | 2012-01-19 | 2016-10-11 | Vid Scale, Inc. | Method and apparatus for signaling and construction of video coding reference picture lists |
US9762903B2 (en) | 2012-06-01 | 2017-09-12 | Qualcomm Incorporated | External pictures in video coding |
CN108540813B (zh) | 2012-09-28 | 2021-03-16 | 杜比国际公司 | 图像解码装置 |
CN103237212B (zh) * | 2013-04-08 | 2016-04-13 | 浙江大学 | 一种生成增强层块单元编码信息参考队列的方法及装置 |
US9948934B2 (en) * | 2014-07-02 | 2018-04-17 | Apple Inc. | Estimating rate costs in video encoding operations using entropy encoding statistics |
WO2016034058A1 (en) * | 2014-09-01 | 2016-03-10 | Mediatek Inc. | Method of intra picture block copy for screen content and video coding |
US10148953B2 (en) | 2014-11-10 | 2018-12-04 | Samsung Electronics Co., Ltd. | System and method for intra prediction in video coding |
WO2016195460A1 (ko) * | 2015-06-05 | 2016-12-08 | 한양대학교 산학협력단 | 화면 내 예측에 대한 부호화/복호화 방법 및 장치 |
CA3025490A1 (en) * | 2016-05-28 | 2017-12-07 | Mediatek Inc. | Method and apparatus of current picture referencing for video coding using affine motion compensation |
WO2018181252A1 (en) | 2017-03-28 | 2018-10-04 | Panasonic Intellectual Property Corporation Of America | Encoding apparatus, decoding apparatus, encoding method, and decoding method |
CN107094251B (zh) * | 2017-03-31 | 2021-07-23 | 浙江大学 | 一种基于空间位置自适应质量调整的视频、图像编解码方法及装置 |
FR3062010A1 (fr) * | 2017-07-05 | 2018-07-20 | Orange | Procedes et dispositifs de codage et de decodage d'un flux de donnees representatif d'une sequence d'images |
JP6825506B2 (ja) * | 2017-07-19 | 2021-02-03 | 富士通株式会社 | 動画像符号化装置、動画像符号化方法、動画像符号化用コンピュータプログラム、動画像復号装置及び動画像復号方法ならびに動画像復号用コンピュータプログラム |
JP2018007279A (ja) * | 2017-10-11 | 2018-01-11 | 株式会社東芝 | 復号方法及び復号装置 |
JP2018007278A (ja) * | 2017-10-11 | 2018-01-11 | 株式会社東芝 | 復号方法及び復号装置 |
US11297348B2 (en) | 2018-04-13 | 2022-04-05 | Mediatek Inc. | Implicit transform settings for coding a block of pixels |
FR3080968A1 (fr) * | 2018-05-03 | 2019-11-08 | Orange | Procede et dispositif de decodage d'une video multi-vue, et procede et dispositif de traitement d'images. |
WO2020002641A1 (en) * | 2018-06-29 | 2020-01-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Extended reference intra-picture prediction |
US10650554B2 (en) * | 2018-09-27 | 2020-05-12 | Sony Corporation | Packing strategy signaling |
US11196988B2 (en) | 2018-12-17 | 2021-12-07 | Apple Inc. | Reference picture management and list construction |
CN115714866A (zh) * | 2019-11-01 | 2023-02-24 | 北京达佳互联信息技术有限公司 | 残差和系数编解码的方法和装置 |
Family Cites Families (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6535558B1 (en) | 1997-01-24 | 2003-03-18 | Sony Corporation | Picture signal encoding method and apparatus, picture signal decoding method and apparatus and recording medium |
WO2000064058A1 (fr) * | 1999-04-16 | 2000-10-26 | Fujitsu Limited | Codeur et decodeur |
WO2003021971A1 (en) * | 2001-08-28 | 2003-03-13 | Ntt Docomo, Inc. | Moving picture encoding/transmission system, moving picture encoding/transmission method, and encoding apparatus, decoding apparatus, encoding method, decoding method, and program usable for the same |
US7643559B2 (en) * | 2001-09-14 | 2010-01-05 | Ntt Docomo, Inc. | Coding method, decoding method, coding apparatus, decoding apparatus, image processing system, coding program, and decoding program |
US6950469B2 (en) | 2001-09-17 | 2005-09-27 | Nokia Corporation | Method for sub-pixel value interpolation |
EP2373035B1 (en) * | 2001-11-30 | 2015-11-25 | NTT DoCoMo, Inc. | Moving picture encoding device, moving picture decoding device, moving picture encoding method, moving picture decoding method, program, and computer readable recording medium storing program |
JP4015934B2 (ja) | 2002-04-18 | 2007-11-28 | 株式会社東芝 | 動画像符号化方法及び装置 |
JP3944225B2 (ja) * | 2002-04-26 | 2007-07-11 | 株式会社エヌ・ティ・ティ・ドコモ | 画像符号化装置、画像復号装置、画像符号化方法、画像復号方法、画像符号化プログラム及び画像復号プログラム |
EP1427216A1 (en) | 2002-07-02 | 2004-06-09 | Matsushita Electric Industrial Co., Ltd. | Image encoding method and image decoding method |
KR100865034B1 (ko) * | 2002-07-18 | 2008-10-23 | 엘지전자 주식회사 | 모션 벡터 예측 방법 |
US7154952B2 (en) * | 2002-07-19 | 2006-12-26 | Microsoft Corporation | Timestamp-independent motion vector prediction for predictive (P) and bidirectionally predictive (B) pictures |
US7801217B2 (en) | 2002-10-01 | 2010-09-21 | Thomson Licensing | Implicit weighting of reference pictures in a video encoder |
EP1568222B1 (en) * | 2002-12-04 | 2019-01-02 | Thomson Licensing | Encoding of video cross-fades using weighted prediction |
WO2004064255A2 (en) * | 2003-01-07 | 2004-07-29 | Thomson Licensing S.A. | Mixed inter/intra video coding of macroblock partitions |
KR100510136B1 (ko) * | 2003-04-28 | 2005-08-26 | 삼성전자주식회사 | 참조 픽처 결정 방법, 그 움직임 보상 방법 및 그 장치 |
US7724827B2 (en) * | 2003-09-07 | 2010-05-25 | Microsoft Corporation | Multi-layer run level encoding and decoding |
US7961786B2 (en) * | 2003-09-07 | 2011-06-14 | Microsoft Corporation | Signaling field type information |
US7400681B2 (en) * | 2003-11-28 | 2008-07-15 | Scientific-Atlanta, Inc. | Low-complexity motion vector prediction for video codec with two lists of reference pictures |
US8036271B2 (en) | 2004-02-24 | 2011-10-11 | Lsi Corporation | Method and apparatus for determining a second picture for temporal direct-mode block prediction |
JP4575129B2 (ja) | 2004-12-02 | 2010-11-04 | ソニー株式会社 | データ処理装置およびデータ処理方法、並びにプログラムおよびプログラム記録媒体 |
JP2009500941A (ja) * | 2005-07-08 | 2009-01-08 | エルジー エレクトロニクス インコーポレイティド | 情報を圧縮/圧縮解除するためにビデオ信号のコーディング情報をモデリングする方法 |
CN101371571B (zh) * | 2006-01-12 | 2013-06-19 | Lg电子株式会社 | 处理多视图视频 |
US9215475B2 (en) | 2006-02-02 | 2015-12-15 | Thomson Licensing | Method and apparatus for motion estimation using combined reference bi-prediction |
JP5155157B2 (ja) | 2006-05-12 | 2013-02-27 | パナソニック株式会社 | 動画像復号化装置 |
KR100823287B1 (ko) | 2007-01-03 | 2008-04-21 | 삼성전자주식회사 | 전역 차이 벡터를 이용한 다시점 영상의 부호화, 복호화방법 및 장치 |
WO2008154041A1 (en) * | 2007-06-14 | 2008-12-18 | Thomson Licensing | Modifying a coded bitstream |
CA2650151C (en) | 2008-01-17 | 2013-04-02 | Lg Electronics Inc. | An iptv receiving system and data processing method |
WO2010041855A2 (en) * | 2008-10-06 | 2010-04-15 | Lg Electronics Inc. | A method and an apparatus for processing a video signal |
-
2010
- 2010-12-17 US US13/515,409 patent/US9100658B2/en not_active Expired - Fee Related
- 2010-12-17 CA CA2784515A patent/CA2784515A1/en not_active Abandoned
- 2010-12-17 JP JP2012544440A patent/JP5855013B2/ja not_active Expired - Fee Related
- 2010-12-17 JP JP2012544439A patent/JP2013514718A/ja active Pending
- 2010-12-17 CA CA2784517A patent/CA2784517A1/en not_active Abandoned
- 2010-12-17 EP EP10837998.3A patent/EP2514209A4/en not_active Withdrawn
- 2010-12-17 US US13/515,140 patent/US9071845B2/en active Active
- 2010-12-17 EP EP10837999.1A patent/EP2514210A4/en not_active Withdrawn
- 2010-12-17 CN CN201080057251.3A patent/CN102656890B/zh not_active Expired - Fee Related
- 2010-12-17 WO PCT/SE2010/051412 patent/WO2011075071A1/en active Application Filing
- 2010-12-17 WO PCT/SE2010/051413 patent/WO2011075072A1/en active Application Filing
- 2010-12-17 CN CN201080057234XA patent/CN102668561A/zh active Pending
- 2010-12-17 RU RU2012130147/08A patent/RU2551207C2/ru active
- 2010-12-17 BR BR112012015001-4A patent/BR112012015001B1/pt active IP Right Grant
-
2015
- 2015-05-21 US US14/718,150 patent/US10542284B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
CN102668561A (zh) | 2012-09-12 |
CN102656890A (zh) | 2012-09-05 |
JP2013514719A (ja) | 2013-04-25 |
US20120250766A1 (en) | 2012-10-04 |
US20120250765A1 (en) | 2012-10-04 |
EP2514209A4 (en) | 2014-03-26 |
EP2514210A4 (en) | 2014-03-19 |
CA2784515A1 (en) | 2011-06-23 |
RU2012130147A (ru) | 2014-03-20 |
US9100658B2 (en) | 2015-08-04 |
CN102656890B (zh) | 2016-01-06 |
JP2013514718A (ja) | 2013-04-25 |
US10542284B2 (en) | 2020-01-21 |
US20150264393A1 (en) | 2015-09-17 |
WO2011075071A1 (en) | 2011-06-23 |
RU2551207C2 (ru) | 2015-05-20 |
EP2514210A1 (en) | 2012-10-24 |
US9071845B2 (en) | 2015-06-30 |
CA2784517A1 (en) | 2011-06-23 |
WO2011075072A1 (en) | 2011-06-23 |
BR112012015001A2 (pt) | 2016-11-29 |
JP5855013B2 (ja) | 2016-02-09 |
EP2514209A1 (en) | 2012-10-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
BR112012015001B1 (pt) | Método em um decodificador de vídeo para decodificar informação, disposição em um decodificador de vídeo, meio não transitório legível por computador para controlar um decodificador de vídeo, método em um codificador de vídeo para codificar informação, disposição em um codificador de vídeo, e, meio não transitório legível por computador para controlar um codificador de vídeo | |
CN110677648B (zh) | 处理视频数据的方法、装置及非暂时性存储介质 | |
CN112970253B (zh) | 用于预测的运动候选列表构建 | |
CN113302917B (zh) | 局部照明补偿的改进方法 | |
US20140064369A1 (en) | Video encoding and decoding | |
CN111083485B (zh) | 仿射模式的运动信息的利用 | |
BR122019028117B1 (pt) | Método de codificação de informação para aplicar deslocamentos adaptativos de amostra a uma imagem | |
BR112013016702B1 (pt) | Método e dispositivo para codificação e decodificação de vídeo com resiliência de erro aprimorada | |
US20200221097A1 (en) | Method and apparatus for encoding or decoding video data in fruc mode with reduced memory accesses | |
KR20100080792A (ko) | 기하학적으로 분할된 쌍방 예측 모드 분할들을 비디오 인코딩 및 디코딩하기 위한 방법 및 장치 | |
BR122020002131B1 (pt) | Método e dispositivo para codificar e decodificar uma sequência de imagens e meio legível por computador | |
BR112019028012A2 (pt) | dispositivo e método para determinar um vetor de movimento, codificador e decodificador de vídeo para codificar e decodificar uma pluralidade de fotos | |
CN113632493B (zh) | 变换跳过模式中的子块变换 | |
CN113055686B (zh) | 一种编解码方法、装置及其设备 | |
US11095878B2 (en) | Method and device for encoding a sequence of images and method and device for decoding a sequence of image | |
CN118355659A (zh) | 用于视频处理的方法、装置和介质 | |
BR112017020632B1 (pt) | Métodos e dispositivo para processar dados de vídeo e memória legível por computador | |
BR112017020627B1 (pt) | Derivação de vetor de movimento em codificação de vídeo | |
BR112017020635B1 (pt) | Método para decodificar dados de vídeo, método e aparelho para codificar dados de vídeo, e memória legível por computador | |
BR122020002130B1 (pt) | Método e dispositivo para codificar e decodificar uma sequência de imagens e meio legível por computador | |
BR122020002129B1 (pt) | Método e dispositivo para codificar e decodificar uma sequência de imagens e meio legível por computador | |
BR122020002128B1 (pt) | Método e dispositivo para codificar e decodificar uma sequência de imagens e meio legível por computador |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
B15K | Others concerning applications: alteration of classification |
Ipc: H04N 19/573 (2014.01), H04N 19/159 (2014.01), H04N |
|
B06F | Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette] | ||
B06U | Preliminary requirement: requests with searches performed by other patent offices: procedure suspended [chapter 6.21 patent gazette] | ||
B09A | Decision: intention to grant [chapter 9.1 patent gazette] | ||
B16A | Patent or certificate of addition of invention granted |
Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 17/12/2010, OBSERVADAS AS CONDICOES LEGAIS. PATENTE CONCEDIDA CONFORME ADI 5.529/DF, , QUE DETERMINA A ALTERACAO DO PRAZO DE CONCESSAO. |