BR112012015001B1 - Método em um decodificador de vídeo para decodificar informação, disposição em um decodificador de vídeo, meio não transitório legível por computador para controlar um decodificador de vídeo, método em um codificador de vídeo para codificar informação, disposição em um codificador de vídeo, e, meio não transitório legível por computador para controlar um codificador de vídeo - Google Patents

Método em um decodificador de vídeo para decodificar informação, disposição em um decodificador de vídeo, meio não transitório legível por computador para controlar um decodificador de vídeo, método em um codificador de vídeo para codificar informação, disposição em um codificador de vídeo, e, meio não transitório legível por computador para controlar um codificador de vídeo Download PDF

Info

Publication number
BR112012015001B1
BR112012015001B1 BR112012015001-4A BR112012015001A BR112012015001B1 BR 112012015001 B1 BR112012015001 B1 BR 112012015001B1 BR 112012015001 A BR112012015001 A BR 112012015001A BR 112012015001 B1 BR112012015001 B1 BR 112012015001B1
Authority
BR
Brazil
Prior art keywords
syntax element
block
mode
list
arrangement
Prior art date
Application number
BR112012015001-4A
Other languages
English (en)
Other versions
BR112012015001A2 (pt
Inventor
Zhuangfei Wu
Kenneth Andersson
Clinton Priddle
Thomas Rusert
Rickard Sjoberg
Original Assignee
Telefonaktiebolaget Lm Ericsson [Publ]
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Telefonaktiebolaget Lm Ericsson [Publ] filed Critical Telefonaktiebolaget Lm Ericsson [Publ]
Publication of BR112012015001A2 publication Critical patent/BR112012015001A2/pt
Publication of BR112012015001B1 publication Critical patent/BR112012015001B1/pt

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/573Motion compensation with multiple frame prediction using two or more reference frames in a given prediction direction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/154Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

método e disposição para codificação de vídeo métodos e disposições na codificação de vídeo e entidades de decodificação. os métodos e disposições referem-se à codificação de união de informação de referência associada com vídeo codificado. o método e a disposição em uma entidade de decodificação referem-se à obtenção (402) de um elemento de sintaxe único associado com um bloco codificado be, e à identificação (404) de um modo de referência e uma ou mais imagens de referência baseada no elemento de sintaxe obtido. o método e a disposição ainda referem-se à decodificação (406) do bloco be baseada no modo de referência identificado e uma ou mais imagens de referência, assim fornecendo um bloco decodificado, b, de pixels.

Description

Campo Técnico
[001] A invenção refere-se geralmente a um método e a uma disposição para codificação de informação relacionada à codificação de vídeo.
Fundamentos
[002] Codificação de vídeo pode ser executada no modo intra e/ou modo inter. Modo intra explora redundâncias dentro de um quadro de vídeo, e modo inter explora redundâncias entre quadros de vídeo. No modo inter, luminância de pixel/ previsões de croma são obtidas a partir de imagens já codificadas/ decodificadas chamadas imagens de referência. Dependendo do número de imagens de referência usadas para previsão, modo inter é categorizado em modo de uni-previsão (ou modo de uni-direção), modo de bi- previsão (B modo), e possivelmente modo de tri-previsão, etc., onde, respectivamente, 1, 2 e 3 imagens de referência são usadas. Dentro dos documentos, estes diferentes modos, isto é, uni-previsão, bi-previsão, etc., serão referidos como “modos de referência”.
[003] Codificação de vídeo avançada (AVC), que é também conhecida como H.264 e MPEG-4 Parte 10, é o estado da técnica padrão para codificação de vídeo 2D a partir de ITU-T (União Internacional de Telecomunicação - Setor de Padronização de Telecomunicação) e MPEG (Grupo Especialista de Imagem em Movimento). O codec AVC é um codec híbrido, que leva vantagem de eliminação da redundância entre quadros e dentro de um quadro.
[004] No AVC, indicadores das imagens de referência relevantes são colocados em ordem em duas listas de referência. Os indicadores são índices de referência denotados, e são numerados de 0 a N, por exemplo (0,1,...,N). A primeira lista, Lista 0 (L0), principalmente gerencia as imagens de referência passadas, isto é, imagens de referência anteriores a uma imagem corrente no tempo, e a segunda lista, Lista 1 (L1), tipicamente gerencia as futuras imagens de referência, isto é, imagens de referência subsequentes a uma imagem corrente no tempo. Para codificação de vídeo de baixo retardo, L1 pode também gerenciar imagens de referência passadas. Cada lista pode conter índices de até 15 imagens de referência, isto é, N=14.
[005] Além disso, no AVC, um indicador, ou índice de modo de referência, especificando a seleção de uma das listas de imagens de referência (por exemplo, para uni-previsão), ou ambas as listas de imagens de referência (por exemplo, para bi-previsão), é codificado junto com a estrutura da partição no modo Bloco Macro (MB)/ modo sub-MD, enquanto os indicadores, ou índices de imagens de referência, especificando as imagens de referência selecionadas nas listas respectivas são codificados como elementos de sintaxe separados. “Estrutura de partição” refere-se a partições, tal como, por exemplo, 16x16, 16x8 ou 8x16, de um 16x16 MB. Uma partição, por exemplo, 16x16, é tipicamente associada com um vetor de movimento (MV) e um índice de referência quando uni-previsão é usada, e com dois MVs e dois índices de referência quando bi-previsão é usada. Um MV tem um componente horizontal MVx e um componente vertical MVy que descreve como pixels da partição corrente são produzidos a partir da imagem de referência correspondente, tal como Ipred (x,y)=Iref(x-MVx,y-MVy) .
[006] O número de imagens de referência associado com uma imagem ou partição depende do modo de referência associado com a mesma partição, isto é, se ele for uni-previsão ou bi-previsão, etc. Quando da decodificação da informação de referência em um decodificador, ambos os índices do modo de referência e de um ou mais índices de imagem de referência associados com uma imagem ou partição devem ser corretamente decodificados, a fim de que o decodificador seja capaz de decodificar a imagem ou partição corretamente. Decodificação incorreta de qualquer dos índices do modo de referência e de um ou mais índices de imagem de referência pode resultar em interpretações errôneas da informação de referência.
[007] Os métodos correntes de codificação da informação de referência, tal como o método e AVC descrito acima, exigem um número relativamente grande de bits a fim de transmitir a informação de referência associada com cada bloco. Isto é identificado como ineficiente em termos de eficiência de codificação.
Sumário
[008] Seria desejável permitir uma eficiência de codificação melhorada para informação de referência, isto é, a informação identificando uma ou mais imagens de referência usada para previsão de um quadro corrente. É um objetivo da invenção permitir uma eficiência de codificação melhorada para informação de referência. Além disso, é um objetivo da invenção fornecer um método e uma disposição para permitir uma codificação melhorada de informação de referência. Estes objetivos podem ser satisfeitos por um método e uma disposição de acordo com as reivindicações independentes anexas. Modalidades opcionais são definidas pelas reivindicações dependentes. A previsão, a codificação e a decodificação descritas abaixo podem ser executadas dentro da mesma entidade ou nó, ou em diferentes entidades ou nós.
[009] De acordo com um primeiro aspecto, um método é fornecido em uma entidade de decodificação de vídeo. O método compreende a obtenção de um elemento de sintaxe único associado com um bloco codificado Be. O método compreende ainda a identificação de um modo de referência e uma ou mais imagens de referência baseada no elemento de sintaxe obtido, e a decodificação do bloco Be, baseada no modo de referência identificado e uma ou mais imagens de referência, assim fornecendo um bloco decodificado, B, de pixels.
[0010] De acordo com um segundo aspecto, uma disposição é fornecida em uma entidade de decodificação de vídeo. A disposição compreende uma unidade funcional, que é adaptada para obter um elemento de sintaxe único associado com um bloco codificado Be. A disposição compreende ainda a unidade funcional, que é adaptada para identificar um modo de referência e uma ou mais imagens de referência com base no elemento de sintaxe obtido. A disposição compreende ainda uma unidade funcional, que é adaptada para decodificar o bloco Be com base no modo de referência identificado e uma ou mais imagens de referência, assim fornecendo um bloco decodificado B de pixels.
[0011] De acordo com um terceiro aspecto, um método é fornecido em uma entidade de codificação de vídeo. O método compreende a codificação de um bloco B de pixels usando um modo de referência e uma ou mais imagens de referência, assim fornecendo um bloco codificado Be. O método compreende ainda derivar um elemento de sintaxe único, identificando o modo de referência e uma ou mais imagens de referência (s) e fornecendo o elemento de sintaxe único a um decodificador do bloco Be.
[0012] De acordo com um quarto aspecto, uma disposição é fornecida em uma entidade de codificação de vídeo. A disposição compreende uma unidade funcional, que é adaptada para codificar um bloco B de pixels usando um modo de referência e uma ou mais imagens de referência, assim fornecendo um bloco codificado Be. A disposição compreende ainda uma unidade funcional, que é adaptada para derivar um elemento de sintaxe único identificando o modo de referência e uma ou mais imagens de referência. A disposição compreende ainda uma unidade funcional, que é adaptada para fornecer o elemento de sintaxe único a um decodificador do bloco Be.
[0013] Os métodos e disposições acima podem ser usados para melhorar a eficiência de codificação. A eficiência de codificação pode ser melhorada, devido ao fato que o uso de menos bits a fim de identificar uma ou mais imagens de referência usadas para previsão de um quadro corrente é habilitado. Os métodos e disposições acima podem ainda permitir um desempenho de resiliência de erro melhorado. Além disso, pelo agrupamento de informação de referência para formar um elemento de sintaxe único, fácil manipulação de índice de números de referência torna-se possível. Além disso, o uso de um elemento de sintaxe como descrito acima irá permitir a utilização de que algumas combinações de índice de referência e modo de referência são mais prováveis do que outras, permitindo codificação eficiente destas combinações. Por exemplo, palavras código menores poderiam ser designadas a mais combinações prováveis de índice de referência e modo de referência.
[0014] Os métodos e disposições acima podem ser implementados em diferentes modalidades. Em algumas modalidades, a identificação de um modo de referência e uma ou mais imagens de referência é baseada em um mapeamento pré-definido entre o elemento de sintaxe e o modo de referência e uma ou mais imagens de referência específicas. Em algumas modalidades, o elemento de sintaxe único representa uma entrada em uma primeira lista de referência predefinida, que pode compreender um ou mais entradas. Uma entrada pode identificar uma pluralidade de imagens de referência ou uma imagem de referência única, e pode também ainda identificar um modo de referência.
[0015] O elemento de sintaxe único pode ainda representar um modo de referência e uma entrada em uma segunda lista de referência pré-definida, que pode compreender uma ou mais entradas identificando uma imagem de referência única, respectivamente.
[0016] As entradas nas listas podem ser identificadas pelos índices da lista. Além disso, o número de bits representando o elemento de sintaxe obtido pode ser relacionado à probabilidade dos valores específicos do elemento de sintaxe.
[0017] Em algumas modalidades, previsão de informação de referência pode ser executada para Be (ou B quando na codificação de entidade), baseada nos elementos de sintaxe únicos associados com blocos vizinhos de Be (ou B). Além disso, em algumas modalidades, sub-regiões de um bloco associado com multi-previsão podem ser identificadas, para que as sub-regiões das regiões correspondentes respectivas dos blocos de referência multi-previsão tenham uma correlação relativamente baixa entre elas, e então uma previsão alternativa, ao invés de multi-previsão, pode ser usada para as sub-regiões identificadas.
[0018] As modalidades acima têm sido principalmente descritas em termos de um método. Entretanto, a descrição acima é também destinada a englobar modalidades das disposições, adaptadas para permitir o desempenho das características acima descritas. As diferentes características das modalidades exemplares acima podem ser combinadas em diferentes maneiras de acordo com a necessidade, exigência ou preferência.
[0019] De acordo com ainda outro aspecto, um programa de computador é fornecido, que compreende meios de código legível por computador, que quando executados em uma ou mais unidades de processamento, fazem com que qualquer das disposições descritas acima realize o procedimento correspondente de acordo com um dos métodos descritos acima.
[0020] De acordo com ainda outro aspecto, um produto de programa de computador é fornecido, que compreende o programa de computador de cima.
Breve Descrição dos Desenhos
[0021] A invenção irá agora ser descrita em maiores detalhes por meio de modalidades exemplares e com referência aos desenhos anexos, em que: Figura 1 é uma vista esquemática ilustrando uma conversão a partir de uma representação da informação de referência de acordo com a técnica anterior para uma representação da informação de referência de acordo com uma modalidade exemplar.
[0022] Figura 2 é uma tabela mostrando diferenças entre uma representação do índice de referência AVC e uma representação do índice de referência de acordo com uma modalidade exemplar.
[0023] Figura 3 é uma vista esquemática ilustrando a designação da informação de referência indicadora de acordo com uma modalidade exemplar.
[0024] Figura 4 é um fluxograma ilustrando um procedimento para decodificação do conjunto da informação codificada relacionada a um modo de referência e uma ou mais imagens de referência em uma entidade de decodificação de vídeo, de acordo com uma modalidade exemplar.
[0025] Figura 5 é um diagrama de blocos ilustrando uma disposição adaptada para decodificação do conjunto de informação codificada relacionada a um modo de referência e uma ou mais imagens de referência em uma entidade de decodificação de vídeo, de acordo com uma modalidade exemplar.
[0026] Figuras 6 é um fluxograma ilustrando um procedimento para codificação de união de informação relacionada a um modo de referência e uma ou mais imagens de referência em uma entidade de codificação de vídeo, de acordo com uma modalidade exemplar.
[0027] Figura 7 é um diagrama de blocos ilustrando uma disposição adaptada para codificação de união de informação relacionada a um modo de referência e uma ou mais imagens de referência em uma entidade de codificação de vídeo, de acordo com uma modalidade exemplar.
[0028] Figura 8 é uma vista esquemática ilustrando uma disposição em uma entrada de codificação/decodificação de vídeo, de acordo com uma modalidade exemplar.
[0029] Figuras 9 e 10 são vistas esquemáticas ilustrando a determinação da frequência da ocorrência de diferentes combinações de um modo de referência e uma ou mais imagens de referência associadas com blocos vizinhos de um bloco corrente, de acordo com modalidades exemplificativas.
[0030] Figura 11 é uma vista esquemática ilustrando designação de indicadores (palavras código) para diferentes símbolos do índice, de acordo com a técnica anterior.
[0031] Figura 12 é uma vista esquemática ilustrando designação de indicadores (palavras código), de acordo com uma modalidade exemplificativa.
[0032] Figura 13 é uma vista esquemática ilustrando partição baseada na informação implícita, de acordo com uma modalidade exemplificativa.
Descrição Detalhada
[0033] Brevemente descrito, um novo procedimento para representar e transmitir informação de referência, isto, é modo(s) de referência e imagens de referência são fornecidos para a inter previsão de codificação e decodificação. O procedimento pode ser referido como Sinalização de Índice de Referência, ou Sinalização de Indicador de Informação de Referência (RIS).
[0034] Dentro deste documento, o termo “blocos vizinhos de bloco X” é usado como referência para blocos que são vizinhos ao bloco X, isto é, localizados vizinhos a ou nos arredores do bloco X. Além disso, dentro deste documento, o termo “bloco” é usado como referência a uma unidade de pixels. O termo “imagem de referência” ou “bloco de referência” é usado como referência a uma imagem codificada/ decodificada previamente, um bloco, uma região ou uma área de uma imagem, esta imagem, bloco, região, etc., usada como referência para a previsão.
[0035] Quando usando RIS, ao invés de, por exemplo, codificar0 um indicador do modo de referência em associação próxima com um indicador da estrutura de partição, e codificar indicadores de imagens de referência separadamente, por exemplo, como no AVC, o indicador do modo de referência e os indicadores de imagens de referências associados com um bloco codificado são “empacotados juntos em um só lugar”, isto é são codificados em conjunto. A codificação de união dos indicadores do modo de referência e imagens de referência, isto é, informação de referência, resulta em que um elemento de sintaxe único, ou indicador, representa toda informação nos modos de referência e imagens de referência necessários, a fim de decodificar o bloco codificado em uma maneira satisfatória. Isto é, uma vez que este elemento de sintaxe único é dado para um bloco codificado, um decodificador deve ser capaz de identificar as imagens de referência exigidas para decodificação do bloco. O “elemento de sintaxe” pode também ser denotado, por exemplo, “unidade de sintaxe”, “unidade de indicação conjunta” ou “unidade de identificação conjunta”.
[0036] Uma maneira de descrever RIS é descrever uma “conversão” ou mapeamento a partir de uma representação tradicional, tal como, por exemplo, a representação AVC da informação de referência usando duas listas separadas, para uma representação ilustrativa da informação de referência de acordo com RIS. Tal conversão para representação RIS poderia basicamente ser feita em três etapas, como ilustrado na figura 1.
[0037] A primeira etapa 102 poderia ser para formar uma única lista de índice de referência a partir de múltiplas listas de índice. Por exemplo, ao invés de gerenciar duas listas de índice de referência, como no AVC, todos os índices de imagem de referência podem ser classificados em uma certa ordem em uma lista conjunta única, como uma alternativa ou um complemento para duas listas de AVC. Isto é ilustrado na figura 1, onde as listas de índice de referência de imagem L0 e L1 são fundidas, ou multiplexadas, em uma nova lista LRIS, em uma maneira intercalada. Além disso, em uma segunda etapa, 104, os números de índice podem ser redesignados consequentemente, para seguir uma ordem consecutiva, isto é, 0-5 na nova lista LRIS.
[0038] Os números do índice, ou entradas, na lista LRIS após a etapa 104, representam informações a respeito de ambos um modo de referência (uni-previsão para trás ou para frente) e uma imagem de referência. Um índice para uma entrada na LRIS pode ser denotado, por exemplo, um “índice RIS” ou um “parâmetro do índice”. Os números do índice RIS 0-5 em LRIS, após a etapa 104 neste exemplo, representam uni-previsão a partir de quatro imagens passadas (originalmente em L0 = (0,1,2,3)), e duas imagens futuras (originalmente em L1= (0,1)).
[0039] Além disso, um ou mais entradas da lista representando bi- previsão podem ser adicionadas a LRIS, por exemplo, por inserção ou anexação. Assim, índices RIS indicativos das entradas representando bi- previsão não apontam para uma imagem de referência única, mas, em vez disso, duas imagens de referência. Assim, um índice RIS pode identificar uma combinação de um modo de referência e uma ou mais imagens de referência .
[0040] Consequentemente, em uma etapa final 106, entradas relacionadas ao modo bi-previsão, onde duas imagens de referência são usadas para previsão, podem ser anexadas consecutivamente a LRIS, e ser indicadas ou representadas pelos índices RIS. Por exemplo, a entrada com número do índice RIS 7 pode ser configurada para sinalizar ou sugerir que a imagem corrente está usando número da imagem 0 e número da imagem 1 como referências de bi-previsão. Assim, esta informação é inerente no índice RIS 7. Número do índice 8 pode, de um modo semelhante, ser configurado para sugerir que a imagem corrente está usando número da imagem 0 e número da imagem 2 como referências de bi-previsão. Analogamente, a lista LRIS pode ainda ser estendida com entradas representando tri-previsão, identificando três imagens de referência, e assim por diante.
[0041] Alternativamente, as etapas 104 e 106 podem ser executadas na ordem reversa, tal que as entradas relacionadas ao modo de bi-previsão sejam adicionadas primeiro, por exemplo, inseridas ou anexadas, e então os números do índice são redesignados consequentemente. Como previamente descrito, as entradas relacionadas ao modo de bi-previsão poderiam também ser inseridas, por exemplo, entre as entradas relacionadas a uni-previsão, que seria exigido que a redesignação de números do índice seja executada após a inserção, como um complemento ou alternativa à etapa 104. Neste exemplo, o mapeamento é representado por uma lista de referência única, da qual os índices das diferentes entradas representam um modo de referência e uma ou mais imagens de referência. Deve ser observado que isto é apenas um exemplo opcional, e que o mapeamento pode envolver diversas etapas, e que nenhuma lista expressa ou registro do tipo exemplificado é requisito para execução do mapeamento.
[0042] Um exemplo da diferença entre uma representação do índice de referência AVC e uma representação do índice RIS, de acordo com uma modalidade exemplo, é mostrado em uma tabela na figura 2. Neste exemplo, é assumido que existem quatro imagens de referência disponíveis para codificação de uma imagem corrente, das quais duas imagens de referência são imagens de referência passadas e duas são imagens de referência futuras. Nesta representação RIS exemplificativa, os índices 0, 1, 3 e 4 são definidos para indicar uni-previsão a partir de uma respectiva das quatro imagens de referência. Os índices 2 e 5 são definidos para indicar bi-previsão a partir de um par respectivo de quatro imagens de referência. Deve ser observado que uma sinalização AVC dos índices de referência também compreenderia informação relacionada a partições, uma vez que esta informação é codificada junto com o modo de índice de referência, tal como, por exemplo, “INTER_16x16_L0”. Isto não é, entretanto, mostrado na figura 2.
[0043] No exemplo mostrado na tabela na figura 2, alguns dos índices RIS indicando ou representando bi-previsão são colocados imediatamente após os índices RIS de uni-previsão “mais próximos”, isto é, intercalados com os índices representando uni-previsão. Esta representação do índice RIS é ainda ilustrada na figura 3, que mostra um assim chamado Grupo Hierárquico de Imagens 7B (BGOP). Na figura, o assim chamado “quadro corrente”, isto é, o quadro a ser codificado, é o quadro 3 no GOP 7B. Os índices RIS mostrados na figura 3 correspondem aos índices RIS 0-7 na tabela na figura 2. Uma representação alternativa RIS poderia ser deixar os índices RISs 0-3 indicarem uni-previsão, e os índices RIS seguintes indicarem bi-previsão, como no exemplo ilustrado na figura 1.
[0044] As maneiras para definir o significado de um índice RIS, ou parâmetro RIS, não são limitadas pelo exemplo dado neste documento. Por exemplo, uma fórmula matemática poderia ser definida para interpretar o significado do índice RIS, por exemplo, uma função com 2 variáveis f (RIS_índice, corrente_quadro_num) que retorna a identificação de 2 índices de imagem de referência para um índice RIS de bi-previsão e identifica um índice de imagem de referência para um índice RIS unidirecional, e assim por diante. Em um exemplo, corrente_quadro_num corresponde ao número do quadro dentro de um BGOP de 7B imagens, onde 0 é o primeiro quadro em ordem de exibição e 8 é o último quadro no BGOP. Em outro exemplo, índice RIS é sempre designado usando a fórmula:
Figure img0001
Figure img0002
[0045] Onde refidx0 e refidx1 são os índices na lista de referência L0 e L1 respectivamente. L0_len e L1_len são o comprimento da lista L0 e L1 respectivamente.
[0046] Alternativamente, uma tabela pode ser usada para casar o índice RIS com dois índices unidirecionais correspondentes no caso de bi- previsão e um índice unidirecional para o caso de uma previsão única. Que método selecionar depende, por exemplo, de restrições de hardware/ software.
[0047] Entretanto, independentemente de qual método que é usado para a derivação de um elemento de sintaxe, o método deve ser conhecido por ambos o codificador e o decodificador, tal que o codificador seja habilitado para derivar e fornecer um elemento de sintaxe correto, e o decodificador seja habilitado para interpretar o elemento de sintaxe corretamente e, assim, identificar a informação de referência necessária para decodificar o bloco codificado ou quadro em questão.
[0048] O índice RIS pode aplicar a diferentes níveis de codificação de vídeo, por exemplo, nível de quadro, nível MB maior, nível MB ou nível sub MB.
Exemplo de procedimento, figura 4, decodificação
[0049] Uma modalidade da parte de decodificação do procedimento de transmissão de informação de referência será agora descrita com referência À figura 4. O procedimento poderia ser executado em uma entidade de decodificação de vídeo, que poderia ser um decodificador de vídeo ou uma entidade compreendendo ainda unidades funcionais além de um decodificador de vídeo. Inicialmente, um elemento de sintaxe único associado com um bloco codificado Be é obtido em uma ação 402. O elemento de sintaxe único pode ser uma unidade, por exemplo, um símbolo, em “o fluxo de bits”, isto é, a representação codificada de, por exemplo, uma sequência de vídeo, ou ser uma unidade, que é decodificada a partir do fluxo de bits. O elemento de sintaxe é um ou mais bits representando um número que corresponde à informação de referência, tal como, por exemplo, um índice RIS. Tipicamente, menos bits são usados para representar índices RIS que são relativamente comuns quando comparado ao número de bits usados para representar índices RIS que são menos comuns. O elemento de sintaxe é decodificado a partir do fluxo de bits para obter o número, por exemplo, índice RIS, que ele representa. Decodificação pode ser feita de acordo com VLC (Codificação de Comprimento Variável) ou codificação aritmética, tal como CABAC (Codificação Aritmética de Binário Adaptado de Contexto), por exemplo.
[0050] Então, em uma ação 404, um modo de referência e uma ou mais imagens de referência a serem usados quando decodificando o bloco Be são identificados com base no elemento de sintaxe obtido. O modo de referência identificado e uma ou mais imagens de referência correspondem ao modo e imagens de referência usados quando codificando o bloco em um codificador. A identificação pode envolver, por exemplo, demapear, decifrar ou “decodificar” o elemento de sintaxe usando uma tabela de mapeamento, uma lista de referência ou outra informação predefinida ou função, pelo uso dos quais um modo de referência e uma ou mais imagens de referência podem ser identificados, dado um elemento de sintaxe. Além disso, quando tendo identificado o modo de referência e uma ou mais imagens de referência necessários, o bloco codificado Be, que é assumido para ser obtido usando métodos convencionais, é decodificado em uma ação 406.
[0051] O elemento de sintaxe único pode ser um indicador ou índice, por exemplo, denotados índice RIS, de uma entrada em uma lista de referência, que lista de referência pode compreende uma pluralidade de entradas, cada entrada representando ou identificando um ou mais modos de referência e uma ou mais imagens de referência. Alternativamente, o elemento de sintaxe é uma palavra código correspondente a uma entrada em uma tabela de pesquisa. A tabela de pesquisa pode ligar a palavra código, por exemplo, a um modo de referência e um ou mais entradas em uma ou mais lista de referência, tal como, por exemplo, L0 e L1 in AVC. O modo de referência pode definir que lista de referência única ou múltiplas lista de referência que deve ser usada na decodificação do bloco.
Exemplo de disposição, figura 5, decodificação
[0052] Abaixo, um exemplo da disposição 500, adaptada para permitir o desempenho do procedimento acima descrito de decodificação, irá ser descrita com referência à figura 5. A disposição é ilustrada como sendo localizada em uma entidade de decodificação de vídeo, 501, que poderia ser um decodificador de vídeo ou uma entidade compreendendo ainda unidade funcional além de um decodificador de vídeo, tal como, por exemplo, um computador, um terminal móvel ou um dispositivo de vídeo dedicado. A disposição 500 é ainda ilustrada para se comunicar com outras entidades através de uma unidade de comunicação 502, que pode ser considerada para compreender meios convencionais para qualquer tipo de comunicação com fio ou sem fio. Vídeo codificado a ser decodificado é assumido como sendo obtido a partir da unidade de comunicação 502 ou uma memória por uma unidade de obtenção 504, e blocos codificados são assumidos como sendo decodificados em uma unidade de decodificação 508, onde a unidade funcional 508 usa métodos de decodificação convencional.
[0053] A unidade de obtenção 504 é adaptada para obter um elemento de sintaxe único associado com um bloco codificado Be. A disposição 500 compreende ainda uma unidade de identificação 506, que é adaptada para identificar um modo de referência e uma ou mais imagens de referência para ser usado quando da decodificação do bloco Be, baseada no elemento de sintaxe obtido. Como previamente descrito, a disposição 500 compreende ainda uma unidade de decodificação 508, que é adaptada para decodificar o bloco Be baseada no modo determinado de referência e imagens de referência, assim fornecendo um bloco decodificado B de pixels.
[0054] Nesta disposição, o elemento de sintaxe pode ser um indicador ou índice de uma entrada em uma lista de referência, lista de referência podendo compreender uma pluralidade de entradas, cada entrada representando ou identificando um ou mais modos de referência e uma ou mais imagens de referência. Alternativamente, a disposição pode ser adaptada a outro caso quando o elemento de sintaxe é uma palavra código correspondente a uma entrada em uma tabela de pesquisa. A tabela de pesquisa pode ligar a palavra código, por exemplo, a um modo de referência e uma ou mais entradas em uma ou mais listas de referência, tal como, por exemplo, L0 e L1 em AVC.
[0055] A entidade de decodificação de vídeo 501 pode ainda compreender, por exemplo, uma unidade de exibição 510, adaptada para exibir o vídeo decodificado.
Exemplo de procedimento, figura 6, codificação
[0056] Uma modalidade da parte de codificação do procedimento de transmissão da informação de referência irá agora ser descrita com referência à figura 6. O procedimento poderia ser executado em uma entidade de codificação de vídeo, que poderia ser um codificador de vídeo, ou uma entidade compreendendo ainda unidade funcional além de um codificador de vídeo. Inicialmente, um bloco B de pixels é codificado em uma ação 602, usando um modo de referência e uma ou mais imagens de referência, assim fornecendo um bloco codificado Be.
[0057] Então, um elemento de sintaxe único é derivado, em uma ação 604, baseada no modo de referência e uma ou mais imagens de referência usados para codificação, o elemento de sintaxe assim identificando, diretamente ou indiretamente, o modo de referência e as uma ou mais imagens de referência usados para codificação do bloco B. O elemento de sintaxe poderia, por exemplo, ser derivado localizando uma entrada da lista, correspondente ao modo de referência e imagens de referência usados, em uma lista de referência pré-definida, e então definindo o número do índice da referida entrada para constituir o elemento de sintaxe. Alternativamente, uma tabela de mapeamento ou tabela de pesquisa predefinida poderia fornecer um mapeamento entre diferentes combinações de modos de referência e imagens de referência e diferentes elementos de sintaxes. O elemento de sintaxe poderia ainda ser um argumento para uma função predefinida, função que retorna um indicador de modo de referência e um ou mais indicadores de imagens de referência. Um tal elemento de sintaxe “argumento” poderia ser derivado, por exemplo, por meio de uma “função reversa” predefinida, tomando um indicador de modo de referência e um ou mais indicadores de imagem referência como argumentos e retornando um elemento de sintaxe único.
[0058] Além disso, o elemento de sintaxe derivado é fornecido a um decodificador do bloco Be, em associação com o bloco Be, em uma ação 606. Assim, a informação de referência, isto é, a informação no modo de referência e nas uma ou mais imagens de referência usadas quando da codificação do bloco B, também a ser usado quando da decodificação do bloco codificado Be, pode ser transmitida a um decodificador de uma maneira compacta e resiliente de erro. O elemento de sintaxe poderia, por exemplo, ser fornecido sendo transmitido através de um canal de rádio para uma entidade ou nó compreendendo um decodificador. Além disso, o elemento de sintaxe poderia, por exemplo, ser armazenado em uma memória junto com o vídeo codificado associado e ser acessado por uma entidade de decodificação em outro ponto no tempo.
Exemplo de disposição, figura 7, codificação
[0059] Abaixo, uma disposição exemplo 700, adaptada para permitir o desempenho do procedimento acima descrito relacionado à codificação, será descrita com referência à figura 7. A disposição é ilustrada como sendo localizada em uma entidade de codificação de vídeo, 701, que poderia ser um codificador de vídeo ou uma entidade compreendendo ainda unidades funcionais além de um codificador de vídeo, tal como, por exemplo, um computador, um terminal móvel ou um dispositivo de vídeo dedicado. A disposição 700 pode se comunicar com outras entidades através de uma unidade de comunicação (não mostrada), que pode ser considerada para compreender meios convencionais para qualquer tipo de comunicação com fio ou sem fio. Vídeo decodificado a ser codificado é assumido como sendo obtido, por exemplo, a partir da unidade de comunicação ou uma memória.
[0060] A disposição 700 compreende uma unidade de codificação 702, que é adaptada para codificar um bloco, B, de pixels usando um modo de referência e uma ou mais imagens de referência, assim fornecendo um bloco codificado Be. A disposição 700 compreende ainda uma unidade de derivação 704, que é adaptada para derivar um elemento de sintaxe único, que identifica, diretamente ou indiretamente, o modo de referência e as uma ou mais imagens de referência usadas quando da codificação do bloco B. O elemento do índice poderia ser derivado de diferentes maneiras, como previamente descrito, e poderia ser, por exemplo, um indicador, tal como, por exemplo, um índice, ou uma palavra código, etc.
[0061] A disposição 700 compreende ainda uma unidade de fornecimento 706, que é adaptada para fornecer o elemento de sintaxe único a um decodificador do bloco Be, possivelmente através de uma unidade de comunicação. O elemento de sintaxe único pode ser fornecido, por exemplo, através da transmissão sobre um canal de rádio para uma entidade ou nó compreendendo um decodificador.
Exemplo de disposição, figura 8
[0062] A Figura 8 mostra esquematicamente uma modalidade de uma disposição 800 em uma entidade de decodificação de vídeo, que também pode ser uma maneira alternativa de divulgação de uma modalidade da disposição para decodificação em uma entidade de decodificação de vídeo ilustrada na figura 5. Compreendidos na disposição 800, estão aqui uma unidade de processamento 806, por exemplo, com um DSP (Processador de Sinal Digital). A unidade de processamento 806 pode ser uma unidade única ou uma pluralidade de unidades para realizar diferentes ações de procedimentos descritos aqui. A disposição 800 pode também compreender uma unidade de entrada 802 para receber sinais a partir de outras entidades, e uma unidade de saída 804 para fornecer sinais para outras entidades. A unidade de entrada 802 e a unidade de saída 804 podem ser dispostas como uma entidade integrada.
[0063] Ademais, a disposição 800 compreende pelo menos um produto de programa de computador 808 na forma de uma memória não volátil, por exemplo, uma EEPROM (Memória de Apenas Leitura Programável Apagável Eletricamente), uma memória flash e um disco rígido. O produto de programa de computador 808 compreende um programa de computador 810, que compreende meios de código, que quando executados na unidade de processamento 806 na disposição 800 fazem com que a disposição e/ou a entidade de decodificação de vídeo realizem as ações dos procedimentos descritos anteriormente em conjunção com a figura 4.
[0064] O programa de computador 810 pode ser configurado como um código de programa de computador estruturado em módulos de programa de computador. Consequentemente, nas modalidades exemplares descritas, os meios de código no programa de computador 810 da disposição 800 compreendem um módulo de obtenção 810a para obtenção de um elemento de sintaxe único associado com uma unidade/bloco de vídeo codificado, por exemplo, através da decodificação a partir de um fluxo de bit originando-se a partir de uma entidade de transmissão de dados ou a partir de um armazenamento, por exemplo, uma memória. O programa de computador compreende ainda um módulo de identificação 810b para identificação de um modo de referência e uma ou mais imagens de referência com base no elemento de sintaxe obtido. O programa de computador 810 compreende ainda um módulo de decodificação 810c para decodificação do bloco codificado.
[0065] Os módulos 810a-c poderiam essencialmente realizar as ações do fluxo ilustrado na figura 4, para imitar a disposição em uma entidade de decodificação de vídeo ilustrada na figura 5. Em outras palavras, quando os diferentes módulos 810a-c são executados na unidade de processamento 806, eles correspondem às unidades 502-506 da figura 5.
[0066] Similarmente, uma alternativa correspondente para a disposição ilustrada na figura 7 é possível.
[0067] Embora os meios de código na modalidade descrita acima em conjunção com a figura 8 sejam implementados como módulos de programa de computador que, quando executados na unidade de processamento, fazem com que a disposição e/ou entidade de tratamento/ apresentação de vídeo realize as ações descritas acima na conjunção com a figura mencionada acima, pelo menos um dos meios de código pode em modalidades alternativas ser implementado pelo menos em parte como circuitos de hardware.
[0068] O processador pode ser uma única CPU (Unidade central de processamento), mas poderia também compreender duas ou mais unidades de processamento. Por exemplo, o processador pode incluem microprocessadores de uso geral; processadores de conjunto de instruções e/ou conjuntos de chips relacionados e/ou microprocessadores de finalidade especial tal como ASICs (Circuito Integrado de Aplicação Específica). O processador pode também compreender memória de placa para propósito de cache. O produto de programa de computador pode ser portado por um produto de programa de computador conectado ao processador. O produto de programa de computador compreende um meio legível por computador no qual o programa de computador é armazenado. Por exemplo, o produto de programa de computador pode ser a memória flash, uma RAM (Memória de acesso aleatório), ROM (Memória de apensa leitura) ou uma EEPROM, e os módulos do programa de computador descritos acima poderiam, nas modalidades alternativas, ser distribuídos em diferentes produtos de programas de computador na forma de memórias dentro da unidade de recebimento de dados.
[0069] Além disso, percebe-se que um problema com a tecnologia de codificação de vídeo existente é que nenhum esquema da previsão de modo de referência /imagem de referência satisfatório é definido ou aplicado. Abaixo, um tal esquema de previsão será descrito. Percebe-se que em, por exemplo, uma cena de corte /desbotamento /cenário flash, é bastante comum que a mesma, por exemplo, combinação do modo de referência e imagens de referência seja usada para a previsão de MBs vizinhos ou adjacentes. Além disso, percebe-se que os métodos de codificação correntes não tiram vantagem da correlação entre os modos de referência/ imagens de referência usados para MBs vizinhos. Em soluções anteriores, os componentes de identificação separados da informação de referência MB são codificados independente e transmitidos para um decodificador de vídeo.
[0070] Um esquema de previsão exemplificado no nível MB poderia ser descrito como segue. O esquema de previsão exemplificado se aplica a ambos codificador e decodificador, e poderia ser aplicado a qualquer tamanho do bloco.
[0071] Em associação com a codificação/decodificação de um MB corrente, o codificador /decodificador é disposto para analisar os indicadores de referência dos MBs codificados em torno, também chamado “o contexto” do MB. Estes blocos em torno poderiam também ser denotados os “blocos vizinhos” do bloco corrente. O codificador/decodificador conta o número de vezes cada um fora de um conjunto de indicadores candidatos ou índices aparece entre os blocos vizinhos, e seleciona um, por exemplo, de acordo com um esquema predefinido, com a maior contagem, como sendo uma previsão ou estimativa. O indicador de referência selecionado deve ser relacionado à previsão inter. O indicador de referência selecionado é definido por uma previsão ou estimativa de quais imagens de referência (e modo de referência) que podem ser adequadas para uso quando da codificação/decodificação do MB corrente. A previsão é derivada através da análise da informação relacionada aos blocos vizinhos codificados/ decodificados do MB, em vez de através da análise do MB corrente do mesmo. Em um codificador, o MB pode ou ser codificado ou decodificado durante esta seleção de uma previsão, uma vez que neste exemplo, a previsão não é para ser usada para seleção de imagens de referência (e modo de referência) para uso quando da codificação do MB corrente. Em um decodificador, o MB corrente é codificado durante a previsão.
[0072] Uma análise e uma seleção de indicador de referência de bloco vizinho exemplificativas de uma estimativa são ilustradas na figura 9. No exemplo ilustrado na figura 9, quatro blocos vizinhos de um bloco corrente são considerados. Entretanto, o método é aplicado também a outros conjuntos ou subconjuntos de blocos vizinhos considerados. Um exemplo de conjunto ou blocos vizinhos poderia consistir de, por exemplo, um bloco à esquerda, um bloco à esquerda no topo e um bloco acima em relação ao bloco corrente. Outros exemplos de conjunto poderiam compreender apenas o bloco à esquerda e bloco acima. Na figura 9, os blocos vizinhos do bloco corrente são associados com os indicadores de referência respectivos, ou índices, 1, 1, 2 e 0. Assim, o indicador de referência “1” tem a maior contagem, isto é, a maior frequência de ocorrência, por aparecer duas vezes entre os blocos vizinhos. Assim, o indicador de referência “1” é selecionado para representar a previsão ou estimativa das imagens de referência (e modo) usadas, ou a ser usadas, quando da codificação de um bloco corrente, ou, quando a previsão ocorre em um decodificador, a previsão das imagens de referência (e modo) a ser usadas quando da decodificação do bloco corrente.
[0073] Quando da contagem do número de ocorrências de um certo indicador de referência entre os blocos vizinhos, mais de um candidato pode ter o mesmo número de contagem mais alto. Isto é ilustrado na figura 10, onde os indicadores de referência “1” e “2” ambos aparecem quatro vezes. Isto poderia ser resolvido, por exemplo, selecionando os indicadores de referência de acordo com um esquema de posição predefinido. Por exemplo, quando os indicadores de referência são representados pelos números 0-2, como ilustrado nas figuras 9 e 10, o indicador de referência representado pelo maior, ou menor, número poderia ser selecionado como previsto.
[0074] A diferença entre um bloco de valores de pixel previstos e os valores de pixel originais, isto é, a fonte antes de ser codificada, é codificada por codificação de transformada, por exemplo, DCT (Transformada Discreta de Cosseno). A saída de transformada compreende coeficientes de transformada, que são então quantizados. O número de coeficientes de transformada associados com um bloco reflete como é bom o casamento entre o bloco previsto e o bloco geral, para a dada quantização. Relativamente poucos coeficientes de transformada indica que existe um bom casamento. Consequentemente, indicadores de referência associados com blocos tendo poucos coeficientes de transformada poderiam ser considerados mais confiáveis.
[0075] Assim, a contagem das ocorrências poderia também ser ponderada de acordo com, por exemplo, os coeficientes de transformada codificados associados com os blocos de referência. Como descrito acima, um índice de referência associado com um bloco vizinho com poucos coeficientes de transformada codificados poderia ser considerado uma previsão mais confiável do que um índice de referência associado com um bloco vizinho com muitos coeficientes de transformada, e pode assim ser atribuído um peso maior para a previsão de índice de referência. Em outro exemplo, blocos com coeficientes codificados podem ter peso maior que blocos sem coeficientes codificados, isto é, blocos pulados. Em outro exemplo, um índice de referência associado com um bloco vizinho que tem uma grande partição MV, por exemplo, um grande MB, poderia ser considerado mais confiável do que um bloco vizinho com uma menor partição MV, e seria assim designado um peso maior para a previsão de índice de referência. O uso de pesos que são múltiplos de 2 é benéfico em vista da complexidade. A contagem ponderada poderia também ser implementada pelo uso de uma tabela de pesquisa.
[0076] Alguns indicadores de referência podem ser mais relacionados a cada outro do que outros. Por exemplo, quando usando juntamente informação codificada de referência, o indicador de referência representando bi-previsão usando os quadros de referência ref0 e ref1 será mais relacionado ao indicador de referência representando uni-previsão usando um de ref0 e ref1, que, por exemplo, a um indicador de referência representando uni- previsão usando quadro de referência ref2. Assim, quando contando um indicador bi-previsão, os indicadores correspondentes representando uni- previsão usando os mesmos quadros de referência poderiam ser atualizados com algum valor de contagem menor, isto é, menor que o valor de contagem para um “casamento total”. Similarmente, indicadores de referência representando uni-previsão usando, por exemplo, ref0 e ref1, são mais relacionados ao indicador de referência correspondente representando bi- previsão usando ref0 e ref1, do que outros indicadores de referência de bi- previsão. Assim, quando contando um indicador de referência unidirecional, a contagem de indicadores de referência correspondente a uma multi-previsão onde o quadro de referência em questão é usado pode também ser atualizada com algum valor menor.
[0077] A Figura 10 ilustra outra modalidade exemplificativa de determinação da frequência da ocorrência de certos indicadores de referência para um bloco corrente, pela contagem de indicadores de referência associados com os blocos vizinhos do bloco corrente. Aqui, um bloco corrente é um MB grande, e os blocos vizinhos são menores em tamanho do que o bloco corrente. Em alguns casos, pode ser de interesse ter o mesmo número de blocos vizinhos no contexto independentemente do tamanho do bloco dos blocos em questão.
[0078] Uma vantagem de introduzir a previsão do indicador de referência, ou previsão do índice de referência, é permitir um mapeamento mais eficiente de uma tabela VLC. Ao considerar a previsão e a tabela VLC juntas, maior compressão pode ser obtida. Por exemplo, quando assumindo codificação de 3 índices, por exemplo, (0,1,2), sem o uso de previsão, uma tabela VLC fixada pode ser atribuída, como a ilustrada na figura 11. Assumindo que o símbolo do índice “2” ocorre mais frequentemente, a tabela ilustrada na figura 11 teria um projeto sub-ideal, uma vez que “2” é codificado usando uma palavra código com dois bits, isto é, “11”, enquanto o menos frequente “0” é codificada usando um bit, isto é, “0”.
[0079] Quando a previsão é adicionada, um projeto melhor da tabela VLC é habilitado. Um exemplo de um tal projeto melhorado da tabela VLC é ilustrado na figura 12. Em um tal projeto melhorado VLC, os bits gastos para codificação de um indicador de referência ou símbolo do índice podem ser adaptados com base na previsão e assim sobre o contexto do bloco corrente. Na tabela ilustrada na figura 12, o indicador de referência ocorrendo mais frequentemente no contexto do bloco corrente é codificado usando uma palavra código de bit único, neste exemplo, “0”. As palavras de código “10”, e “11”, compreendendo dois bits, poderiam ser definidas para identificar, por exemplo, o indicador de referência tendo a segunda maior frequência de ocorrência e o indicador de referência tendo uma terceira maior frequência de ocorrência, respectivamente. Ambos o codificador e o decodificador de indicadores de referência devem estar cientes de, e concordam, como realizar a previsão e como interpretar as palavras código.
[0080] O exemplo descrito acima é apenas um exemplo simples, e deve ser observado que o projeto possível não é limitado a este. Existem várias maneiras de atribuir diferentes tabelas VLC para indicadores de referência ou símbolos do índice, por exemplo, quando mais indicadores de referência ou símbolos do índice são envolvidos. Um exemplo de abordagem poderia ser variar a indexação com a probabilidade de ocorrência dos índices, de modo que um indicador de referência ocorrendo frequentemente seja designado um baixo número de índice, e vice versa, e que um baixo número do índice custa menos bits para codificar do que um alto número de índice. Codificação Aritmética Binária Adaptativa de Contexto (CABAC) pode ser usada para obter custo de bit variável para representar indicadores de referência ou índices de acordo com sua probabilidade. Alguns exemplos de diferentes contextos são, por exemplo, os indicadores de referência associados com os blocos vizinhos, um número de contagem de indicadores de referência, ou um número de contagem ponderada de indicadores de referência, como descrito acima.
[0081] No estado da técnica, por exemplo, usando H.264, a geração de um bloco de bi-previsão usando dois MVs/ imagens de referência, blocos ou áreas, envolve uma média sobre as duas áreas de referência. Quando MV aponta para uma posição sub-pel (sub-pixel) em uma área de referência, os valores de pixel da posição sub-pel necessitam ser primeiro gerados, antes da média. A geração de valores de pixel da posição sub-pel é referida como “filtragem espacial”, isto é, o processo de geração envolve a filtragem espacial das áreas de referência respectivas. Assim, o processo do estado da técnica para geração de um bloco de bi-previsão usando duas áreas de referência envolve filtragem espacial da primeira área; filtragem espacial da segunda área, e finalmente a média sobre as áreas filtradas. Filtragem espacial é relativamente exigente em termos de complexidade computacional.
[0082] Percebe-se que esta complexidade computacional poderia ser reduzida, o que será descrito abaixo. A fim de reduzir a complexidade, um bloco pode primeiro ser construído baseado no movimento inteiro, por exemplo, adicionando os dois blocos de referência juntos (sem execução da filtragem espacial). Esta adição é uma operação que é relativamente barata em termos de complexidade computacional. Então, o bloco resultante pode ser filtrado, por exemplo, interpolado, a fim de obter, por exemplo, metade ou quarto-pel da resolução. O ajuste sub-pel pode ser executado de acordo com um dos MVs, ou baseado em, por exemplo, informação adicional codificada/ decodificada separadamente.
[0083] Quando um bloco é associado com mais que um MV e o índice de referência, que é aqui referido como “multi-previsão”, os respectivos componentes de previsão unidirecional da multi-previsão podem ser determinados. Uni-previsão pode ser referida como “única-previsão”, como pode também, por exemplo, intra previsão. Percebe-se que a partição da informação poderia ser derivada baseada na diferença absoluta entre estas previsões unidirecionais. A partição da informação poderia ser derivada tanto sobre o codificador e o decodificador, a fim de evitar a sobrecarga quando transmitindo informação de partição de fina granulação.
[0084] Em regiões onde a diferença absoluta entre as previsões unidirecionais é relativamente maior, uma única previsão unidirecional ou uma bi-previsão espacial poderia ser usada. A única previsão unidirecional poderia ser feita de acordo com o índice de referência e MV indicado no fluxo de bits para um dos componentes de bi-previsão da bi-previsão (ou multi- previsão). Em outras regiões do bloco, onde a diferença absoluta entre as previsões unidirecionais é relativamente menor, bi-previsão pode ser usada como indicada no fluxo de bits para o bloco. A decisão de se usar uma única bi-previsão /bi-previsão espacial para uma região, ou uso da bi-previsão indicada no fluxo de bits, poderia ser baseada por exemplo sobre uma comparação da diferença absoluta entre as previsões unidirecionais associadas com a região e um limite predefinido.
[0085] Assumindo um bloco de bi-previsão associado com 2 MVs e 2 áreas de referência. Convencionalmente, neste estágio, este bloco não é ainda dividido, mas é codificado como está. Entretanto, percebe-se que a informação “implícita” obtida a partir de análise de diferenças absolutas ou o “mapa de diferença” poderia ser usada para dividir o bloco em mais partições, tanto no codificador quanto no decodificador.
[0086] Quando a diferença absoluta de 2 áreas de referência ou previsões é calculada, haverá alguma(s) região(s) no mapa de diferença com mais elevado(s) valor(es) absoluto(s) e alguma(s) região(ões) com menor(es) valor(es) absoluto(s). Um baixo valor da diferença absoluta em uma região geralmente representa que o mesmo objeto é representado nesta região em ambas as áreas de referência. Se diferentes objetos estariam representados na região nas áreas de referência respectivas, a diferença absoluta seria grande. Se o mesmo objeto é representado em uma correspondente região nas áreas de referência respectivas, ele é adequado e apropriado para média das regiões. Se as regiões correspondentes representam diferentes objetos, não faz sentido fazer a média delas.
[0087] Por exemplo, um limite poderia ser definido, onde valores de diferença mais elevados do que o limite representam “diferentes regiões de objetos”, e valores de diferença menores que o limite representam “algumas regiões do objeto”. O bloco poderia ser particionado de acordo com estas regiões, de acordo com um esquema predefinido. Como afirmado previamente, a partição poderia ser executada baseada na informação implícita, isto é, sem sinalização explícita descrevendo o particionamento. Outra vantagem disso é que “particionamento não quadrado” pode ser suportado. Por exemplo, quando a metade de uma bola é representada em um bloco, a partição do bloco poderia ser feita muito precisa em torno da borda da bola.
[0088] O codificador pode sinalizar ao decodificador se a abordagem de partição descrita acima deve ser usada. Quando sinalizado que a abordagem de partição deve ser usada, o codificador pode opcionalmente sinalizar, para regiões tendo um valor absoluto de diferença relativamente alto, quais das previsões unidirecionais usar ou que bi-previsão espacial usar. Por exemplo, bi-previsão ponderada (diferente da média e possivelmente com offset DC) poderia ser usada. Em alguns casos, pode ser necessário codificar/ decodificar alguma informação adicional para determinar parâmetros locais para ser capaz de produzir a bi-previsão espacial. A informação de partição obtida pode também ser usada para previsão de informação de partição e o codificador pode codificar mudanças comparadas à partição prevista a ser decodificada e usada pelo decodificador. A derivação de informação de partição baseada na diferença entre as áreas de referência pode dar uma indicação aproximada de como a partição deve ser feita. Refinamento adicional pelo envio de refinamentos da informação de partição prevista é também possível.
[0089] Um exemplo para obter a informação de partição consiste em dividir o bloco em 4 sub-blocos de tamanhos iguais. O sub-bloco com maior SAD normalizado ((Soma das diferenças absolutas) (divididas pelo número de pixels sobre os quais foi calculado)) normalizado é iterativamente dividido em 4 regiões de tamanhos iguais se o SAD normalizado do sub-bloco for, por exemplo, igual a ou maior que o SAD normalizado do bloco “principal” 4 vezes maior. O SAD normalizado refere-se a SAD por pixel ou SAD por um tamanho do sub-bloco específico. Ao invés de SAD, outras métricas de pixels diferentes poderiam alternativamente ser usadas. Um exemplo é uma métrica com mais peso na estrutura da imagem local forte, por exemplo, bordas/ linhas. Um sub-bloco restante, que não é dividido ainda, é então definido para ser a partição que deve usar, por exemplo, alguma modificação da bi- previsão.
[0090] A figura 13 mostra uma modalidade exemplificativa do método de partição. O bloco no lado esquerdo, 1302:a, é bi-previsto. Cálculo SAD é executado sobre o bloco (agora denotado 1302:b), e as áreas SAD altas são identificadas e selecionadas fora, e são tratadas consequentemente. Neste exemplo, a área SAD alta é tratada mudando para previsão unidirecional com apenas MV para trás. Assim, o bloco geral pode ser particionado em duas partições, das quais uma usa a bi-previsão indicada no fluxo de bits, e uma (ilustrada como compreendendo círculos) usa uni-previsão (um dos componentes da bi-previsão). Optimização da Distorção da Taxa (RDO) poderia ser usada para selecionar a melhor uni-previsão (componente da bi- previsão).
[0091] Outro exemplo de como obter informação de partição consiste em dividir, por exemplo, um bloco de bi-previsão em um número de, por exemplo, tamanhos iguais de sub-blocos; determinar o SAD máximo do sub- tamanho do bloco em questão, e selecionar os sub-blocos tendo um SAD “fechado” para, por exemplo, dentro de um certo intervalo a partir, deste valor máximo, para fazer parte de uma região que é para usar alguma versão modificada da bi-previsão, ou uma previsão unidirecional.
[0092] Além de particionamento, esta abordagem pode ser usada, por exemplo, para determinar o índice RIS previamente descrito ou índices de referência do estado da técnica, quando um modo de bi-previsão é usado. Por exemplo, um mapa de diferença suave para uma região pode sugerir, e ser interpretado como, que a região é possivelmente associada com um “índice bi-RIS”. A abordagem poderia ainda ser usada como uma previsão alternativa ou em combinação com o Indicador de previsão de índice de referência previamente descrito. A seleção pode ser feita em ambos o codificador e o decodificador baseada no SAD entre possíveis candidatos de bi-previsão para selecionar a combinação com SAD mínimo.
[0093] Deve ser observado que com a multi-previsão acima descrita baseada na partição aproximada, ao invés de derivar um particionamento baseado em bloco, outros tipos de particionamento poderiam ser derivados tanto no codificador e no decodificador. Isto inclui partição linear (por exemplo, horizontal, vertical, ou diagonal) ou não-linear de bloco em duas ou mais partições, por exemplo de acordo com métodos de processamento de imagem não-linear tal como detecção de borda e/ou segmentação. Por exemplo, o sinal de diferença de multi-previsão pode ser segmentado de acordo com um método de segmentação de imagem tal como detecção de borda ou região crescente, e então a partição do bloco é derivada baseada no sinal de diferença segmentado.
[0094] O número de sub-partições poderia ser derivado através de quaisquer métodos de processamento de imagem tal como segmentação de imagem, ou poderia ser sinalizado do codificador para o decodificador. Como uma alternativa para particionamento linear ou não linear, também partição baseada em pixel pode ser aplicada. Uma variante seria para sinalizar a partir do codificador para o decodificador em que método de partição é usado, outra variante seria que o método de partição é acordado entre o codificador e o decodificador através de outros meios de sinalização. A vantagem com métodos baseados em multi-previsão é que a informação de partição pode ser derivada baseada na informação que já está disponível no codificador e no decodificador, isto é, ela não tem de ser explicitamente sinalizada, reduzindo assim o número de bits usados para codificação.
[0095] Deve ser observado que, de acordo com particionamento baseado em multi-previsão, ao invés de comutação de bi-previsão para uni- previsão com MVs unidirecionais derivados dos MVs usados para bi- previsão, é também possível sinalizar MVs e/ou modos de previsão adicionais (previsão de inter-imagem unidirecional, previsão de inter-imagem bidirecional, ou previsão de intra-imagem) para sub-partições. Em outras palavras, o número e formas das partições para um bloco poderiam ou ser sinalizados explicitamente e/ou ser derivados a partir de informação implícita, com base em, por exemplo, um método de segmentação. Além disso, MVs e/ou modo de previsão podem ser sinalizados por alguma ou todas das sub- partições resultantes.
[0096] Enquanto o procedimento como sugerido acima foi descrito com referência às modalidades específicas fornecidas como exemplo, a descrição geralmente apenas pretende ilustrar o conceito inventivo e não deve ser tomada como limitativa do âmbito dos métodos e disposições sugeridos, que são definidos pelas reivindicações anexas. Enquanto descrito em termos gerais, os métodos e as disposições podem ser aplicados, por exemplo, para diferentes tipos de sistemas de comunicação, usando tecnologias de comunicação comumente disponíveis, tal como, por exemplo, tecnologias GSM/EDGE, WCDMA ou LTE ou broadcast por satélite, terrestre, ou cabo, por exemplo, DVB-S, DVB-T, ou DVB-C, mas também para armazenamento/ recuperação de vídeo para/a partir de memória.
[0097] Deve também ser entendido que a escolha de unidade de interação ou módulos, assim como a nomeação das unidades são apenas para exemplificar propósitos, e entidades de manipulação de vídeo adequadas para executar quaisquer dos métodos descritos acima podem ser configuradas em uma pluralidade de maneiras alternativas a fim de ser capaz de executar os processos das ações sugeridas.
[0098] Deve ser observado que as unidades ou módulos descritos neste relatório devem ser considerados como entidades lógicas e não com necessidade como entidades físicas separadas.
Abreviaturas
[0099] AVC Codificação de Vídeo Avançada CABAC Codificação Aritmética do Contexto Binário Adaptado GOP Grupo de Imagens MB Bloco Macro MV Vetor de Movimento RIS Sinalização do Índice de Referência/ Informação de sinalização de Referência do Indicador SAD Soma de Diferença Absoluta VLC Codificação do Comprimento Variável

Claims (28)

1. Método em um decodificador de vídeo para decodificar informação, o método caracterizado pelo fato de compreender: obter (402) um elemento de sintaxe único associado com um bloco codificado Be, em que o elemento de sintaxe único representa uma entrada em uma primeira lista de referência predefinida e em que a primeira lista compreende uma ou mais entradas identificando pelo menos uma de uma pluralidade de imagens de referência e uma única imagem de referência; identificar (404) um modo de referência e uma ou mais imagens de referência com base no elemento de sintaxe obtido; e decodificar (406) o bloco Be com base no modo de referência identificado e uma ou mais imagens de referência, assim fornecendo um bloco decodificado, B, de pixels.
2. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a identificação de um modo de referência e as uma ou mais imagens de referência são baseadas em um mapeamento predefinido entre o elemento de sintaxe obtido e o modo de referência e uma ou mais imagens de referência específicas a serem usadas quando da decodificação do bloco Be.
3. Método, de acordo com qualquer uma das reivindicações 1 ou 2, caracterizadopelo fato de que cada entrada na primeira lista ainda identifica um modo de referência.
4. Método, de acordo com qualquer uma das reivindicações 1 a 3, caracterizado pelo fato de que o elemento de sintaxe ainda representa um modo de referência e uma entrada em uma segunda lista de referência predefinida.
5. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que uma ou mais figuras de referência incluem uma figura de referência do passado e uma figura de referência do futuro.
6. Disposição (500) em um decodificador de vídeo compreendendo um processador e uma memória, a memória contendo instruções executáveis pelo processador, a disposição caracterizada pelo fato de ser operada para: obter um elemento de sintaxe único associado com um bloco codificado Be, em que o elemento de sintaxe único representa uma entrada em uma primeira lista de referência predefinida e em que a primeira lista compreende uma ou mais entradas identificando pelo menos uma de uma pluralidade de imagens de referência e uma única imagem de referência; identificar um modo de referência e as uma ou mais imagens de referência com base no elemento de sintaxe obtido; e decodificar o bloco Be com base no modo de referência identificado e uma ou mais imagens de referência, assim fornecendo um bloco decodificado B de pixels.
7. Disposição, de acordo com a reivindicação 6, caracterizada pelo fato de ser ainda operada para identificar o modo de referência e as uma ou mais imagens de referência com base em um mapeamento predefinido entre o elemento de sintaxe obtido e o modo de referência e as uma ou mais imagens de referência específicas a serem usadas quando da decodificação do bloco Be.
8. Disposição, de acordo com qualquer uma das reivindicações 6 ou 7, caracterizadapelo fato de que cada entrada na primeira lista ainda identifica um modo de referência.
9. Disposição, de acordo com a reivindicação 6, caracterizada pelo fato de ser ainda operada para interpretar o elemento de sintaxe como representando ainda um modo de referência e uma entrada em uma segunda lista de referência predefinida.
10. Disposição, de acordo com a reivindicação 9, caracterizada pelo fato de a segunda lista compreender uma ou mais entradas identificando uma imagem de referência única.
11. Disposição, de acordo com a reivindicação 6, caracterizada pelo fato de que as uma ou mais entradas de lista são identificadas por um índice de lista.
12. Disposição de acordo com qualquer uma das reivindicações 6, caracterizada pelo fato de ser operada ainda para interpretar o número de bits representando o elemento de sintaxe obtido como correlacionado à probabilidade dos valores específicos do elemento de sintaxe, de tal forma que poucos bits impliquem valores prováveis, e mais bits impliquem valores menos prováveis.
13. Disposição, de acordo com a reivindicação 6, caracterizada pelo fato de ser operada ainda para realizar previsão de informação de referência para Be, com base em elementos de sintaxe únicos associados com blocos vizinhos.
14. Disposição, de acordo com a reivindicação 6, caracterizada pelo fato de ser operada ainda para identificar uma ou mais sub-regiões de um bloco associado com multi-previsão, para que sub-regiões das respectivas regiões correspondentes dos blocos de referência de multi-previsão possuem uma correlação baixa entre eles.
15. Disposição, de acordo com a reivindicação 6, caracterizada pelo fato de que uma ou mais figuras de referência incluem uma figura de referência do passado e uma figura de referência do futuro.
16. Meio não transitório legível por computador para controlar um decodificador de vídeo, o meio não transitório legível por computador caracterizado por compreender instruções que, quando executadas no decodificador de vídeo, fazem com que o decodificador de vídeo: obtenha um elemento de sintaxe único associado a um bloco codificado Be, em que o elemento de sintaxe único representa uma entrada em uma primeira lista de referência predefinida e em que a primeira lista compreende uma ou mais entradas que identifique pelo menos uma dentre uma pluralidade de imagens de referência e uma única imagem de referência; identifique um modo de referência e as uma ou mais imagens de referência com base no elemento de sintaxe obtido; e decodificar o bloco Be baseado no modo de referência identificado e nas uma ou mais imagens de referência, fornecendo um bloco decodificado, B, de pixels.
17. Método em um codificador de vídeo para codificar informação, o método caracterizado pelo fato de compreender as etapas de: codificar (602) um bloco B de pixels usando um modo de referência e uma ou mais imagens de referência, assim fornecendo um bloco codificado Be; derivar (604) um elemento de sintaxe único identificando o modo de referência e as uma ou mais imagens de referência, em que o elemento de sintaxe representa uma entrada em uma primeira lista de referência predefinida e em que a primeira lista compreende uma ou mais entradas identificando pelo menos uma de uma pluralidade de imagens de referência e uma única imagem de referência; - fornecer (606) o elemento de sintaxe a um decodificador do bloco Be.
18. Método, de acordo com a reivindicação 17, caracterizado pelo fato de que o elemento de sintaxe é derivado pelo modo de referência usado e as uma ou mais imagens de referência são mapeadas para o elemento de sintaxe de acordo com um esquema de mapeamento predefinido.
19. Método, de acordo com a reivindicação 17, caracterizado pelo fato de que cada entrada na primeira lista ainda identifica um modo de referência.
20. Disposição (700) em um codificador de vídeo compreendendo um processador e uma memória, a memória contendo instruções executáveis pelo processador, a disposição caracterizadapelo fato de ser operada para: codificar um bloco B de pixels usando um modo de referência e uma ou mais imagens de referência, assim fornecendo um bloco codificado Be; derivar um elemento de sintaxe único identificando o modo de referência e as uma ou mais imagens de referência, em que o elemento de sintaxe representa uma entrada em uma primeira lista de referência predefinida e em que a primeira lista compreende uma ou mais entradas identificando pelo menos uma de uma pluralidade de imagens de referência e uma única imagem de referência; e fornecer o elemento de sintaxe a um decodificador do bloco Be.
21. Disposição, de acordo com a reivindicação 20, caracterizada pelo fato de ser operada ainda para derivar o elemento de sintaxe a partir de um mapeamento predeterminado entre o modo de referência e uma ou mais imagens de referência e o elemento de sintaxe.
22. Disposição, de acordo com a reivindicação 20, caracterizada pelo fato de que cada entrada na primeira lista ainda identifica um modo de referência.
23. Disposição, de acordo com a reivindicação 20, caracterizada pelo fato de ser operada ainda para derivar o elemento de sintaxe de tal modo a ainda representar um modo de referência e uma entrada em uma segunda lista de referência predefinida.
24. Disposição, de acordo com a reivindicação 23, caracterizada pelo fato de a segunda lista compreender uma ou mais entradas identificando uma respectiva imagem de referência única.
25. Disposição, de acordo com a reivindicação 20, caracterizada pelo fato de ser operada ainda para derivar o elemento de sintaxe pela seleção de um índice de lista identificando uma ou mais entradas em uma ou mais listas de referência predefinidas.
26. Disposição, de acordo com a reivindicação 20, caracterizada pelo fato de ser operada ainda para selecionar o número de bits representando o elemento de sintaxe de tal forma a ser correlacionado à probabilidade dos modos e imagens específicos, que o elemento de sintaxe identifica, de modo que probabilidade mais elevada corresponda a poucos bits, e probabilidade mais baixa corresponda a mais bits.
27. Disposição, de acordo com a reivindicação 20, caracterizada pelo fato de ser operada ainda para realizar previsão de informação de referência para B ou Be, com base em elementos de sintaxe únicos associados com blocos vizinhos.
28. Meio não transitório legível por computador para controlar um codificador de vídeo, o meio não transitório legível por computador caracterizado por compreender instruções que, quando executadas no codificador de vídeo, fazem o codificador de vídeo: codificar um bloco B de pixels usando um modo de referência e uma ou mais imagens de referência, fornecendo assim um bloco codificado Be; derivar um único elemento de sintaxe identificando o modo de referência e as uma ou mais imagens de referência, em que o elemento de sintaxe representa uma entrada em uma primeira lista de referências predefinida e em que a primeira lista compreende uma ou mais entradas que identificam pelo menos uma dentre uma pluralidade de imagens de referência e uma única imagem de referência; e fornecer o elemento de sintaxe para um decodificador do bloco Be.
BR112012015001-4A 2009-12-17 2010-12-17 Método em um decodificador de vídeo para decodificar informação, disposição em um decodificador de vídeo, meio não transitório legível por computador para controlar um decodificador de vídeo, método em um codificador de vídeo para codificar informação, disposição em um codificador de vídeo, e, meio não transitório legível por computador para controlar um codificador de vídeo BR112012015001B1 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US28724209P 2009-12-17 2009-12-17
US61/287,242 2009-12-17
PCT/SE2010/051412 WO2011075071A1 (en) 2009-12-17 2010-12-17 Method and arrangement for video coding

Publications (2)

Publication Number Publication Date
BR112012015001A2 BR112012015001A2 (pt) 2016-11-29
BR112012015001B1 true BR112012015001B1 (pt) 2021-06-29

Family

ID=44167578

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112012015001-4A BR112012015001B1 (pt) 2009-12-17 2010-12-17 Método em um decodificador de vídeo para decodificar informação, disposição em um decodificador de vídeo, meio não transitório legível por computador para controlar um decodificador de vídeo, método em um codificador de vídeo para codificar informação, disposição em um codificador de vídeo, e, meio não transitório legível por computador para controlar um codificador de vídeo

Country Status (8)

Country Link
US (3) US9100658B2 (pt)
EP (2) EP2514209A4 (pt)
JP (2) JP5855013B2 (pt)
CN (2) CN102656890B (pt)
BR (1) BR112012015001B1 (pt)
CA (2) CA2784515A1 (pt)
RU (1) RU2551207C2 (pt)
WO (2) WO2011075071A1 (pt)

Families Citing this family (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103385002A (zh) * 2010-02-17 2013-11-06 韩国电子通信研究院 用于对超高清图像进行编码的装置及其方法、以及解码装置及其方法
US20110310976A1 (en) * 2010-06-17 2011-12-22 Qualcomm Incorporated Joint Coding of Partition Information in Video Coding
JP2012023651A (ja) * 2010-07-16 2012-02-02 Sony Corp 画像処理装置と画像処理方法
KR20130036768A (ko) 2010-07-28 2013-04-12 노키아 코포레이션 복잡도 균형 엔트로피 코딩을 제공하는 방법 및 장치
US9398308B2 (en) * 2010-07-28 2016-07-19 Qualcomm Incorporated Coding motion prediction direction in video coding
US9025661B2 (en) 2010-10-01 2015-05-05 Qualcomm Incorporated Indicating intra-prediction mode selection for video coding
TW201230818A (en) * 2010-11-26 2012-07-16 Panasonic Corp Image encoding method, image decoding method, image encoding device, image decoding device, program, and integrated circuit
US8913662B2 (en) * 2011-01-06 2014-12-16 Qualcomm Incorporated Indicating intra-prediction mode selection for video coding using CABAC
US9008176B2 (en) * 2011-01-22 2015-04-14 Qualcomm Incorporated Combined reference picture list construction for video coding
US9008181B2 (en) * 2011-01-24 2015-04-14 Qualcomm Incorporated Single reference picture list utilization for interprediction video coding
WO2012124961A2 (ko) * 2011-03-11 2012-09-20 삼성전자 주식회사 영상의 부호화 방법 및 장치, 그 복호화 방법 및 장치
US8934552B2 (en) 2011-03-31 2015-01-13 Qualcomm Incorporated Combined reference picture list construction and mapping
US9485518B2 (en) * 2011-05-27 2016-11-01 Sun Patent Trust Decoding method and apparatus with candidate motion vectors
TR201819396T4 (tr) 2011-05-27 2019-01-21 Sun Patent Trust Görüntü Kod Çözme Metodu Ve Görüntü Kod Çözme Cihazı
MX2013012209A (es) 2011-05-31 2013-11-01 Panasonic Corp Metodo de codificacion de video, aparato de codificacion de video, metodo de decodificacion de video, aparato de decodificacion de video y aparato de codificacion/decodificacion de video.
KR20120140592A (ko) 2011-06-21 2012-12-31 한국전자통신연구원 움직임 보상의 계산 복잡도 감소 및 부호화 효율을 증가시키는 방법 및 장치
WO2012177052A2 (ko) 2011-06-21 2012-12-27 한국전자통신연구원 인터 예측 방법 및 그 장치
GB2492337B (en) * 2011-06-27 2018-05-09 British Broadcasting Corp Video encoding and decoding using reference pictures
US9699456B2 (en) 2011-07-20 2017-07-04 Qualcomm Incorporated Buffering prediction data in video coding
AU2012291454B2 (en) 2011-08-03 2016-11-17 Sun Patent Trust Video encoding method, video encoding apparatus, video decoding method, video decoding apparatus, and video encoding/decoding apparatus
WO2013057877A1 (ja) 2011-10-19 2013-04-25 パナソニック株式会社 画像符号化方法、画像符号化装置、画像復号方法、および、画像復号装置
JP2013126093A (ja) * 2011-12-14 2013-06-24 Sony Corp 画像処理装置及び画像処理方法
JPWO2013108690A1 (ja) * 2012-01-19 2015-05-11 ソニー株式会社 画像処理装置および方法
US9467695B2 (en) 2012-01-19 2016-10-11 Vid Scale, Inc. Method and apparatus for signaling and construction of video coding reference picture lists
US9762903B2 (en) 2012-06-01 2017-09-12 Qualcomm Incorporated External pictures in video coding
CN108540813B (zh) 2012-09-28 2021-03-16 杜比国际公司 图像解码装置
CN103237212B (zh) * 2013-04-08 2016-04-13 浙江大学 一种生成增强层块单元编码信息参考队列的方法及装置
US9948934B2 (en) * 2014-07-02 2018-04-17 Apple Inc. Estimating rate costs in video encoding operations using entropy encoding statistics
WO2016034058A1 (en) * 2014-09-01 2016-03-10 Mediatek Inc. Method of intra picture block copy for screen content and video coding
US10148953B2 (en) 2014-11-10 2018-12-04 Samsung Electronics Co., Ltd. System and method for intra prediction in video coding
WO2016195460A1 (ko) * 2015-06-05 2016-12-08 한양대학교 산학협력단 화면 내 예측에 대한 부호화/복호화 방법 및 장치
CA3025490A1 (en) * 2016-05-28 2017-12-07 Mediatek Inc. Method and apparatus of current picture referencing for video coding using affine motion compensation
WO2018181252A1 (en) 2017-03-28 2018-10-04 Panasonic Intellectual Property Corporation Of America Encoding apparatus, decoding apparatus, encoding method, and decoding method
CN107094251B (zh) * 2017-03-31 2021-07-23 浙江大学 一种基于空间位置自适应质量调整的视频、图像编解码方法及装置
FR3062010A1 (fr) * 2017-07-05 2018-07-20 Orange Procedes et dispositifs de codage et de decodage d'un flux de donnees representatif d'une sequence d'images
JP6825506B2 (ja) * 2017-07-19 2021-02-03 富士通株式会社 動画像符号化装置、動画像符号化方法、動画像符号化用コンピュータプログラム、動画像復号装置及び動画像復号方法ならびに動画像復号用コンピュータプログラム
JP2018007279A (ja) * 2017-10-11 2018-01-11 株式会社東芝 復号方法及び復号装置
JP2018007278A (ja) * 2017-10-11 2018-01-11 株式会社東芝 復号方法及び復号装置
US11297348B2 (en) 2018-04-13 2022-04-05 Mediatek Inc. Implicit transform settings for coding a block of pixels
FR3080968A1 (fr) * 2018-05-03 2019-11-08 Orange Procede et dispositif de decodage d'une video multi-vue, et procede et dispositif de traitement d'images.
WO2020002641A1 (en) * 2018-06-29 2020-01-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Extended reference intra-picture prediction
US10650554B2 (en) * 2018-09-27 2020-05-12 Sony Corporation Packing strategy signaling
US11196988B2 (en) 2018-12-17 2021-12-07 Apple Inc. Reference picture management and list construction
CN115714866A (zh) * 2019-11-01 2023-02-24 北京达佳互联信息技术有限公司 残差和系数编解码的方法和装置

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6535558B1 (en) 1997-01-24 2003-03-18 Sony Corporation Picture signal encoding method and apparatus, picture signal decoding method and apparatus and recording medium
WO2000064058A1 (fr) * 1999-04-16 2000-10-26 Fujitsu Limited Codeur et decodeur
WO2003021971A1 (en) * 2001-08-28 2003-03-13 Ntt Docomo, Inc. Moving picture encoding/transmission system, moving picture encoding/transmission method, and encoding apparatus, decoding apparatus, encoding method, decoding method, and program usable for the same
US7643559B2 (en) * 2001-09-14 2010-01-05 Ntt Docomo, Inc. Coding method, decoding method, coding apparatus, decoding apparatus, image processing system, coding program, and decoding program
US6950469B2 (en) 2001-09-17 2005-09-27 Nokia Corporation Method for sub-pixel value interpolation
EP2373035B1 (en) * 2001-11-30 2015-11-25 NTT DoCoMo, Inc. Moving picture encoding device, moving picture decoding device, moving picture encoding method, moving picture decoding method, program, and computer readable recording medium storing program
JP4015934B2 (ja) 2002-04-18 2007-11-28 株式会社東芝 動画像符号化方法及び装置
JP3944225B2 (ja) * 2002-04-26 2007-07-11 株式会社エヌ・ティ・ティ・ドコモ 画像符号化装置、画像復号装置、画像符号化方法、画像復号方法、画像符号化プログラム及び画像復号プログラム
EP1427216A1 (en) 2002-07-02 2004-06-09 Matsushita Electric Industrial Co., Ltd. Image encoding method and image decoding method
KR100865034B1 (ko) * 2002-07-18 2008-10-23 엘지전자 주식회사 모션 벡터 예측 방법
US7154952B2 (en) * 2002-07-19 2006-12-26 Microsoft Corporation Timestamp-independent motion vector prediction for predictive (P) and bidirectionally predictive (B) pictures
US7801217B2 (en) 2002-10-01 2010-09-21 Thomson Licensing Implicit weighting of reference pictures in a video encoder
EP1568222B1 (en) * 2002-12-04 2019-01-02 Thomson Licensing Encoding of video cross-fades using weighted prediction
WO2004064255A2 (en) * 2003-01-07 2004-07-29 Thomson Licensing S.A. Mixed inter/intra video coding of macroblock partitions
KR100510136B1 (ko) * 2003-04-28 2005-08-26 삼성전자주식회사 참조 픽처 결정 방법, 그 움직임 보상 방법 및 그 장치
US7724827B2 (en) * 2003-09-07 2010-05-25 Microsoft Corporation Multi-layer run level encoding and decoding
US7961786B2 (en) * 2003-09-07 2011-06-14 Microsoft Corporation Signaling field type information
US7400681B2 (en) * 2003-11-28 2008-07-15 Scientific-Atlanta, Inc. Low-complexity motion vector prediction for video codec with two lists of reference pictures
US8036271B2 (en) 2004-02-24 2011-10-11 Lsi Corporation Method and apparatus for determining a second picture for temporal direct-mode block prediction
JP4575129B2 (ja) 2004-12-02 2010-11-04 ソニー株式会社 データ処理装置およびデータ処理方法、並びにプログラムおよびプログラム記録媒体
JP2009500941A (ja) * 2005-07-08 2009-01-08 エルジー エレクトロニクス インコーポレイティド 情報を圧縮/圧縮解除するためにビデオ信号のコーディング情報をモデリングする方法
CN101371571B (zh) * 2006-01-12 2013-06-19 Lg电子株式会社 处理多视图视频
US9215475B2 (en) 2006-02-02 2015-12-15 Thomson Licensing Method and apparatus for motion estimation using combined reference bi-prediction
JP5155157B2 (ja) 2006-05-12 2013-02-27 パナソニック株式会社 動画像復号化装置
KR100823287B1 (ko) 2007-01-03 2008-04-21 삼성전자주식회사 전역 차이 벡터를 이용한 다시점 영상의 부호화, 복호화방법 및 장치
WO2008154041A1 (en) * 2007-06-14 2008-12-18 Thomson Licensing Modifying a coded bitstream
CA2650151C (en) 2008-01-17 2013-04-02 Lg Electronics Inc. An iptv receiving system and data processing method
WO2010041855A2 (en) * 2008-10-06 2010-04-15 Lg Electronics Inc. A method and an apparatus for processing a video signal

Also Published As

Publication number Publication date
CN102668561A (zh) 2012-09-12
CN102656890A (zh) 2012-09-05
JP2013514719A (ja) 2013-04-25
US20120250766A1 (en) 2012-10-04
US20120250765A1 (en) 2012-10-04
EP2514209A4 (en) 2014-03-26
EP2514210A4 (en) 2014-03-19
CA2784515A1 (en) 2011-06-23
RU2012130147A (ru) 2014-03-20
US9100658B2 (en) 2015-08-04
CN102656890B (zh) 2016-01-06
JP2013514718A (ja) 2013-04-25
US10542284B2 (en) 2020-01-21
US20150264393A1 (en) 2015-09-17
WO2011075071A1 (en) 2011-06-23
RU2551207C2 (ru) 2015-05-20
EP2514210A1 (en) 2012-10-24
US9071845B2 (en) 2015-06-30
CA2784517A1 (en) 2011-06-23
WO2011075072A1 (en) 2011-06-23
BR112012015001A2 (pt) 2016-11-29
JP5855013B2 (ja) 2016-02-09
EP2514209A1 (en) 2012-10-24

Similar Documents

Publication Publication Date Title
BR112012015001B1 (pt) Método em um decodificador de vídeo para decodificar informação, disposição em um decodificador de vídeo, meio não transitório legível por computador para controlar um decodificador de vídeo, método em um codificador de vídeo para codificar informação, disposição em um codificador de vídeo, e, meio não transitório legível por computador para controlar um codificador de vídeo
CN110677648B (zh) 处理视频数据的方法、装置及非暂时性存储介质
CN112970253B (zh) 用于预测的运动候选列表构建
CN113302917B (zh) 局部照明补偿的改进方法
US20140064369A1 (en) Video encoding and decoding
CN111083485B (zh) 仿射模式的运动信息的利用
BR122019028117B1 (pt) Método de codificação de informação para aplicar deslocamentos adaptativos de amostra a uma imagem
BR112013016702B1 (pt) Método e dispositivo para codificação e decodificação de vídeo com resiliência de erro aprimorada
US20200221097A1 (en) Method and apparatus for encoding or decoding video data in fruc mode with reduced memory accesses
KR20100080792A (ko) 기하학적으로 분할된 쌍방 예측 모드 분할들을 비디오 인코딩 및 디코딩하기 위한 방법 및 장치
BR122020002131B1 (pt) Método e dispositivo para codificar e decodificar uma sequência de imagens e meio legível por computador
BR112019028012A2 (pt) dispositivo e método para determinar um vetor de movimento, codificador e decodificador de vídeo para codificar e decodificar uma pluralidade de fotos
CN113632493B (zh) 变换跳过模式中的子块变换
CN113055686B (zh) 一种编解码方法、装置及其设备
US11095878B2 (en) Method and device for encoding a sequence of images and method and device for decoding a sequence of image
CN118355659A (zh) 用于视频处理的方法、装置和介质
BR112017020632B1 (pt) Métodos e dispositivo para processar dados de vídeo e memória legível por computador
BR112017020627B1 (pt) Derivação de vetor de movimento em codificação de vídeo
BR112017020635B1 (pt) Método para decodificar dados de vídeo, método e aparelho para codificar dados de vídeo, e memória legível por computador
BR122020002130B1 (pt) Método e dispositivo para codificar e decodificar uma sequência de imagens e meio legível por computador
BR122020002129B1 (pt) Método e dispositivo para codificar e decodificar uma sequência de imagens e meio legível por computador
BR122020002128B1 (pt) Método e dispositivo para codificar e decodificar uma sequência de imagens e meio legível por computador

Legal Events

Date Code Title Description
B15K Others concerning applications: alteration of classification

Ipc: H04N 19/573 (2014.01), H04N 19/159 (2014.01), H04N

B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B06U Preliminary requirement: requests with searches performed by other patent offices: procedure suspended [chapter 6.21 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted

Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 17/12/2010, OBSERVADAS AS CONDICOES LEGAIS. PATENTE CONCEDIDA CONFORME ADI 5.529/DF, , QUE DETERMINA A ALTERACAO DO PRAZO DE CONCESSAO.