BRPI0706438B1 - Método para decodificação de vídeo e decodificador de vídeo - Google Patents

Método para decodificação de vídeo e decodificador de vídeo Download PDF

Info

Publication number
BRPI0706438B1
BRPI0706438B1 BRPI0706438-1A BRPI0706438A BRPI0706438B1 BR PI0706438 B1 BRPI0706438 B1 BR PI0706438B1 BR PI0706438 A BRPI0706438 A BR PI0706438A BR PI0706438 B1 BRPI0706438 B1 BR PI0706438B1
Authority
BR
Brazil
Prior art keywords
cross
view
image
lists
images
Prior art date
Application number
BRPI0706438-1A
Other languages
English (en)
Inventor
Yeping Su
Peng Yin
Cristina Gomila
Original Assignee
Interdigital Vc Holdings, Inc.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Interdigital Vc Holdings, Inc. filed Critical Interdigital Vc Holdings, Inc.
Priority to BR122016024819-4A priority Critical patent/BR122016024819B1/pt
Publication of BRPI0706438A2 publication Critical patent/BRPI0706438A2/pt
Publication of BRPI0706438B1 publication Critical patent/BRPI0706438B1/pt

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/109Selection of coding mode or of prediction mode among a plurality of temporal predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/174Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a slice, e.g. a line of blocks or a group of blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/573Motion compensation with multiple frame prediction using two or more reference frames in a given prediction direction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/58Motion compensation with long-term prediction, i.e. the reference frame for a current frame not being the temporally closest one
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • H04N19/82Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)

Abstract

métodos e aparelho para codificaçao de video multivisualizaçao são fornecidos métodos e aparelho para codificação de vídeo multivisualização. um codificador de video inclui um codificador (100) para codificar um bloco em uma imagem pela escolha entre prognóstico temporal e prognóstico de visualização cruzada para habilitar um prognóstico para o bloco. a imagem é uma de um conjunto de imagens correspondente ao conteúdo de vídeo multivisualização e com diferentes pontos de visualização em relação a uma mesma cena ou a uma cena similar. a imagem representa um dos diferentes pontos de visualização. uma sintaxe de alto nível é usada para indicar o uso do prognóstico de visualização cruzada para o bloco.

Description

“MÉTODO PARA DECODIFICAÇÃO DE VÍDEO E DECODIFICADOR DE VÍDEO
REFERÊNCIA CRUZADA A PEDIDOS RELACIONADOS
Este pedido reivindica o benefício do pedido provisório US 60/757.289, intitulado “Multi-View Video Coding System, depositado em 9 de janeiro de 2006, que é aqui incorporado pela referência. Além do mais, este pedido está relacionado ao pedido não provisório, Documento Judicial PU060004, intitulado “Methods and Apparatus for Multi-View Video Coding, do mesmo requerente, incorporado pela referência em sua íntegra e depositado simultaneamente.
CAMPO DA INVENÇÃO
A presente invenção diz respeito, no geral, a codificadores e decodificadores de vídeo e, mais particularmente, a métodos e aparelho para Codificação de Vídeo Multivisualização.
ANTECEDENTES DA INVENÇÃO
Codificação de vídeo multivisualização (MVC) é a estrutura de compressão para a codificação das seqüências multivisualização. Uma seqüência de Codificação de Vídeo Multivisualização (MVC) é um conjunto de duas ou mais seqüências de vídeo que captura a mesma cena de um diferente ponto de visualização.
Reconhece-se amplamente que a Codificação de Vídeo Multivisualização é uma tecnologia chave que serve a uma ampla variedade de aplicações, incluindo aplicações com ponto de visualização livre e aplicações de vídeo em 3D, entretenimento doméstico e vigilância. Nestas aplicações multivisu
Petição 870190039595, de 26/04/2019, pág. 8/51
2/34 alização, a quantidade de dados de vídeo envolvida é enorme. Assim, existe uma necessidade de tecnologias de compressão eficientes para melhorar a eficiência de codificação das atuais soluções de codificação de vídeo que realizam a difusão simultânea de visualizações independentes.
Nos últimos anos, foram feitos muitos esforços no projeto de métodos eficientes para a compressão de vídeo estereoscópico. Métodos de compressão monoscópica convencionais podem ser aplicados independentemente às visualizações esquerda e direita de um par de imagem estéreo. Entretanto, maiores taxas de compressão podem ser alcançadas se a alta correlação entre as visualizações for explorada.
Considerando uma abordagem da tecnologia anterior na qual ambas as visualizações de um par de imagem estereoscópica são codificadas, um Perfil Multivisualização (MVP) foi definido no padrão Grupo de Especialistas em Imagens em Movimento-2 (MPEG-2) da Organização Internacional para Padronização / Comissão Eletrotécnica Internacional (ISO/IEC) para transmitir um par de sinais de vídeo. O MVP se baseia em uma abordagem de representação de sinal multicamadas de maneira tal que uma visualização (freqüentemente, a visualização esquerda) é atribuída a uma camada base, e a outra visualização é atribuída a uma camada de melhoria. A codificação monoscópica com as mesmas ferramentas do Perfil Principal (MP) é aplicada na camada base. A camada de melhoria é codificada usando ferramentas de escalabilidade temporal e um prognóstico híbrido do movimento e dos campos de disparidade.
Petição 870190039595, de 26/04/2019, pág. 9/51
3/34
Em métodos da tecnologia anterior relacionados ao padrão de Codificação Avançada de Vídeo (AVC) parte 10 do Grupo de Especialistas de Imagens em Movimento-4 (MPEG-4) da Organização Internacional para a Padronização / Comissão Eletrotécnica Internacional (ISO/IEC) / recomendação H.264 do Setor de Telecomunicações da União Internacional de Telecomunicações (ITU-T) (doravante o “padrão MPEG-4 AVC), a codificação estereoscópica de vídeo pode ser realizada de duas maneiras diferentes: (i) como um caso em particular de codificação de imagem entrelaçada, em que todos os campos de uma paridade em particular são atribuídos à visualização esquerda e todos os campos da paridade oposta são considerados a visualização direita do conteúdo de visualização estéreo; ou, alternativamente, (ii) pela alternação de quadros das visualizações esquerda e direita para criar uma única seqüência monoscópica de vídeo. Uma mensagem de informação de melhoria complementar (SEI) de estereovisão fornece uma indicação ao decodificador se a seqüência de vídeo codificada representa conteúdo estereoscópico ou não e qual método foi usado para codificar o conteúdo correspondente.
Estes métodos previamente conhecidos exigem mínimas modificações das técnicas de codificação monoscópica existentes. Entretanto, eles mostram uma capacidade limitada de reduzir a redundância existente entre as duas visualizações em um par estereoscópico. Em decorrência disto, a codificação da visualização estéreo resulta em um grande sobreprocessamento, se comparado com a codificação de uma única visualização monoscópica. Além do mais, não há suporte antePetição 870190039595, de 26/04/2019, pág. 10/51
4/34 rior para a codificação de mais do que duas visualizações de câmera.
SUMÁRIO DA INVENÇÃO
Estes e outros inconvenientes e desvantagens da tecnologia anterior são abordados pela presente invenção, que é direcionada a métodos e aparelho para Codificação de Vídeo Multivisualização.
De acordo com um aspecto da presente invenção, é fornecido um codificador de vídeo. O codificador de vídeo inclui um codificador para codificar um bloco em uma imagem usando pelo menos uma das duas listas de imagem de referência. A imagem é uma de um conjunto de imagens correspondente ao conteúdo de vídeo multivisualização e com diferentes pontos de visualização em relação a uma mesma cena ou a uma cena similar. A imagem representa um ponto de visualização atual de um dos diferentes pontos de visualização. As duas listas de imagem de referência de visualização cruzada correspondem a imagens de referência com uns dos diferentes pontos de visualização diferentes do ponto de visualização atual.
De acordo com um outro aspecto da presente invenção, é fornecido um codificador de vídeo. O codificador de vídeo inclui pelo menos um armazenamento temporário para armazenar imagens decodificadas correspondentes ao conteúdo multivisualização para diferentes pontos de visualização de uma mesma cena ou de uma cena similar.
De acordo com um ainda outro aspecto da presente invenção, é fornecido um método de codificação de vídeo. O
Petição 870190039595, de 26/04/2019, pág. 11/51
5/34 método inclui codificar um bloco em uma imagem usando pelo menos uma das duas listas de imagem de referência de visualização cruzada. A imagem é uma de um conjunto de imagens correspondente ao conteúdo de vídeo multivisualização e com diferentes pontos de visualização em relação a uma mesma cena ou a uma cena similar. A imagem representa um ponto de visualização atual dos diferentes pontos de visualização. As duas listas de imagem de referência de visualização cruzada correspondem a imagens de referência com uns dos diferentes pontos de visualização diferentes do ponto de visualização atual.
De acordo com um ainda outro aspecto da presente invenção, é fornecido um método para codificação de vídeo. O método inclui armazenar, em pelo menos um armazenamento temporário, imagens decodificadas correspondentes ao conteúdo multivisualização para diferentes pontos de visualização de uma mesma cena ou de uma cena similar.
De acordo com um aspecto adicional da presente invenção, é fornecido um decodificador de vídeo. O decodificador de vídeo inclui um decodificador para decodificar um bloco em uma imagem usando pelo menos uma das duas listas de imagem de referência de visualização cruzada. A imagem é uma de um conjunto de imagens correspondente ao conteúdo de vídeo multivisualização e com diferentes pontos de visualização em relação em relação a uma mesma cena ou a uma cena similar. A imagem representa um ponto de visualização atual dos diferentes pontos de visualização. As duas listas de imagem de referência de visualização cruzada correspondem às
Petição 870190039595, de 26/04/2019, pág. 12/51
6/34 imagens de referência com uns dos diferentes pontos de visualização diferentes do ponto de visualização atual.
De acordo com um aspecto ainda adicional da presente invenção, é fornecido um decodificador de vídeo. O decodificador de vídeo inclui pelo menos um armazenamento temporário para armazenar imagens decodificadas correspondentes ao conteúdo multivisualização para diferentes pontos de visualização de uma mesma cena ou de uma cena similar.
De acordo com um aspecto adicional da presente invenção, é fornecido um método para decodificação de vídeo. O método inclui decodificar um bloco em uma imagem usando pelo menos uma das listas de imagem de referência de visualização cruzada. A imagem é uma de um conjunto de imagens correspondente ao conteúdo de vídeo multivisualização e com diferentes pontos de visualização em relação a uma mesma cena ou a uma cena similar. A imagem representa um ponto de visualização atual dos diferentes pontos de visualização. As duas listas de imagem de referência de visualização cruzada correspondem às imagens de referência com uns dos diferentes pontos de visualização diferentes do ponto de visualização atual.
De acordo com um aspecto ainda adicional da presente invenção, é fornecido um método para decodificação de vídeo. O método inclui armazenar, em pelo menos um armazenamento temporário, imagens decodificadas correspondentes ao conteúdo multivisualização para diferentes pontos de visualização de uma mesma cena ou de uma cena similar.
Estes e outros aspectos, recursos e vantagens da
Petição 870190039595, de 26/04/2019, pág. 13/51
7/34 presente invenção ficaram aparentes a partir da seguinte descrição detalhada das modalidades exemplares, que deve ser lida em conjunto com os desenhos anexos.
DESCRIÇÃO RESUMIDA DOS DESENHOS
A presente invenção pode ser mais bem entendida de acordo com as seguintes figuras exemplares, nas quais:
a figura 1 é um diagrama de blocos para um codificador de Codificação de Vídeo Multivisualização (MVC) no qual os presentes princípios podem ser aplicados, de acordo com uma modalidade dos presentes princípios;
a figura 2 é um diagrama de blocos para um decodificador de Codificação de Vídeo Multivisualização (MVC) no qual os presentes princípios podem ser aplicados, de acordo com uma modalidade dos presentes princípios;
a figura 3 é um fluxograma para um método exemplar para a construção da lista de referência para conteúdo de vídeo multivisualização, de acordo com uma modalidade dos presentes princípios;
a figura 4 é um fluxograma para um método exemplar para realizar uma decisão de modo de visualização temporal / cruzada, de acordo com uma modalidade dos presentes princípios;
a figura 5 é um fluxograma para um método exemplar para processar vetores de movimento e de disparidade para a mesma fatia correspondente ao conteúdo de vídeo multivisualização, de acordo com uma modalidade dos presentes princípios; e a figura 6 é um fluxograma para um outro método
Petição 870190039595, de 26/04/2019, pág. 14/51
8/34 para processar vetores de movimento e de disparidade para conteúdo de vídeo multivisualização, de acordo com uma modalidade dos presentes princípios.
DESCRIÇÃO DETALHADA
A presente invenção é direcionada a métodos e aparelho para Codificação de Vídeo Multivisualização.
A presente descrição ilustra os princípios da presente invenção. Assim, percebe-se que versados na técnica podem conceber vários arranjos que, embora não explicitamente descritos ou mostrados aqui, incorporam os princípios da invenção e estão incluídos no seu espírito e escopo.
Pretende-se que todos os exemplos e linguagem condicional aqui citados tenham propósitos pedagógicos para auxiliar o leitor no entendimento dos princípios da invenção e dos conceitos contribuídos pelo inventor para desenvolver a tecnologia, e devem ser interpretados sem limitação a tais exemplos e condições especificamente citados.
Além do mais, pretende-se que todas as declarações que aqui citam princípios, aspectos e modalidades da invenção, bem como seus exemplos específicos, abranjam tanto seus equivalentes estruturais quanto funcionais. Adicionalmente, pretende-se que tais equivalentes incluam tanto equivalentes atualmente conhecidos quanto equivalentes desenvolvidos no futuro, isto é, qualquer elemento desenvolvido que realize a mesma função, independente da estrutura.
Assim, por exemplo, versados na técnica percebem que os diagramas de blocos aqui apresentados representam visualizações conceituais do sistema de circuitos ilustrativo
Petição 870190039595, de 26/04/2019, pág. 15/51
9/34 que incorpora os princípios da invenção. Similarmente, percebe-se que todos os fluxogramas, diagramas de fluxo, diagramas de transição de estado, pseudocódigos e congêneres representam vários processos que podem ser substancialmente representados em mídia legível por computador e, portanto, executados por um computador ou processador, caso tal computador ou processador sejam explicitamente mostrados ou não.
As funções dos vários elementos mostrados nas figuras podem ser fornecidas por meio do uso de hardware dedicado, bem como de hardware que pode executar software em conjunto com software apropriado. Quando fornecidas por um processador, as funções podem ser fornecidas por um único processador dedicado, por um único processador compartilhado ou por uma pluralidade de processadores individuais, alguns dos quais podem ser compartilhados. Além do mais, o uso explícito do termo “processador ou “controlador não deve ser interpretado dizendo respeito exclusivamente a hardware que pode executar software, e pode incluir implicitamente, mas sem limitações, hardware processador de sinal digital (“DSP), memória exclusiva de leitura (“ROM) para armazenar software, memória de acesso aleatório (“RAM) e armazenamento não volátil.
Outro hardware, convencional e/ou personalizado, também pode ser incluído. Similarmente, todas as chaves mostradas nas figuras são somente conceituais. Sua função pode ser realizada por meio da operação de lógica de programa, por meio de lógica dedicada, por meio da interação do controle do programa e da lógica dedicada, ou mesmo manualmen
Petição 870190039595, de 26/04/2019, pág. 16/51
10/34 te, a técnica em particular sendo selecionada pelo implementador, como é mais especificamente entendido a partir do contexto.
Nas reivindicações anexas, pretende-se que todos os elementos expressos como um dispositivo para realizar uma função específica abranjam qualquer maneira de realizar aquela função, incluindo, por exemplo, a) uma combinação de elementos de circuito que realiza aquela função ou b) software em qualquer forma, incluindo, portanto, software embarcado, microcódigo ou congêneres, combinados com sistema de circuitos apropriado para executar aquele software para realizar a função. A invenção definida por tais reivindicações fica residente no fato de que as funcionalidades fornecidas pelos vários dispositivos citados são combinadas e articuladas da maneira que as reivindicações exigem. Assim, considera-se que todos os dispositivos que podem fornecer aquelas funcionalidades são equivalentes àqueles aqui mostrados.
Nesta especificação, a referência a “uma modalidade ou “a modalidade dos presentes princípios significa que um recurso, estrutura, característica e assim por diante em particular descrito em conjunto com a modalidade está incluído em pelo menos uma modalidade dos presentes princípios. Assim, nem todas as aparências da frase “em uma modalidade ou “na modalidade que aparecem em vários locais por toda a especificação, se referem, necessariamente à mesma modalidade.
Voltando para a figura 1, um codificador de Codi
Petição 870190039595, de 26/04/2019, pág. 17/51
11/34 ficação de Vídeo Multivisualização (MVC) exemplar é indicado, no geral, pelo número de referência 100. O codificador 100 inclui um combinador 105 com uma saída conectada em comunicação de sinal com uma entrada de um transformador 110. Uma saída do transformador 110 é conectada em comunicação de sinal com uma entrada do quantizador 115. Uma saída do quantizador 115 é conectada em comunicação de sinal com uma entrada de um codificador de entropia 120 e com uma entrada de um quantizador invertido 125. Uma saída do quantizador invertido 125 é conectada em comunicação de sinal com uma entrada de um transformador invertido 130. Uma saída do transformador invertido 130 é conectada em comunicação de sinal com uma primeira entrada não invertida de um combinador 135. Uma saída do combinador 135 é conectada em comunicação de sinal com uma entrada de um intrapreditor 145 e com uma entrada de um filtro de desagrupamento 150. Uma saída do filtro de desagrupamento 150 é conectada em comunicação de sinal com uma entrada de um armazenamento da imagem de referência 155 (para a visualização i). Uma saída do armazenamento da imagem de referência 155 é conectada em comunicação de sinal com uma primeira entrada de um compensador de movimento 175 e com uma primeira entrada de um estimador de movimento 180. Uma saída do estimador de movimento 180 é conectada em comunicação de sinal com uma segunda entrada do compensador de movimento 175.
Uma saída de um armazenamento da imagem de referência 160 (para outras visualizações) é conectada em comunicação de sinal com uma primeira entrada de um estimador de
Petição 870190039595, de 26/04/2019, pág. 18/51
12/34 disparidade / iluminação 170 e com uma primeira entrada de um compensador de disparidade / iluminação 165. Uma saída do estimador de disparidade / iluminação 170 é conectada em comunicação de sinal com uma segunda entrada do compensador de disparidade / iluminação 165.
Uma saída do decodificador de entropia 120 fica disponível como uma saída do codificador 100. Uma entrada não invertida do combinador 105 fica disponível como uma entrada do codificador 100 e é conectada em comunicação de sinal com uma segunda entrada do estimador de disparidade / iluminação 170 e com uma segunda entrada do estimador de movimento 180. Uma saída de uma chave 185 é conectada em comunicação de sinal com uma segunda entrada não invertida do combinador 135 e com uma entrada invertida do combinador 105. A chave 185 inclui uma primeira entrada conectada em comunicação de sinal com uma saída do compensador de movimento 175, uma segunda entrada conectada em comunicação de sinal com uma saída do compensador de disparidade / iluminação 165, e uma terceira entrada conectada em comunicação de sinal com uma saída do intrapreditor 145.
Um módulo de decisão de modo 140 tem uma saída conectada na chave 185 para controlar qual entrada é selecionada pela chave 185.
Voltando para a figura 2, um decodificador de Codificação de Vídeo Multivisualização é indicado, no geral, pelo número de referência 200. O decodificador 200 inclui um decodificador de entropia 205 com uma saída conectada em comunicação de sinal com uma entrada de um quantizador inverPetição 870190039595, de 26/04/2019, pág. 19/51
13/34 tido 210. Uma saída do quantizador invertido é conectada em comunicação de sinal com uma entrada de um transformador invertido 215. Uma saída do transformador invertido 215 é conectada em comunicação de sinal com uma primeira entrada não invertida de um combinador 220. Uma saída do combinador 220 é conectada em comunicação de sinal com uma entrada de um filtro de desagrupamento 225 e com uma entrada de um intrapreditor 230. Uma saída do filtro de desagrupamento 225 é conectada em comunicação de sinal com uma entrada de um armazenamento da imagem de referência 240 (para visualização i). Uma saída do armazenamento da imagem de referência 240 é conectada em comunicação de sinal com uma primeira entrada de um compensador de movimento 235.
Uma saída do armazenamento da imagem de referência 245 (para outras visualizações) é conectada em comunicação de sinal com uma primeira entrada de um compensador de disparidade / iluminação 250.
Uma entrada de um codificador de entropia 205 fica disponível como uma entrada para o decodificador 200 para receber o fluxo contínuo de bits residual. Além do mais, uma entrada de um módulo de modo 260 também fica disponível como uma entrada para o decodificador 200 para receber a sintaxe de controle para controlar qual entrada é selecionada pela chave 255. Adicionalmente, uma segunda entrada do compensador de movimento 235 fica disponível como uma entrada do decodificador 200 para receber os vetores de movimento. Também, uma segunda entrada do compensador de disparidade / iluminação 250 fica disponível como uma entrada para o decoPetição 870190039595, de 26/04/2019, pág. 20/51
14/34 dificador 200 para receber vetores de disparidade e sintaxe de compensação de iluminação.
Uma saída de uma chave 255 é conectada em comunicação de sinal com uma segunda entrada não invertida do combinador 220. Uma primeira entrada da chave 255 é conectada em comunicação de sinal com uma saída do compensador de disparidade / iluminação 250. Uma segunda entrada da chave 255 é conectada em comunicação de sinal com uma saída do compensador de movimento 235. Uma terceira entrada da chave 255 é conectada em comunicação de sinal com uma saída do intrapreditor 230. Uma saída do módulo de modo 260 é conectada em comunicação de sinal com a chave 255 para controlar qual entrada é selecionada pela chave 255. Uma saída do filtro de desagrupamento 225 fica disponível como uma saída do decodificador.
A codificação de vídeo multivisualização (MVC) é a estrutura de compressão para a codificação das seqüências multivisualização. Uma seqüência de Codificação de Vídeo Multivisualização (MVC) é um conjunto de duas ou mais seqüências de vídeo que captura a mesma cena a partir de um ponto de visualização diferente.
Já que uma fonte de vídeo multivisualização inclui múltiplas visualizações da mesma cena, existe um alto grau de correlação entre as imagens de múltiplas visualizações. Portanto, a redundância de visualização pode ser explorada além da redundância temporal, e é alcançada pela realização do prognóstico de visualização através das diferentes visualizações. Dessa maneira, modalidades dos presentes princíPetição 870190039595, de 26/04/2019, pág. 21/51
15/34 pios aqui descritos podem envolver prognóstico tanto temporal quanto de visualização cruzada.
Com propósitos ilustrativos, modalidades dos presentes princípios são aqui descritas em relação ao padrão MPEG-4 AVC. Entretanto, percebe-se que a presente invenção não é limitada ao padrão MPEG-4 AVC e, dados os preceitos dos presentes princípios aqui fornecidos, versados na técnica percebem que este e outros padrões de codificação de vídeo podem fazer a Codificação de Vídeo Multivisualização à qual os presentes princípios podem ser aplicados, mantendo o escopo dos presentes princípios. Modalidades dos presentes princípios aqui descritos que dizem respeito ao padrão MPEG4 AVC podem envolver, por exemplo, mudanças no filtro de desagrupamento e/ou na codificação de entropia das sintaxes.
Em uma modalidade, no nível da fatia, as listas do prognóstico de visualização cruzada são introduzidas para habilitar prognóstico de disparidade, e uma sintaxe tipo codificação de visualização cruzada é adicionada para indicar o tipo de codificação do prognóstico de disparidade. No nível do macrobloco (MB), uma sintaxe de indicador é introduzida para indicar se a compensação de movimento ou a compensação de disparidade é usada para cada bloco de sinal. Além do mais, outras mudanças que podem ser utilizadas em modalidades direcionadas para o padrão MPEG-4 AVC incluem, por exemplo, um filtro de desagrupamento, contextos de Codificação Aritmética Binária Adaptativa ao Contexto (CABAC) para as novas sintaxes, e sintaxes adicionais no nível do conjunto de parâmetro e no nível do cabeçalho da fatia.
Petição 870190039595, de 26/04/2019, pág. 22/51
16/34
Agora, uma descrição será dada considerando listas do tipo codificação de visualização cruzada e listas de referência de visualização cruzada de acordo com uma modalidade dos presentes princípios.
O padrão MPEG-4 AVC realiza o prognóstico interquadros pela formação de duas listas de prognóstico, List0 e List1. Portanto, um bloco de imagem no quadro atual pode ser compensado tanto pelo uso de somente uma imagem de referência na List0 quanto pelo uso de duas imagens de referência, uma de cada lista. No cabeçalho da fatia, uma sintaxe slice_type é assinalada para indicar o tipo de codificação temporal para cada fatia. Quando slice_type = P_SLICE, somente List0 será usada na compensação de movimento. Quando slice_type = B_SLICE, possivelmente, tanto a List0 quanto a List1 podem ser usadas na compensação de movimento.
Para habilitar o prognóstico de visualização cruzada entre as diferentes visualizações, uma modalidade dos presentes princípios envolve o uso de duas novas listas de prognóstico: ViewList0 e ViewList1. Imagens na ViewList0 / ViewList1 são imagens de referência das visualizações da câmera diferentes da visualização atual. Uma nova sintaxe view_slice_type no cabeçalho da fatia é usada para indicar o tipo de codificação para o prognóstico de visualização cruzada. Por exemplo, se uma fatia específica tiver slice_type = B_SLICE e view_slice_type = P_SLICE, então, um macrobloco (MB) naquela fatia pode ser tanto temporalmente codificado como um tipo de codificação B_SLICE quanto codificado em visualização cruzada como um tipo de codificação P_SLICE.
Petição 870190039595, de 26/04/2019, pág. 23/51
17/34
Uma maneira alternativa de habilitar os prognósticos de visualização cruzada na estrutura do padrão MPEG-4 AVC envolve inserir imagens de referência de outras visualizações nas listas List0 / List1 sem introduzir novas listas de prognóstico de visualização e tipo de codificação de visualização cruzada. Entretanto, as vantagens da primeira abordagem são como segue. Uma vantagem da primeira abordagem é que, já que as imagens de referência em ViewList0 / ViewList1 somente incluem referências de visualização cruzada, sinalizar o ref_Idx gastará menos bits do que ter tanto as referências de mesma visualização quanto as referências de visualização cruzada na mesma lista. Uma outra vantagem da primeira abordagem é que ter duas novas listas ViewList0 / ViewList1 fornece uma maneira separada de tratar os prognósticos temporal e de visualização cruzada. Isto diz respeito ao caso em que as List0 / List1 incluem tanto referências temporais quanto referências de visualização cruzada, para que o padrão MPEG-4 AVC que reordena o processo para a reconstrução das listas da imagem de referência tenha que ser modificado, e, necessariamente, será mais complexo.
Em uma modalidade, as listas de referência de visualização cruzada para cada fatia podem ser formadas de acordo com as seguintes regras. Em relação à primeira regra, no cabeçalho da fatia, o número de imagens de referência de visualização cruzada e de seus view_id's é assinalado tanto para ViewList0 quanto para ViewList1. Os view_id's são distintivos em cada uma das duas listas de prognóstico de visualização cruzada. Em relação à segunda regra, as imagens de
Petição 870190039595, de 26/04/2019, pág. 24/51
18/34 referência na lista de prognóstico de visualização cruzada são ordenadas na mesma seqüência que elas aparecem no cabeçalho da fatia. Para cada visualização referida, a imagem de referência com o número de Contagem de Ordem de Imagem (POC) mais próximo (em relação ao POC da fatia atual) é usada na lista de prognóstico de visualização cruzada da fatia atual.
Sintaxes de reordenamento de referência adicionais podem ser incluídas para permitir tratamento mais flexível das imagens de referência de visualização cruzada.
Voltando para a figura 3, um método exemplar para a construção da lista de referência para o conteúdo de vídeo multivisualização é indicado, no geral, pelo número de referência 300. O método 300 inclui um bloco de início 305 que passa o controle para um bloco de decisão 310. O bloco de decisão 310 determina se um tipo de fatia atual é fatia P ou fatia B ou não. Então, se for o caso, o controle é passado para um bloco de função 315. Caso contrário, o controle é passado para um bloco de decisão 330.
O bloco de função 315 constrói a List0 usando referências temporais, e passa o controle para um bloco de decisão 320. O bloco de decisão 320 determina se o tipo de fatia atual é fatia B ou não. Então, se for o caso, o controle é passado para o bloco de função 325. Caso contrário, o controle é passado para o bloco de decisão 330.
O bloco de função 325 constrói a List1 usando referências temporais e passa o controle para o bloco de decisão 330.
O bloco de decisão 330 determina se o tipo de fa
Petição 870190039595, de 26/04/2019, pág. 25/51
19/34 tia de visualização atual é fatia P ou fatia B ou não. Então, se for o caso, o controle é passado para um bloco de função 335. Caso contrário, o controle é passado para um bloco de limite de laço 350.
O bloco de função 335 constrói a ViewList0 usando referências de visualização cruzada e passa o controle para um bloco de decisão 340. O bloco de decisão 340 determina se o tipo de fatia de visualização atual é fatia B ou não. Então, se for o caso, o controle é passado para um bloco de função 345. Caso contrário, o controle é passado para o bloco de limite de laço 350.
O bloco de função 345 constrói ViewList0 usando referências de visualização cruzada e passa o controle para o bloco de limite de laço 350.
O bloco de limite de laço 350 começa um laço em cada macrobloco incluindo o ajuste de uma faixa para o laço usando uma variável mb = 0 até MacroBlocksinPic-1 e passa o controle para um bloco de função 355. O bloco de função 355 codifica um macrobloco atual usando List0 / List1 e passa o controle para um bloco de decisão 360. O bloco de decisão 360 determina se o tipo de fatia de visualização atual é igual à fatia P ou fatia B ou não. Se for o caso, o controle é passado para um bloco de função 365. Caso contrário, o controle é passado para um bloco de função 370.
O bloco de função 365 codifica o macrobloco atual usando ViewList0 / ViewList1 e passa o controle para o bloco de função 370.
O bloco de função 370 seleciona o melhor modo,
Petição 870190039595, de 26/04/2019, pág. 26/51
20/34 ajusta o mvc_prediction_flag e passa o controle para um bloco de função 375. O bloco de função 375 realiza processamento de armazenamento temporário do vetor de movimento / disparidade e passa o controle para um bloco de limite de laço 380. O bloco de limite de laço termina o laço e passa o controle para um bloco de função 385. O bloco de função 385 salva a imagem codificada em armazenamento temporário de imagens decodificadas (dqb) e passa o controle para um bloco de fim 390.
Já que o prognóstico de visualização cruzada de cada fatia é completamente configurável usando listas do tipo de codificação de visualização cruzada e do prognóstico de visualização, o codec de Codificação de Vídeo Multivisualização (MVC) pode suportar ordem de codificação de visualização e escalabilidade de visualização arbitrárias.
Em uma modalidade, no nível MB, uma nova sintaxe chamada mvc_pred_flag indica se prognóstico temporal ou prognóstico de visualização cruzada é usado para codificar cada bloco de sinal. No caso de mvc_pred_flag = 0, List0 / List1 será utilizada para a compensação de movimento dependendo do slice_type. Quando mvc_pred_flag = 1, então, ViewList0 / ViewList1 serão utilizadas dependendo do view_slice_type.
Voltando para a figura 4, um método exemplar para realizar uma decisão de modo temporal / visualização cruzada é indicado, no geral, pelo número de referência 400. O método 400 inclui um bloco de início 405 que passa o controle para um bloco de decisão 410. O bloco de decisão 410 deter
Petição 870190039595, de 26/04/2019, pág. 27/51
21/34 mina se o tipo de fatia atual é fatia P ou fatia B ou não. Então, se for o caso, o controle é passado para um bloco de função 415. Caso contrário, o controle é passado para um bloco de decisão 430.
O bloco de função 415 constrói List0 usando referências temporais e passa o controle para um bloco de decisão 420. O bloco de decisão 420 determina se o tipo de fatia atual é fatia B ou não. Se for o caso, o controle é passado para um bloco de função 425. Caso contrário, o controle é passado para o bloco de decisão 430.
O bloco de função 425 constrói a List1 usando re-
ferências temporais e passa o controle para o bloco de deci-
são 430.
O bloco de decisão 430 determina se o tipo de fa-
tia de visualização atual é fatia P ou fatia B ou não. En-
tão, se for o caso, o controle é passado para um bloco de
função 435. Caso contrário, o controle é passado para um bloco de limite de laço 450.
O bloco de função 435 constrói ViewList0 usando referências de visualização cruzada e passa o controle para um bloco de decisão 440. O bloco de decisão 440 determina se o tipo de fatia de visualização atual é fatia B ou não. Então, se for o caso, o controle é passado para um bloco de função 445. Caso contrário, o controle é passado para o bloco de limite de laço 450.
O bloco de função 445 constrói a ViewList0 usando referências de visualização cruzada e passa o controle para o bloco de limite de laço 450.
Petição 870190039595, de 26/04/2019, pág. 28/51
22/34
O bloco de limite de laço 450 começa um laço em cada macrobloco incluindo o ajuste de uma faixa do laço usando uma variável mb = 0 até MacroBlocksinPic-1 e passa o controle para um bloco de decisão 455. O bloco de decisão 455 determina se mvc_prediction_flag é igual a 1 ou não. Então, se for o caso, o controle é passado para um bloco de função 460. Caso contrário, o controle é passado para um bloco de função 465.
O bloco de função 460 decodifica um macrobloco usando ViewList0 / ViewList1 e passa o controle para um bloco de função 470.
O bloco de função 465 decodifica o macrobloco usando List0 / List1 e passa o controle para um bloco de função 470.
O bloco de função 470 realiza o processamento do armazenamento temporário do vetor de movimento / disparidade e passa o controle para um bloco de limite de laço 475. O bloco de limite de laço 475 termina o laço e passa o controle para um bloco de função 480. O bloco de função 480 salva a imagem decodificada em armazenamento temporário de imagens decodificadas (dqb) e passa o controle para um bloco de fim 485.
Três novos contextos CABAC são adicionados para codificar a sintaxe mvc_pred_dir. A modelagem de contexto é a mesma da sintaxe transform_size_8x8_flag.
Na extensão multivisualização do padrão MPEG-4 AVC, o armazenamento temporário da imagem decodificada (dpb) precisa ser capaz de tratar as imagens decodificadas a par
Petição 870190039595, de 26/04/2019, pág. 29/51
23/34 tir de múltiplas visualizações. Considerando que há N visualizações de entrada, uma modalidade dos presentes princípios pode envolver N dpb's separados. Cada dpb armazena imagens decodificadas de uma visualização específica.
Uma maneira alternativa de gerenciar dpb é colocar todas as imagens de visualização em um único dpb. Entretanto, a primeira abordagem tem as seguintes vantagens. Uma vantagem da primeira abordagem é que cada visualização tem seu próprio dpb, com o mesmo processo de marcação de referência decodificada que o padrão MPEG-4 AVC. Esta abordagem mais simples reduz as complicações de gerenciar diferentes imagens de visualização no mesmo dpb. Uma outra vantagem da primeira abordagem diz respeito à indesejabilidade de reduzir o número de quadros de referência temporal disponíveis, já que a correlação temporal é, no geral, mais forte do que a correlação de visualização cruzada. Com cada visualização gerenciando suas próprias imagens de referência no seu dpb, o prognóstico temporal terá a mesma capacidade de prognóstico de quadro de referência múltipla que na difusão simultânea.
Um traço característico da MVC, comparando com a codificação de vídeo convencional, é a coexistência tanto de movimento quanto de disparidade. Os blocos que são temporalmente prognosticados precisarão assinalar vetores de movimento (MV) em relação a vetores de disparidade (DV) para prognóstico de visualização cruzada.
Dois métodos exemplares são aqui descritos para lidar tanto com os vetores de movimento quanto com os veto
Petição 870190039595, de 26/04/2019, pág. 30/51
24/34 res de disparidade para a mesma fatia. Entretanto, percebese que dados os preceitos da presente invenção aqui fornecidos, versados na técnica contemplam estes e outros métodos para a mesma, mantendo o escopo da presente invenção.
No primeiro método, para cada bloco, sinalizar e armazenar um vetor de movimento ou um vetor de disparidade, mas não ambos. Se um vetor de movimento ou um vetor de disparidade será assinalado e armazenado depende da sintaxe mvc_pred_flag. Isto exigirá menos armazenamento de memória, mas o campo do vetor combinado não será consistente.
No segundo método, para cada bloco, armazenar tanto um vetor de movimento quanto um vetor de disparidade. Isto pode ser alcançado tanto pela sinalização de ambos os vetores quanto pela sinalização de somente um deles e pelo enchimento do outro usando a interpolação do campo do vetor. Esta abordagem tomará mais armazenamento de memória, mas a consistência de ambos os campos de movimento e de disparidade pode ser mais bem preservada.
Uma modalidade exemplar do primeiro método é mostrada e descrita em relação à figura 5. Uma modalidade exemplar do segundo método é mostrada e descrita em relação à figura 6.
Voltando para a figura 5, um método exemplar para processar vetores de movimento e de disparidade para a mesma fatia correspondente ao conteúdo de vídeo multivisualização é indicado, no geral, pelo número de referência 500. O método 500 inclui um bloco de início 505 que passa o controle para um bloco de decisão 510. O bloco de decisão 510 deter
Petição 870190039595, de 26/04/2019, pág. 31/51
25/34 mina se mvc_pred_flag é igual a 0 ou não. Então, se for o caso, o controle é passado para um bloco de função 515. Caso contrário, o controle é passado para um bloco de função 520. O bloco de função 515 forma o preditor do vetor de disparidade, processa o vetor de disparidade DV, armazena o vetor de disparidade DV em VectorBuffer e passa o controle para um bloco de fim 525.
O bloco de função 520 forma o preditor do vetor de movimento, processa o vetor de movimento MV, armazena o vetor de movimento MV em VectorBuffer e passa o controle para o bloco de fim 525.
Voltando para a figura 6, um outro método para processar vetores de movimento e de disparidade para conteúdo de vídeo multivisualização é indicado, no geral, pelo número de referência 600. O método 600 inclui um bloco de início 605 que passa o controle para um bloco de função 610. O bloco de função 610 forma o preditor do vetor de disparidade, processa o vetor de disparidade DV, armazena o vetor de disparidade DV em VectorBuffer1 e passa o controle para um bloco de função 615. O bloco de função 615 forma o preditor do vetor de movimento, processa o vetor de movimento MV, armazena o vetor de movimento MV em VectorBuffer2 e passa o controle para um bloco de fim 620.
A implicação de ambos os vetores de movimento e de disparidade na codificação da mesma fatia surge nos seguintes aspectos: (1) codificação preditiva dos vetores de movimento / disparidade; e (2) modos Direto e Ignorar.
No padrão MPEG-4 AVC, os componentes do vetor de
Petição 870190039595, de 26/04/2019, pág. 32/51
26/34 movimento são diferencialmente codificados usando prognóstico de mediana ou direcional a partir dos blocos vizinhos. Na Codificação de Vídeo Multivisualização, os blocos vizinhos podem ter uma(s) direção(s) de prognóstico diferente(s) em relação ao bloco atual. A fim de economizar bits na codificação dos vetores de movimento / disparidade, é preferível usar a informação mais correlacionada para formar um preditor. Dependendo se há tanto os vetores de movimento quanto os vetores de disparidade disponíveis para os blocos vizinhos, para o primeiro método, use somente aqueles blocos vizinhos que têm a mesma direção de prognóstico. Para o segundo método, use somente os vetores de movimento dos blocos vizinhos na formação do preditor do vetor de movimento, e use somente os vetores de disparidade dos blocos vizinhos na formação do preditor de disparidade.
Aparte dos blocos espaciais vizinhos, blocos temporalmente co-localizados também podem ser usados para melhorar o prognóstico de disparidade em virtude de os campos de disparidade ser usualmente estacionários na dimensão temporal.
Os modos Direto e Ignorar no padrão MPEG-4 AVC são ferramentas de codificação efetivas que exploram melhor a correlação espaço-temporal que existe entre os macroblocos adjacentes, em virtude de eles poderem representar movimento sem ter que transmitir os vetores de movimento. Na Codificação de Vídeo Multivisualização, aqueles modos devem ser adaptados a fim de considerar a correlação de visualização cruzada adicional.
Petição 870190039595, de 26/04/2019, pág. 33/51
27/34
Para modos P_Skip, o sinal reconstruído é obtido similar ao sinal de prognóstico de um macrobloco tipo P_16x16 que referencia a imagem que está localizada no índice 0 de List0. O vetor de movimento usado para reconstruir o macrobloco P_Skip é similar ao preditor do vetor de movimento para o bloco 16x16. Na MVC, a adaptação supradescrita do preditor do vetor de movimento / disparidade ajudará a tornar o modo P_Skip mais usado.
Para a codificação de B_SLICE, os modos B_Skip / B_Direct_16x16 / B_Direct_8x8 devem ser adaptados para considerar a mistura de movimento e de disparidade. Há dois diferentes modos Direto suportados no padrão MPEG-4 AVC, a saber, Direto temporal e Direto espacial.
Para o modo Direto temporal, os vetores de movimento são derivados da posição co-localizada na primeira referência da List1. Quando a primeira referência de List1 for disparidade prognosticada, o sistema pode tanto procurar vetores de movimento na posição co-localizada em outras referências da List1 (ref_idx > 0) quanto usar o preditor do vetor de movimento espacial.
Para o modo Direto espacial, os vetores de movimento são derivados de uma maneira similar à empregada pelo P_SKIP, mas com ambas List0 / List1 consideradas. A mesma adaptação feita em P_SKIP também pode ser estendida na List1.
As Tabelas 1-4 ilustram várias sintaxes para Codificação de Vídeo Multivisualização incluindo aquelas de acordo com várias modalidades dos presentes princípios. A
Petição 870190039595, de 26/04/2019, pág. 34/51
28/34
Tabela 1 ilustra a sintaxe RBSP ajustada do parâmetro sequência para Codificação de Vídeo Multivisualização. A Tabela 2 ilustra a sintaxe RBSP ajustada do parâmetro imagem para Codificação de Vídeo Multivisualização. A Tabela 3 ilus5 tra a sintaxe do cabeçalho de fatia para Codificação de Vídeo Multivisualização. A Tabela 4 ilustra a sintaxe de camada de macrobloco para Codificação de Vídeo Multivisualização.
TABELA 1
seq parameter set rbsp(){ C Descritor
log2 max view num minus1 0 ue(v)
num views sps 0 u(log2 max view num minus1+1)
view id sps 0 u(log2 max view num minus1+1)
profile_idc 0 u(8)
constraint set0 flag 0 u(1)
constraint set1 flag 0 u(1)
constraint set2 flag 0 u(1)
constraint set3 flag 0 u(1)
reserved_zero_4bits/* equal to 0 */ 0 u(4)
...
TABELA 2
pic_parameter_set_rbsp(){ C Descritor
v i ew_i d_pp s 0 u(log2_max_view_num_minus1+1)
Petição 870190039595, de 26/04/2019, pág. 35/51
29/34
pic_parameter_set_id 1 ue (v)
seq_parameter_set_id 1 ue(v)
entro- py coding mode flag 1 u(1)
plc_order_present_flag 1 u(1)
num slice groups minus1 1 ue(v)
Reserved_zero_4bits/* equal to 0 */ 0 u(4)
. . .
TABELA 3
slice header(){ C Descritor
first mb in slice 2 ue (v)
view_id 2 u(log2_max_view_num_minus 1 + 1)
view slice type 2 ue (v)
se(view_slice_type == VL SLICE){
num_re f_idx_ll_act ive_minu s1 2 ue(v)
para(i=0; i<=num_re f_idx_ll_act ive_m inus1; i++){
left ref view id[i] 2 ue (v)
Petição 870190039595, de 26/04/2019, pág. 36/51
30/34
} 0 u(4)
}
se(view_slice_type == VR SLICE){
num_re f_idx_lr_act ive_minu s1 2 ue(v)
para(i = 0; i<= num_re f_idx_lr_act ive_minu s1; i++){
right ref view id[i] 2 ue (v)
}
}
se(view_slice_type == VB SLICE){
num_ref_idx_ll_active_minu s1 2 ue(v)
para(i=0; i<= num_re f_idx_ll_act ive_minu s1; i++){
left ref view id[i] 2 ue (v)
}
num_re f_idx_i r_act ive_minu s1 2 ue(v)
para(i=0; i<= num re f idx lr act ive minu
Petição 870190039595, de 26/04/2019, pág. 37/51
31/34
s1; i++){
right ref view id[i] 2 ue (v)
}
}
...
slice type 2 ue (v)
pic parameter set id 2 ue (v)
frame num 2 U(v)
...
TABELA 4
macroblock layer(){ C Descritor
mvc pred flag 2 u(i)lac(v)
mb type 2 ue(v)lac(v)
se(mb type == I PCM){
enquanto(!byte aligned())
pcm alignment zero bit 2 f(1)
para(i=0; i<256; i++)
pcm sample luma[i] 2 U(v)
...
Agora, será dada uma descrição de algumas das muitas vantagens / recursos presentes da presente invenção, algumas das quais fora mencionadas anteriormente. Por exemplo, 5 uma vantagem / recurso é um codificador de vídeo que inclui um codificador para codificar um bloco em uma imagem usando pelo menos uma das duas listas de imagem de referência de visualização cruzada. A imagem é uma de um conjunto de imagens correspondente ao conteúdo de vídeo multivisualização e
Petição 870190039595, de 26/04/2019, pág. 38/51
32/34 com diferentes pontos de visualização em relação a uma mesma cena ou a uma cena similar. A imagem representa um ponto de visualização atual dos diferentes pontos de visualização. As listas de imagem de referência de visualização cruzada correspondem às imagens de referência com uns dos diferentes pontos de visualização diferentes do ponto de visualização atual.
Uma outra vantagem / recurso é o codificador de vídeo supradescrito em que as duas listas de imagem de referência de visualização cruzada são diferentes da List0 e List1 do padrão de Codificação Avançada de Vídeo do Grupo de Especialistas de Imagens em Movimento-4 Parte 10 da Organização Internacional para Padronização / Comissão Eletrotécnica Internacional / ou da recomendação H.264 do Setor de Telecomunicações da União Internacional de Telecomunicações.
Uma ainda outra vantagem / recurso é um codificador de vídeo que inclui pelo menos um armazenamento temporário para armazenar imagens decodificadas correspondentes ao conteúdo multivisualização para diferentes pontos de visualização de uma mesma cena ou de uma cena similar.
Além do mais, uma outra vantagem / recurso é o codificador de vídeo supradescrito, em que o pelo menos um armazenamento temporário inclui um armazenamento temporário separado para cada um dos diferentes pontos de visualização.
Estes e outros recursos e vantagens da presente invenção podem ser prontamente apurados pelos versados na técnica com base nos preceitos aqui descritos. Entende-se que os preceitos da presente invenção podem ser implementaPetição 870190039595, de 26/04/2019, pág. 39/51
33/34 dos em várias formas de hardware, software, software embarcado, processadores de uso pessoal ou combinações destes.
Mais preferivelmente, os preceitos da presente invenção são implementados como uma combinação de hardware e software. Além do mais, o software pode ser implementado como um programa de aplicação tangivelmente incorporado em uma unidade de armazenamento de programa. O programa de aplicação pode ser carregado em uma máquina que compreende qualquer arquitetura e executado por ela. Preferivelmente, a máquina é implementada em uma plataforma de computador com hardware tal como uma ou mais unidades centrais de processamento (“CPU), uma memória de acesso aleatório (“RAM) e interfaces de entrada / saída (“I/O). A plataforma de computador também pode incluir um sistema operacional e código de microinstrução. Os vários processos e funções aqui descritos podem ser tanto parte do código de microinstrução quanto parte do programa de aplicação, ou qualquer combinação destes, que podem ser executados por uma CPU. Além do mais, várias outras unidades periféricas podem ser conectadas na plataforma do computador, tais como uma unidade de armazenamento de dados adicional e uma unidade de impressão.
Entende-se adicionalmente que, em virtude de alguns dos componentes e métodos do sistema constituinte representados nos desenhos anexos ser preferivelmente implementados em software, as conexões reais entre os componentes do sistema ou os blocos de função do processo podem diferir dependendo da maneira na qual a presente invenção é programada. Dados os preceitos aqui descritos, versados na técnica
Petição 870190039595, de 26/04/2019, pág. 40/51
34/34 podem contemplar estas e similares implementações e configurações da presente invenção.
Embora as modalidades ilustrativas tenham sido aqui descritas em relação aos desenhos anexos, entende-se 5 que a presente invenção não é limitada a estas precisas modalidades, e que várias mudanças e modificações podem ser efetuadas pelos versados na técnica sem fugir do escopo ou do espírito da presente invenção. Pretende-se que todas tais mudanças e modificações sejam incluídas no escopo da presen10 te invenção apresentado nas reivindicações anexas.

Claims (4)

  1. REIVINDICAÇÕES
    1. Método para decodificação de vídeo, CARACTERIZADO pelo fato de que compreende:
    decodificar (435, 445) um bloco em uma imagem usando duas listas de imagem de referência de visualização cruzada, a imagem sendo uma de um conjunto de imagens correspondente ao conteúdo de vídeo multivisualização e com diferentes pontos de visualização em relação a uma mesma cena ou a uma cena similar, a imagem representando um ponto de visualização atual dos diferentes pontos de visualização, em que as duas listas de imagens de referência de visualização cruzada correspondem a imagens de referência com pontos de visualização diferentes do ponto de visualização atual, em que um número de imagens de referência de visualização cruzada e identificadores de visualização correspondentes a imagens de referência de visualização cruzada são sinalizados em um cabeçalho de fatia no fluxo de bits para cada uma das duas listas de imagens de referência de visualização cruzada, e em que os identificadores de visualização são distintos em cada uma das duas listas de imagens de referência, e em que a referida decodificação inclui pelo menos um buffer para armazenar imagens decodificadas correspondentes a conteúdo de multivisualização para diferentes pontos de visualização de uma mesma cena ou similar, e em que pelo menos um buffer inclui um buffer separado para cada um dos diferentes pontos de visualização, e as imagens de referência nas listas de imagens de referência de visualização cruzada são ordenadas na mesma sequência que aparecem no
    Petição 870190039595, de 26/04/2019, pág. 42/51
  2. 2/3 cabeçalho de fatia, e em que a sintaxe no cabeçalho de fatia é usada para indicar um tipo de codificação para uma previsão de visualização cruzada.
    2. Método, de acordo com a reivindicação 1, CARACTERIZADO pelo fato de que as duas listas de imagem de referência de visualização cruzada são diferentes da List0 e List1 do padrão de Codificação Avançada de Vídeo do Grupo de Especialistas de Imagens em Movimento-4 Parte 10 da Organização Internacional para Padronização / Comissão Eletrotécnica Internacional / ou da recomendação H.264 do Setor de Telecomunicações da União Internacional de Telecomunicações (435, 445).
  3. 3. Decodificador de vídeo, CARACTERIZADO pelo fato de que compreende:
    um processador configurado para decodificar um bloco em uma imagem utilizando duas listas de imagens de referência de visualização cruzada, a imagem sendo uma de um conjunto de imagens correspondentes a um conteúdo de vídeo de multivisualização e com diferentes pontos de visualização em relação a uma mesma cena ou similar, a imagem representando um ponto de visualização atual dos diferentes pontos de visualização, em que as duas listas de imagens de referência de visualização cruzada correspondem a imagens de referência com pontos de visualização diferentes do ponto de visualização atual, em que um número de imagens de referência de visualização cruzada e identificadores de visualização correspondentes a imagens de referência de visualização cruzada
    Petição 870190039595, de 26/04/2019, pág. 43/51
    3/3 são sinalizados em um cabeçalho de fatia no fluxo de bits para cada uma das duas listas de imagens de referência de visualização cruzada, e em que os identificadores de visualização são distintos em cada uma das duas listas de imagens de referência, e em que a dita decodificação inclui pelo menos um buffer para armazenar imagens decodificadas correspondentes ao conteúdo de multivisualização para diferentes pontos de visualização de uma mesma cena ou similar, e em que o pelo menos um buffer inclui um buffer separado para cada um dos diferentes pontos de visualização, e as imagens de referência nas listas de imagens de referência de visualização cruzada são ordenadas na mesma sequência que aparecem no cabeçalho de fatia, e em que a sintaxe no cabeçalho de fatia é usada para indicar um tipo de codificação para uma previsão da visualização cruzada.
  4. 4. Decodificador de vídeo, de acordo com a reivindicação 3, CARACTERIZADO pelo fato de que as duas listas de imagem de referência de visualização cruzada são diferentes da List0 e List1 do padrão de Codificação Avançada de Vídeo do Grupo de Especialistas de Imagens em Movimento-4 Parte 10 da Organização Internacional para Padronização / Comissão Eletrotécnica Internacional / ou da recomendação H.264 do Setor de Telecomunicações da União Internacional de Telecomunicações.
BRPI0706438-1A 2006-01-09 2007-01-08 Método para decodificação de vídeo e decodificador de vídeo BRPI0706438B1 (pt)

Priority Applications (1)

Application Number Priority Date Filing Date Title
BR122016024819-4A BR122016024819B1 (pt) 2006-01-09 2007-01-08 Codificador e decodificador de vídeo, método de codificação e decodificação de vídeo e meio de armazenamento

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US75728906P 2006-01-09 2006-01-09
US60/757,289 2006-01-09
PCT/US2007/000482 WO2007081926A2 (en) 2006-01-09 2007-01-08 Methods and apparatuses for multi-view video coding

Publications (2)

Publication Number Publication Date
BRPI0706438A2 BRPI0706438A2 (pt) 2011-03-29
BRPI0706438B1 true BRPI0706438B1 (pt) 2020-01-07

Family

ID=38193755

Family Applications (3)

Application Number Title Priority Date Filing Date
BRPI0706438-1A BRPI0706438B1 (pt) 2006-01-09 2007-01-08 Método para decodificação de vídeo e decodificador de vídeo
BR122016024819-4A BR122016024819B1 (pt) 2006-01-09 2007-01-08 Codificador e decodificador de vídeo, método de codificação e decodificação de vídeo e meio de armazenamento
BRPI0706434-9A BRPI0706434B1 (pt) 2006-01-09 2007-01-08 codificador de vídeo, decodificador de vídeo, método para codificar vídeo, método para decodificar vídeo, estrutura de sinal de vídeo para codificação de vídeo, e mídia de armazenamento com dados de sinal de vídeo codificados

Family Applications After (2)

Application Number Title Priority Date Filing Date
BR122016024819-4A BR122016024819B1 (pt) 2006-01-09 2007-01-08 Codificador e decodificador de vídeo, método de codificação e decodificação de vídeo e meio de armazenamento
BRPI0706434-9A BRPI0706434B1 (pt) 2006-01-09 2007-01-08 codificador de vídeo, decodificador de vídeo, método para codificar vídeo, método para decodificar vídeo, estrutura de sinal de vídeo para codificação de vídeo, e mídia de armazenamento com dados de sinal de vídeo codificados

Country Status (10)

Country Link
US (6) US10194171B2 (pt)
EP (8) EP1972145A2 (pt)
JP (14) JP5229810B2 (pt)
KR (2) KR101350597B1 (pt)
CN (9) CN103108184B (pt)
AU (2) AU2007205179B2 (pt)
BR (3) BRPI0706438B1 (pt)
RU (2) RU2494569C2 (pt)
WO (2) WO2007081926A2 (pt)
ZA (3) ZA200805337B (pt)

Families Citing this family (123)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7903737B2 (en) * 2005-11-30 2011-03-08 Mitsubishi Electric Research Laboratories, Inc. Method and system for randomly accessing multiview videos with known prediction dependency
ZA200805337B (en) 2006-01-09 2009-11-25 Thomson Licensing Method and apparatus for providing reduced resolution update mode for multiview video coding
WO2007081176A1 (en) * 2006-01-12 2007-07-19 Lg Electronics Inc. Processing multiview video
US20070177671A1 (en) * 2006-01-12 2007-08-02 Lg Electronics Inc. Processing multiview video
KR101276847B1 (ko) 2006-01-12 2013-06-18 엘지전자 주식회사 다시점 비디오의 처리
US8565319B2 (en) * 2006-03-30 2013-10-22 Lg Electronics Inc. Method and apparatus for decoding/encoding a video signal
US20100091845A1 (en) * 2006-03-30 2010-04-15 Byeong Moon Jeon Method and apparatus for decoding/encoding a video signal
EP2030450B1 (en) * 2006-06-19 2015-01-07 LG Electronics Inc. Method and apparatus for processing a video signal
ZA200900857B (en) * 2006-07-06 2010-05-26 Thomson Licensing Method and apparatus for decoupling frame number and/or picture order count (POC) for multi-view video encoding and decoding
JP2009543461A (ja) 2006-07-06 2009-12-03 トムソン ライセンシング マルチビュービデオ符号化及び復号化のためにフレームナンバー及び/又はピクチャオーダカウント(poc)を分離する方法及び装置
WO2008007913A1 (en) 2006-07-12 2008-01-17 Lg Electronics, Inc. A method and apparatus for processing a signal
WO2008020734A1 (en) 2006-08-18 2008-02-21 Gwangju Institute Of Science And Technology A method and apparatus for encoding or decoding frames of different views in multiview video using global disparity
TW200820791A (en) * 2006-08-25 2008-05-01 Lg Electronics Inc A method and apparatus for decoding/encoding a video signal
EP2080382B1 (en) * 2006-10-20 2016-07-20 Nokia Technologies Oy System and method for implementing low-complexity multi-view video coding
CA2672924C (en) * 2006-12-28 2014-07-22 Nippon Telegraph And Telephone Corporation Video encoding method and decoding method, apparatuses therefor, programs therefor, and storage media which store the programs
US8494046B2 (en) * 2007-03-23 2013-07-23 Lg Electronics Inc. Method and an apparatus for decoding/encoding a video signal by performing illumination compensation
MX2009010973A (es) 2007-04-12 2009-10-30 Thomson Licensing Texturizado en codificacion y descodificacion de video.
WO2008130528A2 (en) 2007-04-17 2008-10-30 Thomson Licensing Hypothetical reference decoder for multiview video coding
US8953684B2 (en) * 2007-05-16 2015-02-10 Microsoft Corporation Multiview coding with geometry-based disparity prediction
TW200910975A (en) * 2007-06-25 2009-03-01 Nippon Telegraph & Telephone Video encoding method and decoding method, apparatuses therefor, programs therefor, and storage media for storing the programs
US8804839B2 (en) * 2007-06-27 2014-08-12 Korea Electronics Technology Institute Method for image prediction of multi-view video codec and computer-readable recording medium thereof
EP3190791B1 (en) * 2007-06-29 2018-11-28 Velos Media International Limited Image encoding device and image decoding device
US10298952B2 (en) 2007-08-06 2019-05-21 Interdigital Madison Patent Holdings Methods and apparatus for motion skip move with multiple inter-view reference pictures
CN103428504B (zh) * 2007-08-15 2017-04-12 汤姆森许可贸易公司 在多视图编码的视频中进行错误隐藏的方法和装置
CN101562745B (zh) * 2008-04-18 2012-07-04 华为技术有限公司 一种多视点视频图像编码和解码的方法及装置
RU2518435C2 (ru) * 2008-07-20 2014-06-10 Долби Лэборетериз Лайсенсинг Корпорейшн Оптимизация кодера в системах доставки стереоскопического видео
CN104768031B (zh) 2009-01-26 2018-02-09 汤姆森特许公司 用于视频解码的装置
BRPI1008226A2 (pt) * 2009-02-12 2019-09-24 Nippon Telegraph & Telephone método de codificação de imagem como múltiplas vistas, método de decodificação de imagem com múltiplas vistas, dispositivo de codificação de imagem com múltiplas vistas,dispositivo de codificação de imagem com múltiplas vistas,programa de codificação de imagem como múltiplas vistas, programa de codificação de imagem como múltiplas vistas.
JP6159507B2 (ja) 2009-02-19 2017-07-05 トムソン ライセンシングThomson Licensing 3d映像フォーマット
JP4993224B2 (ja) * 2009-04-08 2012-08-08 ソニー株式会社 再生装置および再生方法
WO2010123203A2 (ko) * 2009-04-22 2010-10-28 엘지전자 주식회사 다시점 영상의 참조 픽쳐 리스트 변경 방법
CN102484700A (zh) 2009-05-01 2012-05-30 汤姆森特许公司 3d视频编码格式
TWI384887B (zh) * 2009-06-11 2013-02-01 Univ Nat Central 多視點影像編解碼方法
KR20110007928A (ko) * 2009-07-17 2011-01-25 삼성전자주식회사 다시점 영상 부호화 및 복호화 방법과 장치
US20110045408A1 (en) * 2009-08-20 2011-02-24 Shota Suzuki Color-forming photosensitive composition, lithographic printing plate precursor and novel cyanine dye
US8624959B1 (en) * 2009-09-11 2014-01-07 The Boeing Company Stereo video movies
JP5722349B2 (ja) 2010-01-29 2015-05-20 トムソン ライセンシングThomson Licensing ブロックに基づくインターリーブ
KR101628383B1 (ko) * 2010-02-26 2016-06-21 연세대학교 산학협력단 영상 처리 장치 및 방법
KR20110101099A (ko) * 2010-03-05 2011-09-15 한국전자통신연구원 복수 전송 계층 연동형 3dtv 방송 서비스 제공을 위한 송신 및 수신 방법, 송신 및 수신 장치
WO2011146451A1 (en) * 2010-05-20 2011-11-24 Thomson Licensing Methods and apparatus for adaptive motion vector candidate ordering for video encoding and decoding
JP2012034352A (ja) * 2010-06-30 2012-02-16 Panasonic Corp ステレオ動画像符号化装置及びステレオ動画像符号化方法
WO2012036902A1 (en) 2010-09-14 2012-03-22 Thomson Licensing Compression methods and apparatus for occlusion data
JP5531881B2 (ja) * 2010-09-22 2014-06-25 富士通株式会社 動画像復号装置、動画像復号方法、及び集積回路
HU1000640D0 (en) * 2010-11-29 2011-02-28 Holografika Hologrameloeallito Fejlesztoe Es Forgalmazo Kft Image coding and decoding method and apparatus for efficient encoding and decoding of 3d field content
KR101893559B1 (ko) 2010-12-14 2018-08-31 삼성전자주식회사 다시점 비디오 부호화/복호화 장치 및 방법
KR20120080122A (ko) * 2011-01-06 2012-07-16 삼성전자주식회사 경쟁 기반의 다시점 비디오 부호화/복호화 장치 및 방법
JP6004271B2 (ja) * 2011-01-12 2016-10-05 サン パテント トラスト 画像符号化方法、画像復号方法、画像符号化装置および画像復号装置
WO2012096176A1 (en) 2011-01-12 2012-07-19 Panasonic Corporation Methods and apparatuses for encoding and decoding video using multiple reference pictures
US20120189060A1 (en) * 2011-01-20 2012-07-26 Industry-Academic Cooperation Foundation, Yonsei University Apparatus and method for encoding and decoding motion information and disparity information
US10841573B2 (en) * 2011-02-08 2020-11-17 Sun Patent Trust Methods and apparatuses for encoding and decoding video using multiple reference pictures
KR20120095610A (ko) * 2011-02-21 2012-08-29 삼성전자주식회사 다시점 비디오의 부호화 방법 및 장치, 그 복호화 방법 및 장치
JP5747559B2 (ja) * 2011-03-01 2015-07-15 富士通株式会社 動画像復号方法、動画像符号化方法、動画像復号装置、及び動画像復号プログラム
WO2012124121A1 (ja) * 2011-03-17 2012-09-20 富士通株式会社 動画像復号方法、動画像符号化方法、動画像復号装置及び動画像復号プログラム
US9445092B2 (en) * 2011-03-18 2016-09-13 Sony Corporation Image processing apparatus, image processing method, and program
WO2012128068A1 (ja) * 2011-03-18 2012-09-27 ソニー株式会社 画像処理装置、画像処理方法、及び、プログラム
KR20120118780A (ko) 2011-04-19 2012-10-29 삼성전자주식회사 다시점 비디오의 움직임 벡터 부호화 방법 및 장치, 그 복호화 방법 및 장치
US9485517B2 (en) 2011-04-20 2016-11-01 Qualcomm Incorporated Motion vector prediction with motion vectors from multiple views in multi-view video coding
JP5341952B2 (ja) * 2011-05-30 2013-11-13 株式会社東芝 ビデオサーバ及びデータ収録再生方法
WO2013001748A1 (ja) * 2011-06-29 2013-01-03 パナソニック株式会社 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置および画像符号化復号装置
WO2013001749A1 (ja) 2011-06-29 2013-01-03 パナソニック株式会社 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置および画像符号化復号装置
JP2013034171A (ja) * 2011-06-30 2013-02-14 Sony Corp 画像処理装置および方法
SG10201609891QA (en) 2011-06-30 2016-12-29 Sony Corp Image processing device and image processing method
JP2014527782A (ja) * 2011-08-30 2014-10-16 インテル コーポレイション 多視点ビデオコード化方式
RU2583040C2 (ru) * 2011-08-30 2016-05-10 Нокиа Текнолоджиз Ой Устройство, способ и компьютерная программа для кодирования и декодирования видеосигналов
AU2012303085A1 (en) * 2011-08-31 2014-01-30 Sony Corporation Encoding device, encoding method, decoding device, and decoding method
JP6039178B2 (ja) * 2011-09-15 2016-12-07 シャープ株式会社 画像符号化装置、画像復号装置、並びにそれらの方法及びプログラム
WO2013042884A1 (ko) * 2011-09-19 2013-03-28 엘지전자 주식회사 영상 부호화/복호화 방법 및 그 장치
CN104247432B (zh) 2011-11-11 2019-06-11 Ge视频压缩有限责任公司 使用深度图估计和更新的高效多视点编码
WO2013068548A2 (en) 2011-11-11 2013-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Efficient multi-view coding using depth-map estimate for a dependent view
EP3739886A1 (en) 2011-11-18 2020-11-18 GE Video Compression, LLC Multi-view coding with efficient residual handling
US9432665B2 (en) * 2011-12-02 2016-08-30 Qualcomm Incorporated Coding least significant bits of picture order count values identifying long-term reference pictures
US20130163880A1 (en) * 2011-12-23 2013-06-27 Chao-Chung Cheng Disparity search methods and apparatuses for multi-view videos
US20130176390A1 (en) * 2012-01-06 2013-07-11 Qualcomm Incorporated Multi-hypothesis disparity vector construction in 3d video coding with depth
WO2013108613A1 (ja) * 2012-01-17 2013-07-25 パナソニック株式会社 動画像符号化方法、動画像復号化方法、動画像符号化装置、動画像復号化装置および動画像符号化復号化装置
WO2013107028A1 (en) * 2012-01-19 2013-07-25 Mediatek Singapore Pte. Ltd. Methods and apparatuses of amvp simplification
US9591328B2 (en) 2012-01-20 2017-03-07 Sun Patent Trust Methods and apparatuses for encoding and decoding video using temporal motion vector prediction
WO2013115942A1 (en) * 2012-02-01 2013-08-08 Vidyo, Inc. Techniques for multiview video coding
KR101996682B1 (ko) 2012-02-03 2019-07-04 선 페이턴트 트러스트 화상 부호화 방법, 화상 복호 방법, 화상 부호화 장치, 화상 복호 장치 및 화상 부호화 복호 장치
CN103650497B (zh) * 2012-03-02 2018-01-05 太阳专利托管公司 图像编码方法、图像解码方法、图像编码装置、图像解码装置及图像编码解码装置
CA2866121C (en) 2012-03-06 2018-04-24 Panasonic Intellectual Property Corporation Of America Moving picture coding method, moving picture decoding method, moving picture coding apparatus, moving picture decoding apparatus, and moving picture coding and decoding apparatus
US9503720B2 (en) 2012-03-16 2016-11-22 Qualcomm Incorporated Motion vector coding and bi-prediction in HEVC and its extensions
US10200709B2 (en) 2012-03-16 2019-02-05 Qualcomm Incorporated High-level syntax extensions for high efficiency video coding
JP2013211776A (ja) * 2012-03-30 2013-10-10 Sharp Corp 画像符号化装置、画像復号装置、画像符号化方法、画像復号方法およびプログラム
JP6681609B2 (ja) * 2012-04-09 2020-04-15 サン パテント トラスト 画像符号化方法および画像復号化方法
EP2847996B1 (en) 2012-05-09 2020-10-07 Sun Patent Trust Method of performing motion vector prediction, encoding and decoding methods, and apparatuses thereof
US20130329007A1 (en) * 2012-06-06 2013-12-12 Qualcomm Incorporated Redundancy removal for advanced motion vector prediction (amvp) in three-dimensional (3d) video coding
KR102136903B1 (ko) * 2012-07-18 2020-07-22 소니 주식회사 화상 처리 장치 및 방법
ITTO20120647A1 (it) * 2012-07-24 2014-01-25 St Microelectronics Srl Procedimenti e sistemi per il trattamento di immagini stereoscopiche, prodotti informatici e supporto relativi
EP2878125A4 (en) * 2012-07-27 2016-10-12 Hfi Innovation Inc CONSTRAINED DISPARITY VECTOR DERIVATION METHOD IN 3D VIDEO CODING
US9357195B2 (en) * 2012-08-16 2016-05-31 Qualcomm Incorporated Inter-view predicted motion vector for 3D video
US20140071235A1 (en) * 2012-09-13 2014-03-13 Qualcomm Incorporated Inter-view motion prediction for 3d video
US9319657B2 (en) * 2012-09-19 2016-04-19 Qualcomm Incorporated Selection of pictures for disparity vector derivation
US20140086328A1 (en) * 2012-09-25 2014-03-27 Qualcomm Incorporated Scalable video coding in hevc
US9584825B2 (en) * 2012-09-27 2017-02-28 Qualcomm Incorporated Long-term reference picture signaling in video coding
WO2014050675A1 (ja) * 2012-09-28 2014-04-03 ソニー株式会社 画像処理装置および方法
JP6301932B2 (ja) 2012-10-01 2018-03-28 ジーイー ビデオ コンプレッション エルエルシー エンハンスメント層の中の変換係数ブロックの副ブロックに基づいた符号化を使用するスケーラブルビデオ符号化
CN104704835B (zh) * 2012-10-03 2017-11-24 联发科技股份有限公司 视频编码中运动信息管理的装置与方法
EP2934011A4 (en) * 2012-12-11 2016-05-11 Sony Corp ENCLOSURE DEVICE AND ENCLOSURE METHOD AND DECOMPOSITION DEVICE AND DECOMPOSITION METHOD
TWI669950B (zh) * 2012-12-21 2019-08-21 日商新力股份有限公司 影像處理裝置及方法
KR20160147069A (ko) * 2013-01-07 2016-12-21 미디어텍 인크. 3차원 비디오 코딩에서의 직접 모드 및 스킵 모드에 대한 공간 모션 벡터 예측 유도 방법 및 장치
US9762905B2 (en) * 2013-03-22 2017-09-12 Qualcomm Incorporated Disparity vector refinement in video coding
CN105122803B (zh) * 2013-04-02 2019-01-08 Vid拓展公司 针对可伸缩视频编码的增强型时间运动向量预测
WO2014166068A1 (en) * 2013-04-09 2014-10-16 Mediatek Inc. Refinement of view synthesis prediction for 3-d video coding
WO2014166360A1 (en) * 2013-04-10 2014-10-16 Mediatek Inc. Method and apparatus for bi-prediction of illumination compensation
WO2015005750A1 (ko) 2013-07-12 2015-01-15 삼성전자 주식회사 변이 벡터 유도를 사용하는 비디오 부호화 방법 및 그 장치, 비디오 복호화 방법 및 그 장치
JP2016528808A (ja) * 2013-07-18 2016-09-15 エルジー エレクトロニクス インコーポレイティド ビデオ信号処理方法およびビデオ信号処理装置
CN105556972B (zh) 2013-07-18 2019-04-05 三星电子株式会社 用于层间视频解码和编码设备和方法的对深度图像的场景内预测方法
WO2015056955A1 (ko) 2013-10-14 2015-04-23 삼성전자 주식회사 다시점 비디오 부호화 방법 및 장치, 다시점 비디오 복호화 방법 및 장치
US10075690B2 (en) * 2013-10-17 2018-09-11 Mediatek Inc. Method of motion information prediction and inheritance in multi-view and three-dimensional video coding
RU2550544C1 (ru) * 2013-12-16 2015-05-10 Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования "Тульский государственный университет" (ТулГУ) Способ компенсации движения в цифровых динамических стереовидеоизображениях
WO2015194915A1 (ko) 2014-06-20 2015-12-23 삼성전자 주식회사 인터 레이어 비디오 부복호화를 위한 깊이 영상의 예측 모드 전송 방법 및 장치
US10321145B2 (en) 2014-10-07 2019-06-11 Samsung Electronics Co., Ltd. Method and device for encoding or decoding image by means of view merging prediction
US10554966B2 (en) 2014-10-07 2020-02-04 Samsung Electronics Co., Ltd. Multi-view image encoding/decoding method and apparatus
JP6937302B2 (ja) * 2015-11-23 2021-09-29 エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュートElectronics And Telecommunications Research Institute 多視点ビデオの符号化/復号化方法
US20180091812A1 (en) * 2016-09-23 2018-03-29 Apple Inc. Video compression system providing selection of deblocking filters parameters based on bit-depth of video data
KR102004247B1 (ko) * 2016-11-25 2019-07-29 경희대학교 산학협력단 영상 병렬 처리 방법 및 장치
US11113636B2 (en) 2016-12-30 2021-09-07 Stubhub, Inc. Automated generation of a package data object
CN106791835B (zh) * 2017-03-01 2019-12-10 北京大学 一种参考图像管理方法
CN107071385B (zh) * 2017-04-18 2019-01-25 杭州派尼澳电子科技有限公司 一种基于h265引入视差补偿的立体视频编码方法
KR102503743B1 (ko) 2018-04-11 2023-02-28 삼성전자주식회사 이미지 처리 장치 및 방법
US11665365B2 (en) * 2018-09-14 2023-05-30 Google Llc Motion prediction coding with coframe motion vectors
US11991376B2 (en) * 2020-04-09 2024-05-21 Intel Corporation Switchable scalable and multiple description immersive video codec
CN111556331A (zh) * 2020-05-08 2020-08-18 湖南快乐阳光互动娱乐传媒有限公司 一种智能化多机位直播装置

Family Cites Families (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2643531B1 (fr) 1989-02-21 1996-04-26 Thomson Csf Procede et dispositif de compression de l'information destine au decodage compatible d'une famille de signaux de television de resolutions croissantes
JPH05229842A (ja) 1992-01-27 1993-09-07 Fujikura Ltd 耐放射イメージファイバ
US6052414A (en) * 1994-03-30 2000-04-18 Samsung Electronics, Co. Ltd. Moving picture coding method and apparatus for low bit rate systems using dynamic motion estimation
US5617334A (en) * 1995-07-21 1997-04-01 The Trustees Of Columbia University In The City Of New York Multi-viewpoint digital video coder/decoder and method
TW335480B (en) 1995-09-29 1998-07-01 Matsushita Electric Ind Co Ltd Method and apparatus for encoding a bistream for multi-angle connection
JP3263807B2 (ja) 1996-09-09 2002-03-11 ソニー株式会社 画像符号化装置および画像符号化方法
JPH10191393A (ja) 1996-12-24 1998-07-21 Sharp Corp 多視点画像符号化装置
JPH10191394A (ja) * 1996-12-24 1998-07-21 Sharp Corp 多視点画像符号化装置
KR20010029494A (ko) 1997-07-11 2001-04-06 요트.게.아. 롤페즈 시청각 데이터 디코딩 방법
US6055264A (en) * 1997-08-01 2000-04-25 Nokia Mobile Phones Limited Method and apparatus for fast acquisition and multipath search in a spread spectrum system
JP3931392B2 (ja) 1997-08-25 2007-06-13 ソニー株式会社 立体画像用ビデオ信号生成装置、立体画像用ビデオ信号送出装置および立体画像用ビデオ信号受信装置
KR100531566B1 (ko) 1997-10-23 2005-11-29 미쓰비시덴키 가부시키가이샤 화상 복호화 장치
CN1156164C (zh) * 1997-11-27 2004-06-30 英国电讯有限公司 代码转换器及其方法
US6055274A (en) * 1997-12-30 2000-04-25 Intel Corporation Method and apparatus for compressing multi-view video
JP3519594B2 (ja) 1998-03-03 2004-04-19 Kddi株式会社 ステレオ動画像用符号化装置
JP2000132683A (ja) 1998-10-23 2000-05-12 Toshiba Corp 多視点画像符号化方法
US6693964B1 (en) * 2000-03-24 2004-02-17 Microsoft Corporation Methods and arrangements for compressing image based rendering data using multiple reference frame prediction techniques that support just-in-time rendering of an image
CN1205818C (zh) * 2000-04-11 2005-06-08 皇家菲利浦电子有限公司 视频编码和解码方法
JP4608136B2 (ja) 2001-06-22 2011-01-05 オリンパス株式会社 動きベクトル及び視差ベクトル検出装置
KR20030001758A (ko) * 2001-06-27 2003-01-08 한국전자통신연구원 움직임 및 시차 보상을 갖는 입체영상의 부호화/복호화장치 및 그 방법
US6566133B1 (en) * 2001-08-01 2003-05-20 Isis Pharmaceuticals, Inc. Antisense inhibition of dual specific phosphatase 9 expression
JP2004007379A (ja) * 2002-04-10 2004-01-08 Toshiba Corp 動画像符号化方法及び動画像復号化方法
KR100508798B1 (ko) 2002-04-09 2005-08-19 엘지전자 주식회사 쌍방향 예측 블록 예측 방법
KR100481732B1 (ko) 2002-04-20 2005-04-11 전자부품연구원 다 시점 동영상 부호화 장치
JP2004023458A (ja) 2002-06-17 2004-01-22 Toshiba Corp 動画像符号化/復号化方法及び装置
KR100523052B1 (ko) * 2002-08-30 2005-10-24 한국전자통신연구원 다중 디스플레이 방식을 지원하는 다시점 동영상의 객체 기반 부호화 장치 및 그 방법과 그를 이용한 객체 기반 송수신 시스템 및 그 방법
KR100751422B1 (ko) 2002-12-27 2007-08-23 한국전자통신연구원 스테레오스코픽 비디오 부호화 및 복호화 방법, 부호화 및복호화 장치
JP4259884B2 (ja) 2003-01-20 2009-04-30 シャープ株式会社 画像データ作成装置およびそのデータを再生する画像データ再生装置
CN1258925C (zh) 2003-06-27 2006-06-07 中国科学院计算技术研究所 多视角视频编解码预测补偿方法及装置
FR2857132A1 (fr) * 2003-07-03 2005-01-07 Thomson Licensing Sa Dispositif, systeme et procede de codage d'images numeriques
US7778328B2 (en) 2003-08-07 2010-08-17 Sony Corporation Semantics-based motion estimation for multi-view video coding
BRPI0413979A (pt) 2003-08-26 2006-11-07 Thomson Licensing método e aparelho para minimizar o número de imagens de referência usadas para inter-codificação
JP4355914B2 (ja) 2003-10-01 2009-11-04 日本電気株式会社 多視点画像伝送システムと方法、多視点画像圧縮装置と方法、多視点画像伸長装置と方法およびプログラム
FI115589B (fi) * 2003-10-14 2005-05-31 Nokia Corp Redundanttien kuvien koodaaminen ja dekoodaaminen
CN1545333A (zh) * 2003-11-21 2004-11-10 �Ϻ���ͨ��ѧ 立体视频图像信号压缩的方法
JP4702059B2 (ja) * 2003-12-22 2011-06-15 日本電気株式会社 動画像を符号化する方法及び装置
JP3879741B2 (ja) 2004-02-25 2007-02-14 ソニー株式会社 画像情報符号化装置および画像情報符号化方法
JP4421940B2 (ja) * 2004-05-13 2010-02-24 株式会社エヌ・ティ・ティ・ドコモ 動画像符号化装置および方法、並びに動画像復号化装置および方法
RU2392664C2 (ru) * 2004-09-22 2010-06-20 Пол Дж. НУННАРИ Система и способ стимулирования охраны здоровья в пункте продаж
FR2878758B1 (fr) 2004-12-06 2007-08-24 Sylvius Sarl Ensemble de jeu electronique avec objets physiques identifiables ou localisables par le jeu
US7728877B2 (en) * 2004-12-17 2010-06-01 Mitsubishi Electric Research Laboratories, Inc. Method and system for synthesizing multiview videos
KR100779875B1 (ko) * 2005-01-14 2007-11-27 주식회사 휴맥스 다-시점 코딩을 위한 참조 프레임 순서 설정 방법 및 그방법을 기록한 기록매체
JP5020953B2 (ja) 2005-07-18 2012-09-05 エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュート 時間及び視点間参照映像バッファを活用した予測符号化/復号化装置及びその方法
US8559515B2 (en) 2005-09-21 2013-10-15 Samsung Electronics Co., Ltd. Apparatus and method for encoding and decoding multi-view video
US7903737B2 (en) 2005-11-30 2011-03-08 Mitsubishi Electric Research Laboratories, Inc. Method and system for randomly accessing multiview videos with known prediction dependency
ZA200805337B (en) * 2006-01-09 2009-11-25 Thomson Licensing Method and apparatus for providing reduced resolution update mode for multiview video coding
JP5225141B2 (ja) 2009-02-20 2013-07-03 下西技研工業株式会社 ディスプレイ支持装置
JP2010191393A (ja) 2009-02-20 2010-09-02 Bridgestone Corp カラーフィルタ基板の製造方法およびカラー情報表示用パネルの製造方法

Also Published As

Publication number Publication date
JP5229810B2 (ja) 2013-07-03
CN101931806A (zh) 2010-12-29
ZA200805337B (en) 2009-11-25
JP6214097B2 (ja) 2017-10-18
WO2007081926A3 (en) 2007-10-04
JP2018164312A (ja) 2018-10-18
US20090010323A1 (en) 2009-01-08
CN103096089B (zh) 2016-03-23
KR101350676B1 (ko) 2014-01-14
JP2014003681A (ja) 2014-01-09
JP2015097406A (ja) 2015-05-21
KR20080092359A (ko) 2008-10-15
JP5219212B2 (ja) 2013-06-26
CN102685488B (zh) 2016-04-20
JP2009522986A (ja) 2009-06-11
CN103118258A (zh) 2013-05-22
EP1972145A2 (en) 2008-09-24
JP2013176065A (ja) 2013-09-05
WO2007081756A2 (en) 2007-07-19
AU2007205179B2 (en) 2011-08-25
EP2458868A3 (en) 2013-01-23
CN101366285B (zh) 2012-04-18
RU2433561C2 (ru) 2011-11-10
CN101931806B (zh) 2014-03-26
EP2458870A2 (en) 2012-05-30
RU2008132879A (ru) 2010-02-20
BRPI0706438A2 (pt) 2011-03-29
CN102685489A (zh) 2012-09-19
US20130242048A1 (en) 2013-09-19
US10194171B2 (en) 2019-01-29
AU2007205179A1 (en) 2007-07-19
US20190037241A1 (en) 2019-01-31
CN101366285A (zh) 2009-02-11
JP2017077015A (ja) 2017-04-20
US8842729B2 (en) 2014-09-23
EP2458871A3 (en) 2013-01-23
US9143782B2 (en) 2015-09-22
EP2458868A2 (en) 2012-05-30
JP5483510B2 (ja) 2014-05-07
JP5229842B1 (ja) 2013-07-03
JP2016059067A (ja) 2016-04-21
CN103118258B (zh) 2016-03-23
EP2458869A3 (en) 2013-01-23
JP6086560B2 (ja) 2017-03-01
AU2007205007B2 (en) 2011-03-31
CN102685489B (zh) 2015-04-29
EP2309750A2 (en) 2011-04-13
JP6578421B2 (ja) 2019-09-18
EP2458870A3 (en) 2013-01-23
CN103096089A (zh) 2013-05-08
BR122016024819B1 (pt) 2020-05-26
AU2007205007A1 (en) 2007-07-19
CN103096088B (zh) 2016-03-23
JP2012231512A (ja) 2012-11-22
CN103108184A (zh) 2013-05-15
BRPI0706434A2 (pt) 2011-03-29
JP2013138486A (ja) 2013-07-11
JP6008433B2 (ja) 2016-10-19
KR20080092357A (ko) 2008-10-15
EP3484157A2 (en) 2019-05-15
JP2009522985A (ja) 2009-06-11
JP5602192B2 (ja) 2014-10-08
JP6077965B2 (ja) 2017-02-08
JP2014239523A (ja) 2014-12-18
JP5483509B2 (ja) 2014-05-07
ZA200805751B (en) 2009-10-28
CN103108184B (zh) 2016-03-23
WO2007081756A3 (en) 2008-01-03
CN103096088A (zh) 2013-05-08
JP2012213205A (ja) 2012-11-01
US20150350668A1 (en) 2015-12-03
EP2458869A2 (en) 2012-05-30
JP6453839B2 (ja) 2019-01-16
US20090168874A1 (en) 2009-07-02
EP1972148A2 (en) 2008-09-24
RU2494569C2 (ru) 2013-09-27
BRPI0706434B1 (pt) 2021-02-02
JP5534536B2 (ja) 2014-07-02
US20150350680A1 (en) 2015-12-03
ZA200805650B (en) 2009-10-28
CN101366286B (zh) 2013-03-27
CN101366286A (zh) 2009-02-11
US9521429B2 (en) 2016-12-13
EP2309750A3 (en) 2013-12-25
US9525888B2 (en) 2016-12-20
JP2013176067A (ja) 2013-09-05
EP2458871A2 (en) 2012-05-30
CN102685488A (zh) 2012-09-19
JP2013176066A (ja) 2013-09-05
EP3484157A3 (en) 2019-08-07
JP5610552B2 (ja) 2014-10-22
WO2007081926A2 (en) 2007-07-19
RU2008132834A (ru) 2010-02-20
KR101350597B1 (ko) 2014-01-14

Similar Documents

Publication Publication Date Title
BRPI0706438B1 (pt) Método para decodificação de vídeo e decodificador de vídeo
Li et al. A novel multi-view video coding scheme based on H. 264

Legal Events

Date Code Title Description
B15K Others concerning applications: alteration of classification

Ipc: H04N 19/597 (2014.01), H04N 19/109 (2014.01), H04N

B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B06T Formal requirements before examination [chapter 6.20 patent gazette]
B25G Requested change of headquarter approved

Owner name: THOMSON LICENSING (FR)

B25G Requested change of headquarter approved

Owner name: THOMSON LICENSING (FR)

B25A Requested transfer of rights approved

Owner name: INTERDIGITAL VC HOLDINGS, INC. (US)

B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 10 (DEZ) ANOS CONTADOS A PARTIR DE 07/01/2020, OBSERVADAS AS CONDICOES LEGAIS.