BRPI0910340B1 - método e aparelho de decodificação de vídeo - Google Patents

método e aparelho de decodificação de vídeo Download PDF

Info

Publication number
BRPI0910340B1
BRPI0910340B1 BRPI0910340-6A BRPI0910340A BRPI0910340B1 BR PI0910340 B1 BRPI0910340 B1 BR PI0910340B1 BR PI0910340 A BRPI0910340 A BR PI0910340A BR PI0910340 B1 BRPI0910340 B1 BR PI0910340B1
Authority
BR
Brazil
Prior art keywords
pixel
phase
low resolution
video frame
image
Prior art date
Application number
BRPI0910340-6A
Other languages
English (en)
Inventor
Tamer Shanableh
Shih-Ta Hsiang
Faisal Ishtiaq
Original Assignee
Google Technology Holdings Llc.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Google Technology Holdings Llc. filed Critical Google Technology Holdings Llc.
Publication of BRPI0910340A2 publication Critical patent/BRPI0910340A2/pt
Publication of BRPI0910340B1 publication Critical patent/BRPI0910340B1/pt

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/39Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability involving multiple description coding [MDC], i.e. with separate layers being structured as independently decodable descriptions of input picture data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

MÉTODO E APARELHO PARA CODIFICAÇÃO E DECODIFICAÇÃO DE VÍDEO Um método e um aparelho para a codificação e a decodificação de vídeo realizam uma transformação de pelo menos uma porção de um quadro de vídeo de resolução alta em uma imagem de resolução baixa e uma pluralidade de conjuntos de dados de melhoramento, codifica a imagem de resolução baixa como uma imagem pictórica codificada primária em um formato de fluxo de bit e codifica cada um da pluralidade de conjuntos de dados de melhoramento como uma imagem pictórica codificada redundante diferente no formato de fluxo de bit. Para a decodificação, uma imagem de resolução baixa decodificada e uma pluralidade de conjuntos de dados de melhoramento decodificados são geradas e uma transformada inversa é realizada para a construção de uma imagem de resolução alta decodificada. A imagem pictórica codificada primária e a imagem pictórica codificada redundante podem ser formatadas de acordo com a especificação de Codificação Avançada da ITU-T H.264. A transformada pode ser uma transformada de polifase ou de sub-banda.

Description

Pedidos Relacionados
O presente pedido está relacionado ao pedido U.S. a seguir comumente possuído com este pedido pela Motorola, Inc.: N° de Série 11/866.771, depositado em 3 de outubro de 2007, intitulado "METHOD AND APPARATUS FOR INTRA FRAME SPACTIAL SCALABLE VIDEO CODING" (protocolo legal N° CML04718EV).
Campo da Exposição
A presente exposição se refere geralmente a uma comunicação de vídeo e, mais particularmente, a técnicas de comunicação de vídeo provendo uma resolução de imagem escalonável e resiliência melhorada a erro.
Antecedentes
No padrão de codificação de vídeo H.264/AVC datado de 3/2005, cada unidade de acesso (p. 4, seção 3.1, definição de "unidade de acesso") compreende uma imagem pictórica primária codificada para a provisão da informação requerida para a representação de uma imagem pictórica em movimento codificada. Uma unidade de acesso pode conter, ainda, uma ou mais imagens pictóricas codificadas redundantes, as quais "não têm efeito normativo sobre o processo de codificação". A Seção 7.4.3 ("Slice header semantics: redundant_pic_cnt") destas normas estabelece: "Não há um processo de decodificação requerido para uma fatia codificada ou uma partição de dados de fatia codificada de uma imagem pictórica codificada redundante. Quando redundant_pic_cnt no cabeçalho de uma fatia de uma fatia codificada é maior do que 0, o decodificador poderá descartar a fatia codificada. NOTA 6 - quando algumas das amostras na imagem pictórica primária decodificada não podem ser decodificadas corretamente devido a erros ou a perdas na transmissão da seqüência e uma fatia redundante codificada pode ser decodificada corretamente, o decodificador deve substituir as amostras da imagem pictórica primária decodificada pelas amostras correspondentes da fatia redundante decodificada. Quando mais de uma fatia redundante cobre a região relevante da imagem pictórica primária, a fatia redundante tendo o valor mais baixo de redundant_pic_cnt deve ser usada". Assim, a presença de uma ou mais imagens pictóricas codificadas redundantes no fluxo de bit codificado é opcional e o uso pretendido (mas não um uso requerido) de uma imagem pictórica codificada redundante é a correção de erros de transmissão na imagem pictórica codificada primária. A Wikipedia.com apresentou (em 15 de março de 2008) o recurso de imagem pictórica codificada redundante de H.264 conforme se segue: "Fatias redundantes (RS), um recurso de robustez a erro / perda permitindo que um codificador envie uma representação extra de uma região de imagem pictórica (tipicamente a uma fidelidade mais baixa) que pode ser usada se a representação primária estiver corrompida ou for perdida".
A nova versão pré-publicada da norma de MPEG-4 AVC/H.264 ainda provê ferramentas de codificação de vídeo escalonáveis e permite que um decodificador recupere a imagem pictórica codificada primária ou uma forma de resolução mais alta da imagem pictórica codificada primária. Contudo, estas novas ferramentas de codificação padronizadas envolvendo uma complexidade aumentada de implementação não foram adotadas rapidamente pela indústria.
Breve Descrição das Figuras
As figuras associadas, onde números de referência iguais se referem a elementos funcionalmente idênticos ou similares por todas as várias vistas separadas, em conjunto com a descrição detalhada abaixo, são incorporadas no e fazem parte do relatório descritivo, e servem para ilustração adicional das modalidades de conceitos que incluem a invenção reivindicada, e explicam vários princípios e vantagens daquelas modalidades. A FIG. 1 é um diagrama que ilustra uma porção de um quadro de vídeo colorido de acordo com certas modalidades. As FIG. 2 e 3 são, respectivamente, um diagrama de blocos funcional e um fluxograma de um aparelho e algumas etapas de um método para a codificação de pelo menos uma porção de um quadro de vídeo, de acordo com certas modalidades. A FIG. 4 é um fluxograma que mostra uma etapa de um método para a realização de uma transformação, de acordo com certas modalidades. A FIG. 5 é um diagrama de blocos de uma função de transformada, de acordo com certas modalidades. A FIG. 6 é um diagrama que ilustra a grade de amostragem para uma porção de um quadro de vídeo, de acordo com certas modalidades. A FIG. 7 é um fluxograma que mostra algumas etapas de um método para a realização de uma transformada, de acordo com certas modalidades. As FIG. 8 e 9 são, respectivamente, um diagrama de blocos de um decodificador e etapas de um método para a decodificação, mostrados de acordo com certas modalidades. A FIG. 10 é um diagrama de blocos de uma função de transformada inversa para uma função de cálculo de média descrita com referência à FIG. 6.
Os técnicos versados apreciarão que os elementos nas FIG. são ilustrados por simplicidade e clareza e não necessariamente foram desenhados em escala. Por exemplo, as dimensões de alguns dos elementos nas FIG. podem estar exageradas em relação a outros elementos, para se ajudar no entendimento de modalidades da presente invenção.
Os componentes de aparelho e de método foram representados, onde apropriado, por símbolos convencionais nos desenhos, mostrando apenas aqueles detalhes específicos que são pertinentes ao entendimento das modalidades da presente invenção, de modo a não se obscurecer a exposição com detalhes que serão prontamente evidentes para aqueles de conhecimento comum na técnica tendo o benefício da descrição aqui.
Descrição Detalhada
De acordo com certos aspectos das presentes modalidades, são descritas técnicas que provêem uma transformação de um quadro de vídeo de resolução alta original em uma imagem de resolução baixa e uma pluralidade de conjuntos de dados de melhoramento, que então são codificados e podem ser transmitidos como fluxos de bit codificados. A imagem de resolução baixa pode ser decodificada e usada para a geração de uma versão de resolução baixa do quadro de vídeo de resolução alta recuperado. A imagem de resolução baixa e a pluralidade de conjuntos de dados de melhoramento podem ser decodificadas e transformadas inversamente para a construção de um quadro de vídeo de resolução alta decodificado. Em algumas modalidades, a maneira pela qual o vídeo é codificado e decodificado é compatível com a especificação publicada pela International Telecommunication Union, que é identificada como a especificação ITU-T H.264 com data de 03/2005, intitulada "SERIES H: AUDIOVISUAL AND MULTIMEDIA SYSTEMS Infrastructure of audiovisual services - Coding of moving video / Advanced video coding for generic audiovisual services", a qual será referida a partir deste ponto como a "Codificação Avançada da ITU-T H.264", e a especificação equivalente publicada pelo Grupo de Especialistas em Imagens com Movimento, a qual é comumente referida como a especificação de AVC Parte 10 MPEG-4. Mais ainda, a maneira pela qual o vídeo é codificado e decodificado pode ser compatível com especificações ainda não lançadas. Em particular, as técnicas descritas aqui exploram o novo uso da ferramenta de imagem pictórica redundante, o que não tem efeito normativo sobre o processo de decodificação, em conjunto com uma codificação de sub- banda e uma codificação de descrição múltipla (MDC). Estas técnicas também podem ser compatíveis com outras técnicas de codificação de vídeo além daquelas especificadas pela Codificação Avançada da ITU-T H.264.
Uma transformada de sub-banda / ondulação decompõe uma imagem de entrada em uma representação de sinal de resolução múltipla. Foi demonstrado ser um dos métodos mais eficientes para compressão de imagem na literatura, e é utilizado na norma internacional JPEG 2000 para aplicações de codificação de imagem e video (no formato de JPEG 2000 em Movimento) na indústria. Graças à alta compactação de energia de uma transformada de sub-banda / ondulação, os codificadores de sub-banda / ondulação são capazes de obterem excelente performance de compressão sem artefatos de bloco tradicionais associados à transformada de bloco. De forma mais importante, eles podem acomodar facilmente a funcionalidade de codificação escalonável espacial desejável quase sem penalidade na eficiência de compressão, porque a transformada de sub-banda de ondulação é de resolução escalonável por natureza.
Certas formas de redução de amostragem de polifase têm sido usadas em uma codificação de descrição múltipla. Uma codificação de vídeo de descrição múltipla (MD) é uma abordagem para transmissão de vídeo em difusão simultânea e multidifusão por redes propensas a erros. Uma codificação de vídeo de descrição múltipla é conceitualmente diferente da codificação de vídeo escalonável de camada múltipla tradicional disponível em codificadores - decodificadores híbridos, tais como MPEG-2, MPEG-4 e na família H.26x de especificações. Em uma codificação de vídeo de MD, vários descritores de vídeo igualmente importantes são gerados e, talvez, entregues através de canais ou percursos de transmissão diferentes. Cada descritor de vídeo é individualmente decodificável e capaz de reproduzir a resolução de vídeo original, embora possivelmente a uma qualidade mais baixa. Portanto, o vídeo codificado pode ser recuperado e consumido por um cliente remoto, desde que pelo menos uma descrição tenha sido recebida de forma bem sucedida. A noção de camadas de vídeo hierárquicas não se aplica; daí, quanto mais descritores de vídeo disponíveis para o receptor, mais alto é o vídeo decodificado, independentemente da ordenação dos descritores recebidos. Em outras palavras, uma codificação de vídeo de descrição múltipla remove as dependências entre camadas, e, portanto, a priorização de camada de vídeo introduzida pela codificação de camada múltipla tradicional não é mais necessária.
A FIG. 1 é um diagrama que mostra uma grade de amostragem para uma porção 100 de um quadro de vídeo colorido, de acordo com certas modalidades. É similar à figura 6-1 da Codificação Avançada da ITU-T H.264, a qual é intitulada "Localizações verticais e horizontais nominais de amostras de luma e croma a 4:2:0 em um quadro". Na FIG. 1, as amostras de luma 105 do quadro de vídeo são mostradas como Xs e um de dois conjuntos associados de amostras de croma 110 são mostrados como Os. As amostras de croma no outro conjunto de croma ocorreriam nas mesmas posições mostradas para amostras de croma 110. A quantidade de amostras de luma 105 está relacionada à resolução e ao tamanho da imagem de vídeo no quadro. A quantidade de amostras de croma está relacionada à quantidade de amostras de luma. A FIG. 1 ilustra um quadro de vídeo especificado em um formato 4:2:0 no qual a quantidade de amostras de croma é igual a U da quantidade de amostras de luma. A norma de Codificação Avançada da ITU-T H.264 provê outras relações, tais como 1 para 1 e para 1. Obviamente, uma imagem monocromática não tem amostras de croma. Quando um quadro de vídeo, ou uma porção de um quadro de vídeo, tal como uma divisão, um macrobloco ou uma região de interesse é codificada, por exemplo, de acordo com a norma de Codificação Avançada da ITU-T H.264, as operações realizadas nas amostras de luma também são realizadas nas amostras de croma, escalonadas para a quantidade de amostras de croma. O mesmo é verdadeiro para as operações únicas definidas aqui. Para simplificar a descrição das operações, elas são descritas em termos de pixels, onde um pixel pode ser tomado como uma amostra de luma ou uma amostra de croma. Para simplificar mais os teísmos usados aqui, quando o termo "porção" é usado, ele significa "pelo menos uma porção", o que pode incluir uma parte, partes ou o todo. Quando o quadro de vídeo é um quadro colorido, as operações descritas aqui são realizadas nos conjuntos de luma e de croma de amostras para a porção do quadro de vídeo, escalonada para os tamanhos dos conjuntos de amostras.
As FIG. 2 e 3 são, respectivamente, um diagrama de blocos funcional 200 e um fluxograma 300 de um aparelho e algumas etapas de um método para a codificação de pelo menos uma porção de um quadro de vídeo, de acordo com certas modalidades. Com referência à FIG. 2, uma informação a partir de uma seqüência de quadros de vídeo é acoplada a uma entrada 210 de uma função de transformada 215. Tipicamente, a informação é operada sobre um quadro de vídeo em um momento, ou pelo menos uma porção (tal como uma fatia) de um quadro de vídeo. Neste exemplo, o quadro de vídeo 206 de uma seqüência de quadro de vídeo 205 está sendo operado pela função de transformada 215. O quadro de vídeo 206 é um quadro de vídeo de resolução alta. A função de transformada 215 transforma (305, FIG. 3) pelo menos uma porção do quadro de vídeo 206 (FIG. 2) em uma imagem de resolução baixa 220 e uma pluralidade de conjuntos de dados * de melhoramento 225, 230, 235. No exemplo mostrado na FIG. 2, há três conjuntos de dados de melhoramento 225, 230, 5 235. A pluralidade de conjuntos de dados de melhoramento poderia ser uma outra quantidade além de três em algumas modalidades. A transformação usada pela função de transformada 215 tem várias modalidades, conforme descrito em maiores detalhes abaixo. Os tipos de transformações que 10 são usados pela função de transformada 215 em certas modalidades são tais que uma realização da inversa da transformação da imagem de resolução baixa e da pluralidade de conjuntos de dados melhorados reconstrua o quadro de vídeo de resolução alta (ou uma porção do mesmo). 15 A imagem de resolução baixa 220 é acoplada a um codificador de imagem pictórica primária (codificador de PP) 240, o qual codifica a imagem de resolução baixa usando técnicas de codificação para uma codificação de imagem pictórica primária, gerando uma imagem pictórica codificada 20 primária 250. Cada um da pluralidade de conjuntos de dados de melhoramento é acoplado a um codificador de imagem pictórica redundante (codificador de RP) 245, o qual codifica o conjunto de dados de melhoramento correspondente usando técnicas de codificação para a codificação de imagem 25 pictórica redundante, gerando uma imagem pictórica codificada redundante 255, 260, 265. De acordo com certas modalidades, o codificador de imagem pictórica primária 240 codifica (310, FIG. 3) a imagem de resolução baixa como uma imagem pictórica primária em um formato que é especificado 30 pela Codificação Avançada da ITU-T H.264, e cada codificador de imagem pictórica redundante 245 codifica (315, FIG. 3) um dos conjuntos de dados de melhoramento como uma imagem pictórica codificada redundante diferente no formato que é especificado pela Codificação Avançada da ITU-T H.264. Quando outras técnicas de codificação além daquelas especificadas pela Codificação Avançada da ITU-T H.264 são usadas, a codificação descrita acima como uma codificação de imagem pictórica primária pode ser realizada por qualquer método de codificação da técnica que é compatível com uma codificação de uma imagem de resolução baixa que normalmente é decodificada por um decodificador para aquela técnica, e a codificação descrita acima como uma codificação de imagem pictórica redundante pode ser realizada por qualquer método de codificação da técnica que é compatível com uma codificação de um conjunto de dados de melhoramento ou suplementar - isto é, um que seja identificado para um decodificador para aquela técnica como estando associado ao quadro de vídeo de resolução alta, e para o qual uma decodificação pode ser ótima. Os formatos de imagem e de codificação usados para outras técnicas podem ser identificados por outros nomes além de uma imagem pictórica codificada primária e uma "imagem pictórica codificada redundante". Quando uma imagem de resolução baixa em uma codificação de conjunto de dados de melhoramento é completada, a imagem pictórica codificada primária 250 e a pluralidade de imagens pictóricas codificadas redundantes 255, 260, 265 são acopladas a uma função de formação de fluxo de bit 270, a qual os forma e um fluxo de bit 275, o qual então pode ser transmitido (320, FIG. 3).
Com referência à FIG. 4, um fluxograma mostra uma etapa de um método para a realização de uma transformação, de acordo com certas modalidades. Nestas modalidades, a função de transformada 215 realiza em 405 uma transformação de sub-banda da porção do quadro de vídeo de resolução alta par a geração de uma representação de resolução baixa e conjuntos de dados de melhoramento comumente referidos como sub-bandas LL, HL, LH e HH do quadro de vídeo (ou de uma porção do mesmo).
Com referência à FIG. 5, um diagrama de blocos da função de transformada de sub-banda 215 é mostrado, de acordo com certas modalidades. A função de transformada 215 compreende bancos de filtro de análise de sub-banda 505, 515, os quais são bancos de filtro de sub-banda convencionais e, em algumas modalidades, bancos de filtro de ondulação, que são bem conhecidos na técnica. O quadro de vídeo de entrada (ou uma porção do mesmo) 206 é processado, respectivamente, em primeiro lugar, por um filtro de passa baixa 506 e um filtro de passa alta 507, seguidos por uma operação de redução de amostragem ao longo da direção horizontal, gerando as quatro sub-bandas LL 220, HL 225, LH 230 e HH 235 que são submetidas a uma codificação pelo codificador de PP 240 e pelos codificadores de PR 245 na FIG. 2, respectivamente. Este processo é comumente referido como decomposição de sub- banda. Os bancos de filtro de síntese de sub-banda correspondentes que são usados na função de transformada inversa 875 de decodificador 800 (FIG. 8) podem construir a partir das quatro sub-bandas decodificadas uma versão decodificada do quadro de vídeo de resolução alta original 206 que foi decomposto pelos bancos de filtro de análise de sub-banda 505, 515 (FIG. 5) . Os filtros usados nos bancos de filtro de análise / sub-banda 505, 515 podem pertencer a uma família de filtros de ondulação ou a uma família de bancos de filtro de sub-banda que podem ser de uma estrutura diferente daquela mostrada, que é conhecida na técnica.
Com referência à FIG. 6, um diagrama ilustra uma porção de um quadro de vídeo 600, de acordo com certas modalidades. Os pixels da porção do quadro de vídeo mostrado na FIG. 6 tiveram uma redução de amostragem em fases da porção do quadro de vídeo. Neste exemplo, a redução de amostragem foi realizada com um fator de dois em cada dimensão espacial. Assim, quatro fases de conjuntos unicamente diferentes de pixels foram formadas, cada uma compreendendo aproximadamente um quarto do número de pixels na porção do quadro de vídeo. A quantidade de um quarto é estabelecida como sendo aproximada, devido a efeitos de borda. Os pixels das quatro fases diferentes são descritos como triângulos, xs, quadrados e círculos. Neste exemplo, uma vizinhança de pixel pode ser definida, que é válida para qualquer pixel no quadro de vídeo. Neste exemplo, uma vizinhança de pixel é definida para incluir um pixel selecionado, tal como o pixel 615, e os outros pixels incluídos na fronteira de vizinhança 610. Em geral, uma vizinhança de pixel pode ter quaisquer formato e tamanho. Um grupo de fase de pixel pode ser definido para qualquer pixel no quadro de vídeo. Um grupo de fase de pixel inclui um pixel a partir de cada fase localizado na mesma posição na respectiva grade de imagem de amostragem reduzida. No exemplo da FIG. 6, o pixel 615 foi selecionado, e identifica o grupo de fase de pixel na fronteira 605. 0 tamanho de um grupo de fase de pixel é determinado pelo fator de redução de amostragem. Para as finalidades deste documento, o pixel selecionado 615 é designado como o pixel (0, 0) . O pixel identificado pelo x no grupo de fase de pixel é designado como o pixel (1, 0). O pixel identificado por um quadrado no grupo de fase de pixel é designado como o pixel (0, 1). O pixel identificado pelo círculo no grupo de fase de pixel é designado como o pixel (1, 1). Embora um grupo de fase de pixel deva ter uma relação topográfica consistente com um pixel selecionado de uma fase em particular para uma modalidade em particular, a relação topográfica pode ser diferente em outras modalidades. Por exemplo, o grupo de fase de pixel mostrado na FIG. 6 usa pixels que são os vizinhos mais próximos do pixel selecionado e os quais estão à direita e abaixo do pixel selecionado, mas um outro conjunto de quatro vizinhos mais próximos únicos poderia ser usado para um grupo de fase.
Com referência à FIG. 7, um fluxograma 700 mostra algumas etapas de um método 700 para a realização de uma transformação, de acordo com certas modalidades. Na etapa 705, a função de transformada 215 forma uma pluralidade de fases da porção do quadro de vídeo de resolução alta 206. No exemplo mostrado na FIG. 6, a pluralidade equivale a quatro. Na etapa 710, a função de transformada 215 forma a imagem de resolução baixa para compreender pixels de resolução baixa nos quais um valor de cada pixel de resolução baixa é determinado usando-se uma função de cálculo de média de valores de pixels em uma vizinhança de pixel de cada pixel que está em uma primeira fase da pluralidade de fases. Na etapa 715, a função de transformada 215 determina cada conjunto de dados de melhoramento da pluralidade de conjuntos de dados de melhoramento como um conjunto único que compreende todos os pixels de uma outra fase além da primeira fase. Por exemplo, os conjuntos de dados de melhoramento para a porção transformada de quadro de vídeo 600 mostrada na FIG. 6 compreenderiam um conjunto de todos os pixels na porção do quadro de vídeo designada por quadrados, um conjunto de todos os pixels na porção do quadro de vídeo 600 designados por xs e um conjunto de todos os pixels na porção do quadro de vídeo 600 designada por círculos. Deve ser notado que a primeira fase pode ser qualquer fase em particular da pluralidade de fases que seja útil para o método.
De acordo com certas modalidades, a função de média é uma função de impulso, a qual determina o valor de cada pixel de resolução baixa como sendo igual ao valor do pixel correspondente da primeira fase. Em outras palavras, o cálculo da média é uma média de um número. No exemplo mostrado na FIG. 6, a imagem de resolução baixa simplesmente compreende todos os pixels designados pelos triângulos.
De acordo com certas modalidades, a função de cálculo de média determina o valor de cada pixel de resolução baixa como sendo igual à média dos valores de pixels em uma vizinhança de pixel de um pixel da primeira fase. No exemplo mostrado na FIG. 6, o valor do pixel da imagem de resolução baixa que está relacionada ao pixel 615 de uma fase em particular é determinado pelo cálculo da média dos valores dos nove pixels na fronteira 610. De acordo com certas modalidades, a função de cálculo de média determina o valor de cada pixel de resolução baixa como sendo igual à média dos valores do pixel no grupo de fase de pixel de um pixel da primeira fase. No exemplo mostrado na FIG. 6, o valor do pixel da imagem de resolução baixa que está relacionado ao pixel 615 da primeira fase pode ser determinado pelo cálculo da média dos valores dos quatro pixels na fronteira 605.
De acordo com certas modalidades, o número de fases é quatro. Os quatro pixels identificados com referência à FIG. 6 pelo triângulo, pelo x, pelo quadrado e pelo círculo em cada grupo de fase de pixel são alternativamente identificados, respectivamente, como os pixels (0, 0) , (0, 1), (1, 0) e (1, 1). Os pixels (0, 0) e (1, 1) são posicionados de forma diagonal. A função de cálculo da média determina o valor de cada pixel de resolução baixa como sendo igual à média do valor de um pixel da primeira fase (pixel 615 na FIG. 6) e um preditor, y. O preditor, y, é determinado a partir dos pixels no mesmo grupo de fase de pixel que o pixel da primeira fase, conforme se segue: y = max ((0, 1), (1, 0)), quando (1, 1) for >= max ((0, 1), (1, 0)) (1) y = min ((0, 1), (1, 0)), quando (1, 1) for <= min ((0, 1), (1, 0)) (2) y = (0, 1) + (1, 0) - (1, 1) caso contrário (3)
Com referência às FIG. 8 e 9, um diagrama de blocos de um decodificador 8 00 e as etapas de um método 900 para decodificação são respectivamente mostrados de acordo com certas modalidades. Um fluxo de bit 805 (FIG. 8) que foi codificado de acordo com uma modalidade descrita com referência às FIG. 1 a 7 é acoplado a um separador de fluxo de bit 810 (FIG. 8) . Uma imagem pictórica codificada primária 815 e uma pluralidade de imagens pictóricas codificadas redundantes 820, 825, 830 são recebidas (905, FIG. 9) no fluxo de bit e separadas pelo separador de fluxo de bit 810. Um decodificador de imagem pictórica primária 835 (FIG. 2) gera (910, FIG. 9) uma imagem de resolução baixa 855 pela decodificação da imagem pictórica codificada primária 815. Na etapa 915 (FIG. 9), quando uma seleção tiver sido feita na etapa 930 (FIG. 9) para se usar uma imagem de resolução baixa, uma função de transformada inversa 875 (FIG. 8) pode simplesmente escalonar a informação na imagem de resolução baixa e gerar uma imagem de resolução baixa decodificada 885 na saída 880, e nenhuma etapa adicional do método 900 pode ser realizada. Na etapa 915 (FIG. 9) , quando uma seleção tiver sido feita para se usar uma imagem de resolução alta, uma pluralidade de decodificadores de imagem pictórica redundante 840 (FIG. 8) gera (920, FIG. 9) uma pluralidade de conjuntos de dados de melhoramento 860, 865, 870 pela decodificação da pluralidade correspondente de imagens pictóricas codificadas redundantes 820, 825, 830. A função de transformada inversa 875 (FIG. 8) realiza (925, FIG. 9) uma função de transformada inversa da imagem de resolução baixa 855 (FIG. 2) , e cada uma da pluralidade de conjuntos de dados de melhoramento 860, 865, 870 (FIG. 2), construindo a versão decodificada da posição do quadro de vídeo de resolução alta 885 a partir da qual a imagem pictórica codificada primária e uma pluralidade de conjuntos de dados de melhoramento foram geradas na saída 880, como uma parte de uma seqüência de quadro de vídeo 890. A etapa 925 pode ser declarada de forma ligeiramente diferente como pelo menos substancialmente reconstruindo a porção do quadro de vídeo de resolução alta 206.
Quando da reconstrução da porção do quadro de vídeo de resolução alta 885, a função de transformada inversa 875 usa uma inversa da transformada que foi empregada para a codificação do quadro de vídeo de resolução alta 206. Para uma versão codificada de um quadro de vídeo de resolução alta que foi gerada usando-se uma transformação de sub- banda, conforme descrito na FIG. 4, a função de transformada inversa 875 é uma operação de síntese de sub- banda que sintetiza o quadro de vídeo de resolução alta decodificado usando-se os bancos de filtro de síntese duplos, conforme é conhecido por aqueles de conhecimento comum na técnica. Para um quadro de vídeo de resolução alta que foi gerado usando-se uma transformada de polifase, conforme descrito na FIG. 7, a função de transformada inversa 875 compreende uma função de cálculo de média inversa. Com referência à FIG. 10, um diagrama de blocos de uma função de transformada inversa 1000 para a função de cálculo de média descrita acima com referência à FIG. 6 é mostrado, de acordo com certas modalidades. A função de transformada inversa 1000 compreende uma memória 1005, uma função de cálculo de média inversa 1010, e uma função de reconstrução 1035. A pluralidade de conjuntos de dados de melhoramento 860, 865, 870 é acoplada à memória 1005, a qual armazena os conjuntos de dados de melhoramento como fases 2, 3 e 4 da imagem de resolução alta. A imagem de resolução baixa 855 é acoplada à função de cálculo de média inversa 1010. Quando uma seleção é feita para uma imagem de resolução baixa no método 900 (FIG. 9), a função de cálculo de média inversa 1010 gera a imagem de resolução baixa 855 na saída 880. A imagem de resolução baixa 855 é recebida pela função de reconstrução 1035 e é passada através dali para a saída 880. A função de cálculo de média inversa 1010 ou a função de reconstrução 1035, ou ambas, pode aplicar um escalonamento aos valores da imagem de resolução baixa 855. Quando uma seleção é feita para uma imagem de resolução alta no método 900 (FIG. 9) , a função de cálculo de média inversa 1010 determina a primeira fase da porção do quadro de vídeo de resolução alta a partir da imagem de resolução baixa 855 e as outras fases da porção do quadro de vídeo de resolução alta 1020, 1025, 1030 usando métodos bem conhecidos por alguém de conhecimento comum na técnica. A primeira fase da porção do quadro de vídeo de resolução alta é acoplada a partir da saída 1015 à função de reconstrução 1035, juntamente com as outras três fases da porção do quadro de vídeo de resolução alta 1020, 1025, 1030, onde elas são combinadas para a reconstrução da porção do quadro de vídeo de resolução alta 885 na saída 880.
Será apreciado que certas etapas do método descritas aqui podem não precisar ser realizadas na ordem descrita. Apenas como um exemplo, a etapa 920 do método 900 na FIG. 9 poderia ser realizada antes da etapa 915; os resultados da etapa 920 então podem não ser usados quando a imagem de resolução baixa for escolhida.
As modalidades descritas aqui proveem novas abordagens para uma codificação de imagem / vídeo escalonável e uma codificação de descrição múltipla requerendo mudanças substanciais em codificadores e decodificadores existentes não escalonáveis. Em particular, as técnicas podem utilizar adicionalmente a ferramenta de imagem pictórica redundante e ser facilmente aplicáveis aos sistemas de codificação de vídeo tradicionais que são projetados apenas para serem compatíveis com os perfis da ITU-T H.264 não escalonáveis.
Será apreciado que algumas modalidades podem compreender um ou mais processadores genéricos ou especializados (ou "dispositivo de processamento"), tais como microprocessadores, processadores de sinal digital, processadores personalizados e arranjos de porta programáveis de campo (FPGAs) e instruções de programa armazenadas únicas (incluindo software e firmware) que controlam um ou mais processadores a implementar, em conjunto com certos circuitos não de processador, alguns, a maioria, ou todas as funções dos métodos e/ou aparelhos descritos aqui. Alternativamente, algumas, a maioria ou todas estas funções poderiam ser implementadas por uma máquina de estado que não tem instruções de programa armazenadas, ou em um ou mais circuitos integrados específicos de aplicação (ASICs), em que cada função ou algumas combinações de certas funções são implementadas como uma lógica personalizada. Obviamente, uma combinação das duas abordagens poderia ser usada.
Mais ainda, uma modalidade pode ser implementada como um meio de armazenamento que pode ser lido em computador tendo um código que pode ser lido em computador armazenado nele para a programação de um computador (por exemplo, compreendendo um processador) para a realização de um método conforme descrito e reivindicado aqui. Os exemplos desses meios de armazenamento que podem ser lidos em computador incluem, mas não estão limitados a um disco rígido, um CD-ROM, um dispositivo de armazenamento ótico, um dispositivo de armazenamento magnético, uma ROM (memória 5 de acesso randômico), uma FROM (memória de acesso randômico programável), uma EPROM (memória de acesso randômico programável apagável), uma EEPROM (memória de acesso randômico programável apagável eletricamente) e uma memória flash. Ainda, é esperado que alguém de conhecimento comum, 10 não obstante possivelmente com esforço significativo e motivado por muitas escolhas de projeto, por exemplo, tempo disponível, tecnologia atual e considerações econômicas, quando guiado pelos conceitos e princípios mostrados aqui, seja prontamente capaz de gerar essas instruções de 15 software e esses programas e ICs com uma experimentação mínima.
No relatório descritivo precedente, as modalidades específicas foram descritas. Contudo, alguém de conhecimento comum na técnica aprecia que várias 20 modificações e mudanças podem ser feitas, sem que se desvie do escopo da invenção, conforme estabelecido nas reivindicações abaixo. Assim sendo, o relatório descritivo e as FIG. devem ser considerados em um sentido ilustrativo, ao invés de restritivo, e se pretende que todas essas 25 modificações estejam incluídas no escopo dos presentes ensinamentos. Os benefícios, as vantagens e soluções dos problemas, e quaisquer elementos que possam fazer com que qualquer benefício, vantagem ou solução ocorra ou se torne mais pronunciado não devem ser construídos como recursos ou 30 elementos críticos, requeridos ou essenciais de todas ou quaisquer reivindicações. A invenção é definida unicamente pelas reivindicações em apenso incluindo quaisquer emendas feitas durante a pendência deste pedido e todos os equivalentes daquelas reivindicações, conforme emitidas.
Mais ainda, neste documento, termos relacionais tais como primeiro e segundo, topo e fundo, e similares podem ser usados unicamente para a distinção de uma entidade ou ação de outra entidade ou ação sem necessariamente requerer ou implicar em qualquer relação real como essa ou ordem entre essas entidades ou ações. Os termos "compreende", "compreendendo", "tem", "tendo", "inclui", "incluindo", "contém", "contendo" ou qualquer outra variação dos mesmos são pretendidos para cobrirem uma inclusão não exclusiva, de modo que um processo, método, artigo ou aparelho que compreenda, tenha, inclua, contenha uma lista de elementos não inclua apenas aqueles elementos, mas possa incluir outros elementos não expressamente listados ou inerentes para esse processo, método, artigo ou aparelho. Um elemento seguido por "compreende... um", "tem... um", "inclui... um", "contém... um" não impede, sem maiores restrições, a existência de elementos idênticos adicionais no processo, método, artigo ou aparelho que compreende, tem, inclui, contém o elemento. Os termos "um" e "uma" são definidos como um ou mais, a menos que explicitamente declarado de outra forma aqui. Os termos "substancialmente", "essencialmente", "aproximadamente", "em torno de" ou qualquer outra versão dos mesmos são definidos como sendo próximos de, conforme entendido por alguém de conhecimento comum na técnica, e em uma modalidade não limitativa o termo é definido como estando em 10%, em uma outra modalidade em 5%, em uma outra modalidade em 1% e em uma outra modalidade em 0,5%. 0 termo "acoplado" conforme usado aqui é definido como conectado, embora não necessariamente de forma direta e não necessariamente de forma mecânica. Um dispositivo ou uma estrutura que é "configurada" de certa forma é configurado pelo menos daquela forma, mas também pode ser configurado de formas que não são listadas.
O Resumo da Exposição é provido para se permitir que o leitor rapidamente avalie a natureza da exposição técnica. É submetido com o entendimento que não será usado para interpretar ou limitar o escopo ou o significado das reivindicações. Além disso, na Descrição Detalhada precedente, pode ser visto que vários recursos são agrupados em conjunto em várias modalidades para fins de otimização da exposição. Este método de exposição não é para ser interpretado como refletindo uma intenção que as modalidades reivindicadas requerem mais recursos do que expressamente recitado em cada reivindicação. Ao invés disso, conforme as reivindicações a seguir refletem, o assunto inventivo está em menos do que todos os recursos de uma única modalidade mostrada. Assim, as reivindicações a seguir desse modo são incorporadas na Descrição detalhada, com cada reivindicação sendo auto-suficiente como um assunto reivindicado separadamente.

Claims (4)

1. Método de decodificação de vídeo, caracterizado por compreender: a geração de uma imagem de resolução baixa decodificada pela decodificação de uma imagem pictórica codificada primária codificada de acordo com a Codificação Avançada da ITU-T H.264 Especificação 03/2005; a geração de uma pluralidade de conjuntos de dados de melhoramento decodificados pela decodificação de uma pluralidade correspondente de imagens pictóricas codificadas redundantes codificadas de acordo com a Codificação Avançada da ITU-T H.264 Especificação 03/2005; e a realização de uma transformação inversa da imagem de resolução baixa decodificada e da pluralidade de conjuntos de dados de melhoramento decodificados para a construção de uma versão decodificada de uma porção de um quadro de vídeo de resolução alta; em que a imagem de resolução baixa compreender pixels de resolução baixa nos quais um valor de cada pixel de resolução baixa é determinado usando-se uma função de cálculo de média de valores de pixels definidos em uma vizinhança de pixel de cada pixel em uma fase em particular de uma pluralidade de fases da porção do quadro de vídeo de resolução alta, e cada um da pluralidade de conjuntos de dados de melhoramento ser um conjunto único que compreende todos os pixels de uma outra fase da porção do quadro de vídeo de resolução alta além da fase em particular, onde a transformação inversa compreende: a regulagem de cada outra fase do quadro de vídeo de resolução alta além da fase em particular para um conjunto correspondente da pluralidade de conjuntos de dados de melhoramento; a determinação da fase em particular da porção do vídeo de resolução alta a partir da imagem de resolução baixa e das outras fases da porção do vídeo de resolução alta; e a combinação da fase em particular e das outras fases para a construção da versão decodificada do quadro de vídeo de resolução alta; e em que um grupo de fase de pixel para um pixel inclui um pixel de cada grupo de fase localizado na mesma posição em relação ao pixel na imagem de resolução baixa, em que o número de fases é quatro, em que os quatro pixels em cada grupo de fase de pixel são identificados como (0, 0), (0, 1) , (1, 0) e (1, 1), onde os pixels (0, 0) e (1, 1) são posicionados de forma diagonal, e onde a função de cálculo da média determina o valor de cada pixel de resolução baixa como sendo igual à média do valor de um pixel da fase em particular e um preditor, y, em que o pixel da fase em particular é um pixel da fase (0, 0), onde o preditor, y, é determinado a partir dos pixels no mesmo grupo de fase de pixel que o pixel da fase em particular, conforme a seguir: y = max ((0, 1), (1, 0)), quando (1, 1) for >= max ((0, 1), (1, 0)) y = min ((0, 1), (1, 0)), quando (1, 1) for <= min ((0, 1), (1, 0)) y = (0, 1) + (1, 0) - (1, 1) caso contrário.
2. Método de decodificação de vídeo, de acordo com a reivindicação 1, caracterizado pelo fato de a vizinhança de um pixel ser um grupo de fase de pixel.
3. Aparelho de decodificação, caracterizado por compreender: um decodificador que recupera uma imagem de resolução baixa a partir de uma imagem pictórica codificada primária em um fluxo de bit e recupera uma pluralidade de conjuntos de dados de melhoramento a partir de uma pluralidade correspondente de imagens pictóricas codificadas redundantes no fluxo de bit, a imagem pictórica codificada primária e a pluralidade correspondente de imagens pictóricas codificadas redundantes codificadas de acordo com a Codificação Avançada da ITU-T H.264 Especificação 03/2005; e um pós-processador que realiza uma transformada inversa na imagem de resolução baixa e na pluralidade de conjuntos de dados de melhoramento, construindo uma versão decodificada de uma porção do quadro de vídeo de resolução alta; em que a imagem de resolução baixa compreender pixels de resolução baixa nos quais um valor de cada pixel de resolução baixa é determinado usando-se uma função de cálculo de média de valores de pixels definidos em uma vizinhança de pixel de cada pixel em uma fase em particular de uma pluralidade de fases da porção do quadro de vídeo de resolução alta, e cada um da pluralidade de conjuntos de dados de melhoramento ser um conjunto único que compreende todos os pixels de uma outra fase da porção do quadro de vídeo de resolução alta além da fase em particular, onde o dito pós-processador é configurado para executar a função de transformada inversa compreende: uma memória para a regulagem de cada outra fase do quadro de vídeo de resolução alta além da fase em particular para um conjunto correspondente da pluralidade de conjuntos de dados de melhoramento; uma função de cálculo de média inversa que determina a fase em particular da porção do vídeo de resolução alta a partir da imagem de resolução baixa e das outras fases da porção do quadro de vídeo de resolução alta; e um reconstrutor que combina a fase em particular e as outras fases na versão decodificada do quadro de vídeo de resolução alta; e em que um grupo de fase de pixel para um pixel inclui um pixel de cada grupo de fase localizado na mesma posição em relação ao pixel na imagem de resolução baixa, em que o número de fases é quatro, em que os quatro pixels em cada grupo de fase de pixel são identificados como (0, 0), (0, 1) , (1, 0) e (1, 1), onde os pixels (0, 0) e (1, 1) são posicionados de forma diagonal, e onde a função de cálculo da média determina o valor de cada pixel de resolução baixa como sendo igual à média do valor de um pixel da fase em particular e um preditor, y, em que o pixel da fase em particular é um pixel da fase (0, 0), onde o preditor, y, é determinado a partir dos pixels no mesmo grupo de fase de pixel que o pixel da fase em particular, conforme a seguir: y = max ((0, 1), (1, 0)), quando (1, 1) for >= max ((0, 1), (1, 0)) y = min ((0, 1), (1, 0)), quando (1, 1) for <= min ((0, 1), (1, 0)) y = (0, 1) + (1, 0) - (1, 1) caso contrário.
4. Aparelho de decodificação, de acordo com a reivindicação 3, caracterizado pelo fato de a vizinhança de um pixel ser um grupo de fase de pixel.
BRPI0910340-6A 2008-04-24 2009-04-07 método e aparelho de decodificação de vídeo BRPI0910340B1 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US12/108,680 US8249142B2 (en) 2008-04-24 2008-04-24 Method and apparatus for encoding and decoding video using redundant encoding and decoding techniques
US12/108,680 2008-04-24
PCT/US2009/039739 WO2009131830A1 (en) 2008-04-24 2009-04-07 Method and apparatus for encoding and decoding video

Publications (2)

Publication Number Publication Date
BRPI0910340A2 BRPI0910340A2 (pt) 2016-04-19
BRPI0910340B1 true BRPI0910340B1 (pt) 2020-10-20

Family

ID=41077660

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI0910340-6A BRPI0910340B1 (pt) 2008-04-24 2009-04-07 método e aparelho de decodificação de vídeo

Country Status (8)

Country Link
US (1) US8249142B2 (pt)
EP (1) EP2279619B1 (pt)
KR (1) KR101249652B1 (pt)
CN (1) CN102067599B (pt)
BR (1) BRPI0910340B1 (pt)
MX (1) MX2010011541A (pt)
RU (2) RU2010147830A (pt)
WO (1) WO2009131830A1 (pt)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090279601A1 (en) * 2008-05-08 2009-11-12 Telefonaktiebolaget Lm Ericsson (Publ) Method and Apparatus of Displaying Video
US8599932B2 (en) 2009-12-18 2013-12-03 General Instrument Corporation Carriage systems encoding or decoding JPEG 2000 video
US9532059B2 (en) 2010-10-05 2016-12-27 Google Technology Holdings LLC Method and apparatus for spatial scalability for video coding
MX2013003868A (es) * 2010-10-05 2013-06-24 Gen Instrument Corp Metodo y aparatoo para codificacion de video basado en las caracteristicas.
JP2012235383A (ja) * 2011-05-06 2012-11-29 Sony Corp エンコーダ、デコーダ、エンコーダシステム、デコーダシステム、伝送アダプタ、エンコード方法、デコード方法、および撮像装置
US9049464B2 (en) * 2011-06-07 2015-06-02 Qualcomm Incorporated Multiple description coding with plural combined diversity
CN102523448A (zh) * 2011-12-27 2012-06-27 北京交通大学 一种基于旋转的多描述视频编解码方法、装置及系统
US11089343B2 (en) * 2012-01-11 2021-08-10 Microsoft Technology Licensing, Llc Capability advertisement, configuration and control for video coding and decoding
IN2015DN02570A (pt) * 2012-10-07 2015-09-11 Numeri Ltd
CN103916649B (zh) * 2012-12-31 2017-03-15 展讯通信(上海)有限公司 一种图像处理方法和装置、系统
CN116708768A (zh) * 2013-01-04 2023-09-05 Ge视频压缩有限责任公司 高效可伸缩编码概念
CN117956142A (zh) 2013-04-08 2024-04-30 Ge视频压缩有限责任公司 多视图解码器
CN103501441B (zh) * 2013-09-11 2016-08-17 北京交通大学长三角研究院 一种基于人类视觉系统的多描述视频编码方法
CN104333762B (zh) * 2014-11-24 2017-10-10 成都瑞博慧窗信息技术有限公司 一种视频解码方法
US9749646B2 (en) * 2015-01-16 2017-08-29 Microsoft Technology Licensing, Llc Encoding/decoding of high chroma resolution details
CN106162316A (zh) * 2015-04-15 2016-11-23 腾讯科技(深圳)有限公司 一种视频流的数据处理方法、装置和系统
JP7378035B2 (ja) * 2018-09-12 2023-11-13 パナソニックIpマネジメント株式会社 変換装置、復号装置、変換方法および復号方法
CN116634177B (zh) * 2023-06-16 2024-02-20 北京行者无疆科技有限公司 一种基于hdmi通信设备的视频通信解码处理方法

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3417790A1 (de) * 1984-05-14 1985-11-14 Basf Ag, 6700 Ludwigshafen Verfahren zur herstellung von ameisensaeure
US6233283B1 (en) * 1998-06-23 2001-05-15 Lucent Technologies Inc. Layered video coding using perceptual coding criteria for error resilience in packet networks
US6639943B1 (en) * 1999-11-23 2003-10-28 Koninklijke Philips Electronics N.V. Hybrid temporal-SNR fine granular scalability video coding
US6816194B2 (en) * 2000-07-11 2004-11-09 Microsoft Corporation Systems and methods with error resilience in enhancement layer bitstream of scalable video coding
KR100783396B1 (ko) * 2001-04-19 2007-12-10 엘지전자 주식회사 부호기의 서브밴드 분할을 이용한 시공간 스케일러빌러티방법
WO2004097796A1 (ja) * 2003-04-30 2004-11-11 Matsushita Electric Industrial Co., Ltd. 音声符号化装置、音声復号化装置及びこれらの方法
US7586924B2 (en) * 2004-02-27 2009-09-08 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for coding an information signal into a data stream, converting the data stream and decoding the data stream
EP1578134A1 (en) * 2004-03-18 2005-09-21 STMicroelectronics S.r.l. Methods and systems for encoding/decoding signals, and computer program product therefor
EP1615441A1 (en) 2004-07-06 2006-01-11 STMicroelectronics S.r.l. Multiple description coding combined with channel encoding
DE102004059993B4 (de) * 2004-10-15 2006-08-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen einer codierten Videosequenz unter Verwendung einer Zwischen-Schicht-Bewegungsdaten-Prädiktion sowie Computerprogramm und computerlesbares Medium
US7848566B2 (en) * 2004-10-22 2010-12-07 Carnegie Mellon University Object recognizer and detector for two-dimensional images using bayesian network based classifier
US7961963B2 (en) * 2005-03-18 2011-06-14 Sharp Laboratories Of America, Inc. Methods and systems for extended spatial scalability with picture-level adaptation
US8879635B2 (en) * 2005-09-27 2014-11-04 Qualcomm Incorporated Methods and device for data alignment with time domain boundary
EP1775958A1 (en) 2005-10-14 2007-04-18 Thomson Licensing Method and apparatus for reconstructing the texture of a spatial enhancement-layer video picture
KR101378079B1 (ko) * 2006-04-20 2014-03-28 톰슨 라이센싱 중복 비디오 코딩을 위한 방법 및 장치
EP1885134A1 (en) 2006-07-31 2008-02-06 Fondazione Torino Wireless A communication system for video data and a method for distributing video data over a network
WO2008039201A1 (en) 2006-09-28 2008-04-03 Thomson Licensing Flexible redundancy coding
US20080095235A1 (en) * 2006-10-20 2008-04-24 Motorola, Inc. Method and apparatus for intra-frame spatial scalable video coding
US8630355B2 (en) * 2006-12-22 2014-01-14 Qualcomm Incorporated Multimedia data reorganization between base layer and enhancement layer
WO2008129500A2 (en) * 2007-04-24 2008-10-30 Nokia Corporation System and method for implementing fast tune-in with intra-coded redundant pictures
US8126054B2 (en) * 2008-01-09 2012-02-28 Motorola Mobility, Inc. Method and apparatus for highly scalable intraframe video coding

Also Published As

Publication number Publication date
MX2010011541A (es) 2011-06-21
CN102067599B (zh) 2014-06-11
WO2009131830A1 (en) 2009-10-29
US8249142B2 (en) 2012-08-21
RU2013128143A (ru) 2014-12-27
US20090268805A1 (en) 2009-10-29
CN102067599A (zh) 2011-05-18
EP2279619A1 (en) 2011-02-02
BRPI0910340A2 (pt) 2016-04-19
EP2279619B1 (en) 2017-11-01
KR101249652B1 (ko) 2013-04-01
RU2010147830A (ru) 2012-05-27
RU2534751C1 (ru) 2014-12-10
KR20100137010A (ko) 2010-12-29

Similar Documents

Publication Publication Date Title
BRPI0910340B1 (pt) método e aparelho de decodificação de vídeo
KR101806216B1 (ko) 효율적인 확장가능한 코딩 개념
US11212541B2 (en) Hierarchical inter-layer prediction in multi-loop scalable video coding
JP6434008B2 (ja) マルチレイヤビデオファイルフォーマットの設計
JP6445552B2 (ja) 拡張機構を使用している層idの信号
JP5020960B2 (ja) スケーラブルビデオ符号化を行う装置及び方法並びにスケーラブルビデオ復号化を行う装置及び方法
BR112021013436A2 (pt) Sinalização de identificador de subimagem em codificação de vídeo
JP6506474B2 (ja) マルチレイヤビットストリームファイルフォーマットにおける動作点サンプルグループの位置合わせ
JP7319336B2 (ja) 符号化映像における動作点サンプルグループ
JP6299899B2 (ja) 符号化装置、符号化方法、プログラム及び媒体
TW201743611A (zh) 以高效率視訊寫碼及分層高效率視訊寫碼檔案格式之圖塊分組及樣本之映射
US20200413042A1 (en) Multi-Layer Video Stream Encoding and Decoding
BR122022007954A2 (pt) Simplificação de dependência de mensagem sei em codificação de vídeo
BR112016000858B1 (pt) Processamento paralelo cross-layer e parâmetros de atraso de deslocamento para a codificação de vídeo
TW201715886A (zh) 多層位元流之檔案中之參數集信令
US20130271571A1 (en) Method and Arrangement for Processing of Encoded Video
JP2019520739A (ja) 別々のファイルトラックにおけるシーケンス終了およびビットストリーム終了nalユニット
BR112014001207B1 (pt) Transmissão dos dados de reconstrução em uma hierarquia de qualidade de sinal enfileirada
BR112015023800B1 (pt) Dispositivo e método para codificação escalonável de informações de vídeo
BR122022009715A2 (pt) Método implementado por um codificador, dispositivo de codificação de vídeo, meio legível por computador não transitório, e codificador
JP2023546392A (ja) マルチレイヤ信号符号化の分散解析
TW202110180A (zh) 跨逐線掃描切片之適應性迴圈濾波
WO2020184672A1 (ja) 画像復号装置、画像復号方法、画像符号化装置、および画像符号化方法
CN117528004A (zh) 多层视频比特流的子比特流提取
EP2936809A1 (en) Multi-layer video stream decoding

Legal Events

Date Code Title Description
B25D Requested change of name of applicant approved

Owner name: MOTOROLA SOLUTIONS, INC. (US)

B25A Requested transfer of rights approved

Owner name: MOTOROLA MOBILITY, INC. (US)

B25E Requested change of name of applicant rejected

Owner name: MOTOROLA MOBILITY, INC. (US)

Free format text: INDEFERIDO O PEDIDO DE ALTERACAO DE NOME CONTIDO NA PETICAO 20130041142 DE 15/05/2013, DEVIDO A AUSENCIA DE GUIA DE RECOLHIMENTO RELATIVA AO SERVICO.

B25G Requested change of headquarter approved

Owner name: MOTOROLA MOBILITY, INC. (US)

B25D Requested change of name of applicant approved

Owner name: MOTOROLA MOBILITY LLC (US)

B25A Requested transfer of rights approved

Owner name: GOOGLE TECHNOLOGY HOLDINGS LLC (US)

B15K Others concerning applications: alteration of classification

Free format text: PROCEDIMENTO AUTOMATICO DE RECLASSIFICACAO. A CLASSIFICACAO IPC ANTERIOR ERA H04N 7/26.

Ipc: H04N 19/39 (2014.01), H04N 19/172 (2014.01), H04N

Ipc: H04N 19/39 (2014.01), H04N 19/172 (2014.01), H04N

B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B06U Preliminary requirement: requests with searches performed by other patent offices: procedure suspended [chapter 6.21 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 10 (DEZ) ANOS CONTADOS A PARTIR DE 20/10/2020, OBSERVADAS AS CONDICOES LEGAIS.