BR112014011151B1

BR112014011151B1 - Previsão intercamadas entre camadas de diferentes faixas de valor de amostras dinâmicas

Info

Publication number: BR112014011151B1
Application number: BR112014011151-0A
Authority: BR
Inventors: Garbas Jens Uwe; Thomas Herbert
Original assignee: Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung Ev
Priority date: 2011-11-09
Filing date: 2012-05-04
Publication date: 2023-02-07
Also published as: CN104185991A; RU2014122981A; BR112014011151A8; US20140241418A1; IN2014KN00934A; US9712816B2; JP5964446B2; EP2777252B1; BR112014011151A2; JP2015502061A; CN104185991B; RU2586837C2; EP2777252A1; WO2013068132A1

Abstract

PREVISÃO INTERCAMADAS ENTRE CAMADAS DE DIFERENTES FAIXAS DE VALOR DE AMOSTRAS DINÂMICAS. A proporção entre qualidade de codificação por um lado e taxa de codificação por outro lado é aumentada. Para esta finalidade, um previsor global e um previsor local são utilizados em combinação. O previsor global deriva uma função de mapeamento por tom global com base em uma análise estatística de pares dos valores de amostras colocalizadas na primeira versão mapeada por tom e na segunda versão da foto, e aplica a função de mapeamento por tom global na primeira versão mapeada por tom da foto. O previsor local deriva localmente uma função de mapeamento por tom variando localmente com base em uma análise estatística dos valores de amostras colocalizadas na segunda versão da foto e na foto de referência prevista globalmente em unidades de subpartes nas quais a foto de referência prevista globalmente e a segunda versão da foto são divididas, e aplica a função de mapeamento por tom variando localmente na foto de referência prevista globalmente.

Description

DESCRIÇÃO

[0001] A presente invenção refere-se a uma previsão intercamadas entre camadas de diferentes faixas de valor de amostras dinâmicas na codificação de foto e/ou video.

[0002] O sistema visual humano pode perceber as faixas de luminância de aproximadamente 8 ordens de magnitude e aproximadamente 5 ordens simultaneamente, quando adaptadas a uma determinada condição de luz [1] . Em contraste, até alguns anos atrás, a faixa dinâmica da maioria dos dispositivos de captura e exibição de video estava limitada a aproximadamente duas ordens de magnitude. Hoje, com a introdução das telas de HDR comerciais, um realismo dramaticamente elevado pode ser esperado quando a faixa de luz visivel total é transmitida através de video HDR [1]. Para permitir uma transição sem costura do vídeo LDR em video HDR, a retrocompatibilidade deste padrão de codificação HDR futura seria extremamente útil para permitir a reprodução nos dispositivos de legado. Até então, na literatura existe apenas algumas abordagens na codificação HDR de vídeo retrocompatível [2-6]. Enquanto que a abordagem em [2] é feita com base em uma implementação do perfil simples avançado de um codec MPEG-4 com uma profundidade de bit de 8 bit, [3-6] são extensões do perfil de codificação de video escalável de H.264/AVC (conhecido como SVC). SVC permite profundidades de bit maiores do que 8 bit.

[0003] Em todos os casos, antes da codificação, a sequência de video LDR deve ser gerada dos dados HDR do vídeo original através do mapeamento por tom. Os operadores do mapeamento por tom (TMO | tone-mapping operators) podem operar em toda a imagem globalmente (métodos globais), localmente (métodos locais), ou ambos. Uma introdução compreensiva do TMO mais importante é dada na caixa de texto [1]. 0 processo que reconstrói I ! uma sequência de vídeo HDR de um vídeo LDR pode ser denotado como mapeamento por tom inverso (ITMO | inverse tone-mapping) ou preferivelmente a previsão entre camadas (ILP I inter-layer prediction) quando é utilizado para codificação do vídeo em escala [3] . Neste contexto o ILP tem a tarefa de reduzir a redundância entre as camadas LDR e HDR para reduzir a taxa de bit necessária para transmitir a informação residual. Em um cenário de codificação, o ILP deve trabalhar agnóstico com relação ao TMO escolhido para ser geralmente eficiente. Por exemplo, em [2] e [4] os autores propõem utilizar uma simples função de mapeamento para globalmente escalar cada estrutura de LDR ou ainda toda a sequência LDR na faixa dinâmica da sequência HDR. Entretanto, a eficiência deste previsor é baixa se o vídeo LDR foi gerado por um TMO adaptativo localmente (que geralmente produz vídeos LDR mais atraentes).

[0004] As abordagens em [3-6] exibem alguma adaptação local, utilizando um ILP em blocos, entretanto, elas estão operando em um espaço de cor que não é adequado para transformar dados HDR. Além disso, elas têm apenas capacidades limitadas para a estimativa do parâmetro ILP e a informação lateral necessária é ineficientemente codificada.

[0005] Certamente, é um objetivo da presente invenção fornecer um conceito para realizar a previsão intercamadas de di^erentes faixas de valor de amostras dinâmicas na codificação de foto (tal como vídeo) de modo que a eficiência da codificação em termos da proporção entre qualidade de codificação por um lado, ou seja, a qualidade de reconstrução que sofre da perda da codificação e, a taxa de decodificação, ou seja, a quantidade de dados necessária, é elevada.

[0006] Este objetivo é obtido pela matéria das reivindicações independentes do quadro de reivindicações anexo.

[0007] Uma constatação básica da presente invenção é a de que a proporção entre qualidade de codificação por um lado e, taxa decodificação por outro lado, pode ser elevada se um previsor global e um previsor local são utilizados em combinação. O previsor global deriva uma função de mapeamento por tom global com base em uma análise estatística de pares dos valores de amostras colocalizadas na primeira versão mapeada por tom e na segunda versão da foto e, aplica a função de mapeamento por tom global na primeira versão mapeada por tom da foto para obter uma foto de referência globalmente prevista para a segunda versão da foto. O previsor local deriva localmente uma função de mapeamento por tom variando localmente com base em uma análise estatística dos valores de amostras colocalizadas na segunda versão da foto e a foto de referência prevista globalmente em unidades de subpartes nas quais a foto de referência prevista globalmente e a segunda versão da foto são divididas, e aplica a função de mapeamento por tom variando localmente na foto de referência prevista globalmente para obter uma foto de referência prevista globalmente e localmente para a segunda versão da foto. No lado da decodificação, um previsor global e um previsor local estão ainda presentes, cada um derivando a função de mapeamento por tom global a função de mapeamento por tom variando localmente da informação g lateral de um fluxo de dados de melhoria.

[0008] De acordo com as aplicações da presente invenção, a previsão global é suprimível. Ou seja, de acordo com estas aplicações, o previsor global é configurado para suprimir a aplicação da função de mapeamento por tom global no caso de uma dispersão dos pares dos valores das amostras colocalizadas na primeira versão mapeada por tom da foto e a segunda versão da foto ao redor da função de mapeamento por tom global excedendo um limite predeterminado, caracterizado pelo previsor local ser configurado para, no caso da supressão, realizar a derivação local de, e a aplicação na primeira versão mapeada por tom da foto ao invés da foto de referência prevista globalmente. Certamente, uma transmissão da função de mapeamento por tom global da codificação à decodificação é, de acordo com estas aplicações, restrita a fotos onde a transmissão da função de mapeamento por tom global e a aplicação respectiva é vantajosa, enquanto evita a sobrecarga da transmissão para fotos onde a previsão global causa principalmente penalidades em termos de taxa de codificação a ser gasta para a transmissão da função de mapeamento por tom global. A decisão da supressão pode ser sinalizada ao decodificador.

[0009] De acordo com outras aplicações da presente aplicação, o previsor local é configurado para, na derivação local da função de mapeamento por tom variando localmente, determinar para cada subparte uma inclinação e uma interceptação de uma linha de regressão através de uma distribuição de pares de valores de amostras colocalizadas na respectiva subparte da segunda versão da foto e da foto de referência prevista globalmente. Para codificar eficientemente o código de inclinação e a interceptação, a inclinação determinado para uma subparte atual pode ser codificado como um residual de previsão de uma previsão espacial da inclinação de uma subparte próxima, a inclinação que foi previamente codificada. Uma linha reta com a inclinação da subparte atual é, de acordo com uma aplicação, encaixado em uma distribuição de pares de valores de amostras colocalizadas na subparte próxima da segunda versão da foto como reconstruida por um lado e, a foto de referência prevista globalmente por outro lado e, o ângulo de intercepção da linha reta é determinado, caracterizado pelo ângulo de interceptação da respectiva subparte ser codificado como um residual de previsão com relação a uma previsão de interceptação espacial que depende da intercepção da linha reta. Estas aplicações tiram vantagem da observação dos inventores, de acordo com a inclinação de variação local determinada pelo previsor local ser adequado, e oferece altos ganhos de codificação da, codificação prevista espacial, enquanto que a correlação de interceptação entre as subpartes próximas é influenciada pela inclinação variando localmente, e certamente a exploração da correlação local entre os valores próximos de interceptação é primeiramente processada como possivel realizando outro ajuste da linha reta utilizando a inclinação prevista da subparte atual como a inclinação para a subparte próxima e utiliza a interceptação resultante para prever espacialmente a inclinação da subparte atual.

[00010] As implementações mencionadas acima e outras implementações vantajosas de aplicações da presente invenção são a matéria das reivindicações dependentes.

[00011] Em particular, as aplicações preferenciais do presente pedido são descritas em maiores detalhes abaixo com relação às Figuras, entre elas:

[00012] A Figura 1 mostra um diagrama em blocos de um aparelho para realizar a previsão intercamadas em um local de codificação de acordo com uma aplicação;

[00013] A Figura 2 mostra um diagrama em blocos de uma possivel implementação da aplicação da Figura 1;

[00014] As Figuras. 3a e 3b mostram funções de mapeamento por tom global resultantes da Figura 1 para diferentes mapeamentos por tom aplicados para derivar a foto de faixa dinâmica baixa;

[00015] As Figuras 4a e 4b mostram diferentes resultados de codificação; e

[00016] A Figura 5 mostra um diagrama em blocos de um aparelho para realizar a previsão intercamadas em um local de decodificação que se encaixam na aplicação da Figura 1, de acordo com uma aplicação.

[00017] A Figura 1 mostra uma aplicação de um aparelho 10 para realizar a previsão intercamadas entre um primeiro estágio de codificação da Figura 12 para codificar uma primeira versão mapeada por tom de uma foto, e um segundo estágio de codificação da foto 14 para codificar uma segunda versão da foto. A primeira versão mapeada por tom da foto codificada pelo primeiro estágio de codificação da Figura 12 tem uma primeira faixa de valor de amostra dinâmica. Por exemplo, o primeiro estágio de codificação da Figura 12 opera nos valores de amostra inteiros de comprimento de bit m. A segunda versão da foto codificada pelo segundo estágio de codificação da foto 14 tem uma segunda faixa de valor de amostra dinâmica que é maior do que a primeira faixa de valor de amostra dinâmica. Por exemplo, o segundo estágio de codificação da foto 14 pode ser configurado para operar em valores de amostra inteiros de comprimento de bit n com n > m. Na aplicação mais detalhada da Figura 2, né 12 emé 8.

[00018] A Figura 1 mostra o aparelho 10 para realizar a previsão intercamadas, o primeiro estágio de codificação de foto 12 e o segundo estágio de codificação de foto 14 como sendo conectado entre si para formar um codificador de foto escalável 16. O primeiro estágio de codificação d e foto 12 tem uma entrada que é conectada a uma entrada de faixa dinâmica baixa 18 do codificador de foto escalável 16, e assim o segundo estágio de codificação da foto 14 tem uma entrada que é conectada a uma entrada de faixa dinâmica alta 20 do codificador de foto escalável 16. Uma saída do primeiro estágio de codificação de foto 12 é conectado a uma saida do fluxo de dados da camada base 22 do codificador de foto escalável 16, e uma saida do segundo estágio de codificação da foto 14 emite um fluxo de dados de melhoria a uma saída de fluxo de dados de melhoria 24 do codificador de foto escalável 16. Como ficará claro a partir da Figura 2, as saídas não devem ser fisicamente distintas. Ainda, ambos os fluxos de dados nas saídas 22 e 24 podem ser multiplexados em fluxo de dados escaláveis no qual o codificador 16 teria meramente que fornecer uma saída comum.

[00019] O aparelho 10 é conectado entre o primeiro estágio de codificação de foto 12 e o segundo estágio de codificação de foto 14. Em particular, conforme ilustrado pelas linhas pontilhadas na Figura 1, o previsor global 10 poderia ter sua entrada conectada à entrada 18 para receber a versão original da primeira versão mapeada por tom da foto como chegando ao primeiro estágio de codificação de foto 12 para operar na primeira versão mapeada por tom da foto sem codificar a perda opcionalmente causada pelo primeiro estágio de codificação de foto 12. Esta alternativa ainda iguala uma conexão da entrada do aparelho 10 com a saida do primeiro estágio de codificação de foto 12 no caso do último ser configurado para codificar sem perda a primeira versão mapeada por tom da foto. Entretanto, no caso de uma codificação sem perda é preferido se o aparelho 10 tiver sua entrada conectada à saida do primeiro estágio de codificação de foto 12 que é, por sua vez, conectada à saida 22, ou alguma outra saida na qual a versão reconstruída da primeira versão mapeada por tom da foto como reconstruída com base na saida do fluxo de dados da camada base em 22 é derivável como no buffer interno em um circuito de previsão interna do estágio de codificação 12. Esta última versão que pode ser reconstruída da primeira versão da foto mapeada por tom também está disponível no lado da decodificação com base no fluxo de dados da camada base 22 de modo que a previsão intercamadas descrita abaixo possa ainda ser exatamente recuperada no lado da decodificação.

[00020] Internamente, o aparelho para realizar a previsão intercamadas compreende um previsor global 26 e um previsor local 28. O previsor global 26 e o previsor local 28 são serialmente conectados entre a entrada do aparelho 10 e uma saida do aparelho 10 no qual o aparelho 10 emite uma foto de referência a uma entrada de previsão intercamadas do segundo estágio de codificação da foto 14. Tanto o previsor global quanto o local 26 e 28 são conectados à entrada 20 onde a segunda versão da foto é fornecida. Além disso, tanto o previsor global quanto o local 26 e 28 podem gerar a informação lateral e emitir esta informação lateral à saída 24 de modo a formar a informação lateral da saída o fluxo de dados de melhoria pelo segundo estágio de codificação da foto 14. Conforme ilustrado pela Figura 1 por uma linha tracejada que leva do segundo estágio de codificação da foto ao previsor local 28, o previsor local 28 e o segundo estágio de codificação da foto 14 podem cooperar de forma interativa conforme será descrito em mais detalhes abaixo com relação às aplicações mais específicas do aparelho 10 mostrado na Figura 1.

[00021] A Figura 1 mostra ainda de forma ilustrativa como o codificador de foto escalável 16 pode ser alimentado com a primeira e a segunda versão da foto nas entradas 18 e 20, É enfatizado que uma diferente solução ainda seria viável. Em qualquer caso, de acordo com a solução mostrado na Figura 1, uma foto de faixa dinâmica alta chega a um nó 30. Um mapeador de tom 32 é conectado entre este nó 30 e a entrada 18 para derivar a versão mapeada por tom da foto da foto de faixa dinâmica alta no nó 30. Conforme mostrado pelas linhas pontilhadas na Figura 1, outro mapeador de tom 34 pode ser opcionalmente conectado entre o nó 30 e a entrada 20. Ou seja, a segunda versão da foto codificada pelo segundo estágio de codificação da foto 14 pode ser a foto de faixa dinâmica alta no próprio nó 30 ou pode ser uma versão mapeada por tom respectivo que, entretanto, tem uma faixa de valor de amostra dinâmica maior comparado à versão na entrada 18.

[00022] Após ter descrito a estrutura do aparelho 10 e sua integração no codificador de foto escalável 16 e o sistema para codificar uma foto no nó 30 em um fluxo de dados da camada base e fluxo de dados de melhoria, respectivamente, o modo de operação do aparelho 10 e os outros elementos mostrados na Figura 1 é explicado.

[00023] Como ficou claro da discussão acima da Figura 1, é um objetivo de todo o sistema mostrado na Figura 1, codificar uma foto no nó 30 de forma escalável em um fluxo de dados da camada base na saida 22 acompanhado por um fluxo de dados de melhoria na saida 24 de modo que uma versão da foto tendo uma faixa de valor de amostra dinâmica inferior é derivàvel do fluxo de dados da camada base e uma versão da foto tendo uma faixa do valor de amostra dinâmica maior é derivàvel do fluxo de dados de melhoria, quando tem uma reconstrução da versão de faixa de valor de amostra dinâmica inferior em mãos. Para ser mais preciso, para reduzir a taxa de dados necessária para transmissão, o aparelho 10 explora as redundâncias entre a versão da faixa dinâmica inferior mapeada por tom e a segunda, versão da faixa dinâmica mais alta fornecendo o segundo estágio de codificação da foto 14 com uma foto de referência prevista para a segunda foto da faixa dinâmica mais alta de entrada. Certamente, o segundo estágio de codificação da foto 14 pode ser configurado para codificar meramente o residual de previsão da foto de referência prevista, ou seja, a diferença entre versão da faixa dinâmica mais alta que chega originalmente e versão prevista intercamadas. Para codificar o residual, o segundo estágio de codificação da foto 14 pode utilizar a codificação sem perda incluindo quantificação, incluindo, por exemplo, codificação por transformação como um DCT em blocos ou semelhante aos resultados da quantificação que, ou seja, os niveis do coeficiente de transformação, são codificados no fluxo de dados de melhoria. 0 residual codificado que representa o residual de previsão é emitido pelo segundo estágio de codificação da foto 14. 0 previsor local e global 26 e 28 podem acompanhar este residual codificado com a informação lateral mencionada acima permitindo que o previsor local e global no lado da decodificação realize a previsão intercamadas da mesma forma que os previsores 26 e 28 no aparelho 10.

[00024] Como ficou claro da discussão na parte introdutória da especificação da presente aplicação, o mapeador de tom 32 é livre para escolher a função de mapeamento por tom aplicada na foto 30. Isso significa, em particular, que o mapeador de tom 32 pode aplicar uma função de mapeamento por tom variando localmente nas amostras da foto de alta faixa dinâmica 30. É importante observar que todos os elementos do codificador de foto escalável 16 são agnósticos com relação ao modo de operação e a função de mapeamento por tom real escolhida do mapeador de tom 32. Em um cenário real, o mapeador de tom 32 pode ser controlado por um produtor de filmes, por exemplo, quem controla a função de mapeamento por tom do mapeador por tom 32 de modo a atingir uma representação agradável da foto de faixa dinâmica alta 30 dentro das ligações da faixa dinâmica do primeiro estágio de codificação da foto 12.

[00025] Ou seja, a função de mapeamento por tom aplicada pelo mapeador de tom 32 pode variar localmente dentro da foto no nó 30. No caso da foto ser uma foto de um vídeo e o primeiro estágio de codificação de foto 12 ser, certamente, um codificador de vídeo, a função de mapeamento por tom aplicada pelo mapeador de tom 32 pode ainda variar no tempo. Mesmo a variação local/espacial da função de mapeamento por tom localmente dentro das fotos individuais do vídeo podem variar no tempo. Por exemplo, o mapeador de tom 32 pode ser controlado para mudar a função de mapeamento por tom ao comutar de uma cena do vídeo a outra, ou dentro de uma foto para mudar a função de mapeamento por tom entre fundo e primeiro plano ou semelhante. Novamente, o estágio de codificação 12 bem como o aparelho 10 são agnósticos com relação às mudanças.

[00026] Do mesmo modo, o mapeador de tom opcional 34 é livre para aplicar uma função de mapeamento por tom de mudança de espaço ou espaço/temporal na foto de faixa dinâmica alta para derivar a segunda versão da foto e novamente, aparelho 10 e codificador 14 são agnósticos com relação a estas mudanças. Novamente, um operador pode controlar o mapeador de tom 34 de modo a obter uma representação agradável da foto nas ligações de faixa da amostra dinâmica impostas pelo estágio de codificação 14.

[00027] Posteriormente, com relação à Figura 2, onde uma implementação mais específica da aplicação da Figura 1 é mostrada, se tornará claro que a alimentação das entradas 18 e 20 pode ser realizada de modo que os codificadores 12 e 14 operam em diferentes espaços de cor, ou seja, que as versões fornecidas nas entradas 18 e 20 têm suas amostras que representam a cor em diferentes espaços de cor, respectivamente. Neste caso, a previsão intercamadas realizada pelo aparelho 10 pode ser realizada por qualquer um destes espaços de cor ou um terceiro espaço de cor. Além disso, a previsão intercamadas realizadas pelo previsor local e global 26 e 28 em mais detalhes abaixo pode relacionar a meramente o componente de luminância do respectivo espaço de cor. üma transformação do espaço de cor pode então ser utilizada para comutar entre os diferentes espaços de cor. Entretanto, deve se tornar claro que todas as aplicações descritas a seguir seriam facilmente transformadas em aplicações onde as fotos são meramente definidas em escala de cinza.

[00028] Após esta descrição introdutória mais genérica da Figura 1, o modo de operação do previsor global 26 e do previsor local 28 é descrito. Previsores 26 e 28 operam em dois estágios. 0 previsor global 26 busca identificar uma relação global entre os valores de amostra da versão da faixa dinâmica inferior da foto e os valores de amostra da versão da faixa dinâmica mais alta da foto e para utilizar esta relação global para realizar uma primeira etapa na determinação da foto de referência a ser utilizada pelo estágio de codificação 14 para efetivamente codificar de forma prevista a versão da faixa dinâmica mais alta da foto. Em particular, o previsor global 26 é configurado para derivar uma função de mapeamento por tom global com base em uma análise estatística dos pares de valores das amostras colocalizadas na primeira versão mapeada por tom e da segunda versão da foto, e aplicar a função de mapeamento por tom global na primeira versão mapeada por tom da foto para obter uma foto de referência prevista globalmente para a segunda versão da foto. Para ilustrar isso, a Figura 1 ilustra a primeira versão mapeada por tom da foto em 36 e a segunda versão da foto em 38. Como ambas as versões 36 e 38 são versões da mesma foto, uma colocalização pode ser definida entre as amostras de ambas as versões 36 e 38. Conforme descrito acima, as amostras da versão 36 são definidas em uma faixa do valor de amostra dinâmica inferior comparada às amostras da versão 38. Por exemplo, as amostras da versão 36 são codificadas utilizando 8 bits enquanto que as amostras da versão 38 são codificadas utilizando 12 bits. Por pequenas misturas, a Figura 1 ilustra um par de amostras colocalizado como um representativo. A análise estatística dos pares de amostras colocalizadas nas versões 36 e 38 pode, por exemplo, envolver a formação de uma função de mapeamento por tom global definida sobre os possíveis valores da versão da foto dos valores de amostra de baixa faixa dinâmica 36 e tendo para cada possível valor uma tendência central ou valor médio de versão da foto dos valores de amostra de alta faixa dinâmica 38 correspondentes. Para ser mais preciso, o previsor global 26 pode ser configurado para derivar uma função de mapeamento por tom global 40, para cada um dos possíveis valores xiow da primeira faixa de valor de amostra dinâmica 42 da versão da foto 36 - ou pelo menos um subconjunto dos valores de suporte representativos entre os possíveis valores pela determinação de uma tendência central de uma distribuição dos valores xHigh das amostras na segunda versão 38 da foto, que são colocalizadas nas amostras na primeira versão mapeada por tom 36 da foto, o valor xiow que iguala o respectivo possível valor. Na Figura 1, por exemplo, um possível valor é de forma ilustrativa mostrado por uma linha pontilhada em 44, e o histograma ou distribuição dos valores de amostra xHlgh das amostras colocalizadas na versão da foto 38, a saber, colocalizada nas amostras na versão da foto 36 tendo seu possível valor de faixa dinâmica baixa representativo 44, é mostrado em 46. Conforme descrito, o previsor global 26 determina a tendência central desta distribuição 46 como a média aritmética 48 e adota este valor 48 como o valor da função de mapeamento por tom global 40 no valor possível representativo 44. Certamente, a função de mapeamento por tom global 40 realiza um mapeamento entre a faixa do valor de amostra dinâmica 42 da versão da foto 36 e a segunda faixa de valor de amostra dinâmica 50 da versão da foto 38. Em particular, o mapeador por tom global 26 obtém a função de mapeamento por tom global 40 realizando o procedimento mencionado para diferentes possíveis valores xiow. O previsor global 26 pode realizar o procedimento já descrito para cada possível valor. Entretanto, para manter a sobrecarga computacional em uma faixa razoável, o previsor global 26 pode realizar o procedimento já descrito meramente para suportar os pontos ou um subconjunto próprio dos possíveis valores ao invés de para todos os possíveis valores, com interpolação entre estes pontos de suporte de modo a obter a função de mapeamento por tom global entre eles.

[00029] Conforme mostrado na Figura 1, o previsor global 26 pode ser configurado para codificar a função de mapeamento por tom global 40 como informação lateral ao fluxo de dados de melhoria gerado pelo segundo estágio de codificação da foto 14 e formando uma extensão da saída do fluxo de dados da camada base pelo primeiro estágio de codificação de foto 12.

[00030] A aplicação da função de mapeamento por tom global 40 na primeira versão mapeada por tom 36 da foto pode envolver configurar cada valor de amostra dentro da versão da foto 36 ao valor da função de mapeamento por tom global correspondente, ou seja, o valor médio no qual seu valor de amostra dinâmico baixo é mapeado de acordo com a função de mapeamento por tom global 40. Certamente, a foto de referência prevista globalmente assim obteve uma saida pelo previsor global 26 com valores de amostra que já são definidos na maior faixa de valor de amostra dinâmica da versão da foto 38 a ser prevista.

[00031] Notavelmente, o previsor global 26 não utilizou qualquer conhecimento do mapeamento por tom realizado dentro do mapeador de tom 32 ou qualquer conhecimento de um mapeamento por tom realizado opcionalmente pelo mapeador de tom 34.

[00032] O previsor global 26 pode codificar a função de mapeamento por tom global 40 diferentemente na direção serial dos possíveis valores crescentes ou decrescentes Xio„, por exemplo, diferenças de codificação f (xiow=i)-f (Xiow=i-1) , f(xlow=i+l)- f (Xiow=i)... Entretanto, outras abordagens ainda seriam praticáveis como primeiramente aproximar a função f utilizando o ajuste da curva como utilizando uma aproximação Taylor do grau polinominal p>=l ou semelhante, com, então, codificando os residuais cuja codificação residual pode então ser conduzida utilizando a codificação diferencial novamente.

[00033] O previsor local 28 é configurado para derivar localmente uma função de mapeamento por tom variando localmente com base em uma análise estatística de valores de amostras colocalizadas na segunda versão 38 da foto e da foto de referência prevista globalmente 52 em unidades de subpartes nas quais a foto de referência prevista globalmente 52 e a segunda versão 38 da foto são divididas, e aplicar a função de mapeamento por tom variando localmente na foto de referência prevista globalmente 52 para obter uma foto de referência prevista global e localmente 54 para a segunda versão 38 da foto. Por exemplo, a divisão pode ser uma divisão regular em blocos de tamanho igual e disposta em colunas e fileiras, conforme ilustrado na Figura 1 por linhas pontilhadas, ou pode ser alguma outra divisão da versão da foto 38 e foto de referência prevista globalmente 52 em subpartes com bordas colocalizadas nas quais as subpartes se encostam. O previsor local 28 pode, na derivação local da função de mapeamento por tom variando localmente, determinar para cada subparte 56 uma inclinação 58 e uma interceptação 60 de uma linha de regressão 62 através de uma distribuição 64 de pares de valores de amostras colocalizadas na respectiva subparte 56 da versão da foto 38 e da foto de referência prevista globalmente 52, ou seja, distribuição dos pontos (Xfíigfifi) , xgJJÍef(i) ) com i denotando as posições da amostra dentro da subparte atual 56. Na Figura 1, os valores de amostra de amostras dentro da foto de referência 52 são denotados xglRef, enquanto os valores de amostra da versão da foto 38 são denotados xhigh. Na aplicação mais especifica descrita em mais detalhes abaixo, a inclinação é denotada a e a interceptação como o. Ambos os valores definem, para cada subparte 56, a função de mapeamento por tom variando local nesta subparte 56. Ainda em outras palavras, o previsor local 28 determina para cada subparte 56 um par de inclinação 58 e interceptação 60, cujos valores são codificados como informação lateral no fluxo de dados de melhoria na saida 24 conforme indicado pela seta tracejada 66.

[00034] Como será descrito em mais detalhes abaixo, o previsor local 28 pode ser configurado para quantificar a inclinação 58 e a interceptação 60 reduzindo uma função de custo que depende da respectiva subparte 56 da versão da foto de faixa dinâmica alta 38 e a respectiva subparte 56 da foto de referência prevista globalmente 52 tendo suas amostras ponderadas pela inclinação e comutadas pela intercepção 60. Ou seja, a inclinação quantificada 58 e a interceptação quantificada 60 são dedicados para obter a foto de referência prevista finalmente 54 da seguinte forma: os valores de amostra xglRef dentro de uma subparte 56 da foto de referência 52 são ponderados (multiplicados) por o> e o é adicionado ao produto resultante, ou seja, xlo+glRef (i) = xgiRef- co+o para todas as posições da amostra i dentro da subparte 56. Isso é feito para cada subparte 56 utilizando o par correspondente de o e o quantificados.

[00035] Como será descrito com relação a aplicação mais detalhada abaixo com relação à Figura 2, o previsor local 28 pode ser configurado para quantificar a inclinação 58 e a interceptação 60 reduzindo uma função de custo que de modo monotônico aumenta com uma taxa de dados necessária, e de modo monotônico aumenta com uma distorção causada, pelo segundo estágio de codificação da foto 14 para codificar um desvio entre a respectiva subparte 56 da segunda versão 38 da foto por um lado e a respectiva subparte 56 da foto de referência prevista globalmente 52 com suas amostras ponderadas pela inclinação 58 e comutadas pela interceptação 60 conforme já descrito, por outro lado. Desta forma, o par de fato escolhido da inclinação 58 e interceptação 60 (quantificado) otimiza a função de custo desejada ao invés de reduzir o desvio dos pontos dos pares de valor da distribuição 64 da linha de regressão 62, cujo desvio não correlaciona a esta função de custo. Os valores quantificados podem ser denotados como ώ e ô para distingui-los da primeira tentativa resultante da regressão 62, mas esta diferenciação será ignorada preliminarmente.

[00036] Assim, finalmente, na saída do previsor local 28, a foto de referência prevista global e localmente 54 é fornecida diferindo da foto de referência prevista globalmente 52 em que, dentro de cada subparte 56, cada valor de amostra da foto de referência 52 foi ponderada pelo valor da inclinação 58 correspondente da respectiva subparte com a adição ao produto resultante deste. O segundo estágio de codificação da foto 14 pode utilizar esta foto de referência 54 para realizar a previsão intercamadas. Em particular, o segundo estágio de codificação da foto 14 pode codificar um residual de previsão entre a foto de referência prevista global e localmente 54 e a versão da foto 38 ao fluxo de dados de melhoria, ou seja, xHigh(i) ~ xlo+glRef(i) para as posições da amostra colocalizadas i, e pode utilizar, para esta finalidade, a codificação por transformação, por exemplo. Entretanto, deve ser observado que o segundo estágio de codificação da foto 14 pode ainda admitir outros modos de previsão do que o modo de previsão intercamadas já descrito. Ou seja, para formar a saída do residual de previsão 68 na sua saída para representar a versão da foto 38, o segundo estágio de codificação da foto 14 pode atribuir um modo de previsão a cada uma das divisões da versão da foto 38, uma das quais abrange prever a divisão atual com base na divisão colocalizada da foto de referência 54. Outros modos de previsão podem determinar o residual de previsão com base em outras fotos de referência como prevendo temporariamente a respectiva divisão das fotos previamente codificadas da entrada do vídeo na entrada 20. A divisão com relação às últimas divisões podem ser iguais ou podem diferir da divisão que define as subpartes 56.

[00037] Como ficou claro da descrição acima, o modo de a operação do estágio 14 pode envolver a codificação do residual de previsão 68, e esta codificação pode ser com perdas, ou seja, pode envolver uma quantificação como uma quantificação dos coeficientes de transformação resultantes da transformação do residual de previsão. Certamente, no lado da decodificação a versão original da versão da foto 38 pode não estar disponível. Para ser mais preciso, a versão reconstruída da versão da foto 38 pode diferir da versão original inserida na entrada 20 apenas na forma da quantificação mencionada envolvida na formação do residual de previsão 68. 0 estágio de codificação 14 pode fornecer ao previsor local 28 uma versão reconstruída da versão da foto 38 para uma codificação eficiente da informação lateral 66, como será discutido em mais detalhes abaixo e brevemente descrito agora. Os valores de amostra da versão reconstruída da versão da foto 38 podem ser denotados

- ao invés dos valores não quantificados

[00038] Em particular, o previsor local 28 pode ser configurado para codificar a inclinação 58 determinado para uma determinada subparte 56 como um residual de previsão de uma previsão local da inclinação o de uma subparte próxima como subparte 70, a inclinação o que foi previamente codificado. Por exemplo, o previsor local 28 pode utilizar uma ordem da análise por varredura para sequencialmente codificar os valores da inclinação e da interceptação da subparte o e w fileira por fileira do topo da foto ao fundo. Dentro de cada fileira, a ordem de varredura pode levar da esquerda para a direita. Certamente, as subpartes superior e esquerda podem servir como as subpartes próximas 70, os valores da inclinação dos quais podem servir para prever localmente o valor de inclinação da subparte atual como combinando o mesmo utilizando uma média desta ou semelhante.

[00039] Infelizmente, os valores da interceptação o são muito mais dependentes dos valores da inclinação e certamente um desvio é utilizado pelo previsor local 28 para derivar um previsor para a interceptação 60 de uma subparte atual 56. Em particular, o previsor local 28 ajusta uma linha reta 72 com a inclinação da subparte atual 56 em uma distribuição de pares de valores de amostras colocalizadas na subparte próxima 70 da versão da foto 38 - como reconstruída com base na residual de previsão 68 -, ou seja,

com i denotando as amostras contidas na subparte próxima, e a foto de referência prevista globalmente 52, ou seja, com i denotando as amostras contidas na subparte próxima, e determina a interceptação desta linha reta 72, ou seja, 74. Com base nesta interceptação 74, o previsor local 28 prevê localmente a interceptação 60 da subparte atual 56 e codifica o residual de previsão para representar o valor da interceptação da subparte atual o. Como o previsor local no lado da decodificação tem que fazer o mesmo, o previsor local 28 utiliza uma diferente distribuição dos pontos na qual a linha reta 72 é encaixada, a saber a distribuição dos pontos

com i denotando as amostras contidas na subparte próxima. Em particular, o residual de previsão 68 como codificado com perdas, mais a foto de referência 54, dentro da subparte atual 56, ou seja,

= xio,gjRef (i) tresidual (i) com i denotando as amostras contidas na subparte próxima e residual (i) sendo derivável do sinal residual £ 68, é utilizado ao invés da versão original da versão da foto 38 , dentro da subparte atual 56, ou seja, ao invés de xHigh(i)

[00040] Como se tornará claro da descrição abaixo, o previsor global 26 pode ser configurado para suprimir a aplicação da função de mapeamento por tom global 40 no caso de uma dispersão dos pares dos valores das amostras colocalizadas na primeira versão mapeada por tom 36 da foto e a segunda versão 38 da foto, ou seja, os pontos xLow(i)) para todas as posições da amostra i na foto, ao redor da função de mapeamento por tom global 40, ou seja, f(j) com j assumindo todos os possíveis valores de xLow, excedendo um limite predeterminado. Para ser mais preciso, as distribuições 46 ao redor dos valores médios 48 para cada possível valor 44 formar um corredor ao redor da função de mapeamento por tom global 40 dentro dos quais os valores de amostra da versão da foto 38 são distribuídos, e se este corredor for muito amplo, o previsor global 26 pode suprimir a aplicação da função de mapeamento por tom global 40. Como uma medição para a dispersão ou amplitude do corredor já mencionado, a soma das variâncias das distribuições 46 nos diferentes possíveis valores pode ser utilizada. O previsor local 28 pode ser configurado para, no caso da supressão, ou seja, no caso da dispersão já mencionada que excede o limite predeterminado, realizar a derivação local e a aplicação da função de mapeamento por tom variando localmente na primeira versão do mapeamento por tom 36 da foto ao invés da foto de referência prevista globalmente 52.

[00041] 0 previsor global 26 pode sinalizar a supressão dentro da informação lateral ao lado da decodificação. Em outras palavras, para uma foto na qual a supressão da previsão global é t utilizada, a supressão é sinalizada e nenhuma função de mapeamento por tom global 40 deve ser transmitida como informação lateral dentro do fluxo de dados de melhoria na saida 24.

[00042] Antes de descrever uma aplicação para um aparelho para realizar a previsão intercamadas no lado da decodificação que ajusta o aparelho da Figura 1, uma aplicação mais detalhada do aparelho da Figura 1 é descrita com relação à Figura 2.

[00043] De acordo com a Figura 2, um video de faixa dinâmica alta é codificado e certamente o estágio de codificação 12 é um codificador de video. Em particular, um codificador de video hibrido é utilizado que, no exemplo apresentado aqui, é conforme com H.264. Entretanto, isso é obrigatório. Além disso, a seguinte discussão mostrará que é possivel intercalar os fluxos de dados nas saldas 22 e 24 em um fluxo de dados comum, mas isso ainda não é naturalmente necessário. Geralmente, ao descrever a aplicação da Figura 2, os mesmos sinais de referência que são utilizados na Figura 1 foram adotados para evitar uma descrição repetitiva da funcionalidade dos elementos que ocorrem em ambas as figuras. Assim, a aplicação da Figura 2 deve ainda ser interpretada como mostrando as possibilidades para especificamente implementar os elementos da Figura 1 e todas estas possibilidades devem ser interpretadas como sendo individualmente aplicáveis aos elementos individuais da Figura 1.

[00044] Primeiramente, os detalhes estruturais comparados à Figura 1 são descritos. Por exemplo, a Figura 2 mostra uma possivel implementação do estágio de codificação 12 como um codificador de video hibrido compreendendo um circuito de previsão 90 suportando modos de previsão espaciais e temporais para os blocos das fotos de entrada, e um codificador de transformada residual com perdas 92 seguido por um codificador de entropia 94. Em particular, o codificador de video hibrido 12 da Figura 2 compreende um subtrator 95, um transformador 96 e um estágio de quantificação 98, que são conectados entre uma entrada do codificador de video híbrido 12 e uma saída deste na ordem de sua referência com o codificador de entropia 94, caracterizado pelo transformador 96 e estágio de quantificação 98 formarem juntos o transformador residual com perdas 92. O circuito de previsão compreende um somador 100, um filtro de desbloqueio 102, um buffer da estrutura 104 e um módulo de inter/intra previsão 106, que são serialmente conectados entre si em um circuito de modo que a saída do módulo de previsão 106 é conectada a uma primeira entrada do somador 100. Uma segunda entrada respectiva é conectada através de um transformador inverso 108 na saída do estágio de quantificação 98. A saída do módulo de previsão 106 é ainda conectado à entrada de subtração do subtrator 95. Os parâmetros de previsão determinados pelo módulo de previsão 106, como dados de previsão de movimento e semelhantes são ainda inseridos, conforme mostrado pela linha tracejada 108, ao codificador de entropia 94.

[00045] Certamente, na operação, o subtrator 95 subtrai um sinal de previsão 110 de uma foto atual que insere o codificador de video 12 em uma entrada não inversora do subtrator 95, assim produzindo um sinal residual 112 na saída do subtrator 95. 0 transformador 96 então espectralmente decompõe este sinal residual 112 pela transformação de fase em fase e estágio de quantificação 98 quantifica os coeficientes de transformação então obtidos, assim introduzindo a perda da codificação. Enquanto o transformador inverso 108 revela o sinal residual ainda reconstruído no lado da decodificaçâo, o codificador de entropia 94 codifica sem perdas, utilizando a codificação por entropia, o sinal residual ao fluxo de dados da camada base 22 com os parâmetros de previsão 107 já mencionados, ou seja, os modos de previsão escolhidos, parâmetros de movimento para os blocos temporariamente previstos e parâmetros de intraprevisão para blocos intraprevistos. Na saída do somador 100, que soma o sinal residual reconstruído 112' na saída do transformador inverso 108 e o sinal de previsão 110 emitido pelo módulo de previsão 106, os resultados da foto reconstruída que é opcionalmente submetida à filtração em circuito pelo filtro de desbloqueio 102 opcional, no qual a foto reconstruída é armazenada no buffer da estrutura 104. O módulo de previsão 106 pode utilizar as fotos reconstruídas armazenadas na estrutura 104 para realizar a previsão temporal para os blocos de inter-previsão de uma foto subsequentemente codificada. No lado da decodificaçâo, o decodificador da camada base compreende um circuito de previsão equivalente que recupera exatamente a mesma foto reconstruída aplicando os parâmetros de previsão no sinal residual enviado através do sinal da camada base 22.

[00046] Conforme mostrado na Figura 2, o codificador híbrido 12 pode operar em valores de amostra de luma de 8 bit representando um componente de luma de um espaço de cor YCbCr. Certamente, as fotos de referência armazenadas no buffer da estrutura 104 são compostas por amostras luma do mesmo comprimento de bit, ou seja, 8 bits.

[00047] De acordo com o exemplo específico da Figura 2, o vídeo de faixa dinâmica alta pode ter sido fornecido no nó 30 em um formato do espaço de cor RGB utilizando números flutuantes indicando os componentes de cor individuais por amostra. O mapeador de tom 32 da Figura 2 é exemplarmente mostrado como dividido em dois processos consecutivos, a saber, o mapeamento realmente mostrado 120 seguido por uma conversão de cor 122. Entretanto, a ordem entre os processos pode de modo alternativo ser comutada. Enquanto o processo de conversão de cor 122 representa uma faixa dinâmica conservando a transição do espaço de cor inicial do vídeo de faixa dinâmica alta no nó 30, ou seja, RGB, ao espaço de cor do codificador de vídeo 12, ou seja, YCbCr, o mapeamento por tom 120 aplica a função de mapeamento por tom variando espaço-temporalrnente mencionada acima nas amostras do vídeo no nó 30, assim reduzindo a faixa dinâmica abaixo da inicial à faixa dinâmica da representação de amostra com 8 bits de extensão do codificador de vídeo 12.

[00048] De acordo com a aplicação da Figura 2, um mapeador de tom 34 está presente onde as transições da flutuação do ponto flutuante HDR no nó 30 em uma representação da luma com 12 bits de extensão do número inteiro do codificador 14. Em particular, para explorar a faixa dinâmica representável, uma representação LogLuv ou espaço de cor é utilizada onde o componente de luma ou luminância é representada por valores de número inteiro de 12 bits, o intervalo de possíveis valores que regularmente testam um subintervalo do domínio de logaritmo de luminância. Em outras palavras, o mapeador de tom 34 da Figura 2 realiza duas funções, a saber, uma transição de um espaço de cor a outro, a saber de RGB a Luv com um componente L indicando o logaritmo da luminância, e espaço/temporalmente que varia o subintervalo mapeado pelo mapeador de tom 34 na faixa do valor de amostra das amostras de luma inseridos ao codificador 14. Veja, por exemplo, o gráfico mostrado em 124 na Figura 2. 0 intervalo da representação do logaritmo da luminância representada pelas amostras de faixa dinâmica alta é indicado em 126. Em outras palavras, o intervalo 126 é coberto ao girar todos possiveis estados do ponto flutuante da representação de cor do vídeo de faixa dinâmica alta no nó 30 nos valores de luminância e considerando o próprio logaritmo. O mapeador de tom 34, ao realizar o mapeamento por tom, espacialmente e temporalmente varia o subintervalo 128 que é linearmente mapeado na representação de número inteiro ou faixa dinâmica 50 das amostras de luma do vídeo inserido ao estágio de codificação 14, que é a largura do intervalo 128 bem com a posição desta ao longo do eixo Lfloat-

[00049] Consequentemente, a Figura 2 mostra, ainda, um previsor global 26 como compreendendo duas funções, a saber um espaço de cor conversão 130 para transicionar do espaço de cor do codificador 12, ou seja, YCbCr, ao espaço de cor Luv, seguido pelo mapeamento por tom global real 132, que é globalmente aplicado às amostras de uma foto atual do buffer da estrutura 104 do codificador 12. Por exemplo, os valores de luminância do espaço de cor na saída do espaço de cor conversão 130 podem ainda ter o menor comprimento de bit do codificador 12, ou seja, 8 bits, por exemplo, em que na saída da previsão global entre as camadas 132 a foto de referência tem 12 bits conforme descrito acima com relação à Figura 1 e como será descrito novamente em mais detalhes abaixo.

[00050] Internamente, o estágio de codificação 14 compreende uma concatenação de um subtrator 140, um transformador 142, um quantif icador 144 e um codificador de entropia 146. 0 conversor do espaço de cor 130, mapeador por tom global 132 e previsor local 28 são serialmente conectados entre o buffer da estrutura 104 e a entrada inversora do subtrator 140 e formam o aparelho intercamadas no sentido da Figura 1. Certamente, o subtrator 140 subtrai a foto de referência 54 emitida pelo previsor local 28 da entrada da foto codificada atualmente do mapeador de tom 34 para obter um residual de previsão 148 que é então codificado por transformação com perdas pelo transformador 142 que realiza uma decomposição espectral como uma transformação em bloco como um DCT seguido por uma quantificação dos coeficientes de transformação no quantificador 144 e a codificação por entropia sem perdas dos niveis de quantificação dos coeficientes de transformação pelo codificador de entropia 146, assim produzindo o residual de previsão 68. Conforme mostrado pela "informação lateral ILP" a informação lateral gerada pelo previsor local e global 26 e 28 é ainda inserida ao codificador de entropia 146 para formar o fluxo de dados de melhoria 24.

[00051] Ambos os fluxos de dados, fluxo de dados da camada base 22 e fluxo de dados de melhoria 24, são multiplexados de acordo com a aplicação da Figura 2 em um fluxo de dados comum 150 em forma de um multiplexador 152, cuja multiplexação é entretanto opcional.

[00052] Antes de proceder com a descrição de um aparelho para realizar a previsão intercamadas no lado da decodificaçâo que ajusta as aplicações descritas acima, várias observações são feitas nas possiveis generalizações da descrição acima.

[00053] Por exemplo, embora as aplicações descritas acima descrevessem que a previsão local e global da previsão intercamadas é realizada em um dominio onde os valores das amostras de número inteiro da primeira versão mapeada por tom 36 e da segunda versão 38 da foto se referem aos codominios das funções lineares dos subintervalos do dominio de luminância do logaritmo, as aplicações acima não são restritas a esta aplicação. Ainda, outro dominio de luminância também pode ser utilizado. Além disso, as aplicações acima não são restritas à realização da previsão intercamadas descrita acima ao componente de luminância. Ainda, as aplicações acima também podem ser aplicadas em outros componentes de cor.

[00054] Além disso, embora a aplicação específica da Figura 2 tenha utilizado especificamente uma representação de 8 bits de extensão para as amostras das fotos codificadas pelo codificador 12 e uma representação de 12 bits de extensão para as amostras do codificador 14, números inteiros tendo outros comprimento de bits podem ainda ser utilizados desde que o comprimento de bit n utilizado pelo codificador 14 seja maior do que o comprimento de bit m utilizado pelo codificador 12.

[00055] Desde que o estágio de codificação 14 seja referido, é observado que o mesmo não é restrito à utilização da codificação por transformação para codificar o residual de previsão. Ainda, o mesmo pode codificar o residual de previsão diretamente no domínio espacial. Além disso, o mesmo pode codificar sem perdas o residual de previsão de acordo com uma aplicação alternativa. Desde que os codificadores de entropia sejam referidos, os mesmos não são restritos a qualquer tipo de codificação por entropia como codificação do comprimento aritmético ou variável. Ainda, os mesmos codificadores sem perda podem ser implemeritados utilizando outro tipo de técnica de compressão sem perdas.

[00056] Em palavras mais especificas, a Figura 2 mostra um diagrama em blocos da arquitetura de um codec de video HDR escalável (HDR SVC). A parte superior 12 constitui a camada base de LDR. É inserida com uma sequência de vídeo bruto mapeado por tom em YCbCr 4:2:0 espaço de cor (cf. mapeamento por tom, sRGB ->YCbCr na Figura 2). A camada base é um codificador da camada base não modificada SVC (8 bit/componente) e assim compatível com o padrão H.264/AVC.

[00057] Para alimentar o estágio do codificador da camada de melhoria 14 os dados do vídeo HDR do ponto flutuante original no nó 30 são representados pelos números inteiros com precisão limitada. Este espaço de cor deve ser capaz de representar uma faixa dinâmica alta e a totalidade de cor completa com erros baixo do limite de percepção. O espaço de cor Lu'v' com uma profundidade de bit de 12 bits para luma e 8 bits para componentes croma (cf.

na Figura 2) é considerado aqui. A amostragem é 4:2:0 bem como para a camada base LDR 12. De acordo com a descrição acima, o codificador da camada de melhoria HDR 14 pode operar em 12 bit sem utilizar a previsão compensada do movimento, mas a previsão do uso do movimento compensado pode ser naturalmente combinado com a descrição intercamadas mostrada.

[00058] Para reduzir a redundância, o video HDR da camada , de melhoria que entra no codificador 14 é previsto pelo aparelho 10 da camada base LDR 12 por um mecanismo de previsão intercamadas (ILP). Conforme descrito acima, a tarefa da ILP 10 é reduzir os custos para transmitir a camada de melhoria de HDR 24. A solução ILP incorpora, conforme descrito, mecanismos global e local. Antes da ILP poder ocorrer, o espaço de cor LDR é convertido no Espaço de cor HDR em 130 de modo que suas diferenças de luma possam ser calculadas de forma perceptualmente significativa (cf.

na Figura 2). É salientado que a ILP 10 não está ciente do TMO especifico e assim é construído para ser muito flexível.

HDR RGB EM LUV

[00059] Uma versão modificada do espaço de cor Lu’v', originalmente proposta por Larson [8], é utilizada para a representação dos valores de pixel HDR do ponto flutuante no nó 30 com números inteiros no codificador 14. Primeiro, o espaço de cor RGB é transformado no mapeador de tom 34 em CIE(u',v'):

[00060]

[00061]

[00062]

[00063]

[00064] Em contraste a [8] , um mapeamento logarítmico adaptativo é então utilizado pelo mapeador 34 para a luminância em transformada de luma [c.p. 7]:

[00065]

[00066] Permite representar a faixa de luníinância dinâmica de Permite representar a faixa ampla estrutura

com 12 bits.

YCBCR EM LUV

[00067] Para a previsão intercamadas ILP 10, o espaço de cor da camada base precisa ser combinado com a camada de melhoria espaço de cor no bloco 130 (cf.

na Figura 2) .

[00068] Multiplicando RGB2XYZ de (1) com o inverso do padrão RGB na matriz de conversão YCbCr , RGB2YCbCr [9], podemos encontrar uma matriz de transformação de YCbCr em XYZ

[00069]

[00070] Substituímos os coeficientes da primeira e da última linha fileira nesta matriz por a,b,c e d,e,f, respectivamente e unimos X e Z em (3) e (4). Isso representa;

[00071]

a. e

[00072]

[00073] Finalmente, um mapeamento logarítmico é aplicado ao componente Y

[00074]

[00075] 0 bloco 130 aplica (7) a (9) nas amostras das fotos de referência obtidas do buffer 104 e emite o resultado ao bloco 132.

[00076] Assim, LLDR e LHDR exibem a mesma relação luminância-luma, a saber, aqui exemplarmente uma relação logarítmica, de modo que qualquer medição de erro entre as duas camadas durante ILP se torne significativa (perceptualmente).

PREVISÃO INTERCAMADAS

[00077] Geralmente o mapeamento por tom não tem muito impacto nas cromacidades, os valores não modificados de podem ser utilizados para prever uHDR',vHDR' . Entretanto, para os componentes de luma a relação é mais complexa. Consequentemente, é proposto utilizar um mecanismo de união global e local ILP 132 para reduzir a redundância entre a camada de vídeo LDR e HDR, independentemente do TMO utilizado.

[00078] Previsão global intercamadas

[00079] Na estrutura de trabalho da Figura 2 a ILP global 132 é realizada buscando uma tabela de visualização adequada para cada estrutura que mapeia os 256 valores possíveis de LLDR a um valor adequado no domínio HDR. Certamente, para cada LLDR valor de pixel, pode haver muitos LHDR valores diferentes presentes. Assim, a média aritmética é exemplarmente utilizada de todos os valores LHDR Que ficam em uma parte LLDR como o valor de reconstrução na tabela de visualização g(Z) que é, assim, uma instanciação da função 40 na Figura 1:

[00080]

[00081] com l = 0..255 denotando o índice das partes e |Ai| a cardinalidade do conjunto Ai de pixels que ficam nesta parte [2] - y

[00082] A Figura 3 mostra a relação dos valores LLDR e LHDR e a função do mapeamento de ILP resultante 40 para dois TMOs diferentes 120 [10] para uma estrutura de uma sequência de teste. Em particular, a relação entre os valores de pixel de L!DR e LHDR para dois diferentes TMOs (dispersos) é mostrada: a Figura 3a mostra TMO pattanaikOO, a Figura 3b mostra TMO fattalO∑ [10]. A função de mapeamento da ILP global estimada é mostrada com uma linha continua. Onde há uma forte correlação entre os valores de LDR e HDR para pattanaikOO TMO a qual a Figura 3a se refere, este não é o caso para fatta!02 TMO mais localmente adaptativa cuja Figura 3b se refere. No último caso a função de mapeamento de ILP mostrada 40 não levará a um bom desempenho de compressão. Pode ainda reduzir o desempenho da etapa de ILP local 28 descrita com relação à Figura 2 na próxima seção. Assim, na estrutura de trabalho da Figura 2, o mecanismo de ILP global 132 é desligado, quando, por exemplo, a média das variâncias dos pixels sobre todas as partes excede um limite. O limite não é um valor crítico e deve ser alto. O desvio padrão altamente possível de valores de 12 bit (211 ) pode ser utilizado, por exemplo.

[00083] Visto que o mapeamento de luminância em luma no mapeador 34 da camada HDR (5) é adaptativo por estrutura, a ILP global 132 deve operar ainda por estrutura, em contraste a, por exemplo, [4] . Assim, em um mapeamento ITMO separado a função g(I) pode ser transmitida em cada foto, como em cada conjunto de parâmetro de foto H.264/AVC, por exemplo. Geralmente a função é nivelada, não consome muitos bits quando é diferentemente codificada.

[00084] Previsão local intercamadas

[00085] A ILP por macro bloco (MB) aplicada em 28 e descrita a seguir com relação à Figura 2, opera utilizando uma estimativa de parâmetro otimizado R-D e utiliza um espaço de cor adequado para representar grandes faixas dinâmicas. Além disso, um método é introduzido para eficientemente prever os parâmetros de ILP de cada MB de sua proximidade casual e assim reduzir a informação lateral necessária significantemente. Certamente, aqui, os macroblocos conhecidos de H.264 servem como representativos dos sub-blocos 56 mencionados com relação à Figura 1.

[00086] Estimativa de escala e deslocamento

[00087] A ILP por MB no bloco 28 é baseada em um modo linear para uma boa compensação entre complexidade, informação lateral necessária, e eficiência da previsão. Para melhor entender a seguinte explicação matemática, os sinais de referência da Figura 1 são coutilizados e assim a seguinte descrição é ainda uma possivel forma de implementação 28 da Figura 1.

[00088] A seguir, denotamos o vetor contendo os pixels dentro de um MB 56 no espaço luma da camada de LDR (kLDR OU xqlRef) com l . O vetor do MB 56 colocalizado no espaço de luma da camada de melhoria LHDR (ou xhigh) é denotado com h . O previsor

que prevê o pixel HDR k-th h(k) de um MB na foto HDR 36 é gerado do pixel da camada base LDR convertida em cor l(k) na foto de referência prevista globalmente 52 (ou, no caso da supressão, na foto 36) de acordo com

[00089]

[00090] com escala w e deslocamento o . Apenas o erro de previsão

precisa ser o codificador da camada HDR de melhoria 14 que, por sua vez, codifica o último na informação residual 68.

[00091] Para a rápida estimativa otimizada por R-D de w e o, um método de pesquisa de dois estágios é utilizado. Primeiro, uma suposição inicial é derivada pela regressão simples linear, ou sej a

[00092]

[00093]

[00094] A barra horizontal denota o valor de amostra médio da respectiva variável, por exemplo,

. w e o são os parâmetros da previsão intercamadas que produzem o erro de previsão com a menor energia, ou seja, o erro quadrático médio (MSE) entre

e h é reduzido, w e o definem a linha de regressão 62 mostrada na Figura 1.

[00095] Certamente, w e O não podem ser conduzidos ao decodificador com precisão arbitrária, mas devem ser quantificados aos números inteiros. Certamente, um intervalo de quantificação de 0.5 pode, por exemplo, ser utilizado para W:

[00096]

[00097] Eq. (13) é modificada de acordo com

[00098]

[00099] Mesmo se usássemos a solução de quadrados mínimos de (12) e (13) ao invés das versões arredondadas ŵ e õ de acordo com (14) e (15), a minimização da energia nos dados residuais não necessariamente resultam na eficiência de compressão mais alta. Assim, nos interessamos na constatação que os parâmetros do modelo ŵ e ô em um sentido ótimo R-D.

[000100] Começando com as suposições iniciais para escala w e deslocamento õ , o previsor local 28 varre todos os candidatos de fator em escala dentro de uma faixa de

. Para cada candidato do parâmetro em escala

um novo ponto inicial para o parâmetro de deslocamento õ é calculado de acordo com (15) e a proximidade na faixa

é varrida. Para cada par de parâmetro, os custos de MB R-D .

são então calculados de acordo com a função de custo H.264/AVC convencional

[000101]

[000102] onde

é o MSE e

a taxa de bit para o respectivo bloco quando codificado com os parâmetros do modelo

e

. Os parâmetros que produzem custos R-D menores são selecionados pelo previsor local 28 como parâmetros do modelo final ŵ e ò .

[000103] Codificação dos Parâmetros de Escala e Deslocamento

[000104] Certamente, a transmissão direta de ŵ e ò para cada MB levaria a uma taxa de bit considerável para esta informação lateral. Certamente, é explorado que prever os parâmetros do MB atual 56 de sua proximidade causal 70 (como MB à esquerda, e MB acima) pode reduzir a taxa de bit significativamente. Em particular, os experimentos conduzidos I revelaram que o parâmetro em escala wmuda levemente o suficiente .para oferecer o ganho de codificação utilizando a previsão espacial. Assim, o previsor local calcula um parâmetro em escala previsor

dos parâmetros em escala já codificados do MB superior e esquerdo,

e

respectivamente. Apenas o residual

, que é na maioria das vezes zero ou próximo a zero, deve ser codificado pelo codificador de entropia:

[000105]

[000106] Infelizmente, o mesmo mecanismo de previsão falhará para codificar o parâmetro de deslocamento ô , pois cada pequena variação de w pode resultar em uma variação muito grande de ô . Assim, a condição nivelada não é satisfatória para o . Refazendo a relação da escala e deslocamento dada pela regressão linear em (13) , o previsor local 28, entretanto, primeiro calcula os valores de deslocamento do MB superior e esquerdo (õu,õt) como se tivessem o mesmo fator de escala que o MB atual (ŵ):

[000107]

and

[000108] com

e

denotando o valor médio do pixel do MC codificado colocalizado HDR ou LDR, que pode ser facilmente mantido do valor DC correspondente. Esta operação simples produz õu e õt, valores que são geralmente muito próximos ao valor de deslocamento do MB atual, ô . Assim, o valor de deslocamento codificado residual

[000109]

[000110] é geralmente zero ou próximo a zero e então a taxa de bit necessária se torna negligenciável.

RESULTADOS EXPERIMENTAIS

[000111] Os experimentos foram conduzidos. Na realização dos experimentos, o software de referência SVC (JSVM8.12) foi $ modificado de modo que possa suportar os mecanismos de ILP introduzidos nas seções anteriores. Os experimentos de codificação foram realizados com três sequências de teste HDR: Panorama, Tunnel, e Sun (640x480 pixel, 30 fps) • A sequência de téste Panorama foi gerada pela panorâmica de uma imagem de panorama de HDR de 8000x4000 pixel [11]. Sua faixa dinâmica geral é da ordem de 1010:l. Ambos, Tunnel e Sun são livremente adequados do Max- Planck Institute [12]. Toda a faixa dinâmica representada nestas sequências é 105:l e 107:l, respectivamente. Duas métricas são utilizadas para avaliar a qualidade dos videos HDR decodificados: o previsor de diferença visivel HDR (VDP) [13] e a proporção de sinal para ruido máximo perceptualmente uniforme (PU PSNR) [14] . As sequências da camada LDR mapeadas por tom foram geradas por seis diferentes TMOs geralmente utilizadas que fazem parte do pacote de software pfstmo [10] . As seguintes identificações em pfstmo são denotadas pelo número TMO em parênteses em nossos experimentos: durand02 (TMO 1), pattanaikOO (TMO 2), fatta!02 (TMO 3), mantiuk06 (TMO 4), reinhard02 (TMO 5), drago03 (TMO 6). Todos os operadores foram utilizados com seus parâmetros padrão, mas a versão adaptativa localmente de reinhard02 foi utilizada.

[000112] Os resultados de codificação mostram a qualidade da camada de melhoria de HDR indicada acima como sendo emitida em 24, com relação a taxa de ambos, a camada de melhoria junto com o fluxo de bits da camada base embutida, ou seja, a taxa de dados nas saidas 22 e 24 juntas. A camada base LDR pode ser simplesmente extraída deste fluxo de bits. Devido à falta de espaço os base resultados de codificação da camada base não são mostrados aqui. A codificação QP fixa com QPs equivalentes para a camada de LDR e HDR foi utilizada de modo que a qualidade aproximadamente igual para ambas as camadas possa ser assumida. Certamente, a alocação de bit ótima é uma questão importante em SVC, mas vai além do escopo desta apresentação.

[000113] As Figuras 4a e 4b mostram os resultados de codificação para a sequência de teste Panorama quando a camada LDR foi gerada por TMO 6. Em particular, os resultados de codificação para a sequência de teste Panorama são dados por PU PSNR (Figura 4a) e HDR VDP (Figura 4b) sobre a taxa de bit. As 4 curvas mostram a eficiência do método de ILP global, local, e da união global+local (veja 10 na Figura 1 e 2} junto com o caso de referência quando nenhuma ILP é utilizada (ou seja, transmissão simultânea da camada LDR e HDR).

[000114] Pode ser visto que a união global+local ILP de acordo com 10 nas Figuras 1 e 2 opera melhor, ambos, em termos de métricas de qualidade PU PSNR e HDR VDP. Visto que durante todas as nossas experiências os resultados de HDR VDP e PU PSNR foram consistentes, no restante, os resultados de PU PSNR são mostrados.

[000115] Tabela 1: Ganho médio de codificação para Tunnel

[000116] Tabela 2: Ganho médio de codificação para Sun

[000117] Tabela 3: Ganho médio de codificação para Panorama

[000118] As tabelas 1 -- 3 exibem o ganho médio PU PSNR (ΔPSNR) ou economia de taxa de bit (Δtaxa), respectivamente, para as 3 sequências de teste com relação ao caso da transmissão simultânea (ou seja, nenhuma ILP). A média foi realizada de acordo com a métrica Bjontegaard [15]). Os resultados para a ILP global (G), local (L) , e a união (G+L) descrita acima são dados nas tabelas para todos os TMOs em consideração. As entradas na Tabela 3 que correspondem ao gráfico R-D na Figura 4a e 4b são escritas em itálico (TMO 6) . Os valores médios nesta fileira inferior das tabelas mostram que as aplicações da presente invenção operam melhor, independentemente do TMO que foi utilizado para gerar a sequência LDR. Uma economia média da taxa de bits de até 50% ou ganhos de qualidade de até 6 dB pode ser encontrada em nossos resultados. É salientado, que em alguns casos a ILP global produz levemente melhores resultados para alguns TMOs distintos do que a ILP de união de acordo com as aplicações acima, principalmente por exigir menos informação lateral. Entretanto, para TMOs com uma adaptação local forte, esta abordagem evidentemente falha: por exemplo, na Tabela 2 pode ser visto que para TMO 3 e 4 a taxa de bit necessária excede significantemente a taxa de bit que é necessária quando as camadas de LDR e HDR são codificadas independentemente (por 44% ou 82%, respectivamente).

[000119] É ainda salientado que o ganho na eficiência da codificação do método local+ILP global apresentado neste documento previamente, comparado aos métodos na literatura [2-6] devem ainda ser mais altos do que o ganho de G+L comparado a L ou G nas Tabelas 1—3: além de uma estratégia ILP de união, a abordagem ILP misturada incorpora um espaço de cor HDR adequado, seleção do parâmetro otimizado de distorção por taxa, e codificação eficiente dos parâmetros de ILP.

LOCAL DE DECODIFICAÇÃO

[000120] A Figura 5 mostra um aparelho 500 para realizar previsão intercamadas entre um primeiro estágio de decodificação de foto 502 para decodificar uma primeira versão mapeada por tom de uma foto, tendo uma primeira faixa de valor de amostra dinâmica, e um segundo estágio de decodificação de foto 504 para decodificar uma segunda versão da foto tendo uma segunda faixa de valor de amostra dinâmica maior do que a primeira faixa de valor de amostra dinâmica. Assim, a Figura 5 ainda mostra um decodificador 506 que pode decodificar a foto na segunda faixa de valor de amostra dinâmica. Para esta finalidade, o primeiro estágio de decodificação de foto 502 é conectado entre uma entrada 508 e uma entrada do aparelho 500. 0 fluxo de dados da camada base 22 chega na entrada 508. O primeiro estágio de decodificação de foto 502 poderia opcionalmente ter duas saídas, a saber, uma para emitir uma foto reconstruída na primeira faixa de valor de amostra dinâmica para uma reprodução da mesma, com esta saída indicada utilizando o sinal de referência 510 e uma segunda saída 512 para emitir um resultado de reconstrução em circuito da foto como amortecido no buffer 104 na Figura 2. A entrada do aparelho 500 pode ser conectada a qualquer uma destas saídas. Ainda, a saída 510 é opcional e pode ser deixado. Adicionalmente, as versões emitidas nas saídas 510 e 512 podem ser iguais entre si ou podem diferir entre si em forma de um filtro de reprodução adicional aplicado para obter a versão a ser reproduzida na saída 510, comparado à versão emitida na saída 512.

[000121] O segundo estágio de decodificação de foto 504 é conectado entre uma entrada 514 do decodificador 506 e uma saída 516 do decodificador 506 para emitir a foto de alta faixa dinâmica. O aparelho 500 é ainda conectado a entrada 515. Para ser mais preciso, o aparelho 500 compreende uma concatenação de um previsor global 518 e previsor local 520 e segundo estágio de decodificação de foto 504 obtém o residual de previsão 68 do fluxo de dados de melhoria enquanto o previsor local e global 518 e 520 recebem a informação lateral 41 e 66, respectivamente. Na saída do previsor local 520, a foto de referência 54 é obtida e emitida à entrada de referência do segundo estágio de decodificação de foto 504. Semelhante à descrição da Figura 1, o segundo estágio de decodificaçâo de foto 504 pode ser configurado para fornecer o previsor local 520, por sua vez, com acesso às subpartes previamente reconstruídas da versão atual da alta faixa dinâmica da foto atualmente decodificada.

[000122] Assim, na operação, o primeiro estágio de decodificaçâo de foto 502 reconstrói a primeira versão mapeada por tom 36 da foto do fluxo de dados da camada base 22. A primeira versão mapeada por tom 36 então obtida é, de acordo com as aplicações preferidas, a mesma que a entrada ao previsor global 26 no lado da codificação de modo que a perda da codificação que opcionalmente ocorre dentro do primeiro estágio de codificação da Figura 12 no lado da codificação não leve a desvios entre os estados/comportamento de codificação e decodificaçâo.

[000123] O previsor global 518 é configurado para derivar a função de mapeamento por tom global da informação lateral 41 do fluxo de dados de melhoria do segundo estágio de decodificação de foto 504 e globalmente aplica a função de mapeamento por tom global nas amostras da primeira versão mapeada por tom 36 da foto para obter a foto de referência prevista globalmente 52. Como a função de mapeamento por tom global é muito provável que seja uma função variantes uniforme e lenta, o previsor global 26 da Figura 1 pode ter sido implementado para codificar a função de mapeamento por tom global sequencialmente ao longo de uma direção de possíveis valores crescentes ou decrescentes da primeira faixa de valor de amostra dinâmica utilizando a codificação diferencial, enquanto o previsor global 518, por sua vez, pode ser implementado para sequencialmente decodificar a função de mapeamento por tom global ao longo da mesma direção utilizando a decodificação do diferencial. Outras possibilidades existem bem como foram mencionadas acima.

[000124] 0 previsor global 518 pode ainda ser configurado para, derivando a função de mapeamento por tom global e aplicando a função de mapeamento por tom global na primeira versão mapeada por tom 36 da foto, realizar a conversão de cor 130 da Figura 2 sobre os valores das amostras na primeira versão mapeada por tom 36 levando do formato em cor do fluxo de dados 22 ao formato em cor do fluxo de dados de melhoria 24 e de estágio de decodificação 504, respectivamente, a conversão de cor sendo constantemente estabelecida independente da primeira versão mapeada por tom 36 e a segunda versão 38 da foto conforme reconstruída pelo segundo estágio de decodificação de foto 504, e então realizar a real aplicação da função de mapeamento por tom global no segundo formato de cor.

[000125] Para ser mais preciso, o previsor local 518 revela a função de mapeamento por tom global 40 mostrado na Figura 1 da informação lateral 41 e estabelece os valores de amostra xlow da primeira versão mapeada por tom 36 da foto a um valor ao qual o mesmo é mapeado de acordo com a função de mapeamento por tom 40, ou seja, XgiRef(i) = f(xiow(i)) para todas as posições da amostra i na foto. O resultado é a foto de referência prevista globalmente 52.

[000126] O previsor local 520 é configurado para localmente derivar a função de mapeamento por tom variando localmente da informação lateral em unidades das subpartes 56 mostradas na Figura 1 na qual a foto de referência prevista s globalmente 52 e a segunda versão 38 da foto são divididas, e aplicam a função de mapeamento por tom variando localmente na foto de referência prevista globalmente 42 para obter a foto de referência prevista global e localmente 54.

[000127] Conforme descrito acima, o previsor local 520 pode, na derivação local da função de mapeamento por tom variando localmente , reconstruir para cada subparte 56 uma inclinação 58 e uma interceptação 60 da informação lateral 66, e, na aplicação na função de mapeamento por tom variando localmente na foto de referência prevista globalmente, pesar, para cada subparte 56, as amostras da foto de referência prevista globalmente 52 na respectiva subparte 56 utilizando a inclinação e acionando a interceptação para o produto de inclinação co e respectiva amostra. Ou seja, dentro de cada subparte 56, o previsor local 520 computa para cada posição de amostra dentro da respectiva subparte, XgiRef(i) • co + o = Xgn.ioRef(i) para todas as posições da amostra I dentro da subparte atual, onde xglRef é o valor de amostra na respectiva posição de amostra na subparte da foto de referência global 52, xgl+loRef é o valor de amostra computado para a posição de amostra colocalizada dentro da mesma subparte 56 da foto de referência prevista global e localmente 54, co é a inclinação derivada da informação lateral 66 para essa subparte 56 e o é a interceptação determinada para essa subparte 56 da informação lateral 66.

[000128] Conforme já descrito acima, a informação se referindo à inclinação co e a interceptação o para as subpartes 56 pode eficientemente ser codificada ao fluxo de dados de melhoria e à informação lateral 66, respectivamente. Certamente, o previsor local 520 pode ser configurado para derivar sequencialmente a inclinação w e a interceptação o para as subpartes 56 da informação lateral 66. Conforme mencionado acima, a análise por linha por ordem de varredura pode ser utilizada para varrer as subpartes 56. Entretanto, outras varreduras são ainda viáveis. Seja como for, o previsor local 520 decodifica, de acordo com a respectiva aplicação, a inclinação e a interceptação residuais para as subpartes 56 da informação lateral 66 e prevê espacialmente a inclinação a para uma subparte atual da inclinação de uma subparte próxima 70 reconstruída previamente, e reconstrói a inclinação CÜ para a subparte atual 56 com base na inclinação previsto e na inclinação residual para a subparte atual. Então, o previsor local 520 encaixa uma linha reta 72 tendo a inclinação w da subparte atual acabado de se reconstruir, em uma distribuição de pares de valores de amostras colocalizadas na subparte próxima 70 da segunda versão da foto como reconstruído previamente, e a foto de referência prevista globalmente 52 e determina a interceptação 74 da linha reta 72. O previsor local 520 então reconstrói a interceptação da subparte atual 56 com base na interceptação prevista então obtida e a interceptação residual para a subparte atual 56.

[000129] Em particular, a interação entre o previsor local 520 e o estágio de decodificaçâo 504 pode ser como segue: o segundo estágio de decodificaçâo de foto 504 termina a reconstrução de certa subparte da versão da foto 38 a ser reconstruída derivando o residual de previsão para essa subparte a partir da informação residual 68 e combinando o mesmo, como adicionando, com a foto de referência prevista global e localmente na subparte colocalizada respectiva. 0 segundo estágio de decodificação da foto 504 então procede com a reconstrução da subparte próxima na ordem de varredura mencionada anteriormente entre as subpartes que ainda são utilizadas pelo previsor local 520. Em particular, o previsor local 520 então decodifica a inclinação e a interceptação para essa subparte próxima na linha da maneira que acaba de ser descrita e, ao fazê-lo, o previsor local 520 está apto a realizar o encaixe em linha reta que acaba de ser mencionado utilizando os valores de amostra já reconstruídos na subparte próxima da versão da foto 38. Após ter decodificado a inclinação e a interceptação para a subparte atual a partir da informação lateral 66 o previsor local 520 deriva a foto prevista global e localmente na subparte atual 56 pesando e transferindo as amostras colocalizadas dentro da subparte colocalizada da foto prevista globalmente 52 utilizando a inclinação previamente decodificado e a interceptação e o estágio de decodificação 504 está apto a reconstruir aquela subparte atual utilizando o residual de previsão correspondente derivada do fluxo de dados de melhoria e informação residual 68, respectivamente. Por essa medição, o previsor local 520 e o estágio de decodificação 504 pode operar alternadamente ao longo da ordem de varredura entre as subpartes mencionadas.

[000130] Conforme ainda descrito acima, o previsor global 518 pode ser configurado para suprimir a derivação e a aplicação da função de mapeamento por tom global 40 em resposta a uma sinalização na informação lateral 66, caracterizado pelo previsor local 520 poder ser configurado para, no caso da supressão, realizar a aplicação na primeira versão mapeada por tom 36 da foto ao invés da foto de referência prevista globalmente 52.

[000131] Apenas por uma questão de completude, é notado que todos os outros detalhes descritos com relação à lateral de codificação são de uma maneira correspondente, transferíveis ao exemplo de decodificação da Figura 5. Por exemplo, o segundo estágio de decodificação 504 pode ser configurado para decodificar por transformação o residual de previsão 68 entre a foto de referência prevista global e localmente e a versão da foto 38 a partir do fluxo de dados de melhoria e reconstruir a versão da foto 38 com base no residual de previsão 68 e a foto de referência prevista global e localmente como se somando-as.

[000132] Resumindo o exposto acima, o framework para a codificação eficiente de dados de vídeo de faixa dinâmica alta (HDR) foi apresentada por meio das aplicações acima. Visto que o esquema de união da ILP das aplicações acima é construído sobre a codificação do vídeo em extensão de escala de H.264/AVC, isso permite uma codificação compatível de trás pra frente. Ou seja, um vídeo de faixa dinâmica baixa (LDR) pode ser extraído, cortando partes desnecessárias a partir do fluxo de dados codificado. Um método para previsão eficiente entre camadas foi proposto para reduzir a redundância associada da transmissão de informação HDR e LDR. Isso compreende um espaço de HDR comum de transformação de cor e uma união de estratégia de previsão global e local bem como uma estimativa otimizada de taxa de distorção dos parâmetros de previsão e a codificação eficiente da informação lateral necessária. Os experimentos tem mostrado que as realizações apresentadas acima oferecem resultados superiores de codificação comparados às estratégias de previsão por estrutura global ou por bloco local, independentemente do mapeamento por tom operador. Além disso, comparados a uma transmissão independente de informação LDR e HDR, pode reduzir o fluxo de dados exigido em até 50% .

[000133] Em outras palavras, algumas das aplicações formadas acima, e algumas são programáveis como, uma previsão entre camadas para codificação de video de alta faixa dinâmica compativel de retrocesso com SVC. Em algumas aplicações, a estrutura de codificação video de faixa dinâmica alta compatível de trás pra frente foi com base em H.264/AVC. Isso permite extrair uma faixa dinâmica padrão baixa (LDR) bem como um vídeo de faixa dinâmica alta (HDR) a partir de um fluxo de dados comprimido. Um método de união global e previsão local entre camadas é proposto para reduzir a redundância entre as camadas LDR e HDR. É com base em um espaço de cor comum que pode representar dados de vídeo HDR perceptivamente sem perdas. Isso foi mostrado para como a previsão entre parâmetros de camadas pode ser estimada de uma maneira otimizada por taxa de distorção e eficientemente codificado para reduzir a informação lateral. As avaliações demonstraram que o framework se desempenha melhor, comparado ao estado da técnica para operadores arbitrários de mapeamento por tom. Com relação à transmissão simultânea, isso permite uma economia de fluxo de dados de até 50%.

[000134] Mesmo em outras palavras, as aplicações acima revelaram um esquema de codificação de vídeo de faixa dinâmica alta compatível de retrocesso que permite extrair uma faixa dinâmica baixa (LDR) padrão bem como um vídeo de faixa dinâmica alta (HDR) a partir de um fluxo de dados comprimido, onde um método de união global e previsão local entre camadas reduz a redundância entre as camadas de LDR e video HDR. Um espaço de cor comum é utilizado que representa dados de vídeo HDR perceptivamente sem perdas. Os parâmetros de previsão intercamadas podem ser estimados de uma maneira otimizada de taxa de distorção e eficientemente codificado para reduzir a informação lateral.

[000135] Codificação escalável por video HDR foi proposta, por exemplo, nas referências [2] - [6] , mas os seguintes aspectos do conceito de união da ILP descritos antes nas aplicações neste documento excedem o estado da técnica:

[000136] - Previsão intercamadas utilizando previsão global e local combinada

[000137] - Espaço de cor logLuv adaptativo para camada HDR (consulte nossa invenção 10F51658-IIS1)

[000138] - Método para determinar parâmetros ideais de taxa de distorção para previsão intercamadas

[000139] - Método para codificação eficiente de parâmetros para a previsão intercamadas o Parâmetros Globais: tabela de consulta codificada diferentemente por estrutura, por exemplo, transmitida no Estabelecer Parâmetro de Foto (infelizmente já mencionada em [4], mas pode ser a combinação entre parâmetros locais poderia ser uma reivindicação). o Parâmetros Locais: escala prevista a partir do macrobloco superior e esquerdo, deslocamento previsto a partir do macrobloco de camada de base superior e esquerdo e colocalizado (outros vizinhos locais são possíveis bem como, por exemplo, macroblocos superior-esquerdo e superior-direito além de, de qualquer forma, a reivindicação deve ser agnóstico de H.264 já que o mesmo principio se aplica às unidades de codificação ou unidades de transformação do próximo padrão de HEVC).

[000140] Implementação do programa de computador

[000141] Embora alguns aspectos tenham sido descritos no contexto de um aparelho, é óbvio que esses aspectos representam, ainda, uma descrição do método correspondente, onde um bloco ou dispositivo corresponde a uma etapa de método ou uma função de uma etapa de método. Analogamente, aspectos descritos no contexto de uma etapa de método representam ainda uma descrição de um bloco correspondente ou item ou função de um aparelho correspondente. Algumas ou todas as etapas de método podem ser executadas por (ou utilizando) um aparelho de hardware, como por exemplo, um microprocessador, um computador programável ou um circuito eletrônico. Em algumas aplicações, algumas ou mais de uma das etapas de método mais importantes podem ser executadas por esse tipo de aparelho.

[000142] Dependendo de certas exigências de implementação, aplicações da invenção podem ser implementadas em hardware ou em software. A implementação pode ser realizada utilizando um meio de armazenamento digital, por exemplo, um disquete, um DVD, um Blu- Ray, um CD, um ROM, um PROM, um EPROM, um EEPROM ou uma memória FLASH, com sinais de controle eletronicamente legiveis armazenados nele, que cooperam (ou são capazes de cooperar) com um sistema de computador programável de modo que o respectivo método seja realizado. Portanto, o meio de armazenamento digital pode ser um computador legivel.

[000143] Algumas aplicações de acordo com a invenção compreendem um portador de dados com sinais de controle legíveis eletronicamente, que são capazes de cooperar com um sistema de computador programável, de modo que um dos métodos descrito neste documento seja realizado.

[000144] Geralmente, aplicações da presente invenção podem ser implementadas como um produto de programa de computador com um código de programa, o código de programa sendo eficiente para realizar um dos métodos quando o produto de programa de computador é executado em um computador. O código de programa pode, por exemplo, ser armazenado em um portador de máquina legível.

[000145] Outras aplicações compreendem o programa de computador para realizar um dos métodos descritos neste documento, armazenado em um portador de máquina legível.

[000146] Em outras palavras, uma aplicação do método inventivo é, portanto, um programa de computador com um código de programa para realizar um dos métodos descritos neste documento, quando o programa de computador é executado em um computador.

[000147] Outra aplicação dos métodos inventivos é, assim, um portador de dados (ou um meio de armazenamento digital, ou um meio legível de computador} compreendendo, gravado ali, o programa de computador para realizar um dos métodos descritos neste documento. O portador de dados, o meio de armazenamento digital ou o meio gravado são normàlmente tangíveis e/ou não transitórios.

[000148] Outra aplicação do método inventivo é, portanto, um fluxo de dados ou uma sequência de sinais que representam o programa de computador para realizar um dos métodos descritos neste documento. 0 fluxo de dados ou a sequência dos sinais pode, por exemplo, ser configurado para ser transferido através de uma conexão de comunicação de dados, por exemplo, através da Internet.

[000149] Outra aplicação compreende um meio de processamento, por exemplo, um computador, ou um dispositivo lógico programável, configurado ou adaptado para realizar um dos métodos descrito neste documento.

[000150] Outra aplicação compreende um computador tendo instalado nele o programa de computador para realizar um dos métodos descritos neste documento.

[000151] Outra aplicação de acordo com a invenção compreende um aparelho ou um sistema configurado para transferir (por exemplo, eletronicamente ou opticamente) um programa de computador para realizar um dos métodos descritos neste documento a um receptor. O receptor pode, por exemplo, ser um computador, um dispositivo móvel, um dispositivo de memória ou semelhante. O aparelho ou sistema pode, por exemplo, compreender um servidor de arquivo para transferir o programa de computador ao receptor.

[000152] Em algumas aplicações, um dispositivo lógico programável (por exemplo, um arranjo de porta de campo programável) pode ser utilizado para realizar algumas ou todas as funcionalidades dos métodos descritos neste documento. Em algumas aplicações, um arranjo de porta de campo programável pode cooperar com um microprocessador para realizar um dos métodos descritos neste documento. Geralmente, os métodos são preferivelmente realizados em qualquer aparelho de hardware.

[000153] As aplicações descritas acima são meramente ilustrativas para os princípios da presente invenção. É entendido que as modificações e variações das disposições e os detalhes descritos neste documento serão evidentes aos outros especialista na técnica. É a intenção, assim, ser limitado apenas pelo escopo das reivindicações de patente iminentes e não pelos detalhes específicos apresentados em forma de descrição e explicação das aplicações neste documento.

[000154] REFERÊNCIAS

[000155] [1] E. Reinhard, G. Ward, S. N. Pattanaik, P. E. Debevec, W. Heidrich, and K. Myszkowski, High Dynamic Range Imaging - Acquisition, Display, and Image-Based Lighting (2. ed.). lem plus 0.5em minus 0.4em Academic Press, 2010.

[000156] [2] R. Mantiuk, A. Efremov, K. Myszkowski, and H.-P. Seidel, ''Backward compatible high dynamic range mpeg video compression,1' ACM Trans. Graph., vol. 25, pp. 713--723, July 2006.

[000157] [3] S. Liu, W.-S. Kim, and A. Vetro, "'Bit-depth scalable coding for high dynamic range video,'' in Proc. SPIE 6822, 682200 (2008), 2008.

[000158] [4] M. Winken, D. Marpe, H. Schwarz, and T. Wiegand, "'Bit-depth scalable video coding,'1 in Inti. Conf, on Image Proc. (ICIP), San Antonio, USA, Oct. 2007.

[000159] [5] A. Segall, "'Scalable coding of high dynamic range video,1' in Inti. Conf, on Image Proc. (ICIP), San Antonio, USA, Oct. 2007.

[000160] [6] Y. Gao, Y. Wu, and Y. Chen, ' "H.264/Advanced Video Coding (AVC) backward-compatible bit-depth scalable coding,'' IEEE Trans, on Circ. and Syst. for Video Techn., vol. 19, no. 4, pp. 500--510, Apr. 2009.

[000161] [7] J.-Ü. Garbas and H. Thoma, ''Temporally coherent luminance-to-luma mapping for high dynamic range video coding with H.264/AVC, " in Inti. Conf, on Acous., Speech and Signal Proc. (ICASSP), May 2011, pp. 829—832.

[000162] [8] G. W. Larson, ''The LogLuv encoding for full gamut, high dynamic range images,’’ Journal of Graph. Tools, vol. 3, no. 1, pp. 15—31, 1998.

[000163] [9] ITU-R rec. BT. 709, basic parameter values for the HDTV standard for the studio and for international programme exchange, Geneva, 1990.

[000164] [10] G. Krawczyk and R. Mantiuk, ''pfstmo tone mapping library,’’ http://pfstools.sourceforge.net/pfstmo.html =0pt

[000165] [11] 8. Steuerwald and A. Waggershauser, ''Sample panorama image: Florist Shop.’’ http://www.lizardq.com/cdn/sample_images/3-Florist-Shop.hdr =0pt

[000166] [12] G. Krawczy, ''HDR video environment maps samples,’’ http://www.mpi-inf.mpg.de/resources/hdr/video/ , Max- Planck Institute for Informatics.

[000167] [13] R. Mantiuk, S. Daly, K. Myszkowski, and H.- P. Seidel, ''Predicting visible differences in high dynamic range images - model and its calibration,’’ in Human Vision and Electronic Imaging X, Proc, of SPIE, vol. 5666, 2005, pp. 204 — 214.

[000168] [14] T. O. Aydn, R. Mantiuk, and H.-P. Seidel, ''Extending quality metrics to full dynamic range images,’’ in Human Vision and Electronic Imaging XIII, Proc, of SPIE, San Jose, USA, Jan. 2008, pp. 6806--6810.

[000169] [15] G. Bjantegaard, ''Calculation of average PSNR differences between RD-curves, 1 ’ in ITU-T SG 16 Q. 6 Video Coding Experts Group (VCEG), document VCEG-M33 , Austin, USA, Apr. 2001.

Claims

1. Um aparelho para realizar previsão inter- camada entre um primeiro estágio de codificação de foto (12) para codificar uma primeira versão mapeada por tom de uma foto, com uma primeira faixa de valor de amostra dinâmica, e um segundo estágio de codificação da foto (14) para codificar uma segunda versão da foto, com uma segunda faixa de valor de amostra dinâmica maior do que a primeira faixa de valor de amostra dinâmica, o aparelho compreendendo: um previsor global (26) configurado para acionar uma função de mapeamento por tom global (40) com base em uma análise estatística de pares de valores das amostras colocalizadas na primeira versão mapeada por tom (36) e na segunda versão (38) da foto, e aplicar a função de mapeamento por tom global (40) na primeira versão mapeada por tom (36) da foto para obter uma foto de referência prevista globalmente(52) para a segunda versão da foto; e um previsor local (28) configurado para derivar localmente uma função de mapeamento por tom variando localmente com base em uma análise estatística de valores de amostras colocalizadas na segunda versão (38) da foto e da foto de referência prevista globalmente (52) em unidades de subpartes nas quais a foto de referência prevista globalmente (52) e a segunda versão (38) da foto são divididas, e aplicam a função de mapeamento por tom variando localmente na foto de referência prevista globalmente (52) de modo a obter uma foto de referência prevista global e localmente (54) para a segunda versão (38) da foto, caracterizado pelo previsor local (28) é configurado para, na derivação local da função de mapeamento por tom variando localmente, para cada subparte, determinar uma inclinação (58) e uma interceptação (60) de uma linha de regressão (62) através de uma distribuição (64) de pares dos valores de amostras colocalizadas na respectiva subparte (56) da segunda versão (38) da foto e a foto de referência prevista globalmente(52), e codificar a inclinação e a interceptação determinados para as subpartes como informação lateral em um fluxo de dados de melhoria gerado pelo segundo estágio de codificação da foto, e formando uma camada de melhoria com relação a um fluxo de dados emitido pelo primeiro estágio de codificação de foto, e em que o segundo estágio de codificação da foto é configurado para codificar com perda um residual de previsão entre a foto de referência prevista global e localmente a segunda versão da foto em um fluxo de dados de melhoria, e o previsor local (28) é configurado para codificar a inclinação (58) determinada para a respectiva subparte (56) como um residual de previsão de uma previsão espacial da inclinação de uma subparte próxima da inclinação que foi previamente codificada, encaixar uma linha reta (72) com a inclinação da respectiva subparte (56), em uma distribuição de pares de valores de amostras colocalizadas na subparte próxima (70) da segunda versão da foto desde que reconstruída com base no residual de previsão e a foto de referência prevista global e localmente por um lado, e a foto de referência prevista globalmente por outro lado e determinar a interceptação da linha reta; e codificar a interceptação (60) da subparte respectiva (56) como um residual de previsão com relação a uma previsão espacial da interceptação dependendo da interceptação da linha reta (74).

2. Um aparelho de acordo com a reivindicação 1, caracterizado pelo previsor global (26) ser configurado para derivar a função de mapeamento por tom global (40) por, para cada um dos possíveis valores da primeira faixa de valor de amostra dinâmica (42), uma tendência central de uma distribuição dos valores das amostras na segunda versão (38) da foto, que são colocalizadas nas amostras na primeira versão mapeada por tom (36) da foto, o valor do qual iguala o valor possível respectivo.

3. Um aparelho de acordo com a reivindicação 2, caracterizado pelo previsor global ser configurado de modo que a tendência central seja um valor médio como um valor médio aritmético.

4. Um aparelho de acordo com qualquer uma das reivindicações de 1 a 3, caracterizado pelo previsor global ser configurado para, na derivação da função de mapeamento por tom global e aplicação da função de mapeamento por tom global na primeira versão mapeada por tom da foto, realizar uma conversão de cor nos valores das amostras na primeira versão mapeada por tom da foto de um primeiro formato de cor em um segundo formato de cor, a conversão de cor sendo constantemente definida independente da primeira versão mapeada por tom e da segunda versão da foto, e então realizar a derivação da função de mapeamento por tom global e a aplicação da função de mapeamento por tom global no segundo formato de cor.

5. Um aparelho de acordo com a reivindicação 4, caracterizado pelo previsor global (26) ser configurado de modo que o segundo formato de cor compreende um componente de luma que é logaritmicamente relacionado a uma luminância.

6. Um aparelho de acordo com qualquer uma das reivindicações anteriores, caracterizado pelo previsor global (26) ser configurado para codificar a função de mapeamento por tom global como informação lateral em um fluxo de dados de melhoria gerado pelo segundo estágio de codificação da foto (14), e formando uma camada de melhoria com relação a um fluxo de dados emitido pelo primeiro estágio de codificação da figura (12).

7. Um aparelho de acordo com a reivindicação 6, caracterizado pelo previsor global (26) ser configurado para codificar a função de mapeamento por tom global sequencialmente ao longo de uma direção de possíveis valores crescentes ou decrescentes da primeira faixa de valor de amostra dinâmica utilizando codificação diferencial.

8. Um aparelho de acordo com as reivindicações 1 a 7, caracterizado pelo previsor local (28) ser configurado para quantificar a inclinação (58) e a interceptação (60) reduzindo uma função de custo que depende da respectiva subparte (56) da segunda versão (38) da foto e da respectiva subparte (56) da foto de referência prevista globalmente(52) com suas amostras ponderadas pela inclinação (58) e alternadas pela interceptação (60).

9. Um aparelho de acordo com qualquer uma das reivindicações 1 a 8, caracterizado pelo previsor local (28) ser configurado para quantificar a inclinação (58) e a interceptação (60) reduzindo uma função de custo que aumenta de forma monotônica com uma taxa de dados necessária, e aumenta de forma monotônica com uma distorção causada, pelo segundo estágio de codificação da foto (14) para codificar um desvio entre a respectiva subparte (56) da segunda versão (38) da foto e a respectiva subparte (56) da foto de referência prevista globalmente(52) com suas amostras ponderadas pela inclinação (58) e mudada pela interceptação (60).

10. Um aparelho de acordo com qualquer uma das reivindicações anteriores, caracterizado pelo previsor global (26) ser configurado para suprimir a aplicação da função de mapeamento por tom global (40) no caso de uma dispersão dos pares dos valores das amostras colocalizadas na primeira versão mapeada por tom (36) da foto e a segunda versão (38) da foto ao redor da função de mapeamento por tom global (40) excedendo um limite predeterminado, em que o previsor local (28) é configurado para, no caso da supressão, realizar a derivação local e a aplicação na primeira versão mapeada por tom (36) da foto ao invés da foto de referência prevista globalmente (52).

11. Um aparelho de acordo com a reivindicação 10, caracterizado pelo previsor global (26) ser configurado para sinalizar a supressão da aplicação da função de mapeamento por tom global como a informação lateral dentro de um fluxo de dados de melhoria gerado pelo segundo estágio de codificação da foto, e formando uma camada de melhoria com relação a um fluxo de dados emitido pelo primeiro estágio de codificação da figura.

12. Um aparelho de acordo com qualquer uma das reivindicações 1 a 11, caracterizado pelas amostras na primeira versão mapeada por tom da foto ser números inteiros de comprimento de bit m e amostras da segunda versão da foto são de comprimento de bit n, com n>m.

13. Um aparelho de acordo com qualquer uma das reivindicações 1 a 12, caracterizado pela foto ser uma foto de um vídeo e o primeiro estágio de codificação da figura ser um codificador de vídeo híbrido configurado para codificar a versão mapeada por tom em um fluxo de dados.

14. Um aparelho de acordo com qualquer uma das reivindicações 1 a 13, caracterizado pelo segundo estágio de codificação ser configurado para codificar por transformação o residual de previsão entre a foto de referência prevista global e localmente a segunda versão da foto em um fluxo de dados de melhoria.

15. Um aparelho para realizar previsão intercamadas entre um primeiro estágio de decodificação de foto para decodificar uma primeira versão mapeada por tom (36) de uma foto, com uma primeira faixa de valor de amostra dinâmica, e um segundo estágio de decodificação de foto para decodificar uma segunda versão da foto, com uma segunda faixa de valor de amostra dinâmica maior do que a primeira faixa de valor de amostra dinâmica, o aparelho compreendendo: um previsor global (518) configurado para derivar uma função de mapeamento por tom global da informação lateral (41) de um fluxo de dados de melhoria do segundo estágio de decodificação de foto (504) e aplicar globalmente a função de mapeamento por tom global nas amostras da primeira versão mapeada por tom (36) da foto de modo a obter uma foto de referência prevista globalmente(52) para a segunda versão da foto; e um previsor local (520) configurado para derivar localmente uma função de mapeamento por tom variando localmente da informação lateral em unidades de subpartes nas quais a foto de referência prevista globalmente(52) e a segunda versão (38) da foto são divididas, e aplicar a função de mapeamento por tom variando localmente na foto de referência prevista globalmente(52) para obter uma foto de referência prevista global e localmente(54) para a segunda versão da foto; em que o previsor local (520) é configurado para, na derivação local da função de mapeamento por tom variando localmente, reconstruir, para cada subparte (56), uma inclinação (58) e uma interceptação (60) da informação lateral (66), e na aplicação da função de mapeamento por tom variando localmente na foto de referência prevista globalmente, pesar, para cada subparte (56), amostras da foto de referência prevista globalmente(52) na respectiva subparte (56) utilizando a inclinação e somando a interceptação ao mesmo, em que o previsor local (520) é configurado para derivar sequencialmente a inclinação e a interceptação para as subpartes da informação lateral pela decodificação da inclinação e da interceptação residual para as subpartes da informação lateral, previsão espacial da inclinação para uma subparte atual da inclinação de uma subparte próxima reconstruída previamente para obter uma previsão da inclinação; reconstruir a inclinação para a subparte atual com base na previsão da inclinação e na inclinação residual para a subparte atual; encaixar uma linha reta tendo a inclinação da subparte atual, em uma distribuição dos pares do valores das amostras colocalizadas na subparte próxima da segunda versão da foto e a foto de referência prevista globalmente e determinar a interceptação da linha reta para obter uma previsão da interceptação; e reconstruir a interceptação da subparte atual (56) com base na previsão da interceptação e da interceptação residual para a subparte atual (56).

16. Um aparelho de acordo com a reivindicação 15, caracterizado pelo previsor global (518) ser configurado para, na derivação da função de mapeamento por tom global e aplicação da função de mapeamento por tom global na primeira versão mapeada por tom (36) da foto, realizar uma conversão de cor nos valores das amostras na primeira versão mapeada por tom (36) da foto de um primeiro formato de cor em um segundo formato de cor, a conversão de cor sendo constantemente definida independente da primeira versão mapeada por tom (36) e da segunda versão (38) da foto, e então realizar a aplicação da função de mapeamento por tom global no segundo formato de cor.

17. Um aparelho de acordo com a reivindicação 16, caracterizado pelo previsor global ser configurado de modo que o segundo formato de cor compreende um componente de luma que é logaritmicamente relacionado a uma luminância.

18. Um aparelho de acordo com qualquer uma das reivindicações de 15 a 17, caracterizado pelo previsor global (518) ser configurado para decodificar a função de mapeamento por tom global da informação lateral sequencialmente ao longo de uma direção de possíveis valores crescentes ou decrescentes da primeira faixa de valor de amostra dinâmica utilizando decodificação do diferencial.

19. Um aparelho de acordo com qualquer uma das reivindicações de 15 a 18, caracterizado pelo previsor global (518) ser configurado para suprimir a derivação e a aplicação da função de mapeamento por tom global (40) receptivo a uma sinalização na informação lateral, em que o previsor local (520) é configurado para, no caso da supressão, realizar a aplicação na primeira versão mapeada por tom da foto ao invés da foto de referência prevista globalmente.

20. Um aparelho de acordo com qualquer uma das reivindicações de 15 a 19, caracterizado pelas amostras na primeira versão mapeada por tom da foto ser números inteiros de comprimento de bit m e amostras da segunda versão da foto são de comprimento de bit n, com n>m.

21. Um aparelho de acordo com qualquer uma das reivindicações de 15 a 20, caracterizado pela foto ser uma foto de um vídeo e o primeiro estágio de codificação da figura é um codificador de vídeo híbrido configurado para codificar a versão mapeada por tom em um fluxo de dados.

22. Um aparelho de acordo com qualquer uma das reivindicações de 15 a 21, caracterizado pelo segundo estágio de decodificação (504) ser configurado para decodificar por transformada um residual de previsão (68) entre a foto de referência prevista global e localmente e a segunda versão da foto do fluxo de dados de melhoria e reconstruir a segunda versão da foto com base no residual de previsão (68) e na foto de referência prevista global e localmente (54).

23. Um método para realizar a previsão intercamadas entre um primeiro estágio de codificação da figura (12) para codificar uma primeira versão mapeada por tom de uma foto, com uma primeira faixa de valor de amostra dinâmica, e um segundo estágio de codificação da foto (14) para codificar uma segunda versão da foto, com uma segunda faixa de valor de amostra dinâmica maior do que a primeira faixa de valor de amostra dinâmica, o método compreendendo: derivar uma função de mapeamento por tom global (40) com base em uma análise estatística de pares dos valores de amostras colocalizadas na primeira versão mapeada por tom (36) e na segunda versão (38) da foto; aplicar a função de mapeamento por tom global (40) na primeira versão mapeada por tom (36) da foto para obter uma foto de referência prevista globalmente (52) para a segunda versão da foto; derivar localmente uma função de mapeamento por tom variando localmente com base em uma análise estatística de valores de amostras colocalizadas na segunda versão (38) da foto e da foto de referência prevista globalmente (52) em unidades de subpartes nas quais a foto de referência prevista globalmente (52) e a segunda versão (38) da foto são divididas, e aplicar a função de mapeamento por tom variando localmente na foto de referência prevista globalmente (52) para obter uma foto de referência prevista global e localmente (54) para a segunda versão (38) da foto; em que a derivação local da função de mapeamento por tom variando localmente, compreende, para cada subparte, determinar uma inclinação (58) e uma interceptação (60) de uma linha de regressão (62) através de uma distribuição (64) dos pares do valores das amostras colocalizadas na respectiva subparte (56) da segunda versão (38) da foto e da foto de referência prevista globalmente (52), o método ainda compreendendo codificar a inclinação e a interceptação determinados para as subpartes como informação lateral em um fluxo de dados de melhoria gerado pelo segundo estágio de codificação da foto, e formar uma camada de melhoria com relação a um fluxo de dados emitido pelo primeiro estágio de codificação de foto, e em que o segundo estágio de codificação da foto compreende codificação sem perdas de um residual de previsão entre a foto de referência prevista global e localmente e a segunda versão da foto em um fluxo de dados de melhoria, e a codificação da inclinação e da interceptação compreende codificar a inclinação (58) determinado para a respectiva subparte (56) como um residual de previsão de uma previsão espacial da inclinação de uma subparte próxima a inclinação que foi previamente codificado, encaixar uma linha reta (72) tendo a inclinação da respectiva subparte (56), em uma distribuição dos pares do valores de amostras colocalizadas na subparte próxima (70) da segunda versão da foto desde que reconstruída com base no residual de previsão e a foto de referência prevista global e localmente por um lado e a foto de referência prevista globalmente por outro lado e determinar a interceptação da linha reta; e codificar a interceptação (60) da subparte respectiva (56) como um residual de previsão com relação a uma previsão da interceptação espacial dependendo da interceptação da linha reta (74).

24. Um método para realizar previsão intercamadas entre um primeiro estágio de decodificação de foto para decodificar uma primeira versão mapeada por tom (36) de uma foto, com uma primeira faixa de valor de amostra dinâmica, e um segundo estágio de decodificação de foto para decodificar uma segunda versão da foto, com uma segunda faixa de valor de amostra dinâmica maior do que a primeira faixa de valor de amostra dinâmica, o método compreendendo: derivar uma função de mapeamento por tom global da informação lateral (41) de um fluxo de dados de melhoria do segundo estágio de decodificação de foto (504); aplicar globalmente a função de mapeamento por tom global nas amostras da primeira versão mapeada por tom (36) da foto para obter uma foto de referência prevista globalmente (52) para a segunda versão da foto; derivar localmente uma função de mapeamento por tom variando localmente da informação lateral em unidades de subpartes nas quais a foto de referência prevista globalmente (52) e a segunda versão (38) da foto são divididas, e aplicar a função de mapeamento por tom variando localmente na foto de referência prevista globalmente (52) para obter uma foto de referência prevista global e localmente (54) para a segunda versão da foto, em que a derivação local da função de mapeamento por tom variando localmente compreende reconstruir, para cada subparte (56), uma inclinação (58) e uma interceptação (60) da informação lateral (66), e a aplicação da função de mapeamento por tom variando localmente na foto de referência prevista globalmente, compreende pesar para cada subparte (56), as amostras da foto de referência prevista globalmente (52) na respectiva subparte (56) utilizando a inclinação e somando a interceptação ao mesmo, em que o método compreende derivar sequencialmente a inclinação e a interceptação para as subpartes da informação lateral pela decodificação da inclinação e da interceptação residual para as subpartes da informação lateral, previsão espacial da inclinação para uma subparte atual da inclinação de uma subparte próxima previamente reconstruída para obter uma previsão da inclinação; reconstruir a inclinação para a subparte atual com base na previsão da inclinação e na inclinação residual para a subparte atual; encaixar uma linha reta tendo a inclinação da subparte atual, em uma distribuição dos pares do valores das amostras colocalizadas na subparte próxima da segunda versão da foto e a foto de referência prevista globalmente e determinar a interceptação da linha reta para obter uma previsão da interceptação; e reconstruir a interceptação da subparte atual (56) com base na previsão da interceptação e da interceptação residual para a subparte atual (56).

25. Um meio de armazenamento não transitório legível por máquina, caracterizado por ter nele armazenado um conjunto de instruções para efetuar o método descrito nas etapas da reivindicação 24.