BR122021007798B1

BR122021007798B1 - Codificador de áudio e decodificador de áudio

Info

Publication number: BR122021007798B1
Application number: BR122021007798-3A
Authority: BR
Inventors: Markus Multrus; Bernhard Grill; Guillaume Fuchs; Stefan Geyersberger; Nikolaus Rettelbach; Virgilio Bacigalupo
Original assignee: Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E. V.
Priority date: 2008-07-11
Filing date: 2009-05-18
Publication date: 2021-10-26
Also published as: RU2011102424A; US8930202B2; RU2487427C2; HK1253032A1; EP4369609A3; ES2651437T3; EP3300076A1; EP4376306A2; EP4369609A2; EP3573056A1; EP3300076B1; US20200294515A1; EP4224472A1; EP4224471A3; EP2301019A1; ZA201009258B; AU2009267543B2; EP4376307A2; PT3300076T; EP4376305A2

Abstract

um decodificador de áudio (110) para segmentos de codificação de coeficientes, os segmentos de coeficientes representando resoluções diferentes de tempo e frequência de um sinal de áudio amostrado, o codificador de áudio (100) compreendendo um processador (110) para derivar um contexto de codificação para o coeficiente codificado atual baseado em um coeficiente codificado anterior de um segmento anterior, o coeficiente previamente codificado representando uma diferente resolução de tempo ou frequência do que o coeficiente codificado atual. o codificador de áudio (100) compreende ainda um codificador de entropia (120) para codificação de entropia do atual coeficiente baseado no contexto de codificação para obter um fluxo de áudio codificado.

Description

ESPECIFICAÇÃO

[0001] A presente invenção está no campo de codificação de áudio, especialmente no campo de codificação de entropia baseada em contexto.

[0002] Os conceitos tradicionais de codificação de áudio incluem um esquema de codificação de entropia para redução de redundância. Tipicamente, a codificação de entropia é aplicada à coeficientes espectrais quantizados para esquemas de codificação baseados em domínio de frequência ou amostras de domínio de tempo quantizadas para esquemas de codificação baseados em domínio de tempo. Esses esquemas de codificação de entropia tipicamente fazem uso da transmissão de uma palavra-código em combinação com um índice de codebook de acordo, que permite a um decodificador procurar uma certa página do codebook para decodificar uma palavra de informação codificada correspondente a palavra-código transmitida em tal página. Em alguns conceitos de codificação, a transmissão do índice do codebook pode não ser obrigatória, por exemplo, para casos em que o índice do codebook pode ser determinado a partir do contexto e um símbolo, que é, por exemplo, codificado por entropia como descrito em Meine, Edler, “Improved Quantization and Lossless Coding for Subband Audio Coding” e Meine, “Vektorquantisierung und kontextabhãngige arithmetische Codierung für MPEG-4 AAC”, Dissertação, Gottfried Wilhelm Leibnitz Universitãt Hannover, Hanover 2007.

[0003] Para codificação de áudio baseada em domínio espectral ou de frequência, um contexto pode descrever símbolos ou propriedades estatísticas, como por exemplo, coeficientes espectrais quantizados, que são anteriores em tempo e/ou frequência. Em alguns dos conceitos convencionais, esses símbolos podem estar disponíveis em ambos, o lado do codificador e do decodificador, e baseado nesses símbolos, um codebook ou contexto pode ser determinado de forma síncrona no lado do decodificador e do codificador.

[0004] A Fig. 9 deve ilustrar um exemplo de um contexto e suas dependências. A Fig. 9 mostra um plano de frequência de tempo, no qual um número de símbolos é indicado. Símbolo Sn,m denota um símbolo no tempo n e frequência m. A Fig. 9 ilustra que para codificar um certo símbolo, seu contexto é usado para determinar o codebook associado. Por exemplo, para um símbolo Sn0,m0, seriam todos símbolos com

[0005] n < n0 e qualquer m, ou com n = n0 e m < m0.

[0006] Em implementações práticas, um contexto não é infinito, mas limitado. No exemplo descrito na Fig. 9, o contexto para o símbolo S0,3 poderia ser, por exemplo,

[0007] S0,2, S0,1, S-1,5, S-1,4, S-1,3, S-1,2, S-1,1, S-2,5, S-2,4, S-2,3, S-2,2, S-2,1.

[0008] Para codificação de áudio baseada em frequência, variante de tempo, bancos de filtros adaptativos de sinal ou os chamados de transformações de bloco podem ser usados, como por exemplo, descrito em Edler, B., “Codierung von Audiosignalen mit überlappender Transformation und adaptiven Fensterfunktionen”, Frequenz, Ausgabe 43, Setembro 1989.

[0009] Em outras palavras, mudanças de resolução de frequência/tempo podem ocorrer com o tempo dentro desses conceitos de codificação de áudio. Um conceito popular de codificação de áudio é o chamado de AAC (AAC = Codificação de Áudio Avançada), nesse caso dois comprimentos de bloco são usados, para quais são codificados por exemplo tanto coeficientes de transformada de 128 ou 1024 representando os componentes de frequência de amostras de domínio de tempo janeladas de 256 ou 2048, respectivamente.

[0010] Esses conceitos permitem uma comutação entre as resoluções diferentes, dependendo de certas características do sinal, como por exemplo ocorrência de transitórios ou tonalidade ou se o sinal lembra música ou fala, etc. No caso de comutação entre resoluções diferentes de tempo/frequência, como por exemplo entre tipos de diferentes de bloco AAC, o contexto não é consistente. Os conceitos convencionais ou implementações no estado da arte podem utilizar redefinição de contexto, ou seja, é basicamente alternado para um estado, no qual nenhum contexto está disponível, no qual o contexto é construído desde o começo. Essa abordagem pode funcionar de forma suficientemente bem, por exemplo em AAC, já que garante ao menos dois longos blocos ou oito blocos curtos em sequência, onde pode presumir-se que comutação raramente ocorre.

[0011] Contudo, conceitos convencionais redefinindo o contexto são em geral sub-adequados em termos da eficiência da codificação, já que cada vez que o contexto é redefinido, a seleção do codebook subsequente é baseado nos valores, que são planejados como soluções de recuo para contexto desconhecido. Geralmente, codebooks sub-adequados são, então, selecionados. O recuo na eficiência de codificação pode ser ínfima para casos que comutação ocorre raramente. Para um cenário, contudo, com mais comutação frequente, isso leva a uma perda significativa da eficiência de codificação. De um lado, uma comutação mais frequente é fortemente desejada para taxas mais baixas de dados/taxas de amostragem, já que especialmente aqui, uma adaptação adequada do comprimento da transformada para a característica do sinal é desejada. Do outro lado, a eficiência de codificação diminui significativamente quando a comutação ocorre frequentemente.

[0012] É objeto da presente invenção fornecer um conceito para comutação entre comprimentos diferentes de transformada na codificação de áudio fornecendo uma eficiência aprimorada de codificação.

[0013] O objeto é alcançado por um codificador de áudio de acordo com a reivindicação 1, um método para codificação de áudio de acordo com a reivindicação 8, um decodificador de áudio para reivindicação 9, e um método para decodificação de áudio de acordo com reivindicação 16.

[0014] A presente invenção é baseada na descoberta que em codificação baseada em contexto como, por exemplo, codificação de entropia baseada em contexto, que pode ser aplicada à resoluções diferentes de tempo/frequência, um mecanismo de mapeamento de contexto pode ser usado, no caso de mudança com o tempo da resolução de tempo/frequência, com isso alcançando uma eficiência melhorada de codificação. É uma descoberta da presente invenção que quando a comutação entre resoluções diferentes de frequência ou tempo, contextos para coeficientes tendo que as novas resoluções podem ser derivadas de coeficientes tendo as velhas resoluções. É uma descoberta da presente invenção que, por exemplo, interpolação, extrapolação, sub-amostragem, downsampling, upsampling, etc, podem ser usados para adaptação de contexto e/ou derivação quando acontece a comutação de resoluções de tempo/frequência na codificação de áudio.

[0015] As materializações da presente invenção fornecem um método de mapeamento, que mapeia a frequência ou coeficientes espectrais de um contexto armazenado, que se refere a uma resolução velha, para a resolução de frequência de um contexto atual ou uma estrutura atual. Em outras palavras, as informações de contexto anterior podem ser utilizadas para determinação do codebook, ou seja, para obter informações sobre novo contexto. Materializações podem com isso permitir uma troca mais frequente do comprimento do bloco e, portanto, uma melhor adaptação às características do sinal sem perder a eficiência de codificação.

[0016] Manifestações da presente invenção serão detalhadas com as figuras de acompanhamento, em que

[0017] Fig. 1 Mostra um materialização de um codificador de áudio;

[0018] Fig. 2 Mostra um materialização de um decodificadorde áudio;

[0019] Fig. 3 Mostra uma materialização para um upsamplingde contexto

[0020] Fig. 4 Mostra uma materialização para um downsampling de contexto;

[0021] Fig. 5 Ilustra resoluções de tempo e frequência da comutação de áudio;

[0022] Fig. 6 Ilustra uma implementação de uma materialização;

[0023] Fig. 7a Mostra um fluxograma de uma materialização de um método para codificação;

[0024] Fig. 7b Ilustra o procedimento de atualização docontexto geral de uma materialização;

[0025] Fig. 7c Ilustra o procedimento de atualização docontexto de uma materialização para mudanças de resolução;

[0026] Fig. 8 Mostra um fluxograma de uma materialização deum método para codificação; e

[0027] Fig. 9 Mostra um esquema de codificação de tempofrequência do estado da arte.

[0028] A Fig. 1 mostra uma materialização de um codificador de áudio 100 para os segmentos de codificação de coeficientes, os segmentos de coeficientes representando diferentes resoluções de tempo ou frequência de um sinal de áudio amostrado. O codificador de áudio 100 dispõe de um processador 110 para obter um contexto de codificação para um coeficiente codificado de um segmento atual com base em um coeficiente previamente codificado de um segmento anterior, o coeficiente previamente codificado representando uma diferente resolução de tempo ou frequência do que o coeficiente codificado atual. A materialização do codificador de áudio inclui ainda um codificador de entropia 120 para codificação de entropia do atual coeficiente baseado no contexto de codificação para obter um fluxo de áudio codificado.

[0029] Em materializações, os coeficientes podem corresponder às amostras de áudio, amostras quantizadas de áudio, coeficientes espectrais ou de frequência, coeficientes escalonados, coeficientes filtrados ou transformados etc. ou qualquer combinação destes.

[0030] Em materializações, o codificador de áudio 100 pode ainda compreender um meio para fornecer os segmentos dos coeficientes de um fluxo de áudio, os coeficientes formando uma representação espectral de um sinal de áudio em uma resolução espectral variando entre os coeficientes. Os meios de fornecer os segmentos podem ser adaptados para determinar os segmentos baseados em comprimentos de janelas diferentes de domínio de tempo ou estruturas diferentes de áudio, ou seja, estruturas de áudio tendo diferentes tamanhos ou números diferentes de coeficientes por largura de banda, ou seja, uma resolução espectral ou de frequência diferente. Os meios para fornecer podem ser adaptados para determinar segmentos de tempo 1024 e 128, coeficientes espectrais, de frequência e tempo.

[0031] O processador 110 pode, em materializações, ser adaptado para derivar o contexto de codificação baseado nas representações do domínio espectral ou de frequência dos coeficientes e segmentos atuais e anteriores. Em outras palavras, em materializações os segmentos sucessivos podem ser representados em tempo e/ou frequência diferente ou domínios espectrais. O processador 110 pode ser adaptado para derivar o contexto de codificação por frequência ou faixa espectral do segmento atual, por exemplo baseado em coeficientes espectrais vizinhos de segmentos anteriores e/ou segmento atual. Em materializações, os segmentos podem ser determinados inicialmente no domínio de tempo, por exemplo, através do janelamento do fluxo de áudio. Baseado nesses segmentos ou coeficientes de domínio de tempo segmentos ou coeficientes de domínio espectral pode ser determinado por meio de transformação. Os segmentos podem ser representados no domínio espectral ou de frequência nos termo de energia, uma amplitude e fase, uma amplitude e sinal, etc. Por frequência ou faixa espectral, ou seja, os segmentos podem ser subdivididos em diferentes faixas espectrais ou de frequência. O processador 110 pode então derivar contextos de código por frequência ou faixa espectral em algumas materializações.

[0032] O processador 110 e o codificador de entropia 120 podem ser configurados para operar baseados em um downsampling de frequência ou coeficientes espectrais de um segmento anterior quando o segmento anterior pertencendo ao contexto compreende uma melhor resolução espectral ou de frequência do que o segmento atual. Em materializações, o processador 110 e o codificador de entropia 120 podem ser configurados para operar baseados em um upsampling de frequência ou coeficientes espectrais de um segmento anterior quando o segmento anterior pertencendo ao contexto compreende uma melhor resolução espectral ou de frequência do que o segmento atual.

[0033] Materializações podem fornecer um método para codificação de segmentos de coeficientes representando diferentes resoluções de tempo ou frequência de um sinal de áudio amostrado. O método pode compreender uma etapa de derivação de um contexto de codificação para um coeficiente atual ou atualmente codificado de um segmento atual baseado em um coeficiente anterior ou anteriormente codificado de um segmento anterior e opcionalmente também está baseado no coeficiente atual ou atualmente codificado, onde o coeficiente anterior ou anteriormente codificado representa uma resolução diferente do que o coeficiente atual ou atualmente codificado. O método pode ainda compreender uma etapa da codificação de entropia de um coeficiente atual baseado no contexto de codificação para obter um fluxo de áudio codificado.

[0034] De forma correspondente, as materializações podem compreender um decodificador de áudio 200 do qual uma materialização é descrita na Fig. 2. O decodificador de áudio 200 é adaptado para decodificação de um fluxo de áudio codificado para obter segmentos de coeficientes representando resoluções diferentes de tempo ou frequência de um sinal de áudio amostrado, o decodificador de áudio 200 compreende um processador 210 para derivar um contexto de codificação para um coeficiente atual ou atualmente decodificado baseado em um coeficiente atual ou atualmente decodificado, o coeficiente anterior ou anteriormente decodificado representando uma resolução diferente de tempo e frequência do que o coeficiente atualmente decodificado. Além do mais, o decodificador de áudio 200 compreende de um de codificador de áudio 220 para decodificação de entropia do atual coeficiente baseado no contexto de codificação e no fluxo de áudio codificado.

[0035] Em materializações, o decodificador de áudio 200 compreende um decodificador de entropia 220, que é adaptado para determinar os segmentos dos coeficientes decodificados baseados em comprimentos diferentes de janela de domínio de tempo ou comprimentos diferentes de estrutura de áudio. O decodificador de entropia 220 pode ser adaptado para determinar segmentos de, por exemplo, 1024 e 128, amostras de domínio de tempo ou frequência ou coeficientes espectrais. De forma correspondente, o processador 210 pode ser adaptado para derivar o contexto de codificação baseado em uma representação de domínio espectral ou de frequência de coeficientes de segmentos anteriores e/ou o segmento atual.

[0036] Em materializações, o processador 210 pode ser adaptado para derivar o contexto de codificação por frequência ou faixa espectral do segmento atual, por exemplo baseado em coeficientes espectrais vizinhos de segmento anterior e de forma opcional do segmento atual. Em outras palavras, os segmentos podem ser processados no domínio de frequência ou espectral, que pode ser executado por faixa de frequências ou espectral. De forma correspondente, o processador 210 pode, então, ser adaptado para derivar um contexto específico de faixa espectral ou de frequência.

[0037] O decodificador de entropia 200 pode ser adaptado para decodificação de entropia do coeficiente atual baseado em uma entropia ou regra de codificação de comprimento variável.

[0038] O processador 210 pode ser adaptado para derivar o contexto de codificação baseado em um downsampling de frequência ou coeficientes espectrais de um segmento anterior quando o segmento anterior compreende mais coeficientes por largura de banda (ou seja, uma resolução de frequência ou espectral melhor ajustada) do que o segmento atual. Em outras materializações, o processador 210 e o codificador de entropia 220 podem ser configurados para operar baseados em um upsampling de coeficientes espectrais de um segmento anterior, quando o segmento anterior compreender menos coeficientes por largura de banda (ou seja, uma resolução de frequência ou espectral grosseira) do que o segmento atual.

[0039] Consequentemente, materializações podem fornecer um método para decodificar um fluxo de áudio codificado para obter segmentos de coeficientes representando amostras de áudio decodificadas. O método para decodificação pode compreender uma etapa de derivar um contexto de codificação para um coeficiente atual ou atualmente decodificado de um segmento atual baseado em um coeficiente anterior ou anteriormente decodificado, o coeficiente anterior ou anteriormente codificado representando uma resolução diferente de frequência ou tempo do que o coeficiente decodificado atual. Além do mais, o método pode compreender uma etapa de decodificação de entropia do coeficiente atual baseado no contexto de decodificação e o fluxo de áudio codificado. De forma opcional, o método pode compreender uma etapa para determinar os segmentos de coeficientes de áudio codificado do fluxo de áudio codificado, os segmentos representando números diferentes de coeficientes de áudio.

[0040] A Fig. 3 ilustra como um processador 110;210 pode derivar um contexto de codificação para o segmento atual de coeficientes Mc,new baseados em um segmento anterior de coeficientes Mc,old, onde o segmento anterior compreende um número diferente de coeficientes de áudio do que o segmento atual. Na materialização descrita na Fig. 3, o número de coeficientes do segmento M determina a resolução espectral ou de frequência do segmento. A materialização pode compreender um método de mapeamento, que mapeia os coeficientes Mc,old de um segmento anterior para coeficientes Mc,new tendo a mesma resolução espectral ou de frequência do contexto como segmento atual. Fig. 3 mostra dois conjuntos de coeficientes dentro de dois segmentos, ou seja o segmento anterior original 310 representando coeficientes Mc,old, Sn,0, Sn,1, Sn,2, etc., e de forma correspondente, o segmento anterior mapeado 320, que tem maior resolução, ou seja, Mc,new é maior do que Mc,old, representando coeficientes Mc,new, Sn,0, Sn,1, Sn,2, Sn,3, etc.

[0041] De forma geral, duas materializações podem ser distinguidas, dependendo se a resolução do contexto do segmento atual é maior ou menor que a resolução do contexto do segmento anterior. Fig. 3 ilustra uma materialização, na qual a resolução do segmento anterior dos coeficientes Mc,old é menor do que a resolução do segmento atual dos coeficientes Mc,new. Fig. 3 mostra os coeficientes do segmento anterior 310 e os símbolos para o segmento anterior mapeado 320. Da Fig. 3 pode ser visto que a resolução do segmento atual dos coeficientes Mc,new é maior que a resolução do segmento anterior 310 tendo apenas coeficientes Mc,old. Em uma materialização o segmento anterior 310 é aumentada a amostra para o segmento 320 de coeficientes Mc,new para combinar a resolução espectral ou de frequência do segmento atual. Isso pode incluir upsampling puro com duplicação de símbolo e mecanismos de decimação como por exemplo, repetir cada valor Mc,new vezes antes de decimar o segmento com amostra aumentada resultante mantendo apenas 1 coeficiente a cada Mc,old. Outros mecanismos de interpolação e extrapolação também podem ser usados.

[0042] Em materializações, o mapeamento pode ser realizado para todos os segmentos anteriores 310, que são necessários para determinar os contextos para o segmento atual, por exemplo, no tempo n, ou seja, vários segmentos anteriores podem ser levados em conta, ou seja, segmentos anteriores nos tempos n-1, n-2, etc. Em geral, as materializações podem levar em conta múltiplos períodos de tempo ou segmentos anterior, o número de slots de tempo necessários para definir um contexto completo pode ser diferente para implementações ou materializações diferentes.

[0043] A Fig. 4 ilustra uma outra materialização, em que os coeficientes de um segmento anterior 410 têm as amostras diminuídas para um segmento 420 usado para computar os contextos do segmento atual, ou seja, no qual o número de coeficientes Mc,old do segmento anterior 410 é maior que o número de coeficientes Mc.new do segmento atual. A Fig. 4 usa uma ilustração semelhante à figura 3, de acordo coeficientes múltiplos são mostrados em cada segmento 410 e 420. Como ilustrado na figura. 4, Mc.old é maior que Mc.new. Portanto os coeficientes Mc,old são diminuídos as amostras, para corresponder à resolução espectral ou de frequência do segmento atual de coeficientes Mc,new, ou seja, em materializações, segmentos anteriores com maior resolução podem ser sub-amostrados para corresponder à resolução do segmento atual com uma resolução mais baixa. Em materializações, podem incluir downsampling puro com duplicação de coeficiente e mecanismos de decimação como, por exemplo, repetir cada valor Mc,new vezes antes de decimar o segmento com aumento de amostra resultante mantendo apenas 1 coeficiente a cada Mc,old. Em outras materializações, as operações do filtro, como por exemplo média de dois ou vários valores adjacentes podem ser levadas em consideração.

[0044] A Fig. 5 ilustra uma outra materialização, em que a comutação entre diferentes resoluções é realizada. A Fig. 5 mostra um plano de tempo/frequência, em que três segmentos subsequentes dos coeficientes de áudio são mostrados, ou seja, 510, 520 e 530. Cada um dos segmentos 510, 520 e 530 corresponde a um único conjunto de coeficientes. Na materialização ilustrada na fig. 5, presume-se que o segundo segmento 520 é duas vezes mais longo que o primeiro e terceiro segmentos 510 e 530. Isto pode ser obtido através de diferentes janelas quando ocorrer segmentação no domínio do tempo, como por exemplo, feito em AAC. Na materialização na fig. 5, presume-se que a taxa de amostragem se mantém constante, em outras palavras, o segundo maior segmento 520 compreende duas vezes mais coeficientes por largura de banda do que o primeiro ou terceiro segmento 510 ou 530.

[0045] A Fig. 5 mostra que, neste caso, a resolução nas escalas de domínio espectral ou de frequência com a extensão do segmento no domínio de tempo. Em outras palavras, quanto menor a janela no domínio de tempo, mais baixo a resolução no domínio de frequência ou espectral. Ao avaliar os contextos de codificação de amostras no domínio de frequência ou espectral, a Fig. 5 mostra que as necessidades de codificação para ter uma versão de alta resolução do segmento 510 quando ocorrer a codificação do segundo segmento 520, como no exemplo considerado, uma resolução dupla do segmento 510 tem de ser derivada. Em outras materializações, especialmente quando se utiliza outras transformações tempo- frequência ou bancos de filtro, outras relações entre resoluções do domínio de tempo e domínio de frequência podem acontecer.

[0046] De acordo com uma materialização, os coeficientes codificados durante o primeiro segmento 510 fornecem uma base para determinar o contexto para o segundo segmento 520, por exemplo, por meio de um upsampling intermediário. Em outras palavras, o conteúdo do contexto proveniente do primeiro segmento 510 pode ser obtido por um up-sampling do primeiro segmento 510, por exemplo, em termos de interpolação ou extrapolação, a fim de obter o contexto para o segundo segmento 520, tendo uma resolução maior.

[0047] Como mostrado na figura. 5, quando comuta-se do segundo segmento 520 para o terceiro segmento 530, o elemento constitutivo do contexto tem que mudar também, pois a resolução já diminuiu. De acordo com uma materialização, os coeficientes codificados durante o segundo segmento 520 podem ser usados a fim de obter o contexto para o terceiro segmento, por meio de um downsampling intermediário. Isto pode ser realizado, por exemplo, em termos de média ou simplesmente usando apenas o cada segundo valor ou outras medidas para downsampling.

[0048] Manifestações alcançam a vantagem de uma eficiência aumentada de codificação, levando em conta o contexto passado proveniente de segmentos anteriores, mesmo quando mudanças na resolução ou comprimento da janela ocorreram. Elementos constitutivos de contexto podem ser adaptados para novas resoluções, em termos de upsampling e downsampling, por exemplo, com interpolação e extrapolação, filtragem ou média, etc.

[0049] A seguir uma materialização mais específica será apresentada em termos de codificação sem ruído espectral. A codificação espectral silenciosa pode ser usada para reduzir ainda mais a redundância de um espectro quantizado na codificação de áudio. Codificação espectral silenciosa pode ser baseada em uma codificação aritmética em conjunto com uma adaptação de contexto de forma dinâmica.A codificação silenciosa pode ser baseada em valores espectrais quantizados e podem usar tabelas de frequência cumulativa dependentes de contexto resultantes de, quatro tuplas vizinhas previamente codificadas. A Fig. 6 ilustra outra materialização. A Fig. 6 mostra um plano de frequência de tempo, onde ao longo do eixo de tempo três horários são indexados N, N-1 e n-2. Além disso, a Fig. 6 ilustra quatro bandas espectrais ou de frequência que são rotuladas por m-2, m-1, m e m +1. A Fig. 6 mostra dentro de caixa de slot de tempo-frequência, que representam tuplas de amostras a serem codificadas ou decodificadas. Três tipos diferentes de tuplas são ilustradas na fig. 6, em que as caixas com uma borda tracejada ou pontilhada indicam tuplas restantes a serem codificadas ou decodificadas, caixas brancas com uma borda sólida indicam codificação ou decodificação prévia e caixas cinzas com uma borda sólida indicam tuplas previamente decodificadas, que são usadas para determinar o contexto para a tupla atual a ser codificada ou decodificada.

[0050] Observe que os segmentos atuais e anteriores referidos nas materializações descritas acima podem corresponder a uma tupla na presente materialização, em outras palavras, os segmentos podem ser processados na forma de banda no domínio espectral ou de frequência. Como ilustrado na Fig. 6, tuplas ou segmentos na vizinhança da tupla atual (ou seja, no domínio espectral, de tempo ou de frequência) podem ser levadas em consideração para resultar em contexto. Tabelas de frequência cumulativa podem então serem usadas pelo codificador aritmético para gerar um código binário de comprimento variável. O codificador aritmético pode produzir um código binário para um dado conjunto de símbolos e suas respectivas probabilidades. O código binário pode ser gerado mapeando um intervalo de probabilidade, onde o conjunto de símbolos está, para uma palavra-código. O codificador aritmético pode corresponder a um codificador de entropia 120, respectivamente o codificador de entropia 220 nas materializações mencionadas acima.

[0051] Na presente materialização, codificação aritmética baseada em contexto pode ser realizada com base em 4 tuplas (ou seja, em quatro índices de coeficiente espectral, os quais são também rotulados como q(n,m), representando os coeficientes espectrais após quantização, os quais são vizinhos no domínio espectral ou de frequência e qual está codificado por entropia em uma etapa. De acordo com a descrição acima, codificação pode ser realizada baseando-se no contexto de codificação. Como indicado na Fig. 6, de forma adicional para as 4 tuplas, que é codificado (ou seja, o segmento atual) quatro 4 tuplas codificadas previamente são levadas em consideração para derivar o contexto. Essas 4 tuplas determinam o contexto e são prévias na frequência e/ou prévias no domínio de tempo.

[0052] A Fig. 7a mostra um fluxograma de uma USAC (USAC = Codificador de Áudio E Fala Universal) codificador aritmético dependente de contexto para o esquema de codificação para o esquema de codificação dos coeficientes espectrais. O processo de codificação depende das 4 tuplas atuais mais o contexto, onde o contexto é usado para selecionar a distribuição de probabilidades do codificador aritmético e para predizer a amplitude dos coeficientes espectrais. Na Fig. 7a a caixa 705 representa determinação de contexto, que é baseada em t0, t1, t2 e t3 correspondendo a q(n-1, m), q(n, m-1), q (n-1, m-1) e q (n-1, m+1), que são as caixas cinzas com bordas sólidas na Fig. 6.

[0053] Geralmente, em materializações, o codificador de entropia pode ser adaptado para codificar o segmento atual nas unidades de 4 tuplas de coeficientes espectrais e para predizer um alcance de amplitude de 4 tuplas baseadas no contexto de codificação.

[0054] Na presente materialização o esquema de codificação compreende vários estágios. Primeiro, a palavra-código literal é codificada usando um codificador aritmético e uma distribuição específica de probabilidade. A palavra-código representa quatro coeficientes espectrais vizinhos (a,b,c,d), contudo, cada a,b,c,d é limitado no alcance:

[0055] -5 < a,b,c,d < 4 .

[0056] Geralmente, em materializações, o codificador de entropia 120 pode ser adaptada para dividir as 4 tuplas por um fator pré-determinado sempre que necessário para caber o resultado da divisão no alcance predito ou em um alcance pré-determinado e para codificar um número de divisões necessárias, um lembrete de divisão e o resultado da divisão quando as 4 tuplas não está no alcance predito, e para codificação de um lembrete de divisão e o resultado da divisão de outra forma.

[0057] A seguir, se o termo (a,b,c,d), ou seja qualquer coeficiente a, b, c, d, exceder o dado alcance nessa materialização, isso pode em geral ser considerado por divisão (a,b,c,d) geralmente pelo fator (por exemplo, 2 ou 4) como for necessário, para encaixar o a palavra-código resultante no dado alcance. A divisão pelo fator de 2 corresponde a uma mudança binária para o lado direito, ou seja (a,b,c,d)>> 1. Essa diminuição é feita em uma representação integral, ou seja as informações podem ser perdidas. Os bits menos significantes, que podem se perder na troca para a direita, são armazenados e mais tarde codificados usando um codificador aritmético e uma distribuição de probabilidade uniforme. O processo de troca para a direita é realizado para todos os quatro coeficientes espectrais (a,b,c,d).

[0058] Em materializações gerais, o codificador de entropia 120 pode ser adaptado para codificação do resultado da divisão ou as 4 tuplas usando um índice de grupo ng, o índice de grupo ng referindo-se a um grupo de um ou mais palavras-códigos para quais uma distribuição de probabilidade está baseado no contexto de codificação, e um índice de elemento ne no caso do grupo compreender mais de uma palavra- código, o índice de elemento ne referindo-se a palavra-código dentro do grupo e o índice de elemento pode ser presumido de forma uniformemente distribuída, e para codificação o número de divisões pelo número de símbolos de fuga, um símbolo de fuga sendo um índice de grupo específico ng apenas usado para indicar a divisão e para codificação dos restantes das divisões baseadas na distribuição uniforme usando uma regra de codificação aritmética. O codificador de entropia 120 pode ser adaptado para uma codificação de uma sequência de símbolos no fluxo de áudio codificado usando um alfabeto de símbolos compreendendo o símbolo de fuga, e símbolo de grupo correspondentes ao conjunto de índices de grupo disponíveis, um alfabeto de símbolo compreendendo os índices de elemento correspondentes, e um alfabeto de símbolo compreendendo os valores diferentes dos restantes.

[0059] Na materialização da Fig. 7a, a distribuição de probabilidade para codificação de palavra-código literal e também uma estimativa do número de estágios da redução de alcance pode ser derivada de um contexto. Por exemplo, todas as palavras- código, em um total de 84 = 4096, aparecem um total de 544 grupos, que consistem de um ou mais elementos. A palavra-código pode ser representada em um fluxo de bits enquanto o índice de grupo ng e o elemento de grupo ne. Ambos os valores podem ser codificados usando um codificador aritmético, usando certas distribuições de probabilidade. Em uma materialização, a distribuição de probabilidade para ng pode ser obtida do contexto, considerando a distribuição de probabilidade para ne pode ser presumido ser uniforme. Uma combinação de ng e ne pode identificar de forma ambígua uma palavra-código. O restante da divisão, ou seja os planos de bit alternados, podem ser presumido como uniformemente distribuído.

[0060] Na Fig. 7a, na etapa 710, as 4 tuplas q(n,m), que são (a,b,c,d) ou o segmento atual é fornecido e um parâmetro lev é iniciado definindo para 0.

[0061] Na etapa 715 do contexto, o alcance de (a,b,c,d) está estimado. De acordo com essa estimativa, (a,b,c,d) pode ser reduzido por lev0 níveis, ou seja dividido por um fator de 2lev0. Os planos de bit menos significantes de lev0 são armazenados para uso posterior na etapa 750.

[0062] Na etapa 720 é verificado se (a, b, c, d) excede o alcance determinada e em caso afirmativo, o intervalo de (a, b, c, d) é reduzido por um fator de 4 na etapa 725. Em outras palavras, na etapa 725 (a, b, c, d) são modificadas por 2 para a direita e os planos de bit removidos são armazenados para posterior utilização na etapa 750.

[0063] Para indicar esta etapa de redução, ng está definido para 544 na etapa 730, ou seja ng = 544 serve como uma palavra- código de fuga. Esta palavra-código é, então, escrito ao fluxo de bits na etapa 755, onde para derivar a palavra-código na etapa 730 um codificador aritmético com uma distribuição de probabilidade derivada a partir do contexto é usado. Caso essa etapa de redução seja aplicado a primeira vez, ou seja se lev==lev0, o contexto é ligeiramente adaptado. Caso a etapa de redução seja aplicado mais de uma vez, o contexto é descartado e uma distribuição padrão é usada adiante. O processo então continua com etapa 720.

[0064] Se na etapa 720 uma combinação para o intervalo for detectada, mais especificamente, se (a, b, c, d) correspondem à condição de alcance, o (a, b, c, d) é mapeado para um grupo ng, e, se aplicável, o índice de elemento de grupo ne. Esse mapeamento não é ambíguo, isto é, (a,b,c,d) pode ser obtido do ng e ne. O índice do grupo ng é então codificado pelo codificador aritmético, utilizando uma distribuição de probabilidades utilizada para o contexto adaptado/descartado na etapa 735. O índice do grupo ng é então inserido no fluxo de bits na etapa 755. Em uma etapa seguinte 740, é verificado que se o número de elementos do grupo é maior que 1. Se necessário, isto é, se os grupos indexados por ng consistem em mais de um elemento, o índice de elemento de grupo ne é codificado pelo codificador aritmético na etapa 745, assumindo uma distribuição uniforme na presente materialização.

[0065] Seguindo a etapa 745, o índice de grupo de elemento ne é inserido no fluxo de bits na etapa 755. Finalmente, na etapa 750, todos os planos de bit são codificados usando codificador aritmético, assumindo uma distribuição uniforme de probabilidade. Os planos de bit codificados armazenados são então inseridos no fluxo de bits na etapa 755.

[0066] Em materializações, o codificador de entropia 220 pode ser adaptado para decodificação de um índice do grupo ng do fluxo de áudio codificado com base em uma distribuição de probabilidade derivada a partir do contexto de codificação, onde o índice do grupo ng representa um grupo de uma ou mais palavras-código, e, com base em uma distribuição de probabilidade uniforme, para decodificar um índice do elemento ne do fluxo de áudio codificado se o índice do grupo ng indica um grupo composto por mais de uma palavra-código, e definir 4 tuplas de coeficientes espectrais do segmento atual com base no índice do grupo ng e o índice do elemento ne, obtendo assim a representação do domínio espectral nas tuplas de coeficientes espectrais.

[0067] O decodificador de áudio 220 pode ser adaptado para decodificação de uma sequência de símbolos do fluxo de áudio codificado com base em uma distribuição de probabilidade derivada a partir do contexto de codificação usando um alfabeto de símbolo compreendendo um símbolo de fuga e símbolos de grupo correspondentes a um conjunto de índices disponíveis de grupo ng, para obter quatro tuplas preliminares de coeficientes espectrais baseados em um índice disponível de grupo ng para qual um símbolo de grupo da sequência de símbolos correspondentes, e baseado no índice de elemento ne, e para multiplicar as 4 tuplas preliminares com o fator dependendo do número de símbolos de fuga na sequência dos símbolos para obter a tupla dos coeficientes espectrais.

[0068] O decodificador de áudio 220 pode ser adaptado para decodificação de restante de divisão do fluxo de áudio codificado baseado em uma distribuição de probabilidade uniforme usando uma regra de codificação aritmética e para adição do restante às 4 tuplas preliminares multiplicadas para obter as 4 tuplas dos coeficientes espectrais.

[0069] O decodificador de entropia 220 pode ser adaptado para multiplicar as 4 tuplas com um fator pré-determinado, bem como quando um símbolo de fuga é decodificado do fluxo de áudio codificado, um símbolo de fuga sendo um índice de grupo ng específico apenas usado para indicar uma multiplicação, e para a decodificação de um restante do fluxo de áudio codificado com base em uma distribuição de probabilidade uniforme utilizando uma regra de codificação aritmética, o decodificador de entropia 220 ainda pode ser adaptado para adicionar o restante ao multiplicado, as 4 tuplas para obter o segmento atual.

[0070] Na sequência de uma materialização de um codificador aritmético USAC dependente do contexto o regime de decodificação será descrito. Correspondente à materialização acima do esquema de codificação, 4 tuplas correspondentes aos coeficientes espectrais quantizados, que são codificados sem ruído, são considerados. Além disso, supõe-se que as 4 tuplas são transmitidas a partir da menor frequência ou coeficiente espectral e progredindo para a maior frequência ou coeficientes espectrais. Os coeficientes podem, por exemplo, corresponder aos coeficientes AAC, que são armazenados em uma matriz e, a ordem de transmissão das palavras-código de codificação sem ruído é suposto ser de tal forma que quando elas são decodificadas na ordem recebida e armazenada no array, bin é o índice mais rapidamente incrementável e g é o índice mais lentamente incrementável. Dentro de uma palavra-chave, a ordem de decodificação é a, b, c, d.

[0071] A Fig. 7-B ilustra o procedimento de atualizaçãodo contexto geral de uma materialização. Os detalhes sobre o contexto de adaptação de acordo com um mecanismo de previsão de profundidade de bits serão considerados na presente materialização. A Fig. 7b mostra um plano 760 exibindo a possível gama de 4 tuplas (a, b, c, d) em termos de planos de bits. A profundidade de bits, ou seja, número de planos de bits necessários para representar 4 tuplas, pode ser prevista pelo contexto das atuais 4 tuplas, por meio do cálculo da variável chamada lev0, que também é indicada na figura 7b. As 4 tuplas são então divididas por 2lev0, ou seja lev=lev0 planos de bits são retirados e armazenados para uso posterior de acordo com a etapa 715 acima descrito.

[0072] Se as 4 tuplas estão no intervalo -5 <a, b, c, d<4, a profundidade de bit lev0 predita foi corretamente predita ou superestimada. As 4 tuplas podem ser então codificadas pelo índice de grupo ng, o índice de elemento ne e os planos de bits lev restantes, em conformidade com a descrição acima. A codificação das 4 tuplas atuais então é finalizada. A codificação do índice de elemento ne é indicada na figura 7b pela distribuição de probabilidade uniforme 762, que será a seguir sempre utilizado para os índices de elemento de codificação, que na fig. 7B o parâmetro r representa o restante das 4 tuplas após a divisão e p(r) representa a função de densidade de probabilidade uniforme correspondente.

[0073] Se as 4 tuplas não estão no intervalo -5 <a, b,c, d <4, a predição com base no contexto de codificação 764 é muito baixa, um símbolo de fuga (ng = 544) é codificado 766 e as 4 tuplas estão divididas por 4 e o lev incrementado por 2, conforme a etapa 730 na fig. 7a. O contexto é adaptado como segue. Se lev==lev0+2 o contexto é ligeiramente adaptado, correspondendo à 768 na Fig. 7b. Uma bandeira pode ser definida na representação do contexto, t, e um novo modelo de distribuição de probabilidade então será usado para codificação de símbolos ng futuros.

[0074] Se lev> lev0 outro símbolo de fuga é codificado de acordo com a etapa 770 na fig. 7b o contexto é completamente redefinido, cf. 772, descartados como na etapa 730 na fig. 7a, respectivamente. Nenhuma adaptação do contexto é utilizada ainda porque não é considerada relevante para a atual codificação das 4 tuplas. O modelo atual de probabilidade, o utilizado quando nenhum contexto está disponível, é então usado para os futuros símbolos ng, que é indicado pelas etapas 774 e 776 na fig. 7b. O processo é então repetido para outras tuplas.

[0075] Para resumir, a adaptação de contexto é um mecanismo a fim de reduzir o significado de contexto na codificação adaptativa de contexto. A adaptação de contexto pode ser acionada quando a lev0 predita e o lev real não combinam. Ela é facilmente detectada pelo número de símbolos codificados de fuga (ng = 544), cf. 766 e 770 na fig. 7b, e portanto pode ser realizada no decodificador de forma semelhante também.

[0076] A adaptação do contexto pode ser feita desencadeando uma bandeira na representação do estado de contexto t. O valor t é calculado pela função get_state(), como lev0, usando o contexto derivado da estrutura anterior e/ou atual ou segmento das 4 tuplas atuais, que são armazenadas em uma tabela q [][]. O estado do contexto pode, por exemplo, ser representado por 24 bits. Existem 1905800 estados possíveis em uma materialização. Esses estados podem ser representados por apenas 21 bits. Os bits 23 e 24 de t são reservados para a adaptação do estado do contexto. De acordo com os valores dos bits 23 e 24, o get_pk() produzirá modelos diferentes de distribuição de probabilidade. Em uma materialização, o bit 23 de t pode ser definido como um, quando as 4 tuplas são divididas por 4, depois de previamente divididas por lev0, ou seja, lev==lev0+2.

[0077] Em consequência, o mapeamento entre o estado de contexto t e o modelo de distribuição de probabilidade pki, é diferente para lev==lev0+2 do que para lev==lev0. O mapeamento entre o estado de contexto t e o modelo pki é pré-definido durante a fase de formação através da realização de otimizações nas estatísticas gerais da sequência de treinamento. Quando lev>lev0+2, o contexto e t pode ser definido como zero. As saídas Get_pk(), então o modelo padrão de distribuição de probabilidade pki, o que corresponde a t=0.

[0078] A seguir, os detalhes de um mapeamento de contexto em uma materialização serão descritas. O mapeamento do contexto é a primeira operação feita na codificação adaptativa de contexto após a redefinição eventual do contexto na presente materialização. É feito em duas etapas. Primeiro, antes da codificação, a tabela de contexto qs[] de tamanho previous_lg / 4, salva na estrutura anterior, é mapeada em uma tabela de contexto q[0][] de tamanho lg / 4 correspondente ao tamanho da estrutura atual. O mapeamento é feito na função arith_map_context, o que é exemplificado pelo seguinte pseudocódigo:

[0079] /*input variable*/

[0080] lg/4 /*number of 4-tuples*/

[0081] arith_map_context()

[0082] {a. v=w=0i. if(core_mode==1){

[0083] q[0][v++]=qs[w++];

[0084] }

[0085] ratio= ((float)previous_lg)/((float)lg);

[0086] for(j=0; j<lg/4; j++){

[0087] k = (int) ((float)) ((j)*ratio);

[0088] q[0][v++] = qs[w+k];

[0089] }

[0090] if(core_mode==0){

[0091] q[0][lg/4]=qs[previous_lg/4];

[0092] }

[0093] q[0][lg/4+1]=qs[previous_lg/4+1];b. previous_lg=lg;

[0094] }

[0095] Como pode ser visto a partir do pseudo-código, omapeamento pode não ser exatamente o mesmo para todas asestratégias de codificação. Na presente materialização, omapeamento se difere quando AAC (Codificação de Áudio Avançada) éusado (core_mode == 0) para um coeficiente de quando TCX (base deCodificação de Transformada) é usado (core_mode == 1). Uma dasdiferenças está no modo como os limites das tabelas sãomanipulados. Em AAC, o mapeamento pode começar a partir do índice0 (primeiro valor da tabela), enquanto para TCX pode iniciar a partir do índice 1 (segundo valor na tabela), sabendo que o primeiro valor é sempre definido como "desconhecido" (estado específico utilizado para redefinir o contexto). A proporção de previous_lg sobre lg irá determinar a ordem do upsampling (proporção<1) ou o downsampling (proporção> 1), que será realizado na presente materialização. A Fig. 7c ilustra o caso do TCX na conversão de uma tabela de contexto salva de tamanho 1024 / 4, cf. lado esquerdo 780 da Fig. 7c, para um tamanho de 512/4, cf. lado direito 782 da Fig. 7c. Pode-se observar que, enquanto para a tabela de contexto atual 782 incrementos de etapas 1 são utilizados, para a tabela de contexto salva 780 incrementos de etapa da proporção descrita acima são utilizados.

[0096] A Fig. 7c ilustra o procedimento de atualizaçãode contexto de uma materialização para alterações de resolução. Uma vez que o mapeamento é feito, a codificação adaptativa de contexto é realizada. No final da codificação, os elementos da estrutura atual são salvos na tabela qs[] para a próxima estrutura. Pode ser feito em arith_update_context (), que é exemplificado pelo seguinte pseudo-código:

[0097] /*input variables*/

[0098] a,b,c,d /* value of the decoded 4-tuple */

[0099] i /*the index of the 4-tuple to decode in thevector*/

[0100] lg/4 /*number of 4-tuples*/

[0101] arith_update_context()

[0102] {c. q[1][1+i].a=a;d. q[1][1+i].b=b; e. q[1][1+i].c=c;f. q[1][1+i].d=d;

[0103] if ( (a<-4) || (a>=4) || (b<-4) || (b>=4) || (c<-4) || (c>=4) | | (d<-4) || (d>=4) ) {g. q[1][1+i].v =1024;

[0104] }

[0105] else q[1][1+i].v=egroups[4+a][4+b][4+c][4+d];i. if(i==lg/4 && core_mode==1){

[0106] qs[0]=q[1][0];

[0107] ratio= ((float) lg)/((float)1024);

[0108] for(j=0; j<256; j++){

[0109] k = (int) ((float) j*ratio);

[0110] qs[1+k] = q[1][1+j] ;

[0111] }

[0112] qs[previous_lg/4+1] = q[1][lg/4+1];ii. previous_lg = 1024;

[0113] }h. if(i==lg/4 && core_mode==0){

[0114] for(j=0; j<258; j++){i. qs[j] = q[1][k];

[0115] }

[0116] previous_lg = min(1024,lg);

[0117] }

[0118] }

[0119] Na presente materialização, o salvamento é feitode maneira diferente de acordo com o programador principal (AAC ou TCX). Em TCX o contexto é sempre salvo em uma tabela qs[] de valores 1024/4. Esse mapeamento adicional pode ser feito por causa da decisão de malha fechada da AMR-WB + (Adaptive Multirate WideBand Codec). Na decisão de malha fechada muitos procedimentos de cópia de estados do codificador são necessários para testar cada combinação possível de TCXs e ACELP (Arithmetic Coded Excited Linear Prediction). A cópia do estado é mais fácil de implementar quando todos os modos TCX compartilham o mesmo tamanho para a tabela qs[]. Um mapeamento é, então, usado para converter de forma sistemática a partir de lg/4 para 1024/4. Por outro lado, AAC salva somente o contexto e não executa o mapeamento durante esta fase.

[0120] A Fig. 8 ilustra um fluxograma da materialização do esquema de decodificação. Na etapa 805, correspondente à etapa 705, o contexto é derivado com base em T0, T1, T2 e T3. Na etapa 810, o primeiro nível de redução lev0 é estimado a partir do contexto, e o leve variável é definido como lev0. Na etapa seguinte 815, o grupo NG é lido a partir do fluxo de bits e a distribuição de probabilidade para a decodificação de ng é derivado do contexto. Na etapa 815, o grupo ng pode então ser decodificado a partir do fluxo de dados. Na etapa 820 é determinado se o ng é igual a 544, que corresponde ao valor de fuga. Se assim for, o variável lev pode ser aumentada em 2 antes de voltar para a etapa 815. Caso essa seção seja usada pela primeira vez, ou seja, se lev==lev0, a distribuição de probabilidade, respectivamente, o contexto pode ser adaptado em conformidade, respectivamente descartada se a seção não for usada pela primeira vez, em consonância com o mecanismo de adaptação de contexto acima descrito, cf. Figs. 7B e 7C. No caso do índice do grupo ng não ser igual a 544 na etapa 820, em uma etapa seguinte 825 é determinado se o número de elementos de um grupo é maior que 1, e sendo assim, na etapa 830, o elemento do grupo ne é lido e decodificado a partir do fluxo de bits, assumindo uma distribuição de probabilidade uniforme. O índice do elemento ne é derivado do fluxo de bits usando codificação aritmética e uma distribuição de probabilidade uniforme.

[0121] Na etapa 835 a palavra-código literal (a, b, c, d) é derivada de ng e ne, por exemplo, por um processo de visualização nas tabelas, por exemplo, referem-se a dgroups [ng] e acod_ne[ne].

[0122] Na etapa 840 para todos os planos de bit sem lev, os planos são lidos a partir do fluxo de bits usando codificação aritmética e assumindo uma distribuição de probabilidade uniforme. Os planos de bits podem então ser anexados a (a, b, c, d) trocando (a, b, c, d) para a esquerda e acrescentando o plano de bit bp: ((a, b, c, d)<<=1)|= bp. Este processo pode ser repetido lev vezes.

[0123] Finalmente na etapa 845 as 4 tuplas q(n, m), ou seja, (a, b, c, d) podem ser fornecidas.

[0124] A seguir, pseudocódigos e detalhes de implementação são fornecidos de acordo com uma materialização. As definições a seguir serão utilizadas.

[0125] (a,b,c,d) 4 tuplas para decodificar

[0126] ng Índice de grupo do plano de 2 bits maissignificante das 4 tuplas, onde 0 <= ng <= 544. O último valor 544corresponde ao símbolo de fuga, ARITH_ESCAPE.

[0127] ne Índice de elemento dentro do grupo. ne estáentre 0 e o cardinal de cada grupo mm. O número máximo deelementos dentro de um grupo é 73.

[0128] lev Nível dos planos de bits restantes.Corresponde ao número de planos de bits menos significantes do que os mais significantes planos de 2 bits.

[0129] egroups Tabela de índice de grupo [a][b][c][d].Permite mapear o plano de 2 bits mais significante das 4 tuplas (a,b,c,d) nos 544 grupos.

[0130] mm Cardinal do grupo

[0131] og Offset do grupo

[0132] dgroups[] Mapeia o índice de grupo ng para ocardinal de cada grupo mm (primeiros 8 bits) e o offset do grupo og em dgvectors[] (últimos 8 bits).

[0133] dgvectors[] Mapeia o offset do grupo og e oíndice do elemento ne para o plano de 2 bits mais significante das 4 tuplas (a,b,c,d).

[0134] arith_cf_ng_hash[] Tabela hash mapeando oestado do contexto para um índice cumulativo de tabela de frequências pki.

[0135] arith_cf_ng[pki][545] Modelos das frequênciascumulativas para o símbolo do índice de grupo ng.

[0136] arith_cf_ne[] Frequências cumulativas parao símbolo de índice do elemento ne.

[0137] r Plano de bit das 4 tuplas menos significantesdo que o plano de 2 bits mais significante.

[0138] arith_cf_r [] Frequências cumulativas para osímbolo dos planos de bits ne menos significantes.

[0139] A seguir, o processo de decodificação é considerado primeiro. Os coeficientes espectrais quantizados de 4 tuplas são silenciosamente codificados e transmitidos a partir da menor frequência ou o coeficiente espectral e progredindo para a maior frequência ou coeficiente espectral. Os coeficientes da AAC são armazenados na matriz x_ac_quant[g][win][sfb][bin], e a ordem de envio das palavras-código de codificação sem ruído é tal que, quando eles são decodificados na ordem recebida e armazenada na matriz, bin é o índice que aumenta mais rápido e g é o índice mais lentamente incrementado. Dentro de uma palavra-código, a ordem de decodificação é a, b, c, d. O coeficiente do TCX é armazenado diretamente na matriz x_tcx_invquant[win][bin], e a ordem de transmissão das palavras-código de codificação sem ruído é tal que, quando eles são decodificados na ordem recebida e armazenada na matriz, Bin é o índice mais rapidamente incrementado e win é o índice mais lentamente incrementado. Dentro de uma palavra-código da ordem de decodificação é a, b, c, d. Primeiro, a bandeira arith_reset_flag determina se o contexto deve ser redefinido. Se a bandeira for VERDADEIRA a função a seguir é chamada:

[0140] *global variables*/

[0141] q[2][290] /*current context*/

[0142] qs[258] /*past context*/

[0143] previous_lg /*number of 4-tuples of the pastcontext*/

[0144] arith_reset_context()

[0145] {

[0146] for(i=0;i<258;i++){

[0147] qs[i].a=0; qs[i].b=0; qs[i].c=0; qs[i].d=0

[0148] qs[i].v=-1;

[0149] }

[0150] for(i=0;i<290;i++){

[0151] q[0][i].a=0; q[0][i].b=0; q[0][i].c=0;q[0][i] .d=0

[0152] q[0][i].v=-1;

[0153] q[1][i].a=0; q[1][i].b=0; q[1][i].c=0;q[1][i] .d=0

[0154] q[1][i].v=-1;

[0155] }

[0156] previous_lg=256;

[0157] }

[0158] Caso contrário, quando a arith_reset_flag forFALSA, o mapeamento é feito entre o contexto passado e do contextoatual:

[0159] /*input variable*/

[0160] lg /*number of 4-tuples*/

[0161] arith_map_context(lg)

[0162] {

[0163] v=w=0

[0164] if(core_mode==1){

[0165] q[0] [v++]=qs[w++];

[0166] }

[0167] ratio= ((float)previous_lg)/((float)lg);

[0168] for(j=0; j<lg; j++){

[0169] k = (int) ((float)) ((j)*ratio);

[0170] q[0][v++] = qs[w+k];

[0171] }

[0172] if(core_mode==0){

[0173] q[0][lg]=qs[previous_lg];

[0174] }

[0175] q[0][lg+1]=qs[previous_lg+1];

[0176] previous_lg=lg;

[0177] }

[0178] O decodificador sem ruído emite 4 tuplas decoeficientes espectrais quantizados assinados. No começo, o estadodo contexto é calculado com base em quatro grupos previamentedecodificados em torno de 4 tuplas para decodificar. O estado do contexto é dado pela função arith_get_context ():

[0179] /*input variables*/

[0180] i /*the index of the 4-tuple to decode in thevector*/

[0181] arith_get_context(i,)

[0182] {

[0183] t0=q[0][1+i].v+1;

[0184] t1=q[1][1+i-1].v+1;

[0185] t2=q[0][1+i-1].v+1;

[0186] T3=q[0][1+i+1].v+1;

[0187] if ( (t0<10) && (t1<10) && (t2<10) && (t3<10) ){

[0188] if ( t2>1 ) t2=2;

[0189] if ( t3>1 ) t3=2;

[0190] return 3*(3*(3*(3*(3*(10*(10*t0+t1))+t2)+t3)));

[0191] }

[0192] if ( (t0<34) && (t1<34) && (t2<34) && (t3<34) ){

[0193] if ( (t2>1) && (t2<10) ) t2=2; else if ( t2>=10 ) t2=3;

[0194] if ( (t3>1) && (t3<10) ) t3=2; else if ( t3>=10 )t3=3;

[0195] return 252000+4*(4*(34*(34*t0+t1))+t2)+t3;

[0196] }

[0197] if ( (t0<90) && (t1<90) ) return880864+90*(90*t0+t1);

[0198] if ( (t0<544) && (t1<544) ) return 1609864 +544*t0+t1;

[0199] if ( t0>1 )

[0200] {

[0201] a0=q[0][i].a;

[0202] b0=q[0][i].b;

[0203] c0=q[0][i].c;

[0204] d0=q[0][i].d;

[0205] }

[0206] else a0=b0=c0=d0=0;

[0207] if ( t1>1 )

[0208] {

[0209] a1=q[1][i-1].a;

[0210] b1=q[1][i-1].b;

[0211] c1=q[1][i-1].c;

[0212] d1=q[1][i-1].d;

[0213] }

[0214] else a1=b1=c1=d1=0;

[0215] l=0;

[0216] do

[0217] {

[0218] a0>>=1;

[0219] b0>>=1;

[0220] c0>>=1;

[0221] d0>>=1;

[0222] a1>>=1;

[0223] b1>>=1;

[0224] c1>>=1;

[0225] d1>>=1;

[0226] l++;

[0227] }

[0228] while ( (a0<-4) || (a0>=4) || (b0<-4) || (b0>=4)| | (c0<-4) || (c0>=4) || (d0<-4) || (d0>=4) ||

[0229] (a1<-4) || (a1>=4) || (b1<-4) || (b1>=4) || (c1<-4) || (c1>= 4) || (d1<-4) || (d1>=4) );

[0230] if ( t0>1 ) t0=1+(egroups[4+a0][4+b0][4+c0][4+d0]>> 16) ;

[0231] if ( t1>1 ) t1=1+(egroups[4+a1][4+b1][4+c1][4+d1]>> 16) ;

[0232] return 1609864 + ((l<<24)|(544*t0+t1));

[0233] }

[0234] Uma vez que o estado é conhecido o grupo a quempertence o plano de 2 bits mais significativo de 4 tuplas édecodificado usando o arith_decode () alimentado com a tabela apropriada de frequências cumulativas correspondente ao estado de contexto. A correspondência é feita pela função arith_get_pk ):

[0235] /*input variable*/

[0236] s /* State of the context*/

[0237] arith_get_pk(s)

[0238] {

[0239] psci[28] = {

[0240] 247,248,249,250,251,252,253,254,254,0,254,254,254,255,250,215,

[0241] 215,70,70,123,123,123,123,3,67,78,82,152

[0242] };

[0243] register unsigned char *p;

[0244] register unsigned long i,j;

[0245] i=123*s;

[0246] for (;;)

[0247] {

[0248] j=arith_cf_nq_hash[i&32767];

[0249] if ( j==0xFFFFFFFFul ) break;

[0250] if ( (j>>8)==s ) return j&255;

[0251] i++;

[0252] }

[0253] p=psci+7*(s>>22);

[0254] j= s & 4194303;

[0255] if ( j<436961 )

[0256] {

[0257] if ( j<252001 ) return p[(j<243001)?0:1]; elsereturn p[(j<288993)?2:3];

[0258] }

[0259] else

[0260] {

[0261] if ( j<1609865 ) return p[(j<880865)?4:5]; elsereturn p[6];

[0262] }

[0263] }

[0264] Então a função arith_decode() é chamada com atabela de frequências cumulativas, correspondente ao retorno doíndice pelo arith_get_pk (). O codificador aritmético é umaimplementação inteira gerando tag com escalonamento. O seguintepseudo-código C descreve o algoritmo utilizado.

[0265] /*helper funtions*/

[0266] bool arith_first_symbol(void);

[0267] /* Return TRUE if it is the first symbol of thesequence, FALSE otherwise*/

[0268] Ushort arith_get_next_bit(void);

[0269] /* Get the next bit of the bitstream*/

[0270] /* global variables */

[0271] low

[0272] high

[0273] value

[0274] /* input variables */

[0275] cum_freq[];

[0276] cfl;

[0277] arith_decode()

[0278] {

[0279] if(arith_first_symbol())

[0280] {

[0281] value = 0;

[0282] for (i=1; i<=20; i++)

[0283] {

[0284] value = (val<<1) | arith_get_next_bit();

[0285] }

[0286] low=0;

[0287] high=1048575;

[0288] }

[0289] range = high-low+1;

[0290] cum =((((int64) (value-low+1))<<16)-((int64)1))/((int64) range);

[0291] p = cum_freq-1;

[0292] do

[0293] {

[0294] q=p+(cfl>>1);

[0295] if ( *q > cum ) { p=q; cfl++; }

[0296] cfl>>=1;

[0297] }

[0298] while ( cfl>1 );

[0299] symbol = p-cum_freq+1;

[0300] if(symbol)

[0301] high = low +(((int64)range) ((int64)cum_freq[symbol-1]))>>16 - 1;

[0302] low += (((int64) range)* ((int64)cum_freq[symbol]))>>16;

[0303] for (;;)

[0304] {

[0305] if ( high<524286) { }

[0306] else if ( low>=524286)

[0307] {

[0308] value -=524286;

[0309] low -=524286;

[0310] high -=524286;

[0311] }

[0312] else if ( low>=262143 && high<786429)

[0313] {

[0314] value -= 262143;

[0315] low -= 262143;

[0316] high -= 262143;

[0317] }

[0318] else break;

[0319] low += low;

[0320] high += high+1;

[0321] value = (value<<1) | arith_get_next_bit();

[0322] }

[0323] return symbol;

[0324] }

[0325] Enquanto o índice de grupo decodificado ng é osímbolo de fuga, ARITH_ESCAPE, um índice grupo adicional ng édecodificado e a variável lev é incrementada por dois. Uma vez queo índice do grupo decodificado não é o símbolo de fuga,ARITH_ESCAPE, o número de elementos, mm, dentro do grupo e ooffset de grupo, og, são deduzidos através da observação da tabeladgroups[]:

[0326] mm=dgroups[nq]&255

[0327] og = dgroups[nq]>>8

[0328] O índice do elemento ne é, então, decodificadochamando o arith_decode() com a tabela de frequências cumulativas (arith_cf_ne + ((mm * (mm-1))>> 1) []. Uma vez que o índice do elemento é decodificado, o plano de 2 bits mais significativo das4 tuplas pode ser obtido com a tabela dgvector[]:

[0329] a=dgvectors[4*(og+ne)]

[0330] b=dgvectors[4*(og+ne)+1]

[0331] c=dgvectors[4*(og+ne)+2]

[0332] d=dgvectors[4*(og+ne)+3]

[0333] Os planos de bits restantes são, então,decodificados a partir do nível mais significante para o menossignificante chamando lev vezes o arith_decode() com a tabela de frequências cumulativas arith_cf_r []. O plano de bit decodificado r permite refinar as 4 tuplas da seguinte forma:

[0334] a = (a<<1) | (r&1)

[0335] b = (b<<1) | ((r>>1)&1)

[0336] c = (c<<1) | ((r>>2)&1)

[0337] d = (d<<1) | (r>>3)

[0338] Uma vez que as 4 tuplas (a, b, c, d) sãocompletamente decodificadas as tabelas de contexto q e qs sãoatualizadas chamando a função arith_update_context ().

[0339] arith_update_context(a,b,c,d,i,lg)

[0340] {

[0341] q[1][1+i].a=a;

[0342] q[1][1+i].b=b;

[0343] q[1][1+i].c=c;

[0344] q[1][1+i].d=d;

[0345] if ( (a<-4) || (a>=4) || (b<-4) || (b>=4) || (c<-4) || (c>=4)

[0346] || (d<-4) || (d>=4) )

[0347] q[1][1+i].v =1024;

[0348] else q[1][1+i].v=egroups[4+a][4+b][4+c][4+d];

[0349] if(i==lg && core_mode==1){

[0350] qs[0]=q[1] [0];

[0351] ratio= ((float) lg)/((float)256);

[0352] for(j=0; j<256; j++){

[0353] k = (int) ((float)) ((j)*ratio);

[0354] qs[1+k] = q[1][1+j] ;

[0355] }

[0356] qs[previous_lg+1]=q[1][lg+1];

[0357] previous_lg=256;

[0358] }

[0359] if(i==lg && core_mode==0){

[0360] for(j=0; j<258; j++){

[0361] qs[j] = q[1][k];

[0362] }

[0363] previous_lg=min(1024,lg);j. }

[0364] }

[0365] Dependendo de certos requisitos de implementaçãodos métodos inventivos, os métodos inventivos podem serimplementados em hardware ou software. A implementação pode serformada usando um meio de armazenamento digital, em particular, um disco, um DVD ou um CD, com um sinal de controle de leitura eletrônica nele, que coopera com o computador programável, de modo que os métodos inventivos são executados. Geralmente, a presente invenção é, portanto, um produto de programa de computador com um código de programa para um portador de leitura óptica, o código do programa sendo operativo para a realização dos métodos inventivos quando o programa de computador é executado em um computador. Em outras palavras, os métodos inventivos são, portanto, um programa de computador com um código de programa para realizar pelo menos um dos métodos inventivos quando o programa de computador for executado em um computador.

Claims

1. Codificador de áudio para codificar uma sequência de segmentos de coeficientes, os segmentos sendo subsequentes um ao outro no tempo, o codificador de áudio (100) compreendendoum fornecedor para fornecer a sequência de segmentos dos coeficientes de um fluxo de áudio representando um sinal de áudio amostrado pelo uso de comprimentos diferentes de transformada, tais quais segmentos de coeficientes para os quais comprimentos diferentes de transformada são usados, representa espectralmente o sinal de áudio amostrado em resoluções diferentes de frequência e compreende números diferentes de coeficientes;um processador para obter um contexto de codificação para um coeficiente codificado de um segmento atual com base em um coeficiente previamente codificado de um segmento anterior; eum codificador de entropia para codificação de entropia do atual coeficiente baseado no contexto de codificação para obter um fluxo de áudio codificado,caracterizado pelo fato de que o processador é configurado para computar o contexto de codificação para adquirir um fluxo de áudio codificado,selecionar um conjunto de coeficientes do segmento anterior de uma maneira de modo queno caso do número de coeficientes do segmento anterior e do número de coeficientes do segmento atual serem diferentes, um número de coeficientes no conjunto de coeficientes é um primeiro número e, no caso do número de coeficientes do segmento anterior e do número de coeficientes do segmento atual não serem diferentes, o número de coeficientes no conjunto de coeficientes é um segundo número que é igual ao primeiro número, eselecionar pelo menos alguns dos coeficientes do segmento anterior de modo que um espaçamento espectral entre os coeficientes selecionados do segmento anterior é maior no caso de o número de coeficientes do segmento anterior ser maior em comparação com um caso que o número de coeficientes do segmento anterior é menor do que o número de coeficientes do segmento atual, ecomputar o contexto de codificação de entropia para o coeficiente atual na base do conjunto de coeficientes.

2. Codificador de áudio, de acordo com a reivindicação 1, caracterizado pelo fato de que o codificador de entropia é adaptado para codificar o coeficiente atual em unidades de uma tupla dos coeficientes espectrais e para predizer um alcance da tupla baseada no contexto de codificação.

3. Codificador de áudio, de acordo com a reivindicação 2, caracterizado pelo fato de que o codificador de entropia é adaptado para dividir a tupla por um fator pré- determinado quando necessário para encaixar um resultado da divisão em um alcance pré-determinado e para codificar um número de divisões necessárias, um lembrete de divisão e o resultado da divisão quando as tuplas não estão no alcance predito, e para codificação de um lembrete de divisão e o resultado da divisão de outra forma.

4. Codificador de áudio, de acordo com a reivindicação 3, caracterizado pelo fato de que o codificador de entropia (120) é adaptado para codificação do resultado da divisão ou as tuplas usando um índice de grupo, o índice de grupo referindo-se a um grupo de um ou mais palavras-códigos, para as quais uma distribuição de probabilidade está baseado no contexto de codificação, e baseado em uma distribuição de probabilidade uniforme, um índice de elemento no caso do grupo compreender mais de uma palavra-código, o índice de elemento referindo-se a palavra-código dentro do grupo e para codificação o número de divisões pelo número de símbolos de fuga, um símbolo de fuga sendo um índice de grupo específico apenas usado para indicar a divisão e para codificação dos restantes das divisões baseadas na distribuição uniforme usando uma regra de codificação aritmética.

5. Codificador de áudio, de acordo coma reivindicação 4, caracterizado pelo fato de que o codificador de entropia (120) é adaptado para codificação de uma sequência de símbolos no fluxo de áudio codificado usando um alfabeto de símbolos compreendendo o símbolo de fuga, e símbolos de grupo correspondentes ao conjunto de índices de grupo disponíveis, um alfabeto de símbolo compreendendo os índices de elemento correspondentes, e um alfabeto de símbolo compreendendo os valores diferentes dos restantes.

6. Codificador de áudio, de acordo com a reivindicação 1, caracterizado pelo fato de que o processador e o codificador de entropia são configurados para operar baseados em um downsampling de coeficientes espectrais dos segmentos anteriores, quando o segmento anterior exibe uma melhor resolução espectral do que o segmento atual e/ou onde o processador e o codificador de entropia estão configurados para operar baseados em um upsampling de coeficientes espectrais do segmento anterior, quando o segmento anterior exibe uma resolução espectral mais rígida que o segmento atual.

7. Aparato do codificador de áudio, de acordo com a reivindicação 1, caracterizado pelo fato de que o codificador de entropia usa o contexto de codificação de entropia para codificar de forma aritmética o coeficiente atual.

8. Aparato do codificador de áudio, de acordo com a reivindicação 1, caracterizado pelo fato de que o número de coeficientes no conjunto de coeficientes é quatro.

9. Aparato do codificador de áudio, de acordo com a reivindicação 7, caracterizado pelo fato de que o segmento anterior e o segmento atual são subdivididos espectralmente em tuplas de coeficientes espectralmente vizinhos, respectivamente, com um número de coeficientes por tupla sendo iguais para tuplas dos segmentos anteriores e tuplas para o segmento atual,em que o processador é configurado para computar o contexto de codificação de entropia para o coeficiente atualselecionando um conjunto de tuplas do segmento anterior de uma maneira de modo queum número de coeficientes no conjunto de tuplas no caso do número de coeficientes do segmento anterior e o número de coeficientes do segmento atual sendo diferente, é igual ao número de coeficientes no conjunto de coeficientes no caso do número de coeficientes do segmento anterior e o número de coeficientes do segmento atual não sendo diferente, epelo menos alguns dos conjuntos de tuplas são selecionados das tuplas do segmento anterior e selecionados de uma maneira de modo que um espaçamento espectral entre os coeficientes do conjunto de coeficientes selecionados dos coeficientes do segmento anterior é maior no caso do número de coeficientes do segmento anterior e sendo maior do que o número de coeficientes do segmento atual do que no caso do número de coeficientes do segmento anterior sendo menor do que o número de coeficientes do segmento atual, ecomputar o contexto de codificação de entropia para o coeficiente atual na base do número de coeficientes de cada um dentre o conjunto de tuplas, eo codificador de entropia é configurado para codificar de forma entrópica o coeficiente atual codificando entropicamente uma tupla que compreende o coeficiente atual usando o contexto de codificação de entropia.

10. Aparato do codificador de áudio, de acordo com a reivindicação 9, caracterizado pelo fato de que o número de coeficientes no conjunto de coeficientes é quatro.

11. Método para codificação de uma sequência de segmentos de coeficientes, os segmentos sendo subsequentes uns aos outros no tempo, o método compreendendofornecer a sequência de segmentos dos coeficientes a partir de um fluxo de áudio representando um sinal de áudio amostrado pelo uso de comprimentos diferentes de transformada, tais quais segmentos de coeficientes para os quais comprimentos diferentes de transformada são usados, representa espectralmente o sinal de áudio amostrado em resoluções diferentes de frequência e compreende números diferentes de coeficientes;obter um contexto de codificação para um coeficiente codificado atualmente de um segmento atual com base em um coeficiente previamente codificado de um segmento anterior, ecodificar de forma entrópica o coeficiente atual com base no contexto de codificação de entropia para adquirir um fluxo de áudio codificado,caracterizado pelo fato de que o derivado o contexto de codificação de entropia compreende computar o contexto de codificação de entropia para o coeficiente atualselecionando um conjunto de coeficientes do segmento anterior de uma maneira de modo queno caso do número de coeficientes do segmento anterior e do número de coeficientes do segmento atual serem diferentes, um número de coeficientes no conjunto de coeficientes é um primeiro número e, no caso do número de coeficientes do segmento anterior e do número de coeficientes do segmento atual não serem diferentes, o número de coeficientes no conjunto de coeficientes é um segundo número que é igual ao primeiro número, eselecionar pelo menos alguns dos coeficientes do segmento anterior de modo que um espaçamento espectral entre os coeficientes selecionados do segmento anterior é maior no caso de o número de coeficientes do segmento anterior ser maior em comparação com um caso que o número de coeficientes do segmento anterior é menor do que o número de coeficientes do segmento atual, ecomputar o contexto de codificação de entropia para o coeficiente atual na base do conjunto de coeficientes.

12. Método, de acordo com a reivindicação 11, caracterizado pelo fato de que a codificação de entropia compreende codificar aritmeticamente o coeficiente atual.

13. Método para codificar uma sequência de segmentos de coeficientes, de acordo com a reivindicação 11, caracterizado pelo fato de que o número de coeficientes no conjunto de coeficientes é quatro.

14. Meio de armazenamento não transitório legível por computador não transitório que armazena um programa de computador que compreende um código de programa para realizar o método, de acordo com a reivindicação 11, caracterizado pelo fato de que o código de programa é executado em um computador ou um processador.

15. Método, de acordo com a reivindicação 11, caracterizado pelo fato de que o segmento anterior e o segmento atual são subdivididos espectralmente em tuplas de coeficientes espectralmente vizinhos, respectivamente, com um número de coeficientes por tupla sendo iguais para tuplas dos segmentos anteriores e tuplas para o segmento atual,em que o derivado o contexto de codificação de entropia compreende computar o contexto de codificação de entropia para o coeficiente atualselecionando um conjunto de tuplas do segmento anterior de uma maneira de modo queum número de coeficientes no conjunto de tuplas no caso do número de coeficientes do segmento anterior e o número de coeficientes do segmento atual sendo diferente, é igual ao número de coeficientes no conjunto de coeficientes no caso do número de coeficientes do segmento anterior e o número de coeficientes do segmento atual não sendo diferente, epelo menos alguns dos conjuntos de tuplas são selecionados das tuplas do segmento anterior e selecionados de uma maneira de modo que um espaçamento espectral entre os coeficientes do conjunto de coeficientes selecionados dos coeficientes do segmento anterior é maior no caso do número decoeficientes do segmento anterior e sendo maior do que o númerode coeficientes do segmento atual do que no caso do número decoeficientes do segmento anterior sendo menor do que o número decoeficientes do segmento atual, ecomputar o contexto de codificação de entropia para o coeficiente atual na base do número de coeficientes de cada um dentre o conjunto de tuplas, ea codificação de entropia compreende codificar de forma entrópica o coeficiente atual codificando de forma entrópica uma tupla que compreende o coeficiente atual usando o contexto de codificação de entropia.

16. Método para codificar uma sequência de segmentos de coeficientes, de acordo com a reivindicação 15, caracterizado pelo fato de que o número de coeficientes no conjunto de coeficientes é quatro.

17. Aparato do decodificador de áudio para decodificar um fluxo de áudio codificado representando um sinal de áudio amostrado para adquirir uma sequência de segmentos de coeficientes sendo subsequentes uns aos outros no tempo e representando o sinal de áudio amostrado usando comprimentos diferentes de transformada, tais quais segmentos de coeficientes para os quais comprimentos diferentes de transformada são usados, representa espectralmente o sinal de áudio amostrado em resoluções diferentes de frequência e compreende números diferentes de coeficientes; compreendendoum processador para obter um contexto de codificação para um coeficiente codificado de um segmento atual com base em um coeficiente previamente codificado de um segmento anterior; eum codificador de entropia para codificação de entropia do atual coeficiente baseado no contexto de codificação para obter um fluxo de áudio codificado,caracterizado pelo fato de que o processador é configurado para computar o contexto de codificação de entropia para o coeficiente atualselecionando um conjunto de coeficientes do segmento anterior de uma maneira de modo queno caso do número de coeficientes do segmento anterior e do número de coeficientes do segmento atual serem diferentes, um número de coeficientes no conjunto de coeficientes é um primeiro número e, no caso do número de coeficientes do segmento anterior e do número de coeficientes do segmento atual não serem diferentes, o número de coeficientes no conjunto de coeficientes é um segundo número que é igual ao primeiro número, eselecionar pelo menos alguns dos coeficientes do segmento anterior de modo que um espaçamento espectral entre os coeficientes selecionados do segmento anterior é maior no caso de o número de coeficientes do segmento anterior ser maior em comparação com um caso que o número de coeficientes do segmento anterior é menor do que o número de coeficientes do segmento atual, ecomputar o contexto de codificação de entropia para o coeficiente atual na base do conjunto de coeficientes.

18. Aparato de decodificação de áudio, de acordo com a reivindicação 17, caracterizado pelo fato de que o processador é adaptado para obter o contexto de codificação por faixa espectral para o coeficiente atual, com base nos coeficientes espectrais vizinhos previamente decodificados em um ou mais dentre os segmentos anteriores e o segmento presente.

19. Aparato de decodificação do áudio, de acordo com a reivindicação 18, caracterizado pelo fato de que a decodificação de entropia de um índice de grupo do fluxo de áudio codificado com base em uma distribuição de probabilidade derivada a partir do contexto de codificação de entropia, em que o índice de grupo representa um grupo de uma ou mais palavras- código, e para, com base em uma distribuição de probabilidade uniforme, decodificar um índice de elemento a partir do fluxo de áudio codificado se o índice de grupo indica um grupo que compreende mais do que uma palavra-chave, e para definir uma tupla de coeficientes espectrais do segmento atual com base no índice de grupo e o índice de elemento, através do mesmo adquirindo a representação do domínio espectral nas tuplas dos coeficientes espectrais.

20. Aparato de decodificação de áudio, de acordo com a reivindicação 19, caracterizado pelo fato de que o decodificador de entropia é adaptado para decodificar uma sequência de símbolos do fluxo de áudio codificado com base na distribuição de probabilidade derivada do contexto de codificação de entropia usando um alfabeto de símbolo que compreende um símbolo de fuga e símbolos de grupo correspondentes a um conjunto de índices de grupo disponíveis, para derivar uma tupla preliminar dos coeficientes espectrais com base em um índice de grupo disponível ao qual um símbolo de grupo da sequência de símbolos corresponde, e com base no índice de elemento, e para multiplicar a tupla preliminar com um fato que depende de um número de símbolos de fuga na sequência de símbolos para adquirir a tupla de coeficientes espectrais.

21. Aparato de decodificação de áudio, de acordo com a reivindicação 20, caracterizado pelo fato de que o decodificador de entropia é adaptado para decodificar um lembrete de divisão a partir do fluxo de áudio codificado com base em uma distribuição de probabilidade uniforme usando uma regra de codificação aritmética e para adicionar o lembrete à tupla preliminar multiplicada para adquirir a tupla de coeficientes espectrais.

22. Aparato de decodificação de áudio, de acordo com a reivindicação 21, caracterizado pelo fato de que o processador e o codificador de entropia são configurados para operar com base em um downsampling dos coeficientes espectrais do segmento anterior, quando o segmento anterior exibe uma resolução espectral mais fina do que o segmento atual e/ou em que o processador e o codificador de entropia são configurados para operar com base em um upsampling de coeficientes espectrais do segmento anterior, quando o segmento anterior exibe uma resolução espectral melhor do que o segmento atual.

23. Aparato de decodificação de áudio, de acordo com a reivindicação 17, caracterizado pelo fato de que o decodificador de entropia usa o contexto de codificação de entropia para decodificar aritmeticamente o coeficiente atual.

24. Aparato de decodificação de áudio, de acordo com a reivindicação 17, caracterizado pelo fato de que o número de coeficientes no conjunto de coeficientes é quatro.

25. Aparato de decodificação de áudio, de acordo com a reivindicação 17, caracterizado pelo fato de que o segmento anterior e o segmento atual são subdivididos espectralmente em tuplas de coeficientes espectralmente vizinhos, respectivamente, com um número de coeficientes por tupla sendo iguais para tuplas dos segmentos anteriores e tuplas para o segmento atual,em que o processador é configurado para computar o contexto de codificação de entropia para o coeficiente atualselecionando um conjunto de tuplas do segmento anterior de uma maneira de modo queum número de coeficientes no conjunto de tuplas no caso do número de coeficientes do segmento anterior e o número de coeficientes do segmento atual sendo diferente, é igual ao número de coeficientes no conjunto de coeficientes no caso do número de coeficientes do segmento anterior e o número de coeficientes do segmento atual não sendo diferente, epelo menos alguns dos conjuntos de tuplas são selecionados das tuplas do segmento anterior e selecionados de uma maneira de modo que um espaçamento espectral entre os coeficientes do conjunto de coeficientes selecionados dos coeficientes do segmento anterior é maior no caso do número de coeficientes do segmento anterior e sendo maior do que o número de coeficientes do segmento atual do que no caso do número de coeficientes do segmento anterior sendo menor do que o número de coeficientes do segmento atual, ecomputar o contexto de codificação de entropia para o coeficiente atual na base do número de coeficientes de cada um dentre o conjunto de tuplas, eo codificador de entropia é configurado para codificar de forma entrópica o coeficiente atual codificando entropicamente uma tupla que compreende o coeficiente atual usando o contexto de codificação de entropia.

26. Aparato de decodificação de áudio, de acordo com a reivindicação 25, caracterizado pelo fato de que o número de coeficientes no conjunto de coeficientes é quatro.

27. Método para decodificar um fluxo de áudio codificado representando um sinal de áudio amostrado para adquirir uma sequência de segmentos de coeficientes senso subsequentes uns aos outros em tempo e representando o sinal de áudio amostrado usando comprimentos diferentes de transformada tais quais segmentos de coeficientes são usados, representa espectralmente o sinal de áudio amostrado em resoluções diferentes de frequências e compreende diferentes números de coeficientes, compreendendoobter um contexto de codificação para um coeficiente codificado atualmente de um segmento atual com base em um coeficiente previamente codificado de um segmento anterior, ecodificar de forma entrópica o coeficiente atual com base no contexto de codificação de entropia para adquirir um fluxo de áudio codificado,caracterizado pelo fato de que o derivado o contexto de codificação de entropia compreende computar o contexto de codificação de entropia para o coeficiente atualselecionando um conjunto de coeficientes do segmento anterior de uma maneira de modo queno caso do número de coeficientes do segmento anterior e do número de coeficientes do segmento atual serem diferentes, um número de coeficientes no conjunto de coeficientes é um primeiro número e, no caso do número de coeficientes do segmento anterior e do número de coeficientes do segmento atual não serem diferentes, o número de coeficientes no conjunto de coeficientes é um segundo número que é igual ao primeiro número, eselecionar pelo menos alguns dos coeficientes do segmento anterior de modo que um espaçamento espectral entre os coeficientes selecionados do segmento anterior é maior no caso de o número de coeficientes do segmento anterior ser maior em comparação com um caso que o número de coeficientes do segmento anterior é menor do que o número de coeficientes do segmento atual, ecomputar o contexto de codificação de entropia para o coeficiente atual na base do conjunto de coeficientes.

28. Método, de acordo com a reivindicação 27, caracterizado pelo fato de que a codificação de entropia compreende decodificar de forma aritmética o coeficiente atual.

29. Meio de armazenamento não transitório legível por computador não transitório que armazena um programa de computador que compreende um código de programa para realizar o método, conforme definido na reivindicação 27, caracterizado pelo fato de que quando o código de programa é executado em um computador ou um processador.

30. Método para decodificar um fluxo de áudio codificado, de acordo com a reivindicação 27, caracterizado pelo fato de que o número de coeficientes no conjunto de coeficientes é quatro.

31. Método, de acordo com a reivindicação 27, onde o segmento anterior e o segmento atual são subdivididos espectralmente em tuplas de coeficientes espectralmente vizinhos, respectivamente, com um número de coeficientes por tupla sendo iguais para tuplas dos segmentos anteriores e tuplas para o segmento atual,caracterizado pelo fato de que o derivado o contexto de codificação de entropia compreende computar o contexto de codificação de entropia para o coeficiente atual selecionando um conjunto de tuplas do segmento anterior de uma maneira de modo queum número de coeficientes no conjunto de tuplas no caso do número de coeficientes do segmento anterior e o número de coeficientes do segmento atual sendo diferente, é igual ao número de coeficientes no conjunto de coeficientes no caso do número de coeficientes do segmento anterior e o número de coeficientes do segmento atual não sendo diferente, epelo menos alguns dos conjuntos de tuplas são selecionados das tuplas do segmento anterior e selecionados de uma maneira de modo que um espaçamento espectral entre os coeficientes do conjunto de coeficientes selecionados dos coeficientes do segmento anterior é maior no caso do número de coeficientes do segmento anterior e sendo maior do que o número de coeficientes do segmento atual do que no caso do número de coeficientes do segmento anterior sendo menor do que o número de coeficientes do segmento atual, ecomputar o contexto de codificação de entropia para o coeficiente atual na base do número de coeficientes de cada um dentre o conjunto de tuplas, ea codificação de entropia compreende codificar de forma entrópica o coeficiente atual codificando de forma entrópica uma tupla que compreende o coeficiente atual usando o contexto de codificação de entropia.

32. Método para decodificar um fluxo de áudio codificado, de acordo com a reivindicação 31, caracterizado pelo fato de que o número de coeficientes no conjunto de coeficientes é quatro.