BRPI0716308B1

BRPI0716308B1 - “dispositivo e método para pós-processamento de valores espectrais e codificador e decodificador de sinais de áudio"

Info

Publication number: BRPI0716308B1
Application number: BRPI0716308-8A
Authority: BR
Inventors: Edler Bernd; Ralf Geiger; Ertel Christian; Hilpert Johannes; Harald Popp
Original assignee: Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V
Priority date: 2006-11-02
Filing date: 2007-09-28
Publication date: 2020-10-06
Also published as: TW200836492A; BRPI0716308A2; PT2264699T; DE102006051673A1; CN101553870A; JP2010508550A; CA2668056A1; AU2011200509B2; AU2007315373B2; EP2264699A2; AU2011200509A1; NO20092125L; TWI350068B; HK1120328A1; EP2264699A3; CA2668056C; KR101090541B1; WO2008052627A1; EP2264699B1; TR201903942T4

Abstract

dispositivo e método para pós-processamento de valores espectrais e codificador e decodificador de sinais de áudio para pós-processamento de valores espectrais que são baseados em um primeiro algoritmo de transformação para conversão do sinal de áudio em uma representação espectral, primeiro é fornecida uma sequência de blocos de valores espectrais representando uma sequência de blocos de amostras do sinal de áudio. depois disto, uma adição ponderada dos valores espectrais da sequência de blocos de valores espectrais é executada a fim de obter uma sequência de blocos de valores espectrais pós- processados, em que a combinação é realizada tal que são usados para cálculo de um valor espectral pós-processado para uma banda , de frequência e uma duração de tempo, um valor espectral da sequência de blocos para a banda de frequência e duração de tempo e um valor espectral para outra banda de frequência ou outra duração de tempo, em que a combinação é além disso realizada de tal forma que tais fatores de ponderação são usados onde os valores espectrais pós-processados são uma aproximação para os valores espectrais, quando eles são obtidos através da conversão do sinal de áudio em uma representação espectral usando um segundo algoritmo de transformação que é diferente do primeiro algoritmo de transformação. os valores espectrais pós-processados, em particular, são usados para uma formação de diferença dentro de um codificador escalável ou para uma adição dentro de um decodificador escalável, respectivamente.

Description

DESCRIÇÃO Campo da invenção

A presente invenção se refere à codificação/decodificação de áudio e em particular aos conceitos de codificador/decodificador escalável tendo uma camada base e uma camada de extensão.

Descrição da arte relacionada

Os codificadores/decodificadores de áudio são conhecidos há muito tempo. Em particular os codificadores/decodificadores de áudio operam de acordo com o padrão ISO/IEC 11172-3, onde tal padrão também é conhecido como padrão MP3, sendo referidos como codificadores de transformação. Tal codificador MP3 recebe uma sequência de amostras de tempo como um sinal de entrada que é submetido a um enquadramento. O enquadramento conduz a blocos sequenciais de amostras de tempo que são depois convertidos em uma representação espectral bloco por bloco. De acordo com o padrão MP3, aqui uma conversão é realizada com um assim chamado banco de filtro hibrido. O primeiro estágio do banco de filtro hibrido é um banco tendo 32 canais designados para gerar 32 sinais de sub-banda. Os filtros de sub-banda deste primeiro estágio formam bandas passantes por sobreposição, sendo por isso que esta filtragem é propensa a aliasing. O segundo estágio é um estágio MDCT que visa dividir os 32 sinais de sub- banda em 576 valores espectrais. Os valores espectrais são então quantizados considerando o modelo fisicoacústico e subsequentemente codificados por Huffman para finalmente obter uma sequência de bits incluindo um fluxo de palavras de código Huffman e a informação de lado necessária para decodificação.

No lado do decodificador, as palavras de código 5 Huffman são então calculadas de volta para os indices de quantização. Uma requantização conduz aos valores espectrais que são então enviados a um banco de filtro de sintese hibrido que é implementado análogo ao banco de filtro de análise para obter outra vez os blocos de amostras de tempo do sinal de áudio 10 codificado e novamente decodificado. Todas as etapas no lado do codificador e no lado do decodificador são apresentadas no padrão MP3. No que diz respeito à terminologia, observa-se a seguir que também é feita a uma referência a uma "quantização reversa". Embora uma quantização não seja reversível, pois isto envolve uma 15 perda de dados não recuperável, a expressão quantização reversa frequentemente é utilizada, que é para indicar um requantização apresentada antes.

Também um algoritmo codificador/decodificador de áudio chamado AAC (AAC = Codificação Avançada de Áudio) é 20 conhecido na técnica. Tal codificador padronizado na norma internacional ISO/IEC 13818-7 novamente opera com base em amostras de tempo de um sinal de áudio. As amostras de tempo do sinal de áudio são outra vez submetidas a um enquadramento a fim de obter blocos sequenciais das amostras de tempo enquadradas. Ao contrário 25 do codificador MP3 no qual é utilizado um banco de filtro hibrido, no codificador AAC uma única transformação MDCT é executada para obter uma sequência de blocos de valores espectrais MDCT. Esses valores espectrais MDCT são então novamente quantizados com base em um modelo fisicoacústico e os valores espectrais quantizados são finalmente codificados por Huffman. No lado do decodificador o processamento é desenvolvido de forma correspondente. As palavras de código Huffman são decodificadas e os indices de quantização ou 5 valores espectrais quantizados, respectivamente, obtidos disto são então requantizados ou inversamente quantizados, respectivamente, para finalmente obter os valores espectrais que podem ser fornecidos a um banco de filtro de sintese MDCT para finalmente obter outra vez amostras de tempo codificado/decodifiçado.

Ambos os métodos operam com blocos de sobreposição e funções de janela adaptativa conforme descrito na publicação especializa "Codierung von Audiosignalen mit überlappender Transformation und adaptiven Fensterfunktionen", Bernd Edler, Frequenz, vol. 43, 1989, pp. 252-256.

Em particular quando áreas transientes são determinadas no sinal de áudio, é realizada uma comutação de funções da janela longa para funções da janela curta a fim de obter uma resolução de frequência reduzida em favor de uma melhor resolução de tempo. Uma sequência de janelas curtas é introduzida 20 por uma janela de partida e uma sequência de janelas curtas é terminada pela parada de uma janela. Por meio disso, pode ser obtida uma transição sem intervalo entre as funções de janela longa de sobreposição para as funções de janela curta de sobreposição. Dependendo da implementação, a área de sobreposição 25 com janelas curtas é menor que a área de sobreposição com janelas longas, o que é razoável com relação ao fato de que partes do sinal transiente estão presentes no sinal de áudio, entretanto não necessariamente tendo que ser este o caso. Com isso, sequências de janelas curtas assim como sequências de janelas longas podem ser implementadas com uma sobreposição de 50 por cento. Em particular com janelas curtas, entretanto, para melhorar a codificação das partes do sinal transiente, pode ser selecionada uma largura de 5 sobreposição reduzida, tal como, por exemplo, apenas 10 por cento ou até menos ao invés de 50 por cento.

Nos padrões MP3 e AAC o enquadramento existe com janelas longas e curtas e as janelas de partida ou janelas de parada, respectivamente, são escalonadas de tal forma que em geral 10 possa ser mantido sempre o mesmo rastro de bloco. Para o padrão MP3 isto significa que, para cada bloco longo, 576 valores espectrais são gerados e que três blocos curtos correspondem a um bloco longo. Isto significa que um bloco curto gera 192 valores espectrais. Com uma sobreposição de 50 por cento, para tal 15 enquadramento é usado, portanto, um comprimento de janela de 1152 amostras de tempo, como devido ao principio de sobreposição e adição de uma sobreposição de 50 por cento, dois blocos de amostras de tempo sempre resultam em um bloco de valores espectrais.

Com os codificadores MP3 e AAC, ocorre uma compressão com perdas. As perdas são introduzidas pela ocorrência de uma quantização dos valores espectrais. Esses valores são quantizados em particular de modo que as distorções introduzidas pela quantização, também referidas como ruido de quantização, 25 tenham uma energia que seja menor que o limiar de mascaramento fisicoacústico.

Quanto mais grosso um sinal de áudio for quantizado, isto é, o maior tamanho de passo do quantizador, mais elevado o ruído de quantizaçâo. Por outro lado, entretanto, para uma quantizaçâo mais grossa deve ser considerado um conjunto menor de valores de saída do quantizador, de modo que valores mais grossos quantizados possam ser codificados por entropia usando 5 menos bits. Isto significa que uma quantizaçâo mais grossa conduz a uma compressão de dados mais alta, entretanto, simultaneamente resulta em perdas de sinal mais elevadas.

Essas perdas de sinal não são problemáticas se estiverem abaixo do limiar de mascaramento. Mesmo se o limiar de 10 mascaramento fisicoacústico for apenas levemente excedido, isto pode possivelmente não resultar em interferências audíveis para os ouvintes não especializados. Em qualquer caso, entretanto, ocorre uma perda de informação que pode ser indesejável, por exemplo, devido a artefatos que podem ser audíveis em determinadas 15 situações.

Em particular, com as conexões de dados de banda larga ou quando a taxa de dados não é o parâmetro decisivo, respectivamente ou quando as redes de dados de banda larga e banda estreita estiverem disponíveis, pode ser desejável não ter perdas, 20 mas uma apresentação comprimida de um sinal de áudio sem perdas ou quase sem perdas.

Tal codificador escalável esquematicamente ilustrado na Fig. 7 e um decodificador associado esquematicamente ilustrado na Fig. 8 são conhecidos da publicação especializada 25 "INTMDCT - Um Link Entre Codificação de Áudio Perceptiva e Sem Perda", Ralf Geiger, Jürgen Herre, Jürgen Koller, Karlheinz Brandenburg, Int. Conferência sobre Acústicas da Fala e Processamento de Sinal (ICASSP) , 13 - 17 de maio de 2002, Orlando, Flórida. Uma tecnologia semelhante é descrita na Patente Européia EP 1 495 464 BI. Os elementos 71, 72, 73, 74 ilustram um codificador AAC que visa gerar um fluxo de bit codificado de perdas referido como "fluxo de bit codificado perceptivamente" na 5 Fig. 7. Este fluxo de bit representa a camada base. Em particular, o bloco 71 na Fig. 7 designa o banco de filtro de análise incluindo o enquadramento com janelas longas e curtas de acordo com o padrão AAC. O bloco 73 representa a quantização/codificação de acordo com o padrão AAC e o bloco 74 representa a geração de 10 fluxo de bit de modo que o fluxo de bit no lado de saida não apenas inclua palavras de código Huffman dos valores espectrais quantizados, mas também a informação de lado necessária, tal como, por exemplo, fatores de escala, etc., de modo que possa ser realizada uma decodificação. A quantização de perdas no bloco 73 é 15 aqui controlada pelo modelo fisicoacústico designado como "modelo perceptivo" 72 na Fig. 7.

Como já indicado, o sinal de saida do bloco 74 é uma camada de escalonamento base que requer relativamente poucos bits sendo, entretanto, apenas uma representação de perdas do 20 sinal de áudio original, podendo consistir de artefatos de codificador. Os blocos 75, 76, 77, 78 representam os elementos adicionais que são necessários para gerar um fluxo de bit de extensão que é sem perda ou virtualmente sem perda, como indicado na Fig. 7. Em particular, o sinal de áudio original é enviado a um 25 MDCT inteiro (IntMDCT) na entrada 70, como ilustrado pelo bloco 75. Além disso, os valores espectrais quantizados, gerados pelo bloco 73, para o qual as perdas do codificador já estão introduzidas, são enviados para uma quantização reversa e para um subsequente arredondamento a fim de obter valores espectrais arredondados. Que são fornecidos a um formador de diferença 77 compondo uma diferença na forma valor-espectral que é depois enviada para uma codificação por entropia no bloco 78 a fim de 5 gerar um fluxo de bit aprimorado sem perdas do esquema escalonado da Fig. 7. Um espectro dos valores diferenciais na saida do bloco 77 representa assim a distorção introduzida pela quantização fisicoacústica no bloco 73.

No lado do decodificador, o fluxo de bit 10 codificado com perdas ou o fluxo de bit codificado perceptivamente é fornecido a um decodif icador de fluxo de bit 81. No lado de saida, o bloco 81 fornece uma sequência de blocos de valores espectrais quantizados que são então enviados para uma quantização reversa no bloco 82. Assim, na saida do bloco 82 estão presentes 15 os valores espectrais inversamente quantizados que agora, ao contrário dos valores na entrada do bloco 82, não representam mais os indices do quantizador, mas que agora são assim chamados valores espectrais "corretos" que, entretanto, são diferentes dos valores espectrais antes da codificação no bloco 73 da Fig. 7 20 devido à quantização com perdas. Esses valores espectrais quantizados são agora fornecidos a um banco de filtro de sintese ou uma transformação MDCT inversa (MDCT inverso), respectivamente, no bloco 83 para obter um sinal de áudio fisicoacusticamente codificado e novamente decodificado (áudio perceptive), que é 25 diferente do sinal de áudio original na entrada 70 da Fig. 7 devido aos erros de codificação introduzidos pelo codificador da Fig. 7. Para não apenas obter uma compressão com perdas, mas até mesmo sem perdas, o sinal de áudio do bloco 82 é fornecido para um arredondamento em um bloco 84. Num somador 85, agora os valores espectrais quantizados inversamente e arredondados são adicionados aos valores diferenciais que foram gerados pelo formador de diferença 77, onde num bloco 86 é realizada uma decodificação por 5 entropia para decodificar as palavras de código de entropia contidas no fluxo de bit de extensão, contendo a informação sem perdas ou virtualmente sem perdas, respectivamente.

Na saida do bloco 85, os valores espectrais do IntMDCT são assim apresentados estando no caso ideal idêntico aos 10 valores espectrais do MDCT na saida do bloco 75 do codificador da Fig. 7. Os mesmos são então enviados a um MDCT inteiro reverso (IntMDCT reverso), para obter um sinal de áudio codificado sem perdas ou sinal de áudio virtualmente sem perdas (áudio sem perdas) na saida do bloco 87. 15 O MDCT inteiro (IntMDCT) é uma aproximação do MDCT, entretanto, gerando valores de saida inteiros. Ele é derivado do MDCT usando o esquema de elevação. Este opera em particular quando o MDCT é dividido nas assim chamadas rotações Givens. Então, um algoritmo de dois estágios com rotações Givens e 20 um subsequente DCT-IV resulta como o MDCT inteiro no lado do codificador e com um DCT-IV e diversos fluxos descendentes (downstream) de rotações Givens no lado do decodificador. No esquema da Fig. 7 e Fig. 8, portanto o espectro MDCT quantizado gerado no codificador AAC é usado para declarar o espectro MDCT 25 inteiro. Em geral, o MDCT inteiro é desse modo um exemplo para uma transformação de inteiro gerando valores espectrais de inteiro e novamente amostras de tempo dos valores espectrais de inteiro, sem transformações de inteiro existem à parte do MDCT inteiro.

O esquema escalonado indicado nas Figs. 7 e 8 é apenas suficientemente eficaz quando as diferenças na saida do formador de diferença 77 são pequenas. Este é o caso no esquema 5 ilustrado na Fig. 7, pois MDCT e MDCT inteiro são semelhantes e como IntMDCT no bloco 7 5 é derivado de MDCT no bloco 71, respectivamente. Se este não fosse o caso, o esquema ilustrado não seria adequado, pois então os valores diferenciais seriam em muitos casos maiores que os valores de MDCT originais ou mesmo 10 maiores que os valores de IntMDCT originais. Então o esquema escalonado na Fig. 7 perdeu seu valor, pois a camada de escalonamento de extensão emitida pelo bloco 78 apresentou uma alta redundância em relação à camada de escalonamento base.

Os esquemas de escalabilidade são sempre ideais 15 quando a camada base consiste de diversos bits e quando a camada de extensão consiste de diversos bits e se a soma dos bits na camada base e na camada de extensão for igual ao número de bits que seria obtido se a camada base já fosse uma codificação sem perdas. Este caso ideal nunca é alcançado nos esquemas de 20 escalabilidade práticos, visto que para a camada de extensão são requeridos bits de sinalização adicionais. Este ideal é, entretanto, almejado até quanto possível. Como as transformações nos blocos 71 e 75 são relativamente parecidas na Fig. 7, o conceito ilustrado na Fig. 7 é próximo do ideal.

Este conceito de escalabilidade simples pode, entretanto, não apenas parecer ser aplicado ao sinal de saida de um codificador MP3, uma vez que o codificador MP3, como foi ilustrado, consiste do banco de filtro MDCT não puro como um banco de filtro, mas o banco de filtro hibrido tendo um primeiro estágio de banco de filtro para geração de diferentes sinais de sub-banda e um MDCT de fluxo descendente para interrupção adicional dos sinais de sub-banda, em que, além disso, como também é indicado no 5 padrão MP3, é implementado um estágio de cancelamento de aliasing adicional do banco de filtro hibrido. Como o MDCT inteiro no bloco 75 da Fig. 7 apresenta pequenas semelhanças com o banco de filtro hibrido de acordo com o padrão MP3, uma aplicação direta do conceito mostrado na Fig. 7 para um sinal de saida MP3 poderia 10 conduzir a valores diferenciais muito altos na saida do formador de diferença 77, o que resultaria em um conceito de escalabilidade extremamente ineficiente, pois a camada de extensão requer muitos bits a fim de codificar razoavelmente os valores diferenciais na saida do formador de diferença 77.

Uma possibilidade para geração do fluxo de bit de extensão para um sinal de saida MP3 é ilustrada na Fig. 9 para o codificador e na Fig. 10 para o decodif icador. Um codificador MP3 90 codifica um sinal de áudio e fornece uma camada base 91 no lado de saida. O sinal de áudio MP3 codificado é então fornecido a um 20 decodificador MP3 92 fornecendo um sinal de áudio com perdas na faixa de tempo. Este sinal é então fornecido a um bloco IntMDCT que pode, em principio, ser ajustado exatamente como o bloco 75 na Fig. 7, onde este bloco 75 então fornece valores espectrais de IntMDCT no lado de saida, que são fornecidos a um formador de 25 diferença 77 que também inclui valores espectrais de IntMDCT como valores de entrada adicionais, que foram, entretanto, não gerados pelo sinal de áudio MP3 decodificado mas pelo sinal de áudio original que foi fornecido ao codificador MP3 90.

No lado do decodificador, a camada base é outra vez enviada a um decodificador MP3 92 para fornecer um sinal de áudio decodificado com perdas em uma saida 100 que corresponderia ao sinal na saida do bloco 83 da Fig. 8. Este sinal teria que ser 5 então enviado a um MDCT inteiro 75 para depois ser codificado junto com a camada de extensão 93 que foi gerada na saida do formador de diferença 77. 0 espectro sem perdas seria então apresentado em uma saida 101 do somador 102 e apenas teria que ser convertido por meio de um IntMDCT reverso 103 para a faixa de 10 tempo a fim de obter um sinal de áudio decodificado de forma sem perdas, que corresponderia ao "áudio sem perdas" no começo do bloco 87 da Fig. 8.

0 conceito ilustrado na Fig. 9 e na Fig. 10, que fornece uma camada de extensão codificada relativamente de maneira 15 eficaz exatamente como os conceitos ilustrados nas Figs. 7 e 8, é dispendioso no lado do codificador (Fig. 9) e também no lado do decodificador (Fig. 10), respectivamente. Ao contrário do conceito mostrado na Fig. 7, são requeridos um decodificador MP3 completo 92 e um IntMDCT adicional 75.

Outra desvantagem neste esquema é que teria que ser definido um decodif icador MP3 de bit-preciso. Isto não é pretendido, entretanto, como o padrão MP3 não representa uma especificação bit-preciso, mas apenas deve ser preenchido no escopo de uma "conformidade" por um decodificador.

No lado do decodificador, também é requerido um estágio IntMDCT adicional completo 75. Ambos os elementos adicionais provocam sobrecarga de cálculo e são desvantajosos em particular para uso em dispositivos móveis com relação ao consumo do chip e ao consumo de corrente e também no que diz respeito ao atraso associado.

Em resumo, as vantagens do conceito ilustrado na Fig. 7 e Fig. 8 são, que comparado aos métodos de dominio de tempo nenhuma decodificação completa do sinal codificado por áudio- adaptado é requerida, e que uma codificação eficiente é obtida por uma representação do erro de quantização na faixa de frequência a ser codificada adicionalmente. Assim, o método padronizado por Codificação Sem Perda Escalável (SLS) ISO/IEC MPEG-4 utiliza esta abordagem, conforme descrito em R. Geiger, R. Yu, J. Herre, S. Rahardja, S. Kim, X. Lin, M. Schmidt, "Codificação de Áudio Avançada Escalável de Alta-definição ISO/IEC MPEG-4", 120° reunião AES, 20 - 23 de maio de 2006, Paris, França, Preprint 6791. Desse modo, é obtida uma extensão sem perdas compatível com versões anteriores dos métodos de codificação de áudio, por exemplo, MPEG- 2/4 AAC, que utiliza o MDCT como um banco de filtro.

Esta abordagem pode, entretanto, não ser aplicada diretamente ao método MPEG-1/2 Camada 3 (MP3) amplamente usado, pois o banco de filtro hibrido usado neste método, ao contrário do MDCT, não é compatível com o IntMDCT ou uma outra transformação de inteiro. Assim, uma formação de diferença entre os valores espectrais decodificados e os valores IntMDCT correspondentes em geral não conduz a pequenos valores diferenciais e, portanto, não leva a uma codificação eficiente dos valores diferenciais. O núcleo do problema aqui é que o tempo se desloca entre as funções de modulação correspondentes do IntMDCT e do banco de filtro hibrido MP3. Estes conduzem a deslocamentos de fase que, nos casos resultam no fato de que valores diferenciais consistem de valores mais altos que os valores do IntMDCT. Além disso, uma aplicação dos princípios básicos do IntMDCT, tal como, por exemplo, o esquema de elevação, para o banco de filtro hibrido de MP3 é problemática, com relação á sua abordagem básica - ao contrário do MDCT - o banco de filtro hibrido é um banco de filtro que não fornece reconstrução perfeita.

SUMÁRIO DA INVENÇÃO

O objetivo da presente invenção é fornecer um conceito eficiente para processar dados de áudio e, em particular, para codificação ou decodificação de dados de áudio.

Este objetivo é alcançado por um dispositivo para pós-processamento de valores espectrais de acordo com a reivindicação 1, um codificador de acordo com a reivindicação 17, um decodificador de acordo com a reivindicação 22 ou um método de acordo com a reivindicação 23, 24, 25 ou um programa de computador de acordo com a reivindicação 26.

A presente invenção está baseada na descoberta de que valores espectrais, por exemplo, representando a camada base de um esquema escalonado, isto é, por exemplo, valores espectrais MP3, são enviados para pós-processamento, para obter os valores deste que são compatíveis com os valores correspondentes obtidos de acordo com um algoritmo de transformação alternativo. De acordo com a invenção, desse modo tal pós-processamento é realizado usando adições ponderadas de valores espectrais de modo que o resultado do pós-processamento é tão semelhante quanto possivel a um resultado que é obtido quando o mesmo sinal de áudio não é convertido em uma representação espectral usando o primeiro algoritmo de transformação, mas usando o segundo algoritmo de transformação, ou seja, nas configurações preferidas da presente invenção, um algoritmo de transformação de inteiro.

Desse modo foi assim encontrado, que mesmo com um primeiro algoritmo de transformação fortemente incompatível e o 5 segundo algoritmo de transformação, através de uma adição ponderada de certos valores espectrais do primeiro algoritmo de transformação, uma compatibilidade dos valores pós-processados com os resultados da segunda transformação foi alcançada sendo assim tão boa que uma camada de extensão eficiente pode ser formada com 10 valores diferenciais, sem as dispendiosas e, portanto, desvantajosas codificação e decodificação do conceito na Fig. 9 e Fig. 10 sendo necessárias. Em particular, a adição ponderada é realizada de tal modo que um valor espectral pós-processado é gerado a partir de uma adição ponderada de um valor espectral e um 15 valor espectral adjacente na saida do primeiro algoritmo de transformação, em que preferivelmente são usados os valores espectrais das faixas de frequência adjacentes e também valores espectrais dos blocos de tempo adjacentes ou periodos de tempo, respectivamente. Pela adição ponderada de valores espectrais 20 adjacentes, foram considerados os filtros adjacentes do primeiro algoritmo de transformação de uma sobreposição de banco de filtro, como é o caso virtualmente com todos os bancos de filtro. Pelo uso de valores espectrais temporalmente adjacentes, isto é, pela adição ponderada de valores espectrais (por exemplo, da mesma ou 25 apenas de uma frequência ligeiramente diferente) de dois blocos subsequentes de valores espectrais da primeira transformação, foi considerado, além disso, que normalmente são usados algoritmos de transformação em que uma sobreposição de bloco é usada.

Preferivelmente, os fatores de ponderação são permanentemente programados no lado do codificador e também no lado do decodif icador, de modo que nenhum bit adicional é necessário para transferir fatores de ponderação. Ao invés disso, 5 os fatores de ponderação são ajustados uma vez e, por exemplo, armazenados como uma tabela ou firmemente implementados no hardware, pois os fatores de ponderação não são dependentes do sinal, mas apenas dependentes do primeiro algoritmo de transformação e do segundo algoritmo de transformação. Em 10 particular, é preferível ajustar os fatores de ponderação de modo que uma resposta de impulso da construção do primeiro algoritmo de transformação e de pós-processamento seja igual a uma resposta de impulso do segundo algoritmo de transformação. Neste aspecto, uma otimização dos fatores de ponderação pode ser empregada 15 manualmente ou auxiliada por computador usando os métodos de otimização conhecidos, por exemplo, usando certos sinais de teste representativos ou, como indicado, usando diretamente as respostas de impulso dos filtros resultantes.

O mesmo dispositivo de pós-processamento pode ser 20 usado no lado do codificador e no lado do decodif icador para adaptar de fato os valores espectrais incompatíveis do primeiro algoritmo de transformação aos valores espectrais do segundo algoritmo de transformação, de modo que ambos os blocos de valores espectrais possam ser enviados para uma formação de diferença para 25 finalmente fornecer uma camada de extensão para um sinal de áudio que é, por exemplo, um sinal MP3 codificado na camada base e compor a extensão sem perdas como a camada de extensão.

Deve ser observado que a presente invenção não está limitada à combinação de MP3 e MDCT inteiro, mas que a presente invenção é de uso em qualquer lugar, quando valores espectrais de algoritmos de transformação de fato incompatíveis tiverem que ser processados juntos, por exemplo, para o propósito de uma formaçao de diferença, uma adiçao ou qualquer outra operação de combinação em um codificador de áudio ou um decodificador de áudio. O uso preferido do dispositivo de pós- processamento inventivo é, entretanto, para fornecer uma camada de extensão para uma camada base em que um sinal de áudio é codificado com uma certa qualidade, em que a camada de extensão, junto com a camada base, serve para alcançar uma qualidade de decodificação mais alta, em que esta decodificação de qualidade mais alta preferivelmente já é uma decodificação sem perdas, mas pode, entretanto, também ser uma decodificação virtualmente sem perdas, desde que a qualidade do sinal de áudio decodificado seja melhorada usando a camada de extensão quando comparada à decodificação usando apenas a camada base.

BREVE DESCRIÇÃO DOS DESENHOS

A seguir, as configurações preferidas da presente invenção são explicadas com mais detalhes em relação aos desenhos que acompanham, onde:

Fig. 1 mostra um dispositivo inventivo para pós-processamento de valores espectrais;

Fig. 2 mostra um lado do codificador de um conceito de codificador inventivo;

Fig. 3 mostra um lado do decodificador de um conceito de decodificador inventivo;

Fig. 4 mostra uma ilustração detalhada de uma configuração preferida do pós-processamento inventivo e a formação de diferença para blocos longos;

Fig. 5a mostra uma implementação preferida do dispositivo de pós-processamento inventivo para blocos curtos de acordo com uma primeira variante;

Fig. 5b mostra uma ilustração esquemática dos blocos de valores pertencentes juntos do conceito mostrado na Fig. 5a;

Fig. 5c mostra uma sequência de janelas da variante mostrada na Fig. 5a;

Fig. 6a mostra uma implementação preferida do dispositivo de pós-processamento inventivo e a formação de diferença para blocos curtos de acordo com uma segunda variante da presente invenção;

Fig. 6b mostra uma ilustração dos valores diversos da variante ilustrada na Fig. 6a;

Fig. 6c mostra um rastro de bloco da variante ilustrada na Fig. 6a;

Fig. 7 mostra uma ilustração do codificador anterior para geração de um fluxo de dados escalonado;

Fig. 8 mostra uma ilustração do decodificador anterior para processamento de um fluxo de dados escalonado;

Fig. 9 mostra uma variante de codificador ineficiente; e

Fig. 10 mostra uma variante de decodificador ineficiente.

DESCRIÇÃO DAS CONFIGURAÇÕES PREFERIDAS

A Fig. 1 mostra um dispositivo inventivo para pós-processamento de valores espectrais que são preferivelmente uma representação com perdas de um sinal de áudio, em que os valores espectrais têm um primeiro algoritmo de transformação básico para conversão do sinal de áudio em uma representação 5 espectral independente do fato dos mesmos serem com perdas ou sem perdas. O dispositivo inventivo ilustrado na Fig. 1 ou o método também esquematicamente ilustrado na Fig. 1, respectivamente, são diferentes entre si - com referência ao dispositivo - por meio de 12 para fornecimento de uma sequência de blocos de valores 10 espectrais representando uma sequência de blocos de amostras do sinal de áudio. Em uma configuração preferida da presente invenção que será ilustrada posteriormente, a sequência de blocos fornecida por meio de 12 é uma sequência de blocos gerada por um banco de filtro MP3. A sequência dos blocos de valores espectrais é 15 fornecida a um combinador inventivo 13, em que o combinador é implementado para executar uma adição ponderada dos valores espectrais da sequência de blocos de valores espectrais para obter, no lado de saida, uma sequência de blocos de valores espectrais pós-processados, como é ilustrado pela saida 14. Em 20 particular, o combinador 13 é implementado para usar, para cálculo de um valor espectral pós-processado para uma banda de frequência e um periodo de tempo, um valor espectral da sequência de blocos para a banda de frequência e o periodo de tempo e um valor espectral para uma banda de frequência adjacente e/ou um periodo 25 de tempo adjacente. Além disso, o combinador é implementado para usar tais fatores de ponderação para ponderar os valores espectrais usados, que os valores espectrais pós-processados são uma aproximação para valores espectrais obtidos por um segundo algoritmo de transformação para conversão do sinal de áudio em uma representação espectral, em que, entretanto, o segundo algoritmo de transformação é diferente do primeiro algoritmo de transformação.

Isto é mostrado pela ilustração esquemática na parte inferior da Fig. 1. Um primeiro algoritmo de transformação é representado por um numeral de referência 16. O pós-processamento, como realizado pelo combinador, é representado pelo numeral de referência 13 e o segundo algoritmo de transformação é representado por um numeral de referência 17. Dos blocos 16, 13 e 17, os blocos 16 e 17 são fixos e normalmente obrigatórios devido a condições externas. Somente os fatores de ponderação do meio de pós-processamento 13 ou o combinador 13, respectivamente, representados pelo numeral de referência 18, podem ser ajustados pelo usuário. Nesta conexão, isto não é dependente do sinal, mas dependente do primeiro algoritmo de transformação e do segundo algoritmo de transformação, entretanto. Pelos fatores de ponderação 18 pode-se ainda ajustar quantos valores espectrais adjacentes com relação à frequência ou os valores espectrais adjacentes no tempo que são combinados entre si. Se um fator de ponderação, como será explicado com relação às Figs. 4 a 6, for ajustado em 0, o valor espectral associado a este fator de ponderação não é considerado na combinação.

Nas configurações preferidas da presente invenção, para cada valor espectral é fornecido um conjunto de fatores de ponderação. Desse modo, resulta uma quantidade considerável de fatores de ponderação. Entretanto isto não é problemático, pois os fatores de ponderação não têm que ser transferidos, mas apenas precisam ser permanentemente programados para o lado do codificador e o lado do decodificador. Se o codificador e o decodificador concordarem portanto com o mesmo conjunto de fatores de ponderação para cada valor espectral e, se aplicável, para cada periodo de tempo, ou, como será ilustrado a seguir, para cada sub-bloco ou posição de ordem, respectivamente, nenhuma sinalização precisa ser usada para a presente invenção, de modo que o conceito inventivo alcança uma redução substancial da taxa de dados na camada de extensão sem qualquer sinalização de informação adicional, sem quaisquer perdas de qualidade associadas.

A presente invenção desse modo fornece uma compensação dos deslocamentos de fase entre valores de frequência, quando eles são obtidos pelo primeiro algoritmo de transformação e valores de frequência, quando eles são obtidos pelo segundo algoritmo de transformação, em que esta compensação de deslocamentos de fase pode ser apresentada através de uma representação espectral complexa. Para este propósito, o conceito descrito em DE 10234130 é incluido por razões de clareza, em que para cálculo das partes imaginárias dos valores de saida do banco de filtro real são obtidas as combinações lineares, temporária e espectralmente, dos valores espectrais adjacentes. Se este procedimento foi usado para valores espectrais MP3 decodificados, seria obtida uma representação espectral complexa-estimada. Cada um dos valores espectrais complexos resultantes agora pode ser modificado em sua posição de fase por uma multiplicação por um fator de correção complexo-estimado de modo que, de acordo com a presente invenção, se obtém o segundo algoritmo de transformação tão próximo quanto possível, i.e. preferivelmente o valor IntMDCT correspondente, sendo assim adequado para uma formação de diferença. Além disso, de acordo com a invenção, também é realizada uma correção de amplitude possivelmente requerida. De acordo com a invenção, estas etapas para a formação da representação espectral complexa-estimada e a correção de fase ou soma, respectivamente, são resumidas de tal forma que pela combinação linear dos valores espectrais com base no primeiro algoritmo de transformação e seus vizinhos temporais e espectrais, um novo valor espectral é formado que minimiza a diferença para o valor IntMDCT correspondente. De acordo com a invenção, ao contrário da DE 10234130, um pós-processamento dos valores de saída do banco de filtro não é realizado usando fatores de ponderação a fim de obter as partes imaginárias e reais. Ao invés disso, de acordo com a invenção um pós-processamento é realizado usando os tais fatores de ponderação que, como foi ilustrado na parte inferior da Fig. 1, uma combinação do primeiro algoritmo de transformação 16 e o pós-processamento 13 é ajustada pelos fatores de ponderação de modo que o resultado corresponde com um segundo algoritmo de transformação até quanto possível.

As Figs. 2 e 3 mostram um campo de uso preferido do conceito inventivo ilustrado na Fig. 1 no lado do codificador (Fig. 2) e também no lado do decodif icador (Fig. 3) de um codificador escalável. Um fluxo de bit MP3 20 ou - geralmente - um fluxo de bit, respectivamente, como pode ser obtido por um primeiro algoritmo de transformação, é enviado a um bloco 21 para gerar os valores espectrais a partir do fluxo de bit que são, por exemplo, valores espectrais MP3. A decodificação dos valores espectrais no bloco 21 desse modo normalmente incluirá uma decodificação de entropia e uma quantizaçâo reversa.

Então, no bloco 10, um cálculo dos valores de aproximação é realizado, em que o cálculo de tais valores ou dos blocos de valores espectrais pós-processados, respectivamente, é realizado como foi ilustrado na Fig. 1. Depois disto, uma formação de diferença é realizada em um bloco 22, usando valores espectrais de IntMDCT, quando eles são obtidos por uma conversão de IntMDCT em um bloco 23. O bloco 23 desse modo obtém um sinal de áudio como um sinal de entrada do qual o fluxo de bit MP3, tal como é enviado para a entrada 20, foi obtido por codificação. Preferivelmente, os espectros diferenciais quando obtidos pelo bloco 22 são enviados para uma codificação sem perdas 24 que, por exemplo, inclui uma codificação delta, uma codificação Huffman, uma codificação aritmética ou qualquer outra codificação por entropia através da qual a taxa de dados é reduzida, nenhuma perda é introduzida em um sinal, entretanto.

No lado do decodificador, o fluxo de bit MP3 20, quando também foi enviado para a entrada 20 da Fig. 2, é outra vez enviado para uma decodificação dos valores espectrais por um bloco 21, que pode corresponder ao bloco 21 da Fig. 2. Depois disto, os valores espectrais MP3 obtidos na saida do bloco 21 são novamente processados de acordo com a Fig. 1 ou bloco 10. No lado do decodificador, entretanto, os blocos de valores espectrais pós- processados, quando emitidos pelo bloco 10, são fornecidos para um estágio de adição 30, que obtém os valores diferenciais de IntMDCT em sua outra entrada, quando são obtidos por uma decodificação sem perdas 31 a partir do fluxo de bit de extensão sem perda que foi emitido pelo bloco 24 na Fig. 2. Pela adição dos valores diferenciais de IntMDCT emitidos pelo bloco 31 e dos valores espectrais processados emitidos pelo bloco 10, então, em uma saida 32 do estágio de adição 30 os blocos de valores espectrais de 5 IntMDCT são obtidos, sendo uma representação sem perdas do sinal de áudio original, isto é, do sinal de áudio que foi introduzido no bloco 23 da Fig. 2. O sinal de saida de áudio sem perda é então gerado por um bloco 33 que executa um IntMDCT reverso a fim de obter um sinal de saida de áudio sem perdas ou virtualmente sem 10 perdas. Em geral, o sinal de saida de áudio na saida do bloco 33 tem uma qualidade melhor que o sinal de áudio que seria obtido se o sinal de saida do bloco 21 fosse processado com um banco de filtro hibrido de sintese MP3. Dependendo da implementação, o sinal de saida de áudio na saida 33 pode, portanto, ser uma 15 reprodução idêntica do sinal de áudio que foi introduzido no bloco 23 da Fig. 2 ou uma representação deste sinal de áudio, que não é idêntica, isto é, não completamente sem perda, que, entretanto, já tem uma qualidade melhor que um sinal de áudio codificado MP3 normal.

Neste ponto deve ser observado que, como um primeiro algoritmo de transformação, o algoritmo de transformação MP3 com seu banco de filtro hibrido é preferido e que como um segundo algoritmo de transformação, o algoritmo IntMDCT como um algoritmo de transformação de inteiro é preferido. A presente 25 invenção já é vantajosa em qualquer lugar, entretanto, onde dois algoritmos de transformação são diferentes entre si, em que ambos os algoritmos de transformação não necessariamente precisam ser algoritmos de transformação de inteiro dentro do escopo da transformação de IntMDCT, mas também podem ser algoritmos de transformação normais que são, dentro do escopo de um MDCT, não necessariamente uma transformação de inteiro reversível. De acordo com a invenção é preferível, entretanto, que o primeiro algoritmo de transformação seja um algoritmo de transformação de não-inteiro e que o segundo algoritmo de transformação seja um algoritmo de transformação de inteiro, em que o pós-processamento inventivo seja em particular vantajoso quando o primeiro algoritmo de transformação fornecer espectros que são comparados aos espectros fornecidos pelo segundo algoritmo de transformação, deslocados e/ou alterados por fase com relação às suas quantidades. Em particular, quando o primeiro algoritmo de transformação não estiver mesmo perfeitamente reconstruindo, o pós-processamento simples inventivo através de uma combinação linear é especialmente vantajoso, podendo ser usado de forma eficiente.

A Fig. 4 mostra uma implementação preferida do combinador 13 dentro de um codificador. A implementação dentro de um decodificador é idêntica, entretanto, se o somador 22 nãofor, como na Fig. 4, executa uma formação de diferença, como ilustrado pelo sinal de subtração acima do somador 22, mas quando uma operação de adição é realizada, como está ilustrado no bloco 30 da Fig. 3. Em cada caso os valores que são fornecidos para uma entrada 40 são os valores como obtidos pelo segundo algoritmo de transformação 23 da Fig. 2 para a implementação do codificador ou como são obtidos pelo bloco 31 da Fig. 3 na implementação do decodificador.

Em uma configuração preferida da presente invenção, o combinador inclui três seções 41, 42, 43. Cada seção inclui três multiplicadores 42a, 42b, 42c, em que cada multiplicador está associado a um valor espectral com um indice de frequência k-1, k ou k+1. Desse modo, o multiplicador 42a está associado ao indice de frequência k-1. O multiplicador 42b está associado ao indice de frequência k e o multiplicador 42c está associado ao indice de frequência k+1.

Assim, cada ramificação serve para ponderação de valores espectrais de um bloco atual com o indice de bloco v ou n+1, n ou n-1, respectivamente, para obter os valores espectrais ponderados para o bloco atual.

Desse modo, a segunda seção 42 serve para ponderação de valores espectrais de um bloco precedente temporalmente ou bloco subsequente temporalmente. Com relação à seção 41, a seção 42 serve para ponderação de valores espectrais do bloco n temporalmente seguindo o bloco n+1 e a seção 43 serve para ponderação do bloco n-1 seguindo o bloco n. Para indicar isto, os elementos de atraso 44 são indicados na Fig. 4. Por razões de clareza, somente um elemento de atraso "z"1" é designado pelo numeral de referência 44.

Em particular, cada multiplicador é fornecido com um fator de ponderação espectral indice-dependente c0(k) a c8(k). Assim, na configuração preferida da presente invenção, resultam nove valores espectrais ponderados, a partir dos quais um valor espectral pós-processado y é calculado para o indice de frequência k e o bloco de tempo n. Esses nove valores espectrais ponderados são adicionados em um bloco 45.

O valor espectral pós-processado do indice de indice de tempo n é, portanto, calculado pela adição dos valores espectrais ponderados possivelmente diferentes do bloco precedente temporalmente (n-1) e o bloco subsequente temporalmente (n+1) e usando valores espectrais adjacentes respectivamente ascendentes (k+1) e descendentes (k-1).

Implementações mais simples, entretanto, somente podem ser que um valor espectral do indice de frequência k seja combinado apenas com um valor espectral adjacente k+1 ou k-1 do mesmo bloco, em que este valor espectral que é combinado com o valor espectral do indice de frequência k, necessariamente não tem que ser 10 diretamente adjacente, mas também ser um valor espectral diferente do bloco. Devido à sobreposição tipica de bandas adjacentes é preferivel, entretanto, executar uma combinação com o valor espectral adjacente diretamente para o topo e/ou para a parte inferior.

Além disso, alternativamente ou adicionalmente, cada valor espectral com um valor espectral de uma duração de tempo diferente, isto é, um indice de bloco diferente, pode ser combinado com o valor espectral correspondente do bloco n, em que este valor espectral de um bloco diferente necessariamente não 20 precisa ter o mesmo indice de frequência mas pode ter um diferente, por exemplo, indice de frequência adjacente. Preferivelmente, entretanto, pelo menos o valor espectral com o mesmo indice de frequência de um bloco diferente é combinado com o valor espectral do bloco considerado atualmente. Este outro bloco 25 novamente necessariamente não precisa ser aquele adjacente temporalmente direto, embora isto seja especialmente preferivel quando o primeiro algoritmo de transformação e/ou segundo algoritmo de transformação tiver uma característica de sobreposição de bloco, como é típico para codificadores MP3 ou codificadores AAC.

Isto significa que, quando os fatores de ponderação da Fig. 4 são considerados, pelo menos o fator de 5 ponderação c4(k) é desigual a 0 e que pelo menos um segundo fator de ponderação é desigual a 0, enquanto todos os outros fatores de ponderação também podem ser iguais a 0, o que também já pode fornecer um processamento, que pode, entretanto, devido ao baixo número de fatores de ponderação desiguais a 0, apenas ser uma 10 aproximação relativamente grossa do segundo algoritmo de transformação, se novamente considerada a metade inferior da Fig. 1. Para considerar mais que nove valores espectrais, podem ser acrescentadas ramificações adicionais para blocos adicionais no futuro ou adiante. Além disso, também podem ser acrescentados 15 multiplicadores adicionais e fatores de ponderação correspondentes adicionais para valores espectrais situados espectralmente mais distantes, para gerar um campo do campo 3x3 da Fig. 4, que consiste de mais que três linhas e/ou mais que três colunas. Foi descoberto que, entretanto, quando nove fatores de ponderação são 20 permitidos para cada valor espectral, comparado com um número inferior de fatores de ponderação, são obtidas melhorias substanciais, enquanto que quando o número de fatores de ponderação é aumentado, não é obtida nenhuma melhoria substancial adicional com relação à diminuição dos valores diferenciais nas 25 saídas do bloco 22, de modo que um número grande de fatores de ponderação com os algoritmos de transformação típicos com uma sobreposição dos filtros sub-banda adjacentes e uma sobreposição temporária dos blocos adjacentes não resulta em melhorias substanciais.

Com relação à sobreposição de 50 por cento usada na sequência de blocos longos, são feitas referências para a ilustração esquemática da Fig. 5c em 45 à esquerda da figura, onde dois blocos longos subsequentes são ilustrados esquematicamente. O conceito de combinador ilustrado na Fig. 4 é assim sempre usado, de acordo com a invenção, quando uma sequência de blocos longos é usada, em que o comprimento de bloco do algoritmo IntMDCT 23 e o grau de sobreposição do algoritmo IntMDCT é ajustado igual ao grau de sobreposição do filtro de análise MP3 e do comprimento de bloco do filtro de análise MP3. Em geral, é preferivel que a sobreposição de bloco e o comprimento de bloco de ambos os algoritmos de transformação sejam ajustados igualmente, o que não representa limitação especial, pois o segundo algoritmo de transformação, isto é, por exemplo, o IntMDCT 23 da Fig. 2, pode ser ajustado facilmente com relação àqueles parâmetros, enquanto que o mesmo não é facilmente possivel com o primeiro algoritmo de transformação, em particular quando o primeiro algoritmo de transformação é padronizado como com relação ao exemplo de MP3 e é frequentemente usado e, portanto, não pode ser alterado.

Como já ilustrado com referência às Figs. 2 e 3, o decodificador associado na Fig. 3 inverte a formação de diferença novamente através de uma adição dos mesmos valores de aproximação, isto é, os valores diferenciais de IntMDCT na saida do bloco 22 da Fig. 2 ou na saida do bloco 31 da Fig. 3.

De acordo com a invenção, este método, portanto, pode ser geralmente aplicado à formação de diferença entre diferentes, isto é, quando um banco de filtro/transformação básica do primeiro algoritmo de transformação é diferente de um banco de filtro/transformação básica do segundo algoritmo de transformação.

Um exemplo de aplicação concreta é o uso de valores espectrais MP3 do "bloco longo" ligado a um IntMDCT, como foi descrito com referência à Fig. 4. Como a resolução de frequência do banco de filtro híbrido neste caso é 576, o IntMDCT também consistirá de uma resolução de frequência de 57 6, de modo que o comprimento de janela possa consistir de um máximo de 1152 amostras de tempo.

No exemplo descrito a seguir, somente são usados os vizinhos temporais e espectrais diretos, enquanto que no caso geral também podem ser (ou alternativamente) usados valores mais distantes.

Se o valor espectral da banda k-th no bloco n-th MP3 for designado por x(k,n) e o valor espectral correspondente de IntMDCT for designado por y(k,n), a diferença é calculada como ilustrado na Fig. 4 para d(k,n). y (k,n) é o valor de aproximação para y(k,n) obtido através de combinação linear e é determinado como ilustrado pela equação longa abaixo da Fig. 4.

Deve ser observado que, devido à diferença de fase diferente para cada uma das 57 6 sub-bandas, pode ser requerido um conjunto de coeficiente distinto. Na realização prática, como ilustrado na Fig. 4, para um acesso a valores espectrais adjacentes temporalmente, são usados atrasos 44 cujos valores de saída respectivamente correspondem aos valores de entrada em um bloco precedente correspondente. Para permitir são atrasados desse modo por um atraso 46 os valores espectrais de IntMDCT quando aplicados à entrada 40.

A Fig. 5a mostra um procedimento um pouco modificado quando o banco de filtro hibrido MP3 fornece blocos curtos em que três sub-blocos respectivamente são gerados por 192 valores espectrais, onde aqui parte da primeira variante da Fig. 5a e também uma segunda variante na Fig. 6a são preferidas de acordo com a invenção.

A primeira variante está baseada em uma aplicação tripla de um IntMDCT com uma resolução de frequência 192 para formação dos blocos correspondentes de valores espectrais. Aqui, os valores de aproximação podem ser formados a partir de três valores pertencentes a um indice de frequência e seus correspondentes vizinhos espectrais. Para cada sub-bloco, é requerido aqui um conjunto distinto de coeficientes. Para descrição do procedimento, portanto, é introduzido um indice de sub-bloco u, de modo que n novamente corresponda ao indice de um bloco completo de comprimento 576. Expresso como uma equação, assim resulta o sistema de equações da Fig. 5a. Tal sequência de blocos é ilustrada na Fig. 5b com referência aos valores e na Fig. 5c com referência às janelas. O codificador MP3 fornece blocos MP3 curtos, como ilustrados em 50. A primeira variante também fornece os blocos IntMDCT curtos y(u0), y(ui) e y(u2), como ilustrado em 51 na Fig. 5b. Por isso, três blocos diferenciais curtos 52 podem ser calculados de tal forma que resulte uma representação 1:1 entre um valor espectral correspondente na frequência k nos blocos 50, 51 e 52 .

Ao contrário da Fig. 4 deve ser observado que, na Fig. 5a atrasos 44 não são indicados. Isto resulta do fato de que o pós-processamento somente pode ser realizado quando foram calculados todos os três sub-blocos 0, 1, 2 de um bloco n. Se o sub-bloco com o indice 0 for o primeiro sub-bloco temporalmente e se o próximo sub-bloco com o indice 1 for o bloco posterior temporalmente e se o indice u=2 for novamente o bloco curto posterior temporalmente, então o bloco diferencial do indice u=0 é calculado usando valores espectrais provenientes do sub-bloco Uoz do sub-bloco Ui e do sub-bloco U2. Isto significa que, somente com referência ao sub-bloco calculado atualmente com o indice 0 são usados os futuros sub-blocos 1 e 2, entretanto nenhum valor espectral do passado. Isto é sensato, quando realizada uma interrupção para blocos curtos, quando havia um resultado transiente no sinal de áudio quando conhecido e, por exemplo, ilustrado na publicação de Edler especializada acima mencionada. Os valores pós-processados do sub-bloco tendo o indice 1 usado para ganhar os valores diferenciais tendo o indice de sub-bloco 1 são, entretanto, calculados a partir de um precedente temporalmente, de um atual temporalmente e de um sub-bloco subsequente temporalmente, enquanto os valores espectrais pós- processados do terceiro sub-bloco com o indice 2 não são calculados usando os sub-blocos futuros mas apenas usando os sub- blocos passados tendo o indice 1 e o indice 0, que também são tecnicamente sensatos em até onde possivel novamente, como indicado na Fig. 5c, facilmente uma comutação de janela para janelas longas pode ser iniciada por uma janela parada, de modo que posteriormente pode ser realizada novamente uma alteração diretamente para o esquema do bloco longo da Fig. 4.

A Fig. 5 torna claro que, em particular, com blocos curtos, entretanto também geralmente, pode ser sensato olhar apenas para o passado ou para o futuro e nem sempre, como indicado na Fig. 4, para o passado e também para o futuro, para obter os valores espectrais que forneçam um valor espectral pós- processado após uma ponderação e uma soma.

A seguir, com referência às Figs. 6a, 6b e 6c, a segunda variante para blocos curtos é ilustrada. Na segunda variante, a resolução de frequência de IntMDCT é ainda 576, de modo que cada um dos três valores espectrais de IntMDCT adjacentes espectralmente residem na faixa de frequência de um valor espectral MP3. Assim, para cada um destes três valores espectrais de IntMDCT, para uma formação de diferença uma combinação linear distinta é formada a partir dos três valores espectrais de sub- bloco subsequentes temporalmente e seus vizinhos espectrais, em que o indice s que também é referido como um indice de ordem agora indica a posição dentro de cada grupo de três. Desse modo, resulta a equação como ilustrada na Fig. 6a abaixo do diagrama de blocos. Esta segunda variante é especialmente adequada se uma função de janela com uma pequena área de sobreposição é usada no IntMDCT, quando então a seção do sinal considerado corresponde bem àquela dos três sub-blocos. Neste caso, como com a primeira variante, é preferivel adaptar as formas de janela do IntMDCT dos blocos longos precedentes ou subsequentes, respectivamente, de modo que resulte uma reconstrução perfeita. Um diagrama de blocos correspondente para a primeira variante é ilustrado na Fig. 5c. Um diagrama correspondente para a segunda variante é ilustrado na Fig. 6c, em que agora apenas um único bloco IntMDCT longo é gerado pela janela longa 63, em que este bloco IntMDCT longo agora consiste de k blocos triplos de valores espectrais, em que a largura de banda de tal bloco triplo resultante de s=0, s = l e s=2 é igual à largura de banda de um bloco k dos blocos MP3 curtos 60 na Fig. 6b. A partir da Fig. 6a pode ser visto que para uma subtração do primeiro valor espectral com s=0 para um bloco triplo tendo o indice k novamente são usados os valores do sub-bloco atual, futuro e próximo futuro 0, 1, 2, entretanto, nenhum valor do passado é usado. Para calcular um valor diferencial para o segundo valor s=l de um grupo triplo, entretanto, são usados valores espectrais do sub-bloco precedente e o sub-bloco futuro, enquanto que para calcular um valor espectral diferencial tendo o indice de ordem s=2 são usados apenas sub-blocos precedentes, como ilustrado pelas ramificações 41 e 42 que estão no passado com referência à ramificação 43 na Fig. 6a.

Neste ponto deve ser observado que com todas as regulações de cálculo os termos que excedem os limites da faixa de frequência, isto é, por exemplo, o indice de frequência -1 ou 576 ou 192, respectivamente, são todos omitidos. Nestes casos, no exemplo geral na Figs. 4 a 6 a combinação linear é portanto reduzida a 6 ao invés de 9 termos.

A seguir, é feita uma referência detalhada para as sequências de janela na Fig. 5c e Fig. 6c. As sequências de janela consistem de uma sequência de blocos longos, quando processados pelo cenário na Fig. 4. Depois disto, uma janela de partida 56 segue tendo uma forma assimétrica, quando é "convertida" de uma área de sobreposição longa no começo da janela de partida para uma área de sobreposição curta no final da janela de partida. Análogo a isto, há uma janela de parada 57 que é novamente convertida de uma sequência de blocos curtos para uma sequência de blocos longos, consistindo assim de uma área de sobreposição curta no começo e uma área de sobreposição longa no final.

Uma interrupção de janela é selecionada, como ilustrado na publicação especializada de Edler mencionada acima, se for detectada uma duração de tempo no sinal de áudio por um codificador consistindo de um sinal transiente.

Tal sinalização está localizada no fluxo de bit MP3, de modo que quando o IntMDCT, de acordo com a Fig. 2 e de acordo com a primeira variante da Fig. 5c, também chavear para blocos curtos, não será necessária nenhuma detecção de transiente distinto, mas ocorre uma detecção de transiente baseada apenas em um aviso de janela curta no fluxo de bit MP3. Para o pós- processamento de valores na janela de partida é preferivel, devido à área de sobreposição longa com a janela precedente, usar blocos com o indice de bloco precedente n-1, enquanto que blocos com o indice de bloco subsequente são apenas levemente ponderados ou geralmente não usados devido à área de sobreposição curta. Análogo a isto, a janela de parada para pós-processamento irá considerar apenas valores com um indice de bloco futuro n+1 além dos valores do bloco atual n, mas apenas executará uma ponderação fraca ou uma ponderação igual a 0, ou seja, nenhum uso do passado, isto é, por exemplo, do terceiro bloco curto.

Quando, como mostrado na Fig. 6c, a sequência de janelas como implementada por IntMDCT 23, isto é, o segundo algoritmo de transformação, não faz comutação para janelas curtas entretanto implementa a comutação de janela usada preferivelmente, então é preferivel iniciar ou terminar, respectivamente, a janela com a sobreposição curta, designada por 63 na Fig. 6c, também por uma janela de partida 56 e por uma janela de parada 57.

Embora na configuração ilustrada na Fig. 6c o IntMDCT da Fig. 2 não muda para o modo de janela curta, a sinalização de janelas curtas no fluxo de bit MP3 em qualquer caso pode ser usada para ativar a comutação de janela com uma janela de partida, janela com sobreposição curta, conforme indicado na Fig. 6c em 63 e janela de parada.

Deve ser observado ainda que, em particular, as sequências de janela ilustradas no padrão AAC, adaptadas para o comprimento de bloco MP3 ou MP3 alimentam, respectivamente, 576 valores para blocos longos e 192 valores para blocos curtos e, em particular, também as janelas de partida e janelas de parada ilustradas lá, são especialmente adequadas para uma implementação do IntMDCT no bloco 23 da presente invenção.

A seguir, é feita uma referência para a precisão da aproximação do primeiro algoritmo de transformação e pós- processamento.

Para 576 sinais de entrada respectivamente tendo um impulso na posição 0 ... 575 dentro de um bloco, foram realizadas as seguintes etapas: cálculo do banco de filtro hibrido + aproximação cálculo do MDCT cálculo da soma de quadrados das componentes espectrais de MDCT cálculo da soma de quadrados dos desvios entre as componentes espectrais de MDCT e a aproximação. Aqui, é determinado o desvio quadrado máximo através de todos os 576 sinais. 5 0 desvio quadrado máximo relativo através todas as posições era, ao usar blocos longos de acordo com a Fig. 4, aproximadamente 3,3 % blocos curtos (hibridos) e blocos longos 10 (MDCT) de acordo com a Fig. 6, aproximadamente 20,6 %.

Alguém, portanto, poderia afirmar que, com um impulso nas entradas das duas transformações, a soma dos quadrados dos desvios entre a aproximação e as componentes espectrais da segunda transformação não deve ser maior que 30% (e 15 preferivelmente não mesmo maior que 25% ou 10% respectivamente) da soma de quadrados das componentes espectrais da segunda transformação, independente da posição do impulso no bloco de entrada. Para calcular as somas de quadrados, todos os blocos das componentes espectrais devem ser considerados como sendo afetados 20 pelo impulso.

Deve ser observado que, na inspeção de erro acima (MDCT versus FB hibrido + pós-processamento) sempre o erro relativo foi considerado como sendo independente do sinal.

No IntMDCT (versus MDCT), entretanto, o erro 25 absoluto é independente do sinal e está situado em uma faixa ao redor de -2 a 2 dos valores inteiros arredondados. A partir disto resulta que o erro relativo torna-se dependente do sinal. Para eliminar esta dependência do sinal, preferivelmente é assumido um impulso totalmente controlado (por exemplo, valor 32767 no 16 bit PCM) .

Isto resultará então em um espectro virtualmente plano com uma amplitude média de aproximadamente 32767/sqrt (576) 5 = 1365 (conservação de energia). O erro médio quadrado seria então de cerca de 2A2/1365z'2=0.0002%, ou seja, desprezível.

Entretanto, com um impulso muito baixo na entrada, o erro seria drástico. Um impulso de amplitude 1 ou 2 seria virtualmente completamente perdido no erro de aproximação do 10 IntMDCT.

O critério de erro de precisão da aproximação, isto é, o valor desejado para os fatores de ponderação, é desse modo melhor comparável, quando indicado para um impulso totalmente controlado.

Dependendo das circunstâncias, o método inventivo pode ser implementado em hardware ou em software. A implementação pode ocorrer sobre um meio de armazenamento digital, em particular, um disco flexivel ou um CD tendo sinais eletrônicos de controle de leitura, que pode cooperar com um sistema de 20 computador programável para que o método seja realizado. Em geral, a invenção, portanto, também consiste de um software de computador tendo um código de programa armazenado em um equipamento portador de leitura para realizar o método inventivo, quando o software de computador é executado. Em outras palavras, a invenção assim pode 25 ser realizada como um software de computador tendo um código de programa para execução do método, quando o software é executado em um computador.

Claims

1. Dispositivo (10) para pós-processamento de valores espectrais com base em um primeiro algoritmo de transformação (16) para conversão de um sinal de áudio em uma representação espectral, caracterizado por compreender: um fornecedor (12) para fornecimento de uma sequência de blocos dos valores espectrais que representam uma sequência de blocos de amostras do sinal de áudio; e um combinador (13) para adição de valores espectrais ponderadamente da sequência de blocos de valores espectrais a fim de adquirir uma sequência de blocos de valores espectrais pós-processados, em que o combinador (13) é implantado para usar, para o cálculo de um valor espectral pós-processado para uma banda de frequência e uma duração de tempo, um valor espectral da sequência de blocos para a banda de frequência e a duração de tempo, e um valor espectral para outra banda de frequência ou outra duração de tempo, e em que o combinador (13) é implantado para usar tais fatores de ponderação ao adicionar ponderadamente, em que os valores espectrais pós-processados são uma aproximação aos valores espectrais à medida que eles são obtidos por um segundo algoritmo de transformação (17) para conversão do sinal de áudio em uma representação espectral, em que o segundo algoritmo de transformação (17) é diferente do primeiro algoritmo de transformação (16).

2. Dispositivo (10), de acordo com a reivindicação 1, caracterizado pelo primeiro algoritmo de transformação (16) ser um algoritmo de transformação híbrido que compreende dois estágios, e o segundo algoritmo de transformação (17) ser um algoritmo de transformação de um estágio.

3. Dispositivo (10), de acordo com a reivindicação 1, caracterizado pelo primeiro algoritmo de transformação (16) compreender um banco de filtro polifase e um transformação de cosseno discreta modificada, e em que o segundo algoritmo de transformação (17) é um MDCT inteiro.

4. Dispositivo (10), de acordo com a reivindicação 1, caracterizado pelo primeiro algoritmo de transformação (16) e pelo segundo algoritmo de transformação (17) serem implantados de modo que forneçam sinais de saída reais.

5. Dispositivo (10), de acordo com a reivindicação 1, caracterizado pelo combinador (13) ser implantado para usar tais fatores de ponderação em que o primeiro algoritmo de transformação (16) e um pós- processamento realizado pelo combinador (13) juntos forneçam uma resposta de impulso que aproxime uma resposta de impulso do segundo algoritmo de transformação (17).

6. Dispositivo (10), de acordo com a reivindicação 5, caracterizado, em uma aproximação do primeiro algoritmo de transformação (16) e pós- processamento, pelos fatores de ponderação serem selecionados de modo que com um impulso na entrada das duas transformações, a soma de quadrados dos desvios entre a aproximação e os componentes espectrais da segunda transformação não seja maior que 30% da soma de quadrados dos componentes espectrais da segunda transformação.

7. Dispositivo (10), de acordo com a reivindicação 1, caracterizado pelo fornecedor (12) para fornecimento de uma sequência de blocos ser implantado para fornecer blocos que são uma representação com perdas do sinal de áudio.

8. Dispositivo (10), de acordo com a reivindicação 1, caracterizado pelo combinador (13) para um cálculo de um valor espectral pós-processado para uma banda de frequência k compreender: uma primeira seção (41, 42, 43) para ponderação de valores espectrais de um bloco atual para a banda de frequência k, uma banda de frequência k-1 ou uma banda de frequência k+1, a fim de adquirir valores espectrais ponderados para o bloco atual; uma segunda seção (41, 42, 43) para ponderação de valores espectrais de um bloco k-1 precedente temporalmente ou bloco k+1 subsequente temporalmente, a fim de adquirir valores espectrais ponderados para o bloco precedente temporalmente ou o bloco subsequente temporalmente; e um adicionador (45) para adição dos valores espectrais ponderados para obter um valor espectral pós- processado para a banda de frequência k de um bloco atual ou precedente ou subsequente de valores espectrais pós- processados .

9. Dispositivo (10), de acordo com a reivindicação 8, caracterizado por compreender ainda: uma terceira seção (43) para ponderação de valores espectrais de um bloco precedente, em que a primeira seção (41, 42, 43) é implantada para ponderar valores espectrais de um bloco subsequente, e em que a segunda seção (41, 42, 43) é implantada para ponderar valores espectrais de um bloco atual, e em que o somador é implantado para adicionar valores espectrais ponderados das três seções a fim de adquirir um valor espectral pós- processado para o bloco atual de valores espectrais pós- processados .

10. Dispositivo (10), de acordo com a reivindicação 1, caracterizado pelo primeiro algoritmo de transformação (16) compreender uma função de sobreposição de bloco, em que blocos de amostras do sinal de áudio de tempo em que a sequência de blocos de valores espectrais se baseia na sobreposição.

11. Dispositivo (10), de acordo com a reivindicação 1, caracterizado pelo combinador (13) ser implantado para usar um conjunto de fatores de ponderação independente de sinal para cada valor espectral.

12. Dispositivo (10), de acordo com a reivindicação 1, caracterizado pela sequência de blocos dos valores espectrais compreender um conjunto de blocos de valores espectrais que é menor que um bloco de valores espectrais longo que segue após o conjunto de blocos ou que precede o conjunto de blocos, e em que o combinador (13) é implantado para usar a mesma banda de frequência ou uma banda de frequência adjacente dentre vários blocos do conjunto de blocos curtos para o cálculo de um valor espectral pós-processado para o conjunto de blocos de valores espectrais.

13. Dispositivo (10), de acordo com a reivindicação 12, caracterizado pelo combinador (13) ser implantado para usar apenas valores espectrais de blocos curtos e nenhum valor espectral de um bloco longo precedente ou um bloco longo subsequente para o cálculo de valores espectrais pós-processados devido aos blocos curtos de valores espectrais.

14. Dispositivo (10), de acordo com a reivindicação 1, caracterizado pelo combinador (13) ser implantado para implantar a seguinte equação: y(k,n) = Co (k) x (k-1, n-1)+Ci (k) x (k- 1, n) +c2 (k) x (k-1, n+1) + Cs (k) x (k, n-1) +c4 (k) x (k, n) +c4 (k) x (k, n+1) + c6 (k) x (k+1, n- 1) +c- (k) x (k+1, n) +cs (k) x (k+1, n+1) em que y(k,n) é um valor espectral pós- processado para um indice de frequência k e um indice de tempo n, em que x(k,n) é um valor espectral de um bloco de valores espectrais com um indice de frequência k e um indice de tempo n, em que Co(k), ..., Cg(k) são fatores de ponderação, associados ao indice de frequência k, em que k- 1 é um indice de frequência decrementado, em que k + 1 é um índice de frequência incrementado, em que n-1 é um índice de tempo decrementado e em que n+1 é um índice de tempo incrementado.

15. Dispositivo (10), de acordo com a reivindicação 1, caracterizado pelo combinador (13) ser implantado para implantar a seguinte equação: y(k,n,u) = co(k,u)x(k-l,n,0)c1(k,u)x(k- 1, n, 1) +c8 (k, u) x (k-1, n,2) + Cs (k, u) x (k, n, 0) +c4 (k, u) x (k, n,l) +c8 (k, u) x (k, n,2) + cfj (k, u) x (k+1, n, Q) + c (k, u) x (k+1, n, 1) +c8 (k, u) x (k+1, n, 2) em que y(k,n,u) é um valor espectral pós- processado para um índice de frequência k e um índice de tempo n e um índice de sub-bloco u, em que x(k,n,u) é um valor espectral de um bloco de valores espectrais com um índice de frequência k e um índice de tempo n e um índice de sub-bloco u, em que Co(k), ..., Cg(k) são fatores de ponderação associados ao índice de frequência k, em que k-1 é um índice de frequência decrementado, em que k + 1 é um índice de frequência incrementado, em que n-1 é um índice de tempo decrementado e em que n+1 é um índice de tempo incrementado, em que u é um índice de sub-bloco que indica uma posição de um sub-bloco em uma sequência de sub-blocos, e em que o índice de tempo especifica um bloco longo e o índice de sub-bloco especifica um bloco curto comparativamente.

16. Dispositivo (10), de acordo com a reivindicação 1, caracterizado pelo combinador (13) ser implantado a fim de implantar a seguinte equaçao: y(3k + s,n) = Co(k,s)x(k-l,n,0)+c1(k,s)x(k- l,n, 1) +c2 (k, s) x (k-1, n, 2) + c3 (k, s)x (k,n, 0) +c2 (k, s) x (k, n, 1) +c5 (k, s) x (k, n,2) + cc (k, s) x (k+1, n, 0) +c2 (k, s) x (k+1, n, 1) +c9 (k, s) x (k+1, n, 2) em que y(k,n) é um valor espectral pós- processado para um indice de frequência k e um indice de tempo n, em que x(k,n,u) é um valor espectral de um bloco de valores espectrais com um indice de frequência k e um indice de tempo n e um indice de sub-bloco u, em que c0(k), Cg(k) são fatores de ponderação associados ao indice de frequência k, em que k-1 é um indice de frequência decrementado, em que k+1 é um índice de frequência incrementado, em que n-1 é um índice de tempo decrementado e em que n+1 é um índice de tempo incrementado, em que s é um índice de ordem que indica uma posição de um sub-bloco em uma sequência de sub-blocos, e em que o índice de tempo especifica um bloco longo e o índice de sub-bloco especifica um bloco curto comparativamente.

17. Codificador para codificar um sinal de áudio caracterizado por compreender: um dispositivo (10) para pós-processamento de valores espectrais com base em um primeiro algoritmo de transformação (16) para conversão de um sinal de áudio em uma representação espectral, que compreende: um fornecedor (12) para fornecimento de uma sequência de blocos dos valores espectrais que representam uma sequência de blocos de amostras do sinal de áudio; e um combinador (13) para adição de valores espectrais ponderadamente da sequência de blocos de valores espectrais a fim de adquirir uma sequência de blocos de valores espectrais pós-processados, em que o combinador (13) é implantado para usar, para o cálculo de um valor espectral pós-processado para uma banda de frequência e uma duração de tempo, um valor espectral da sequência de blocos para a banda de frequência e a duração de tempo, e um valor espectral para outra banda de frequência ou outra duração de tempo, e em que o combinador (13) é implantado para usar tais fatores de ponderação ao adicionar ponderadamente, em que os valores espectrais pós-processados são uma aproximação aos valores espectrais à medida que eles são obtidos por um segundo algoritmo de transformação (17) para conversão do sinal de áudio em uma representação espectral, em que o segundo algoritmo de transformação (17) é diferente do primeiro algoritmo de transformação (16); um calculador (23) para calcular uma sequência de blocos de valores espectrais, de acordo com o segundo algoritmo de transformação (17) do sinal de áudio; um formador (22) para uma formação de diferença modo valor-espectral entre a sequência de blocos devido ao segundo algoritmo de transformação (17) e a sequência de blocos de valores espectrais pós-processados.

18. Codificador, de acordo com a reivindicação 17, caracterizado por compreender ainda: um gerador para geração de um fluxo de bit de extensão devido a um resultado gerado pelo formador (22) para uma formação de diferença modo valor-espectral.

19. Codificador, de acordo com a reivindicação 18, caracterizado pelo gerador para geração compreender um codificador de entropia.

20. Codificador, de acordo com a reivindicação 17, caracterizado pela sequência de blocos devido ao primeiro algoritmo de transformação (16) ser com base em uma compressão com perdas, e em que a sequência de blocos devido ao segundo algoritmo de transformação (17) é com base em uma compressão sem perdas ou virtualmente sem perdas.

21. Codificador, de acordo com a reivindicação 17, caracterizado por compreender uma memória para armazenamento dos fatores de ponderação em que os fatores de ponderação são armazenáveis independentemente de um sinal.

22. Codificador, de acordo com a reivindicação 17, caracterizado pelo gerador para geração da sequência de blocos que usa o segundo algoritmo de transformação (17) ser implantado para executar um enquadramento com uma sequência de janela que depende de uma sequência de janela em que a sequência de blocos dos valores espectrais se baseia em qual é dada devido ao primeiro algoritmo de transformação (16).

23. Codificador, de acordo com a reivindicação 22, caracterizado pelo fornecedor (22) para fornecimento de uma sequência de blocos que usa o segundo algoritmo de transformação (17) ser implantado para comutar de uma janela longa com uma área de sobreposição longa para uma janela longa com uma área de sobreposição curta ou para uma pluralidade de janelas curtas, quando, na sequência de blocos dos valores espectrais devido ao primeiro algoritmo de transformação (16), uma comutação para janelas curtas ocorre.

24. Decodificador para decodificação de um sinal de áudio codificado caracterizado por compreender: um dispositivo (10) para pós-processamento de valores espectrais com base em um primeiro algoritmo de transformação (16) para conversão de um sinal de áudio em uma representação espectral, que compreende: um fornecedor (12) para fornecimento de uma sequência de blocos dos valores espectrais que representam uma sequência de blocos de amostras do sinal de áudio; e um combinador (13) para adição de valores espectrais ponderadamente da sequência de blocos de valores espectrais a fim de adquirir uma sequência de blocos de valores espectrais pós-processados, em que o combinador (13) é implantado para usar, para o cálculo de um valor espectral pós-processado para uma banda de frequência e uma duração de tempo, um valor espectral da sequência de blocos para a banda de frequência e a duração de tempo, e um valor espectral para outra banda de frequência ou outra duração de tempo, e em que o combinador (13) é implantado para usar tais fatores de ponderação ao adicionar ponderadamente, em que os valores espectrais pós-processados são uma aproximação aos valores espectrais à medida que eles são obtidos por um segundo algoritmo de transformação (17) para conversão do sinal de áudio em uma representação espectral, em que o segundo algoritmo de transformação (17) é diferente do primeiro algoritmo de transformação (16); um fornecedor (12) para fornecimento de valores diferenciais modo valor-espectral entre uma sequência de blocos de valores espectrais pós-processados devido ao primeiro algoritmo de transformação (16) e uma sequência de blocos devido ao segundo algoritmo de transformação (17); um combinador (13) para combinação da sequência de blocos dos valores espectrais pós-processados e dos valores diferenciais a fim de adquirir uma sequência de blocos de valores espectrais de combinação; e um transformador para transformação inversa da sequência de blocos de valores espectrais de combinação de acordo com o segundo algoritmo de transformação (17) para obter um sinal de áudio decodificado.

25. Método para pós-processamento de valores espectrais que se baseiem em um primeiro algoritmo de transformação (16) para conversão de um sinal de áudio em uma representação espectral, caracterizado por compreender: fornecer, por um fornecedor (12), uma sequência de blocos dos valores espectrais que representam uma sequência de blocos de amostras do sinal de áudio; e adicionar de modo ponderado, por um combinador (13), valores espectrais da sequência de blocos de valores espectrais para obter uma sequência de blocos de valores espectrais pós-processados, em que para o cálculo de um valor espectral pós-processado para uma banda de frequência e uma duração de tempo um valor espectral da sequência de blocos para a banda de frequência e a duração de tempo e um valor espectral para outra banda de frequência ou outra duração de tempo são usados, e em que tais fatores de ponderação são usados ao adicionar ponderadamente de modo que os valores espectrais pós- processados sejam uma aproximação aos valores espectrais à medida que eles são obtidos por um segundo algoritmo de transformação (17) para conversão do sinal de áudio em uma representação espectral, em que o segundo algoritmo de transformação (17) é diferente do primeiro algoritmo de transformação (16), em que pelo menos um dentre o fornecedor (12) e o combinador (13) compreende uma implantação de hardware.

26. Método para codificação de um sinal de áudio caracterizado por compreender: pós-processar, por um dispositivo (10) para pós-processamento, valores espectrais que se baseiam em um primeiro algoritmo de transformação (16) para conversão de um sinal de áudio em uma representação espectral, que compreende: fornecer uma sequência de blocos dos valores espectrais que representam uma sequência de blocos de amostras do sinal de áudio; e adicionar de modo ponderado valores espectrais da sequência de blocos de valores espectrais para obter uma sequência de blocos de valores espectrais pós-processados, em que para o cálculo de um valor espectral pós-processado para uma banda de frequência e uma duração de tempo um valor espectral da sequência de blocos para a banda de frequência e a duração de tempo e um valor espectral para outra banda de frequência ou outra duração de tempo são usados, e em que tais fatores de ponderação são usados ao adicionar ponderadamente de modo que os valores espectrais pós-processados sejam uma aproximação aos valores espectrais à medida que eles são obtidos por um segundo algoritmo de transformação (17) para conversão do sinal de áudio em uma representação espectral, em que o segundo algoritmo de transformação (17) é diferente do primeiro algoritmo de transformação (16); calcular, por um calculador (23), uma sequência de blocos de valores espectrais de acordo com o segundo algoritmo de transformação (17) do sinal de áudio; formação de diferença modo valor-espectral, por um formador (22) entre a sequência de blocos de valores espectrais devido ao segundo algoritmo de transformação e a sequência de blocos de valores espectrais pós-processados, em que pelo menos um dentre o dispositivo (10) para pós-processamento do calculador (23) ou do formador (22) compreende uma implantação de hardware.

27. Método para decodificar um sinal de áudio codificado caracterizado por compreender: pós-processar, por um dispositivo (10) para pós-processamento, valores espectrais que se baseiam em um primeiro algoritmo de transformação (16) para conversão de um sinal de áudio em uma representação espectral, que compreende: fornecer uma sequência de blocos dos valores espectrais que representam uma sequência de blocos de amostras do sinal de áudio; e adicionar de modo ponderado valores espectrais da sequência de blocos de valores espectrais para obter uma sequência de blocos de valores espectrais pós-processados, em que para o cálculo de um valor espectral pós-processado para uma banda de frequência e uma duração de tempo um valor espectral da sequência de blocos para a banda de frequência e a duração de tempo e um valor espectral para outra banda de frequência ou outra duração de tempo são usados, e em que tais fatores de ponderação são usados ao adicionar ponderadamente de modo que os valores espectrais pós-processados sejam uma aproximação aos valores espectrais à medida que eles são obtidos por um segundo algoritmo de transformação (17) para conversão do sinal de áudio em uma representação espectral, em que o segundo algoritmo de transformação (17) é diferente do primeiro algoritmo de transformação (16); fornecer, por um fornecedor (12), valores diferenciais modo valor-espectral entre uma sequência de blocos de valores espectrais pós-processados devido ao primeiro algoritmo de transformação (16) e uma sequência de blocos de valores espectrais devido ao segundo algoritmo de transformação (17); combinar, por um combinador (13), a sequência de blocos dos valores espectrais pós-processados e os valores diferenciais para obter uma sequência de blocos de valores espectrais de combinação; e transformar de modo inverso, por um transformador, a sequência de blocos de valores espectrais de combinação, de acordo com o segundo algoritmo de transformação (17), para obter um sinal de áudio decodificado, em que pelo menos um dentre o dispositivo (10) para pós-processamento do fornecedor (12), o combinador (13) ou o transformador compreende uma implantação de hardware.