BR112016003029B1

BR112016003029B1 - Aparelho e método para processamento de um sinal de áudio utilizando uma combinação em uma faixa de sobreposição

Info

Publication number: BR112016003029B1
Application number: BR112016003029-0A
Authority: BR
Inventors: Nagel Frederik; Neukam Christian; Disch Sascha; Geiger Ralf; Edler Bernd
Original assignee: Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V
Priority date: 2013-08-23
Filing date: 2014-08-22
Publication date: 2023-04-04
Also published as: TWI570708B; AU2014310547B2; PT3028275T; TWI570709B; US20160163323A1; AU2014310547A1; CN105556601A; MY175355A; JP2016528562A; CA2921192A1; CN105556600B; WO2015025051A1; EP3028275A1; BR112016003029A2; RU2016110408A; PL3028275T3; MX354372B; EP3036738B1; AR097443A1; CN105556600A

Abstract

APARELHO E MÉTODO PARA PROCESSAMENTO DE UM SINAL DE ÁUDIO UTILIZANDO UMA COMBINAÇÃO EM UMA FAIXA DE SOBREPOSIÇÃO. Um aparelho para processamento de um sinal de áudio, compreendendo uma sequência de blocos (114) de valores espectrais, compreende: um processador (100) para processar a sequência de blocos utilizando, pelo menos, um valor de modificação (102) para um primeiro bloco para obter um primeiro sinal de resultado de distorção reduzida ou livre de distorção em uma faixa de sobreposição (170) e utilizando, pelo menos, um segundo valor de modificação diferente (106) para um segundo bloco da sequência de blocos para obter um segundo sinal de resultado de distorção reduzida ou livre de distorção (108) na faixa de sobreposição (170) e um combinador (110) para combinar o primeiro sinal de resultado (104) e o segundo sinal de resultado (108) na faixa de sobreposição (170) para obter um processador do sinal (112) para a faixa de sobreposição (170).

Description

RELATÓRIO DESCRITIVO

[0001] A presente invenção refere-se ao processamento de áudio e, particularmente, ao processamento de áudio no contexto de processamento afetado por distorção dos sinais de áudio.

[0002] Na operação normal, a Transformada de Cosseno Discreta Modificada (MDCT | Modified Discrete Cosine Transform) tem recursos que a tornam uma ferramenta bem adequada para aplicações de codificação de áudio. Ela gera uma representação do sinal espectral criticamente amostrado das estruturas de sobreposição e fornece uma reconstrução perfeita. Isso significa que o sinal de entrada pode ser reconstruído a partir dos coeficientes espectrais de uma transformada de avanço aplicando a transformada de retrocesso e uma operação de adição de sobreposição nas regiões de sobreposição. Entretanto, se processamento adicional for aplicado nos coeficientes espectrais, a MDCT tem algumas desvantagens em comparação às representações superamostradas como processamento sobreposto com base em DFT. Mesmo o tempo relativamente simples e o controle de ganho dependente da frequência, conforme utilizado para controle de faixa dinâmica ou prevenção de recorte, podem produzir efeitos adicionais indesejados. Assim, o pós-processamento separado com base em DFT na decodificação de áudio é aplicado em várias aplicações que exigem esse tipo de modificação de sinal, embora uma representação espectral com base em MDCT estaria disponível dentro do decodificador. Uma desvantagem além da complexidade computacional é o atraso adicional introduzido por tal pós-processamento.

[0003] Uma abordagem comum para a redução da distorção do domínio de tempo da MDCT é recriar uma transformada revestida complexa modulada superamostrada (MCLT | modulated complex lapped transform). A MCLT resulta da combinação da MDCT com sua contraparte complexa, a Transformada de Seno Discreta Modificada (MDST | Modified Discrete Sine Transform). A MCLT oferece recursos similares como uma representação de DFT de um sinal e, portanto, sua robustez contra a distorção de domínio de tempo (TDA | time domain aliasing) devido à manipulação espectral é comparável à representação de DFT. Mas, infelizmente, calcular o espectro de MDST pelo espectro de MDCT é computacionalmente muito complexo e produz um atraso de sinal significante. Assim, o estão da técnica fornece técnicas para reduzir atraso e complexidade [2 - 3]. Nessas abordagens, uma transformada real a complexa (R2C | real-to-complex) é utilizada para aproximar os valores de MDST necessários. Então, no domínio de MCLT, a manipulação dos coeficientes espectrais é aplicada. Depois disso, os valores complexos são transformados em domínio de MDCT novamente, utilizando uma transformada complexa a real (C2R | complex-to-real). Embora essa abordagem entregue bons resultados em termos de robustez da distorção, ela tem algumas desvantagens. Primeiro, os coeficientes de MDST são estimados e sua precisão é definida pela quantidade da complexidade computacional. Segundo, a cadeia de transformada R2C-C2R ainda produz atraso.

[0004] [1] H. S. Malvar, “A modulated complex lapped transform and its applications to audio processing”, in Proc. IEEE Int. Conf. on Acoustics, Speech, and Signal Processing (ICASSP), Phoenix, March 1999.

[0005] [2] Kuech, F.; Edler, B., “Distorção Reduction for Modified Discrete Cosine Transform Domain Filtering and its Application to Speech Enhancement”, in IEEE Workshop on Applications of Signal Processing to Audio and Acoustics, 21-24 Oct. 2007.

[0006] [3] Edler, B., “Distorção Reduction for Gain Control with Critically Sampled Filter Banks”, in First International Conference on Communications and Electronics, ICCE '06, 10-11 Oct. 2006.

[0007] [4] E. Larsen and R. M. Aarts. Audio Bandwidth Extension - Application to psychoacoustics, Signal Processing and Loudspeaker Design. John Wiley & Sons, Ltd, 2004.

[0008] [5] M. Dietz, L. Liljeryd, K. Kjorling and O. Kunz, “Spectral Band Replication, a novel approach in audio coding” , in 112th AES Convention, Munich, May 2002.

[0009] [6] P. Ekstrand, “Bandwidth Extension of Audio Signals by Spectral Band Replication”, in Proceedings of 1st IEEE Benelux Workshop on MPCA, Leuven, November 2002

[00010] É um objeto da presente invenção fornecer um conceito melhorado para processamento de um sinal de áudio.

[00011] Esse objeto é alcançado por um aparelho para processamento de um sinal de áudio, de acordo com a reivindicação 1, um método para processamento de um sinal de áudio, de acordo com a reivindicação 15 ou um programa de computador, de acordo com a reivindicação 16.

[00012] Em um aspecto da presente invenção, um aparelho para processamento de um sinal de áudio, compreendendo uma sequência de blocos de valores espectrais, compreende um processador para processar a sequência de blocos de valores espectrais, utilizando, pelo menos, um valor de modificação para um primeiro bloco para obter um primeiro sinal de resultado com distorção reduzida ou livre de distorção em uma faixa de sobreposição e utilizando, pelo menos, um segundo valor de modificação diferente de um segundo bloco da sequência de blocos de valores espectrais para obter um segundo sinal de resultado com distorção reduzida ou livre de distorção na faixa de sobreposição. Então, ambos os sinais na faixa de sobreposição, ambos constituindo uma determinada representação de uma mesma parte do sinal, são combinados para obter o processador do sinal para a faixa de sobreposição.

[00013] Preferivelmente, essa combinação depende de uma cross-fade (transição livre) de um sinal de resultado a outro sinal de resultado, ou seja, uma fade-out (conclusão) do primeiro sinal de resultado e simultaneamente um fade-in (início) do segundo sinal de resultado.

[00014] Preferivelmente, o processador compreende um modificador para modificar o primeiro bloco da sequência utilizando, pelo menos, um primeiro valor de modificação para obter um primeiro bloco modificado, para modificar o segundo bloco da sequência utilizando, pelo menos, um segundo valor de modificação para obter um segundo bloco modificado, para modificar o segundo bloco utilizando, pelo menos, o segundo de um primeiro valor de modificação para obter um terceiro bloco modificado e para modificar o primeiro bloco utilizando, pelo menos, um segundo valor de modificação para obter um quarto bloco modificado. Um conversor de tempo espectral é configurado para converter do primeiro ao quarto blocos modificados em representações de tempo respectivas e um adicionador de sobreposição para adição de sobreposição do primeiro e do terceiro blocos modificados para obter um sinal de resultado e para adição de sobreposição das representações de tempo do segundo e do quarto blocos modificados para obter o segundo sinal de resultado é fornecido. Assim, basicamente duas operações de transformada inversa paralela são realizadas, uma com o primeiro valor de modificação de ganho e uma com o segundo valor de modificação de ganho.

[00015] Quando o valor de modificação de ganho é apenas variante no tempo, ou seja, é constante por toda a faixa de frequência, então, apenas um único valor de modificação de ganho é utilizado para a modificação de um bloco. Entretanto, se o valor de modificação de ganho variar pela frequência, então, cada bloco de valores espectrais é modificado com uma pluralidade de valores de modificação de ganho. Um valor de modificação de ganho pode aplicar em cada valor espectral individual ou a um grupo de valores espectrais, como 2, 3, 4 ou 5 valores espectrais adjacentes à frequência. No caso geral, entretanto, um único valor de modificação de ganho pode existir para cada e toda linha espectral, um bloco de valores espectrais é modificado com um número de valores de modificação de ganho onde o número é igual ao número de valores espectrais no bloco de valores espectrais.

[00016] Assim, de acordo com esse aspecto, dois sinais de saída com distorção reduzida ou livre de distorção são gerados para a região de sobreposição e, então, uma cross-fade é realizada entre essas duas saídas ou sinais de resultado.

[00017] De acordo com um aspecto adicional da presente invenção, um aparelho para processamento de um sinal de áudio compreende um processador para calcular um sinal afetado por distorção utilizando, pelo menos, um primeiro valor de modificação para um primeiro bloco da sequência e, pelo menos, um segundo valor de modificação diferente para um segundo bloco da sequência de blocos de valores espectrais. Então, um sinal de erro de distorção é estimado onde esse sinal de erro de distorção está incluído no sinal de áudio afetado por distorção ou submetido a distorção. Então, o sinal afetado por distorção e o sinal de erro de distorção são combinados, de modo que o sinal obtido pela combinação seja um sinal reduzido de distorção ou livre de distorção.

[00018] Em outras palavras, o outro aspecto depende do cálculo de um sinal afetado por distorção e um sinal de erro de distorção e uma combinação subsequente de ambos os sinais, a fim de obter o sinal reduzido de distorção ou livre de distorção. Preferivelmente, a distorção é cancelada por uma reconstrução do sinal de entrada em uma região de sobreposição por uma transformada de frequência-tempo adicional com ganhos iguais para ambos os blocos, uma multiplicação com uma função de janela ou uma função relacionada, uma reversão de tempo, uma multiplicação com uma diferença de ganho entre os dois valores de ganho ou de modificação e uma subtração da saída do processamento com o ganho diferente.

[00019] Preferivelmente, o algoritmo de transformada utilizado é uma transformada de cosseno discreta modificada (MDCT) e a operação de transformada reversa é uma transformada de cosseno discreta modificada inversa. De modo alternativo, outras dessas transformadas de introdução à distorção podem ser utilizadas como uma MDST (transformada de seno discreta modificada) ou uma transformada de seno discreta modificada inversa (IMDST | inverse modified discrete sine transform) ou qualquer outra transformada, na qual no lado da análise um número de amostras em uma parte de tempo é maior que um número de valores espectrais ou, declarado de modo alternativo, na qual há uma região de sobreposição entre as partes de tempo subsequentes resultantes nos dois blocos subsequentes de valores espectrais, ou seja, nos blocos de valores espectrais que são subsequentes no tempo. Aqui, ambos os blocos de valores espectrais estão relacionados, pelo menos parcialmente, a uma e mesma região de sobreposição, ou seja, a região de sobreposição entre essas duas partes de tempo que finalmente resultaram nos dois blocos subsequentes de tempo de valores espectrais. Isso significa que, no lado da análise, o número de amostras de domínio de tempo em um bloco de amostras ou uma estrutura é maior que o número de valores de domínio de frequência em um bloco de representação de domínio de frequência e no lado da síntese o número de amostras de domínio de tempo sintetizadas é maior que o número de valores espectrais em um bloco utilizado para sintetizar os blocos de sobreposição das amostras de domínio de tempo.

[00020] Entretanto, como um estágio final no lado da síntese, um processamento de adição de sobreposição é realizado de modo que, no final, um número de amostras na faixa de sobreposição seja menor que o número de amostras de domínio de tempo em uma estrutura sintetizada e seja preferivelmente igual ao número de valores espectrais de um bloco de valores espectrais. No último caso, uma transformada criticamente amostrada é obtida e tais transformadas são preferidas para a presente invenção, mas a presente invenção também pode ser aplicada a transformadas não criticamente amostradas, embora essas transformadas tenham algum tipo de sobrecarga se comparado às transformadas criticamente amostradas.

[00021] Os aspectos inventivos não são apenas úteis para compensar a distorção devido à modificação de ganho variável de tempo-frequência, mas também para a extensão de largura de banda (BWE | bandwidth extension). Nesse caso de uso, o espectro replicado produzido pelo estágio de cópia do algoritmo de BWE deve ser formado com um envelope espectral para combinar o envelope espectral original o mais próximo possível [4 - 6]. Esse envelope espectral é, no geral, dependente tanto de tempo quanto de frequência. Embora na maioria das técnicas de BWE do estado da técnica o esquema de cópia seja constante, é possível realizar uma cópia variável no tempo que leva a uma distorção adicional. A nova técnica de cancelamento de distorção proposta é também capaz de controlar essas perturbações da BWE.

[00022] As aplicações preferidas da presente invenção serão subsequentemente discutidas no contexto dos desenhos anexos, nos quais: a figura 1a é uma aplicação preferida de um primeiro aspecto; a figura 1b é uma aplicação preferida de um segundo aspecto; a figura 1c é uma representação esquemática de uma sequência de blocos de valores espectrais; a figura 1d é uma representação esquemática da sequência das partes de tempo de sobreposição, resultando na sequência de blocos da figura 1c; a figura 2a ilustra uma implementação de uma transformada de avanço de introdução à distorção; a figura 2b ilustra uma implementação de uma transformada reversa de redução da distorção; a figura 3a ilustra uma aplicação adicional do segundo aspecto; a figura 3b ilustra uma aplicação adicional do segundo aspecto; a figura 3c ilustra um diagrama esquemático de uma aplicação da extensão de largura de banda para o primeiro e o segundo aspectos; a figura 4 ilustra um componente de erro da distorção para o segundo aspecto; a figura 5a ilustra uma aplicação do primeiro aspecto; a figura 5b ilustra uma aplicação do segundo aspecto; a figura 6 ilustra um termo de distorção gerado pela reconstrução, reversão de tempo e janelamento relacionados ao segundo aspecto; a figura 7 ilustra fatores de ganho variáveis em uma estrutura; a figura 8 ilustra uma aplicação dos fatores de ganho antes de um processamento de MDCT inversa; e a figura 9 ilustra sinais relacionados ao processamento da figura 8.

[00023] A figura 1a ilustra um aparelho para processamento de um sinal de áudio que compreende uma sequência de blocos de valores espectrais, de acordo com o primeiro aspecto. O aparelho para processamento compreende um processador (100) para processar a sequência de blocos de valores espectrais utilizando, pelo menos, um valor de modificação (102) para um primeiro bloco para obter um primeiro sinal de resultado de distorção reduzida ou livre de distorção (104). O processador, além disso, processa o segundo bloco da sequência de blocos que está seguindo o primeiro bloco no tempo ou que precede o primeiro bloco no tempo e que é imediatamente adjacente ao primeiro bloco utilizando, pelo menos, um segundo valor de modificação diferente, ou seja, um segundo valor de modificação (106) que é diferente do primeiro valor de modificação para obter um segundo sinal de resultado de distorção reduzida ou livre de distorção (108) em uma faixa de sobreposição. Assim, o processador gera dois sinais de domínio de tempo livre de distorção ou, pelo menos, de distorção reduzida para a mesma faixa de sobreposição. Esses sinais (108) são inseridos em um combinador (110) para combinar o primeiro e o segundo sinais de resultado na faixa de sobreposição para obter um processador do sinal (112) para a faixa de sobreposição. Preferivelmente, o processador é configurado para gerar dois sinais de saída livres de distorção para a região de sobreposição e, então, preferivelmente realiza uma cross-fade entre esses dois sinais de saída livres de distorção. Uma implementação para o processador atingir isso é a provisão de um processamento de transformada inversa completa, como um processamento de IMDCT, para ambos os blocos ou ambos os valores de modificação diferentes para os blocos. Em outras palavras, o processador gera um processamento de IMDCT completo para a faixa de sobreposição do primeiro bloco, um e os mesmos valores de modificação para o primeiro e o segundo bloco. Além disso, o processador realiza um processamento de IMDCT completo para o primeiro e o segundo bloco, mas agora utilizando valores de modificação secundários. Ambas operações de processamento dessas IMDCTs resultam em dois sinais de resultado de domínio de tempo livres de distorção ou, pelo menos, com distorção reduzida na faixa de sobreposição que são, então, combinados pelo combinador.

[00024] Subsequentemente, um segundo aspecto é discutido no contexto da figura 1b. A figura 1b ilustra um aparelho para processamento de um sinal de áudio que compreende uma sequência de blocos de valores espectrais, de acordo com uma aplicação da presente invenção, com relação ao segundo aspecto. O aparelho compreende um processador (150) para calcular um sinal afetado por distorção (154) utilizando, pelo menos, um primeiro valor de modificação (102) para o primeiro bloco da sequência (114) de blocos de valores espectrais e utilizando, pelo menos, um segundo valor de modificação (106) diferente para um segundo bloco da sequência (114) de blocos de valores espectrais. O processador é configurado para estimar, além do sinal afetado por distorção (154), um sinal de erro de distorção (158). Além disso, o aparelho compreende um combinador (152) para combinar o sinal afetado por distorção e o sinal de erro de distorção de modo que um sinal de áudio processado (112) obtido combinando o combinador (152) é um sinal reduzido de distorção ou livre de distorção.

[00025] Especificamente, de acordo com o segundo aspecto ilustrado na figura 1b, o processamento é realizado utilizando o valor de modificação diferente para os blocos pertencentes à mesma faixa de sobreposição que resulta no sinal afetado por distorção (154). Entretanto, ao contrário da técnica prévia, onde esse sinal afetado por distorção é utilizado para processamento adicional e o erro induzido por distorção é tolerado, isso não é feito na presente invenção. Ao invés disso, o processador (150) adicionalmente calcula um sinal de erro de distorção (158), o sinal de erro de distorção é, então, combinado com o sinal afetado por distorção tipicamente pela subtração ou geralmente pela combinação linear ponderada, de modo que o sinal de áudio processado seja preferivelmente livre de distorção, mas mesmo quando a combinação ou o sinal de erro de distorção específico não é completamente calculada(o) de forma precisa, a combinação, entretanto, resulta em um sinal de áudio processado que tem menos erro de distorção que o sinal afetado por distorção (154).

[00026] Em muitas aplicações, é desejável modificar os coeficientes espectrais, aplicando os fatores de ganho neles antes de os inserir na IMDCT, de modo que:

com Xj(k) sendo o espectro de MDCT da estrutura -th, k sendo o índice de frequência, gjk) sendo uma função de ponderação espectral dependente de tempo e frequência e Yjk) sendo o espectro de MDCT filtrado. Essa aplicação dos fatores de ganho também é mostrada na figura 8.

[00027] Em particular, a figura 8 ilustra um sistema de síntese de MDCT típico da técnica prévia, no qual os valores espectrais de um bloco precedente (800) que tem um índice de tempo j-1 é multiplicado por, pelo menos, um fator de ganho gj-1 por um multiplicador (802). Além disso, o bloco atual (804) com o índice de tempo j é multiplicado ou modificado por um fator de ganho gj para o bloco atual indicado em (805). Especificamente, o fator de ganho (801) para o bloco precedente com o índice de tempo j-1 indicado em (801) e o fator de ganho gj para o bloco atual (805) são diferentes entre si. Além disso, conforme descrito na figura 8, o fator de ganho pode ser dependente da frequência. Isso é ilustrado pelo índice de frequência k. Assim, cada valor espectral com o índice k é multiplicado pelo primeiro ou segundo fator de ganho (801, 805) correspondente dependendo à qual bloco (800 ou 804) o fator de ganho pertence. Assim, devido ao fato de que os fatores de ganho para os dois blocos são variante do tempo e/ou variante de frequência, um erro de distorção resulta no processamento quando o processamento na figura 8 é aplicado. Esse processamento consiste em uma operação de IMDCT (807) para o bloco precedente (800) e uma operação de IMDCT adicional 808 para o bloco atual (804). A operação de IMDCT consiste em uma transformada de tempo de frequência e uma operação de dobra subsequente, conforme será discutido também no contexto da figura 2b. Então, um processamento de adição de sobreposição que adicionalmente compreende, antes da adição real conjunta, um janelador de síntese, é realizado pelo bloco (809), a fim de finalmente obter um sinal afetado por distorção y(n) indicado em (810), Assim, o sinal afetado por distorção (810) pode tipicamente ser exatamente o mesmo que o sinal afetado por distorção ilustrado em (154) na figura (154).

[00028] Se os ganhos nas duas estruturas subsequentes forem diferentes, os termos de distorção não se cancelam mais, como pode ser visto na figura 9 (direita), onde os fatores de ganho são constantes pela frequência, mas não ao longo do tempo. Nesse exemplo, eles são , de modo que o componente de distorção remanescente seja a distorção da estrutura 0 multiplicado por um fator de 0,3.

[00029] Deve-se notar que para tal caso simples, que foi principalmente escolhido para ilustração, o processamento de domínio de frequência não seria necessário, visto que um efeito similar poderia ser obtido sem problemas de distorção, aplicando um envelope temporal adequado. Entretanto, esse exemplo ajuda a explicar a ideia básica do esquema de redução de distorção. Aqui, o componente de distorção remanescente é o tempo revertido e o sinal de entrada janelado multiplicado pela diferença de dois fatores de ganho, que é em nosso exemplo 0,3. Assim, a distorção pode ser cancelada pelas seguintes etapas: • Reconstrução do sinal de entrada na região de sobreposição pela IMDCT adicional com ganhos iguais para os dois blocos; • multiplicação com a função ; • reversão de tempo; • multiplicação com diferença de ganho 0,3; • subtração da saída do processamento com ganho diferente.

[00030] A saída das primeiras três etapas é ilustrado na figura 6.

[00031] No primeiro aspecto, dois sinais de saída livres de distorção para a região de sobreposição são calculados e, então, uma cross-fade é realizada entre eles. A figura 5a mostra um diagrama em blocos de uma aplicação.

[00032] O primeiro sinal é obtido a partir do processamento de IMDCT das duas estruturas afetadas com os coeficientes espectrais Xj_1(_k) e Xj(k) com conjuntos iguais de fatores de ganho . Os componentes de distorção de domínio de tempo das duas estruturas se cancelam, pois não há diferenças de ganho. O segundo sinal j é gerado, por conseguinte, a partir de Aj-_1(k) e Aj(fc), mas agora utilizando fatores de ganho j. A variação da forma espectral agora pode ser obtida pela realização de uma cross-fade de 1j em direção a j dentro da região de sobreposição:

com sendo típica e monotonamente decrescente de 1 a 0 no intervalo 0<n<N. Para o caso , pode ser mostrado que ambas as abordagens produzem exatamente a mesma saída (vide Apêndice para detalhes). A liberdade para escolher as funções de cross-fade independentes da janela de MDCT, entretanto, fornece um benefício para essa abordagem, que é ilustrada na figura 5a.

[00033] Como para a pura variação de ganho, um segundo procedimento pode reduzir os componentes de distorção, gerando os dois sinais livres de distorção e realizando uma cross-fade. Aqui, cada um dos dois sinais é obtido utilizando correção igual e fatores de ganho iguais nas duas estruturas correspondentes (vide figura 5b). Nenhuma distinção especial precisa ser feita para a correção constante e fixa. A correção constante deduziria apenas o mapeamento igual ! ! para todas as estruturas.

[00034] O processamento fica mais complicado se os fatores de ganho não variam apenas com o tempo, mas também com a frequência. Nesse caso, uma substituição por um envelope temporal não é mais possível e a geração do sinal de entrada reversa de tempo também não fornece um sinal adequado para a redução do componente de distorção. Isso é ilustrado no seguinte exemplo, no qual os ganhos na primeira estrutura são constantes com a frequência novamente ( ), mas na segunda estrutura varia, conforme mostrado na figura 7.

[00035] Isso leva a um componente de distorção não cancelado que, entretanto, tem uma forma diferente da mostrada na figura 9 (direita). Conforme visto no primeiro exemplo, as diferenças de ganho estão causando componentes de distorção não cancelados. Assim, o procedimento mostrado na figura 3a.

[00036] A redução de distorção é realizada pelas seguintes etapas ilustradas na figura 3a: • gerar coeficientes espectrais adicionais por ponderação (307, 308) dos coeficientes originais pelas diferenças de ganho:

• reconstrução (303, 304, 306) do sinal de entrada na região de sobreposição pela IMDCT adicional com

• multiplicação (330) com a função

• reversão de tempo (340); • combinação como adição ou subtração à saída do processamento com ganho diferente.

[00037] A ordem do termo de diferença de ganho

determina se a saída da reversão de tempo deve ser adicionada ou subtraída a partir da saída de IMDCT regular para a implementação de MDCT especificamente ilustrada. Para as implementações de MDCT, os sinais podem ser diferentes:

: adicionar a saída da reversão de tempo na saída de IMDCT regular.

: subtrair a saída da reversão de tempo da saída de IMDCT regular.

[00038] Assim, para a aplicação descrita acima e para o caso ilustrado na figura 3a, em que

é ilustrado, o combinador (341) deve ser implementado como um adicionador que adiciona ambas as entradas.

[00039] Deve-se notar que os sinais necessários podem ser diferentes para diferentes implementações das transformadas revestidas. Há, por exemplo, pelo menos, quatro aplicações para a MDCT sobreposta de modo não uniforme. Além disso, há aplicações adicionais para uma MDCT sobreposta de forma uniforme ou uma ELT com múltipla sobreposição. Para a MDCT sobreposta de modo não uniforme, os sinais para os termos de correção são diferentes. Assim, a combinação realizada no bloco (341) pode compreender uma adição ou uma subtração.

[00040] O termo de correção de distorção para o exemplo atual é mostrado junto com a saída da IMDCT distorcida na figura 4.

[00041] O estágio de cópia de um algoritmo de BWE é descrito por uma função de mapeamento !. Para copiar a metade inferior dos coeficientes espectrais para a metade superior, o processo seria conforme segue:

[00042] A função de ganho seria constante e igual a 1 na metade inferior:

[00043] Se os fatores de ganho variassem na metade superior do espectro, a distorção não cancelada ocorreria novamente. Entretanto, a redução de distorção poderia ser realizada exatamente da mesma forma que a descrita na primeira abordagem descrita acima, com a diferença apenas que a correção também deveria ser considerada na geração do sinal de compensação. Isso pode ser realizado, utilizando os coeficientes espectrais mapeados, conforme eles são inseridos na IMDCT, e ponderando-os corretamente com as diferenças de ganho. Nesse caso, todas as diferenças de ganho na metade inferior seriam zero.

[00044] A extensão de largura de banda mais avançada poderia aplicar a correção que varia de estrutura para estrutura. Isso pode ser descrito pela definição de uma função de mapeamento individual !k para cada estrutura. Nesse caso, a redução de distorção deve considerar que diferentes componentes podem ser copiados no mesmo índice de frequência nas duas estruturas que influenciam a região de sobreposição comum. Isso deve ser considerado na geração do componente de redução de distorção. Para essa finalidade, a correção na primeira estrutura é tratada como acima, tendo um ganho de ^y-i(fc) na estrutura j — 1 e 0 na estrutura j, e a correção na estrutura j é tida como tendo um ganho de 0 na estrutura j — 1 e gj(k~) na estrutura j. Os coeficientes espectrais resultantes para a geração do sinal de redução de distorção são, conforme segue:

[00045] O diagrama em blocos para essa configuração é mostrado na figura 3b.

[00046] Na seção a seguir, os dois aspectos na figura 3a, bem como nas figuras 5a e 5b, são discutidos em mais detalhes com relação às similaridades.

[00047] A MDCT com uma resolução de frequência de N coeficientes espectrais de uma estrutura Xj(n) de 2N amostras,começando na posição da amostra jN, é definida por:

com w(n) sendo uma função de janela de comprimento 2N, k sendo o índice de frequência e n sendo o índice de amostra no domínio de tempo. A estrutura Xj(n) do sinal de tempo x(n) é definida como:

[00048] Uma estrutura de saída intermediária

é obtida a partir dos componentes espectrais Yj(k)com a transformada de retrocesso:

[00049] A saída final do processamento de MDCT inversa (IMDCT) é calculada, adicionando os segmentos de sobreposição:

[00050] Com a abreviação

e com as condições de janela

a saída da IMDCT na região de sobreposição após a aplicação dos fatores de ganho é:

[00051] Com

[00052] O termo de correção de distorção do Segundo aspecto descrito com relação às figuras 1b, 3a após a adição de sobreposição, janelamento e reversão de tempo é:

[00053] Os termos de cosseno têm as seguintes simetrias:

[00054] Substituí-los leva a:

[00055] Subtrair rk(n) de yk(n) fornece os termos que formam a saída da redução de distorção

[00056] Que correspondem a uma cross-fade entre os sinais reconstruídos com ganhos gj_1(k) e gj(k~), de acordo com o primeiro aspecto ilustrado e descrito com referência às figuras 1a, 5a e 5b.

[00057] A seguir, referência é feita às figuras 1c e 1d, a fim de ilustrar a relação das partes de tempo e blocos ou no codificador ou no lado da análise ou no decodificador ou no lado da síntese.

[00058] A figura 1d ilustra uma representação esquemática de uma parte de tempo 0th em uma terceira parte de tempo e cada parte de tempo dessas partes de tempo subsequentes tem uma determinada faixa de sobreposição (170). Com base nessas partes de tempo, os blocos da sequência de blocos que representam as partes de tempo de sobreposição são geradas pelo processamento discutido em mais detalhes com relação à figura 2a que mostra um lado da análise de uma operação de transformada de introdução à distorção.

[00059] Em particular, o sinal de domínio de tempo ilustrado na figura 1d, quando a figura 1d é aplicada ao lado da análise, é janelada por um janelador (201) que aplica uma janela de análise. Assim, a fim de obter a parte de tempo 0th, por exemplo, o janelador aplica a janela de análise para, por exemplo, (2048) amostras, e, especificamente, da amostra 1 à amostra (2048). Assim, N é igual a (1024) e uma janela tem um comprimento de 2N amostras, que no exemplo é (2048). Então, o janelador aplica uma operação de análise adicional, mas não para a amostra (2049) como a primeira amostra do bloco, mas para a amostra (1025) como a primeira amostra no bloco para obter a primeira parte de tempo. Assim, a primeira faixa de sobreposição (170), que tem (1024) amostras para uma sobreposição de 50%, é obtida. Esse procedimento é adicionalmente aplicado para a segunda e a terceira partes de tempo, mas sempre com uma sobreposição, a fim de obter uma certa faixa de sobreposição (170).

[00060] Deve-se enfatizar que a sobreposição não deve ser necessariamente uma sobreposição de 50%, mas a sobreposição pode ser mais alta e mais baixa e pode haver, ainda, uma sobreposição múltipla, ou seja, uma sobreposição de mais de duas janelas, de modo que uma amostra do sinal de domínio de tempo de áudio não contribua apenas para as duas janelas e, consequentemente, para os blocos de valores espectrais, mas que uma amostra, então, contribua para mais do que duas janelas/blocos de valores espectrais. Por outro lado, especialistas na técnica entendem, ainda, que há outras formas de janela, podendo ser aplicadas pelo janelador (201) da figura 2a, que têm 0 partes e/ou partes tendo valores unitários. Para tais partes tendo valores unitários, parece que essas partes tipicamente se sobrepõem com 0 partes de janelas precedentes ou subsequentes e, assim, uma determinada amostra de áudio localizada em uma parte constante de uma janela que tem valores unitários contribui apenas com um único bloco de valores espectrais.

[00061] As janelas das partes de tempo, conforme obtido pela figura 1d, são, então, encaminhadas a uma pasta (202) para realizar uma operação de dobra. Essa operação de dobra pode, por exemplo, realizar uma dobra de modo que, na saída da pasta (202), hajam apenas blocos dos valores de amostragem que têm N amostras por bloco. Então, subsequente à operação de dobra realizada pela pasta (202), um conversor de tempo-frequência é aplicado, o qual é, por exemplo, um conversor DCT-IV que converte N amostras por bloco na entrada em N valores espectrais na saída do conversor de tempo- frequência (203).

[00062] Assim, a sequência de blocos de valores espectrais obtida na saída do bloco (203) é ilustrada na figura 1c, especificamente mostrando o primeiro bloco (191) que associou um primeiro valor de modificação ilustrado em (102) na figura 1a e 1b e que tem um segundo bloco (192) que associou o segundo valor de modificação como (106) ilustrado nas figuras 1a e 1b. Naturalmente, a sequência tem mais blocos (193 ou 194), precedentes ao segundo bloco ou ainda levando o primeiro bloco conforme ilustrado. Os primeiro e segundo blocos (191, 192) são, por exemplo, obtidos pela transformação da primeira parte de tempo janelada da figura 1d para obter o primeiro bloco e o segundo bloco pela transformação da segunda parte de tempo janelada da figura 1d pelo conversor de tempo-frequência (203) da figura 2a. Assim, ambos os blocos de valores espectrais sendo adjacentes no tempo na sequência de blocos de valores espectrais representam uma faixa de sobreposição coberta pela primeira parte de tempo e pela segunda parte de tempo.

[00063] A seguir, a figura 2b é discutida, a fim de ilustrar um processamento do lado da síntese ou lado do decodificador do resultado do codificador ou processamento do lado de análise da figura 2a. A sequência de blocos de valores espectrais emitida pelo conversor de frequência (203) da figura 2a é inserida em um modificador (211). Conforme descrito, cada bloco de valores espectrais tem N valores espectrais para o exemplo ilustrado nas figuras 1c a 2b. Cada bloco associou seus valores de modificação como (102, 104) ilustrado nas figuras 1a e 1b. Então, em uma operação típica de IMDCT ou uma transformada de síntese de redução por redundância típica, as operações ilustradas por um conversor de frequência-tempo (212), uma pasta (213) para dobrar, um janelador (214) para aplicar uma janela de síntese e uma operação de sobreposição/adicionador ilustrada pelo bloco (215) são realizados a fim de obter o sinal de domínio de tempo na faixa de sobreposição. O mesmo tem, no exemplo, 2N valores por bloco, de modo que após cada sobreposição e operação de adição, N novas amostras livres de distorção de domínio de tempo são obtidas de modo que os valores de modificação (102, 104) não sejam variáveis com o tempo ou frequência. Entretanto, se esses valores são variáveis com o tempo e frequência, então o sinal de saída do bloco (215) não é livre de distorção, mas esse problema é solucionado pelo primeiro e pelo segundo aspecto da presente invenção conforme discutido no contexto das figuras 1b e 1a e conforme discutido no contexto de outras figuras na especificação.

[00064] Subsequentemente, uma ilustração adicional dos procedimentos realizados pelos blocos na figura 2a e na figura 2b é dada.

[00065] A ilustração é exemplificada pela referência à MDCT, mas outras transformadas de introdução à distorção podem ser processadas de forma similar ou de forma análoga. Como uma transformada revestida, a MDCT é um bit incomum comparado a outras transformadas relacionadas a Fourier pelo fato de que ela tem metade de saídas em relação às entradas (ao invés do mesmo número). Em particular, é uma função linear F : R2N → R N (onde R denota o conjunto de números reais). Os 2N números reais x0, . .., x2N-1 são transformados em N números reais X0, ..., XN-1, de acordo com a fórmula:

(O coeficiente de normalização na frente dessa transformada, aqui unitária, é uma convenção arbitrária e difere entre os tratamentos. Apenas o produto das normalizações da MDCT e da IMDCT, abaixo, é restrito.)

[00066] A MDCT inversa é conhecida como a IMDCT. Por haver números diferentes de entradas e saídas, à primeira vista, parece que a MDCT não deveria ser invertível. Entretanto, a perfeita capacidade de inversão é obtida adicionando as IMDCTs sobrepostas de blocos de sobreposição adjacentes ao tempo, fazendo com que os erros cancelem e os dados originais sejam recuperados; essa técnica é conhecida como cancelamento de distorção de tempo-domínio (TDAC | timedomain aliasing cancellation).

[00067] A IMDCT transforma N números reais X0, XN-1 em 2N números reais y0, ..., y2N-1 de acordo com a fórmula:

(Como para DCT-IV, uma transformada ortogonal, a inversão tem a mesma forma que a transformada de avanço.)

[00068] No caso de uma MDCT janelada com a normalização de janela comum (vide abaixo), o coeficiente de normalização na frente da IMDCT deve ser multiplicado por 2 (ou seja, se tornando 2/N).

[00069] Nas aplicações típicas de compressão de sinal, as propriedades de transformada são melhoradas, ainda utilizando uma função de janela wn (n = 0, ..., 2N-1) que é multiplicada com xn e yn nas fórmulas de MDCT e IMDCT acima, a fim de evitar as descontinuidades nos limites de n = 0 e 2N fazendo com que a função chegue a zero nesses pontos (isso é, uma faz o janelamento dos dados antes da MDCT e após a IMDCT.) A princípio, x e y poderiam ter diferentes funções de janela e a função de janela também poderia mudar de um bloco para o próximo (especialmente para o caso onde os blocos de dados de diferentes tamanhos são combinados), mas para simplificar, considera-se o caso comum de funções de janela idênticas para blocos com tamanho igual.

[00070] A transformada permanece invertível (isso é, TDAC funciona), para uma janela simétrica wn = w2N-1-n, desde que w atenda à condição de Princen-Bradley:

várias funções de janela são utilizadas. Uma janela que produz uma forma conhecida como uma transformada revestida modulada é dada por

e é utilizada para MP3 e MPEG-2 AAC, e

para Vorbis. AC-3 utiliza uma janela derivada de Kaiser-Bessel (KBD | Kaiser-Bessel derived) e MPEG-4 AAC também pode usar uma janela KBD.

[00071] Deve-se observar que as janelas aplicadas na MDCT são diferentes das janelas usadas para alguns outros tipos de análise de sinal, visto que elas devem atender à condição de Princen-Bradley. Uma das razões para essa diferença é que as janelas de MDCT são aplicadas duas vezes, tanto para MDCT (análise) quando para IMDCT (síntese).

[00072] Como pode ser visto pela inspeção das definições, para N par, a MDCT é essencialmente equivalente a DCT-IV, onde a entrada é alternada por N/2 e dois blocos N de dados são transformados por vez. Avaliando essa equivalência mais cuidadosamente, as propriedades importantes como TDAC podem ser facilmente derivadas.

[00073] A fim de definir a relação precisa ao DCT-IV, deve-se perceber que o DCT-IV corresponde a condições alternadas pares/ímpares: par no seu limite esquerdo (aproximadamente n=-1/2), ímpar no seu limite direito (aproximadamente n=N-1/2) e assim por diante (ao invés de limites periódicos como para uma DFT). Isso segue a partir das identidades e, assim, suas entradas

[00074] Assim, se suas entradas são uma matriz x de comprimento N, pode-se imaginar estender essa matriz para (x, -xR, -x, xR, ...) e assim por diante, onde xR denota x na ordem reversa.

[00075] Ao considerar uma MDCT com entradas 2N e saídas N, onde se divide as entradas em quatro blocos (a, b, c, d) cada um com tamanho N/2. Ao se alternar esses para a direita por N/2 (do termo +N/2 na definição de MDCT), então, (b, c, d) se estendem pelo final das entradas N DCT-IV, assim, deve-se “dobrá-las” de volta, de acordo com as condições de limite descritas acima.

[00076] Assim, a MDCT das entradas 2N (a, b, c, d) é exatamente equivalente a um DCT-IV das entradas N: (-cR-d, a-bR), onde R denota reversão, conforme mencionado acima.

[00077] Isso é exemplificado para a função de janela (202) na figura 2a. a é uma parte (204b), b é a parte (205a), c é a parte (205b) e d é a parte (206a).

[00078] (Dessa forma, qualquer algoritmo para calcular DCT-IV pode ser comumente aplicado à MDCT.)

[00079] De forma similar, a fórmula de IMDCT acima é precisamente 1/2 de DCT-IV (que é sua própria inversão), uma vez que a saída é estendida (através das condições de limite) a um comprimento 2N e alternada de volta à esquerda por N/2. A DCT-IV inversa simplesmente retornaria as entradas (-cR-d, a-bR) de cima. Quando essa é estendida através das condições de limite e alternada, temos: IMDCT(MDCT(a, b, c, d)) = (a-bR, b-aR, c+dR, d+cR) / 2.

[00080] Metade das saídas de IMDCT é, então, redundante, como b-aR = -(a-bR)R, e da mesma forma para os dois últimos termos. Ao se agrupar a entrada em blocos maiores A,B com tamanho N, onde A=(a, b) e B=(c, d), pode-se escrever esse resultado de forma mais simples:IMDCT(MDCT(A, B)) = (A-AR, B+BR) / 2

[00081] Agora pode-se entender como a TDAC funciona. Supondo que se calcule a MDCT do bloco 2N adjacente ao tempo com 50% sobreposto (B, C). A IMDCT, então, será análoga à acima: (B-BR, C+CR) / 2. Quando essa é adicionada ao resultado da IMDCT anterior na metade da sobreposição, os termos reversos cancelam-se e chega-se simplesmente ao B, recuperando os dados originais.

[00082] A origem do termo “cancelamento de distorção de tempo-domínio” agora está clara. O uso de dados de entrada que se estendem além dos limites de DCT-IV lógico faz com que os dados sejam deformados da mesma forma que as frequências além da frequência de Nyquist que são deformadas para frequências inferiores, exceto que essa distorção ocorre no domínio de tempo ao invés no domínio de frequência: não se pode distinguir as contribuições de a e de bR para a MDCT de (a, b, c, d), ou equivalentemente, ao resultado da IMDCT(MDCT(a, b, c, d)) = (a-bR, b-aR, c+dR, d+cR) / 2. As combinações c-dR, e assim por diante, têm precisamente os sinais corretos para as combinações cancelarem-se quando são adicionadas.

[00083] Para N ímpar (que são raramente utilizados na prática), N/2 não é um número inteiro, de modo que a MDCT não é simplesmente uma permutação de mudança de um DCT-IV. Nesse caso, a mudança adicional pela metade de uma amostra significa que a MDCT/IMDCT se torna equivalente à DCT-III/II e a análise é análoga à acima.

[00084] Vimos acima que a MDCT das entradas 2N (a, b, c, d) é equivalente a um DCT-IV das entradas N (-cR-d, a-bR). O DCT-IV é projetado para o caso onde a função no limite direito é ímpar e, assim, os valores próximos ao limite direito estão próximos a 0. Se o sinal de entrada for uniforme, esse é o caso: os componentes mais à direita de a e bR são consecutivos na sequência de entrada (a, b, c, d) e, assim, sua diferença é pequena. Vamos olhar no meio do intervalo: ao se reescrever a expressão acima como (-cR-d, a-bR) = (-d, a)-(b,c)R, o segundo termo, (b,c)R, fornece uma transição uniforme no meio. Entretanto, no primeiro termo, (-d, a), há uma descontinuidade potencial onde a extremidade direita de -d chega na extremidade esquerda de a. Essa é a razão para utilizar uma função de janela que reduz os componentes próximos aos limites da sequência de entrada (a, b, c, d) em direção ao 0.

[00085] Acima, a propriedade de TDAC foi comprovada para a MDCT comum, mostrando que adicionar IMDCTs de blocos adjacentes ao tempo em sua metade de sobreposição recupera os dados originais. A derivação dessa propriedade inversa para a MDCT janelada é apenas levemente mais complicada.

[00086] Considere sobrepor os conjuntos consecutivos de entradas 2N (A,B) e (B,C), para os blocos A,B,C com tamanho N. Lembrando que quando (A,B) e (B, C) são inseridos em uma MDCT, uma IMDCT e adicionados em sua metade de sobreposição, chega-se a (B+BR)/2+(B-BR)/2=B , os dados originais.

[00087] Agora, supõe-se que se multiplique as entradas de MDCT e as saídas de IMDCT por uma função de janela de comprimento 2N. Conforme mencionado acima, assume- se uma função de janela simétrica, que é, portanto, da forma (W,WR), onde W é um vetor de comprimento N e R denota a reversão como antes. Então, a condição de Princen-Bradley pode ser escrita como W2 +WR2 = (1, 1,...) , com os quadrados e adições realizados por elementos.

[00088] Assim, ao invés de realizar uma MDCT (A,B), pode-se agora proceder à MDCTs (WA,WRB) com todas as multiplicações realizadas por elementos. Quando essa é inserida em uma IMDCT e multiplicada novamente (por elementos) pela função de janela, a última metade N se torna: WR(WRB+(WRB)R)=WR(WRB+WBR)=WR2B+WWRBR (Observe que não há mais multiplicação por 1/2, pois a normalização de IMDCT difere por um fator de 2 no caso janelado.)

[00089] De forma similar, as MDCT e IMDCT janeladas de (B,C)produzem, em sua primeira metade N: W -(WB - WRBR) = W2B - WWRBR

[00090] Quando se adiciona duas metades juntas, uma recupera os dados originais. A reconstrução também é possível no contexto de mudança de janela, quando as duas metades de sobreposição da janela atendem à condição de Princen-Bradley. A redução da deformação poderia, nesse caso, ser realizada exatamente da mesma forma que a descrita acima. Para as transformadas com múltipla sobreposição, mais de duas ramificações seriam necessárias, utilizando todos os valores de ganho envolvidos.

[00091] A seguir, o primeiro aspecto é discutido em mais detalhes com referência às figuras 5a e 5b. Especificamente, o processador (100) ilustrado na figura 1a pode incluir todos ou apenas uma parte dos elementos (501 a 506) ilustrados nas figuras 5a na caixa definida pelo número de referência (100). Preferivelmente, o processador (100) compreende um modificador para modificar o primeiro bloco da sequência ilustrado como Xj-1 utilizando, pelo menos, um primeiro valor de modificação (102) para obter um primeiro bloco modificado (551). Essa modificação é preferivelmente realizada por um multiplicador de ganho (510), que pode ser implementado digitalmente ou de forma análoga ou em qualquer outra forma adequada. Além disso, o modificador é configurado para modificar o segundo bloco indicado como Xj(k) utilizando, pelo menos, um segundo valor de modificação 106 para obter um segundo bloco modificado (552). Essa modificação é novamente preferivelmente realizada por um multiplicador (509) que pode ser implementado na mesma forma que o multiplicador (510) ou em uma forma diferente. Além disso, o modificador é configurado para modificar o segundo bloco Xj(k) utilizando, pelo menos, o segundo de um primeiro valor de modificação (102) para obter um terceiro bloco modificado (553), onde essa modificação pode novamente ser realizada por um multiplicador (508) que pode ser implementado na mesma forma ou de forma diferente com relação aos multiplicadores (510 ou 509).

[00092] Além disso, o modificador é configurado para modificar o primeiro bloco xj-1 utilizando, pelo menos, um segundo valor de modificação (106), ou seja, Xj(k) para obter um quarto bloco modificado (554). Preferivelmente, o quarto bloco modificado (554) é novamente gerado por um multiplicador (507) que pode ser implementado na mesma forma ou de forma diferente com relação aos multiplicadores (510, 509, 508).

[00093] Além disso, o processador (100) preferivelmente compreende um conversor de espectro-tempo para converter do primeiro ao quarto blocos modificados (551 a 554) em representações de tempo correspondentes (561, 562, 563, 564). Em particular, o conversor de espectro-tempo é implementado como compreendendo os blocos de IMDCT (501, 502, 503, 504) gerando do primeiro ao quarto blocos modificados (561 a 564) correspondentes. O conversor de espectro-tempo pode ser implementado como um algoritmo de IMDCT que compreende os elementos reais (212) (conversor de frequência- tempo), (213) (pasta para uma dobra) e (214) (um janelador de síntese) da figura 2b. Entretanto, o conversor de espectro- tempo pode ser implementado como qualquer outro transformador de redução de distorção que resulta, em uma saída, em um bloco de valores de amostragem de domínio de tempo que têm um número mais alto de amostras comparado ao número de amostras em uma entrada respectiva.

[00094] De modo alternativo, para uma implementação computacionalmente eficiente, não a IMDCT total ou toda a transformada inversa de redução de distorção pode ser calculada, mas apenas a seção temporal contendo o sinal de cancelamento de distorção ou reduzido por distorção. Com essas linhas, por exemplo, no caso de IMDCT uma operação de dobra e metade da operação de janelamento de síntese podem ser omitidas. Assim, o processador pode ser configurado para realizar as transformadas revestidas que têm uma faixa de sobreposição e em que o processador é configurado para apenas realizar as operações que influenciam os valores na faixa de sobreposição e para não realizar as operações que não influenciam os valores na faixa de sobreposição. Com referência à figura 2b, as operações que não influenciam a faixa de sobreposição são as operações de dobra de bloco (213) que influenciam a primeira metade do bloco precedente e a segunda metade do bloco atual. Além disso, as operações correspondentes de janelamento para a primeira metade do bloco precedente e a segunda metade do bloco atual também não são necessárias para essa implementação eficiente. Isso é devido ao fato que apenas a segunda metade do bloco precedente e a primeira metade do bloco atual para a faixa de sobreposição.

[00095] Na aplicação na figura 5a, o número de amostras inseridas no bloco de IMDCT é igual a N e o número de amostras emitidas pelo bloco de IMDCT é 2N. Entretanto, outros índices numéricos correspondentes a outros fatores de sobreposição podem ser implementados, desde que número de amostras emitidas pelo conversor de espectro-tempo seja maior que número de amostras de domínio espectral inseridas ao conversor de espectro-tempo correspondente.

[00096] Além disso, o conversor de espectro-tempo pode ser implementado como contendo conversores de tempo de espectro individuais para cada sinal individual a ser convertido ou pode compreender um único conversor de tempo de espectro como apenas o bloco (501) da figura 5a e um controlador de sequência correspondente a fim de sequencialmente transformar um bloco modificado após o outro.

[00097] Além disso, o processador (100) compreende um adicionador de sobreposição para adição de sobreposição de representações do primeiro (561) e do terceiro (563) blocos modificados para obter o primeiro sinal de resultado (104) que é livre de distorção ou, pelo menos, com distorção reduzida.

[00098] Além disso, o adicionador de sobreposição é configurado para adição de sobreposição das representações de tempo do segundo (562) e do quarto (564) blocos modificados para obter o segundo sinal de resultado (108) que também é livre de distorção ou, pelo menos, com distorção reduzida. Essa operação de adição de sobreposição para a primeira e a terceira representações de tempo é realizada pelo bloco de adição de sobreposição (505) e a outra operação de adição de sobreposição para as representações de tempo do segundo e do quarto blocos modificados, ou seja, para o sinal em linha (562 e 564) é realizado por um bloco de adição de sobreposição (506) adicional. Novamente, o adicionador de sobreposição pode ter esses blocos separados ou um único bloco e um controle de sequência correspondente ou pode ser implementado em qualquer outra forma imaginável, a fim de obter o resultado definido. Preferivelmente, cada um dos blocos (505, 506) é implementado no bloco (215) correspondente descrito no contexto da figura 2b.

[00099] Preferivelmente, o combinador (110) na figura 5a é configurado para combinar o primeiro sinal de resultado (104) e o segundo sinal de resultado (108) por fade-out do primeiro sinal de resultado e por fade-in do segundo sinal de resultado. Para essa finalidade, um bloco de fade-out (520) para o primeiro sinal de resultado (104) e o bloco de fade-in (521) para o segundo sinal de resultado são fornecidos. A combinação real pode ser realizada por um adicionador (522) ilustrado na figura 5a como um elemento separado. Entretanto, deve-se enfatizar que a operação real do combinador (510) é preferível uma combinação linear ponderada, para cada amostra, a função de fade-out (520) fornece um certo fator de ponderação e, então, a amostra correspondente ponderada por esse fator de ponderação é adicionada a uma amostra correspondente de outro sinal de resultado sendo ponderado com um fator de ponderação fornecido pela função de fade-in (521) para a amostra correspondente.

[000100] Conforme descrito, o processador (100) é configurado para realizar uma operação de IMDCT ao realizar uma conversão de espectro-tempo e essa operação de IMDCT pode compreender as funcionalidades dos blocos (212, 213, 214), mas a operação de IMDCT pode ser implementada de qualquer outra forma e um número eficiente de algoritmos de IMDCT que obtém basicamente o mesmo resultado conforme discutido no contexto das figuras 2a e 2b são bem conhecidos

[000101] Além disso, o processador (100) é configurado para realizar uma operação de processamento de adição de sobreposição (505, 506) ao calcular o primeiro e o segundo sinais de resultado em uma faixa de sobreposição ilustrada em (170) na figura 1d. Além disso, o combinador (104) é configurado para combinar o primeiro e o segundo sinais de resultado em uma faixa de combinação, ou seja, por exemplo, em uma faixa de adição de sobreposição onde essa faixa de combinação é igual à faixa de sobreposição.

[000102] Assim, enfatiza-se que a figura 1d também pode ser considerada para representar a operação de adição de sobreposição realizada pelo bloco (215) no lado da síntese. Então, cada “parte de tempo” na figura 1d representa um bloco emitido pelo janelador de síntese (214) da figura 2b e amostras na faixa de sobreposição de um bloco janelado são adicionadas às amostras na faixa de sobreposição do próximo bloco janelado. Além disso, as amostras correspondentes são ponderadas com os fatores de ponderação fornecidas por uma função de fade-out como (520) e uma função de fade-in (522), conforme necessário. Por exemplo, quando a primeira parte de tempo corresponde a um bloco janelado, então, na faixa de sobreposição (170) na figura 1d, a primeira parte de tempo seria concluída durante a faixa de sobreposição e, ao mesmo tempo, a segunda parte de tempo seria iniciada dentro da faixa de sobreposição. Assim, uma função de fade-out forneceria fatores de fade-out que reduzem de 1 para 0 preferivelmente em uma forma linear e igualmente distribuída sobre o número de amostras de 1 a N. Assim, quando o comprimento de um bloco janelado é 2N, então, o intervalo entre 1 e 0 seria separado em N intervalos iguais e, para cada intervalo, o fator de fade-out seria determinado como o centro de cada intervalo, por exemplo. De forma similar, uma função de fade-in seria uma função que fornece fatores de fade-in crescentemente lineares de 0 a 1, novamente com N intervalos iguais.

[000103] Entretanto, outras funções diferentes das funções lineares podem ser aplicadas e é preferido que, para cada amostra, a soma do fator de fade-in para a amostra e o fator de fade-out para a amostra seja igual a 1, de modo que o fade-in/fade-out ou, de modo geral, a cross-fade não resulte em uma variação de amplitude ou ruído do sinal de áudio. Assim, uma soma de uma parte de fade-out e da parte de fade-in para cada amostra em uma faixa de cross-fade é constante e preferivelmente igual a 1.

[000104] Preferivelmente, a presente invenção é aplicada no contexto de funcionalidades de preenchimento da largura de banda, no contexto da figura 5b. A extensão de largura de banda significa que a largura de banda do sinal de entrada é estendida de modo que o sinal de saída gerado pela tecnologia de extensão de largura de banda tenha uma largura de banda mais alta que o sinal de entrada. Por outro lado, entretanto, as tecnologias de preenchimento de largura de banda também existem, que não necessariamente aumentam a largura de banda, mas que preenchem os furos espectrais dentro do sinal de entrada. Quando a banda de frequência superior é considerada um “furo espectral”, então, uma funcionalidade de preenchimento da largura de banda é similar a uma tecnologia de extensão de largura de banda. Entretanto, se um furo espectral do sinal de entrada que está localizado, com relação à frequência, abaixo de uma faixa na qual os valores espectrais existem, então a funcionalidade de preenchimento de largura de banda não estende a largura de banda, mas o resultado da tecnologia tem a mesma largura de banda que a entrada. Nesse contexto, SBR, por exemplo, é um exemplo de uma tecnologia de extensão de largura de banda e preenchimento de lacuna inteligente (IGF | intelligent gap filling) é um exemplo para uma funcionalidade de preenchimento de largura de banda geral sem necessariamente aumentar a largura de banda do sinal de entrada.

[000105] Preferivelmente, o processador (100) é configurado para aplicar uma funcionalidade de preenchimento de largura de banda que tem uma função de correção para corrigir os valores espectrais de uma faixa de origem 300 em uma faixa alvo (334), e o processador é configurado para aplicar a função de correção ao calcular o primeiro e o segundo sinais de resultado. De forma exemplar, a figura 3c ilustra um corretor para gerar, de uma sequência de blocos de valores espectrais tendo uma alta resolução ou que representam uma faixa de origem, uma sequência (334) de blocos de valores espectrais em uma faixa de preenchimento da largura de banda ou faixa alvo. O corretor é indicado em (332) na figura 3c e pode ser implementado para aplicar uma função de correção P(k) conforme ilustrado. Opcionalmente, conforme ilustrado na figura 3c e no caso de uma funcionalidade de preenchimento de largura de banda aplicada, a construção do processador (100) e do combinador (110) é a mesma como se nenhum preenchimento de largura de banda fosse aplicado longe do fato que a sequência de blocos de valores espectrais indicada em (334) na figura 5b é uma saída do corretor na figura 3c e os fatores de ganho (102, 106) ou, de modo geral, os fatores de modificação para cada bloco, são definidos por certa funcionalidade de preenchimento de largura de banda como réplica de banda espectral, preenchimento de lacuna inteligente ou qualquer outra funcionalidade de preenchimento de largura de banda . Assim, o corretor (332) pode ser parte do processador ou pode ser implementado como um estágio de pré-processamento aplicado na entrada ao processador.

[000106] Assim, o aparelho para processamento de um sinal de áudio compreende um corretor, ou como parte do processador (100) ou como um bloco aplicado na direção do processamento do sinal, antes do processador (100) da figura 1a, onde esse corretor é configurado para gerar o primeiro bloco em uma faixa de preenchimento da largura de banda, utilizando valores espectrais de uma faixa de frequência diferente, ou seja, de uma faixa de origem de acordo com uma função de correção para o primeiro bloco e o corretor é adicionalmente configurado para gerar o segundo bloco de valores espectrais em uma faixa de preenchimento da largura de banda ou faixa alvo utilizando faixa espectral de uma região de frequência diferente ou região de origem de acordo com uma função de correção para o segundo bloco, que pode ser a mesma função de correção ou uma função de correção diferente.

[000107] Além disso, conforme previamente discutido no contexto da figura 5a ou 5b, o processador é configurado para realizar uma funcionalidade do tipo multiplicação (510, 509, 508, 507) para modificar o primeiro e o segundo blocos utilizando funções de ganho ou valores de ganho como valores de modificação.

[000108] Outras aplicações do segundo aspecto da presente invenção são discutidas no contexto das figuras 3a e 3b.

[000109] As figuras 3a e 3b mostram um aparelho para processamento de um sinal de áudio que compreende uma sequência de blocos dos valores espectrais (114). Cada implementação compreende um processador (150) para calcular um sinal afetado por distorção (154) utilizando, pelo menos, um primeiro valor de modificação (102) para um primeiro bloco da sequência de blocos (114) e, pelo menos, um segundo valor de modificação diferente para um segundo bloco da sequência de blocos. Preferivelmente, a funcionalidade do processador para calcular um sinal afetado por distorção compreende um modificador de ganho para modificar o primeiro bloco utilizando, pelo menos, um primeiro valor de modificação para obter um primeiro bloco modificado (351). Essa modificação é preferivelmente realizada por um multiplicador (310), mas pode ser implementada conforme discutido no contexto do multiplicador correspondente (510) da figura 5. Além disso, o modificador de ganho é configurado para modificar o segundo bloco Xj(k) utilizando, pelo menos, um segundo valor de modificação (106) para obter um segundo bloco modificado (352). Essa modificação mais uma vez pode ser realizada por uma multiplicador (309), que novamente pode ser implementado conforme discutido no contexto do multiplicador (510). Para gerar o sinal afetado por distorção, o processador (150) compreende um conversor de espectro-tempo para converter o primeiro e o segundo blocos modificados em representações de domínio de tempo (361, 362) e adicionalmente um adicionador de sobreposição é configurado para adição de sobreposição das representações de domínio de tempo do primeiro e do segundo blocos, ou seja, (361 e 362), para obter o sinal afetado por distorção (154).

[000110] Além disso, o processador também é configurado para estimar o sinal de erro de distorção. Para essa finalidade, o processador (150) compreende uma funcionalidade adicional do modificador de ganho ilustrado por um multiplicador (308 e 307) a fim de modificar o primeiro bloco e o segundo bloco utilizando, pelo menos, um primeiro valor de modificação (102) ou, pelo menos, um segundo valor de modificação (106) para obter um terceiro bloco modificado (353) e um quarto bloco modificado (354).

[000111] Além disso, um conversor de espectro-tempo é ilustrado em (303 e 304) para converter o terceiro bloco modificado (353) e o quarto bloco modificado (354) em uma representação de domínio de tempo (363 e 364), respectivamente, e esses terceiro e quarto blocos modificados são, então, processados por um adicionador de sobreposição para adição de sobreposição das representações de domínio de tempo dos terceiro e quarto blocos modificados a fim de obter o sinal de erro de distorção (158).

[000112] A fim de manipular o sinal de erro de distorção (158) para obter uma boa combinação com o sinal afetado por distorção (158), o combinador compreende um janelador (330) para aplicar a função de janela e um bloco de reversão de tempo (340) para reversão de tempo de um sinal.

[000113] A diferença entre os valores de modificação de ganho é aplicada no domínio de frequência, ou seja, no processador antes de realizar a conversão de tempo espectral nos blocos (303 e 304). Para essa finalidade, a referência é feita à figura 3a. Em particular, nessa aplicação, o processador compreende o modificador de ganho, que é configurado para modificar o primeiro bloco xj-1 através do multiplicador (307) utilizando uma diferença entre, pelo menos, um primeiro valor de modificação e, pelo menos, um segundo valor de modificação, onde essa diferença é preferivelmente calculada por valor de frequência ou valor espectral conforme indicado pelo índice k na figura 3a. Além disso, o modificador de ganho é configurado para modificar o segundo bloco utilizando a diferença (125) dentro de um multiplicador (308) a fim de obter o terceiro bloco modificado (353) e o quarto bloco modificado (354). Nessa aplicação, que é ilustrada na figura 3a, o combinador compreende a janela (330) e a reversão de tempo (340).

[000114] Embora a sequência das operações de processamento dentro do combinador seja indicada de modo que o janelador (330) seja operado na direção do fluxo do sinal antes da reversão de tempo (340), fica claro que a ordem das operações desses elementos também pode ser revertida.

[000115] Assim, o processador (150) na figura 3a é de modo que o modificador de ganho modifique o primeiro bloco e o segundo bloco utilizando, pelo menos, um primeiro ou, pelo menos, um dos valores de modificação secundários. A modificação na figura 3a incorre ambos os valores de modificação devido ao fato de que a diferença entre ambos os valores de modificação é realmente utilizada para modificação que é realizada, por exemplo, pelos multiplicadores (308, 307), onde a diferença de ganho é indicada em (125) na figura 3a.

[000116] Além disso, conforme descrito, a operação de janelamento (330) e a operação de reversão de tempo (340) são preferivelmente aplicadas. Entretanto, para outras implementações, por exemplo, quando a transformada de tempo espectral é implementada em uma forma diferente, pode não ser necessário aplicar uma reversão de tempo (340). Além disso, quando nenhuma janela de análise ou síntese é aplicada, mas quando apenas, por exemplo, “janelas retangulares” são aplicadas, então o janelamento (330) também pode ser dispensado com ele.

[000117] Em uma aplicação preferida, entretanto, o janelador e o operador reversor de tempo são ilustrados e são posicionados na ordem ilustrada.

[000118] A seguir, a figura 3b é discutida em mais detalhes. A figura 3b é análoga à figura 3a em que a aplicação da “diferença” de ganho é aplicada no domínio de frequência. Entretanto, devido ao fato de que uma operação de correção é aplicada, a diferença de ganho não pode ser aplicada explicitamente, mas as diferentes operações de correção são preferivelmente explicadas

[000119] Assim, a fim de obter o sinal de erro de distorção, na operação de correção no contexto de uma funcionalidade de preenchimento de largura de banda, conforme discutido no contexto da figura 3c, os seguintes procedimentos são preferivelmente aplicados. Primeiramente, o bloco de valores espectrais (306a) é calculado, o qual é o primeiro bloco, mas o primeiro bloco é corrigido através da operação de correção para o segundo bloco e esse primeiro bloco (306a) é, então, multiplicado pelo fator de ganho (106) para o segundo bloco.

[000120] Além disso, conforme ilustrado, o primeiro bloco de valores espectrais (306b) é gerado, sendo o mesmo que o primeiro bloco (304b), ou seja, o primeiro bloco, no qual a operação de correção associada ao primeiro bloco é aplicada e o sinal é, então, multiplicado pelo primeiro fator de modificação (102). Então, os sinais gerados pelos multiplicadores são combinados como subtraídos ou adicionados juntos em (329) que podem ser implementados como um subtrator ou um adicionador com uma entrada negada, etc. Então, o terceiro bloco modificado é obtido, correspondendo basicamente ao bloco (353). Em uma forma similar, o bloco (354) é obtido, ou seja, pela correção do segundo bloco Xj com a operação de correção para o segundo bloco, ou seja, utilizando o bloco (304b) e multiplicando esse bloco com o segundo fator de modificação (106). Entretanto, o segundo bloco também é submetido a um algoritmo de correção associado ao primeiro bloco, conforme indicado no item (306d), e o resultado é, então, multiplicado pelo primeiro fator de multiplicação através do multiplicador (307b). Os sinais de saída dos multiplicadores (307a e 307b) são, então, adicionados juntos ao adicionador (328), a fim de finalmente obter o quarto bloco modificado (354). Então, o terceiro e o quarto blocos modificados (353 e 354) são submetidos a uma transformada de tempo espectral, conforme discutido no contexto da figura 3a, e são, então, adicionados por sobreposição, utilizando o bloco (306), conforme ilustrado na figura 3b. Então, as mesmas operações no combinador, como janelamento (330), reversão de tempo (340) e finalmente combinação (152) são realizadas, a fim de finalmente obter o sinal livre de distorção (112).

[000121] Embora a presente invenção tenha sido descrita no contexto de diagramas em blocos, onde os blocos representam os componentes de hardware reais ou lógicos, a presente invenção também pode ser implementada por um método implementado por computador. No último caso, os blocos representam etapas do método correspondentes, onde essas etapas são responsáveis pelas funcionalidades realizadas pelos blocos de hardware lógicos ou físicos correspondentes.

[000122] Embora alguns aspectos tenham sido descritos no contexto de um aparelho, é evidente que estes aspectos também representam uma descrição do método correspondente, onde um bloco ou dispositivo corresponde a uma etapa do método ou característica de uma etapa do método. De forma análoga, aspectos descritos no contexto de uma etapa do método também representam uma descrição de um bloco ou item ou característica correspondente de um aparelho correspondente. Algumas ou todas as etapas do método podem ser executadas por (ou utilizando) um aparelho de hardware, tal como, por exemplo, um microprocessador, um computador programável ou um circuito eletrônico. Em algumas aplicações, uma ou mais da(s) etapa(s) mais importante(s) do método pode(m) ser executada(s) pelo referido aparelho.

[000123] O sinal de áudio codificado inventivo pode ser armazenado em um meio de armazenamento digital ou pode ser transmitido por um meio de transmissão, tal como um meio de transmissão sem frio ou um meio de transmissão cabeado, tal como a internet.

[000124] Dependendo de certas exigências de implementação, as aplicações da invenção podem ser implementadas em hardware ou em software. A implementação pode ser realizada utilizando um meio de armazenamento digital, por exemplo, um disquete, um DVD, um Blu-Ray, um CD, uma memória ROM, uma PROM, uma EPROM, uma EEPROM ou a memória flash, tendo sinais de controle eletronicamente legíveis armazenados nele, que cooperam (ou são capazes de cooperar) com um sistema de computador programável, de modo que o respectivo método seja realizado. Assim, o meio de armazenamento digital pode ser legível por computador.

[000125] Algumas aplicações de acordo com a invenção compreendem um transportador de dados, tendo sinais de controle eletronicamente legíveis, que podem cooperar com um sistema de computador programável, de modo que um dos métodos descritos aqui seja realizado.

[000126] Geralmente, as aplicações da presente invenção podem ser implementadas como um produto do programa de computador com um código de programa, o código de programa sendo operativo para realizar um dos métodos quando o produto do programa de computador é executado em um computador. O código de programa pode, por exemplo, ser armazenado em um transportador legível por máquina.

[000127] Outras aplicações compreendem o programa de computador para realizar um dos métodos descritos aqui, armazenados em um transportador legível por máquina.

[000128] Em outras palavras, uma aplicação do método inventivo é, portanto, um programa de computador tendo um código de programa para realizar um dos métodos descritos aqui, quando o programa de computador é executado em um computador.

[000129] Outra aplicação do método inventivos é, portanto, um transportador de dados (ou um meio de armazenamento digital ou um meio legível por computador) compreendendo, gravado nele, o programa de computador para realizar um dos métodos descritos aqui. O transportador de dados, o meio de armazenamento digital ou o meio gravado são tipicamente tangíveis e/ou não transitórios.

[000130] Outra aplicação do método inventivo é, portanto, um fluxo de dados ou uma sequência de sinais representando o programa de computador para realizar um dos métodos descritos aqui. O fluxo de dados ou a sequência de sinais pode, por exemplo, ser configurado para ser transferido através de uma conexão de comunicação de dados, por exemplo, através da Internet.

[000131] Outra aplicação compreende um meio de processamento, por exemplo, um computador ou um dispositivo de lógica programável, configurado para ou adaptado para realizar um dos métodos descritos aqui.

[000132] Outra aplicação compreende um computador tendo instalado nele o programa de computador para realizar um dos métodos descrito aqui.

[000133] Outra aplicação, de acordo com a invenção, compreende um aparelho ou um sistema configurado para transferir (por exemplo, eletrônica ou opticamente) um programa de computador para realizar um dos métodos descritos aqui a um receptor. O receptor pode, por exemplo, ser um computador, um dispositivo móvel, um dispositivo de memória ou semelhante. O aparelho ou sistema pode, por exemplo, compreender um servidor de arquivo para transferir o programa de computador ao receptor.

[000134] Em algumas aplicações, um dispositivo de lógica programável (por exemplo, um arranjo de portas programáveis de campo) pode ser utilizado para realizar algumas ou todas as funcionalidades dos métodos descritos aqui. Em algumas aplicações, um arranjo de portas programáveis de campo pode cooperar com um microprocessador, a fim de realizar um dos métodos descritos aqui. Geralmente, os métodos são preferivelmente realizados por qualquer aparelho de hardware.

[000135] As aplicações descritas acima são meramente ilustrativas para os princípios da presente invenção. Entende-se que modificações e variações das disposições e os detalhes descritos serão evidentes a outros especialistas na técnica. É intenção, portanto, ser limitada escopo das reivindicações de patente iminentes detalhes específicos apresentados em forma de explicação das aplicações neste documento.

Claims

1. Um aparelho para processar um sinal de áudio, o sinal de áudio compreendendo uma sequência de blocos de valores espectrais, o aparelho caracterizado por compreender: um processador para processar a sequência de blocos de valores espectrais do sinal de áudio usando pelo menos um primeiro valor de modificação para um primeiro bloco para adquirir o primeiro sinal de resultado reduzido ou livre de aliasing em uma faixa de sobreposição e usando pelo menos um segundo valor de modificação diferente para um segundo bloco da sequência de blocos adquirir um segundo sinal de resultado reduzido ou livre de aliasing na faixa de sobreposição; e um combinador para combinar o primeiro sinal de resultado e o segundo sinal de resultado na faixa de sobreposição para adquirir um sinal de áudio processado para a faixa de sobreposição, em que o processador compreende: um modificador para modificar o primeiro bloco da sequência usando o pelo menos um primeiro valor de modificação para adquirir um primeiro bloco modificado, para modificar o segundo bloco da sequência usando o pelo menos um segundo valor de modificação para adquirir um segundo bloco modificado, para modificar o segundo bloco usando o pelo menos um primeiro valor de modificação para adquirir um terceiro bloco modificado e para modificar o primeiro bloco usando o pelo menos um segundo valor de modificação para adquirir um quarto bloco modificado; um conversor de espectro de tempo para converter o primeiro ao quarto bloco modificado em uma representação de tempo correspondente; e um adicionador de sobreposição para sobrepor e adicionar as representações temporais do primeiro e terceiro blocos modificados para adquirir o primeiro sinal de resultado e para sobrepor e adicionar as representações temporais do segundo e quarto blocos modificados para adquirir o segundo sinal de resultado, em que o combinador é configurado para combinar o primeiro sinal de resultado e o segundo sinal de resultado realizando um fade-out do primeiro sinal de resultado e simultaneamente, realizando um fade-in do segundo sinal de resultado e adicionando ambos os sinais, e em que pelo menos um dentre o processador, o combinador, o modificador, o conversor de tempo de espectro e o adicionador de sobreposição compreende uma implementação de hardware.

2. Aparelho, de acordo com a reivindicação 1, caracterizado pelo fato de que o processador é configurado para realizar uma operação de transformação discreta de cosseno modificada inversamente ao realizar uma conversão de espectro-tempo.

3. Aparelho, de acordo com a reivindicação 1, caracterizado pelo fato de que o processador é configurado para executar uma operação de processamento de sobreposição e adição no cálculo do primeiro e segundo sinais de resultado na faixa de sobreposição,e em que o combinador é configurado para combinar o primeiro e o segundo sinais de resultado em uma faixa de combinação, em que a faixa de combinação é idêntica à faixa de sobreposição.

4. Aparelho, de acordo com a reivindicação 1, caracterizado pelo fato de que o combinador está configurado para executar uma função de cross-fade,em que a função cross-fade compreende uma parte fade-out e uma parte fade-in, eem que a soma de um coeficiente de ponderação da parte de fade-out e de um coeficiente de ponderação da parte de fade-in para uma amostra em uma faixa de desvanecimento cruzado é constante.

5. Aparelho, de acordo com a reivindicação 1, caracterizado pelo fato de que o combinador está configurado para executar uma operação de cross fade, em que a operação de desvanecimento cruzado compreende uma parte de fade-out monotonicamente decrescente e uma parte de fade-in monotonicamente crescente.

6. Aparelho, de acordo com a reivindicação 1, caracterizado pelo fato de que o processador é configurado para aplicar uma operação de preenchimento de largura de banda compreendendo uma função de patching para corrigir valores espectrais de um intervalo de origem para um intervalo de destino, e em que o processador está configurado para aplicar a função de patching no cálculo do primeiro e segundo sinais de resultado.

7. Aparelho, de acordo com a reivindicação 1, caracterizado pelo fato de que compreende ainda: um patcher para gerar o primeiro bloco em uma faixa de preenchimento de largura de banda usando valores espectrais de uma faixa de frequência diferente de acordo com uma função de patch para o primeiro bloco e para gerar o segundo bloco em uma faixa de preenchimento de largura de banda que compreende valores espectrais para uma região de frequência diferente de acordo com uma função de patching associada ao segundo bloco.

8. Aparelho, de acordo com a reivindicação 1, caracterizado pelo fato de que o processador é configurado para realizar uma operação de multiplicação para o primeiro e segundo blocos usando as funções de ganho como valores de modificação.

9. Aparelho, de acordo com a reivindicação 1, caracterizado pelo fato de que o processador está configurado para processar a sequência de blocos, em que o primeiro bloco é adjacente no tempo com o segundo bloco, e em que o primeiro e o segundo blocos sendo adjacentes no tempo compreendendo uma sobreposição igual a 55% a 45% de uma porção de tempo.

10. Aparelho, de acordo com a reivindicação 1, caracterizado pelo fato de que o processador é configurado para aplicar uma operação de conversão espectral no tempo que compreende uma parte da transformação do espectro no tempo e uma parte da janela de síntese aplicada a uma saída da parte da transformação do espectro no tempo.

11. Aparelho, de acordo com a reivindicação 1, caracterizado pelo fato de que o processador é configurado para operar usando valores de modificação que variam ao longo do tempo e frequência.

12. Aparelho, de acordo com a reivindicação 1, caracterizado pelo fato de que o processador está configurado para realizar transformações sobrepostas compreendendo uma faixa de sobreposição, e em que o processador é configurado para realizar apenas operações que influenciam valores na faixa de sobreposição e para não realizar operações que não influenciem os valores na faixa de sobreposição.

13. Método para processar um sinal de áudio, o sinal de áudio compreendendo uma sequência de blocos de valores espectrais, o método caracterizado por: processar a sequência de blocos de valores espectrais do sinal de áudio usando pelo menos um primeiro valor de modificação para um primeiro bloco para adquirir o primeiro sinal de resultado reduzido ou livre de aliasing em uma faixa de sobreposição e usando pelo menos um segundo valor de modificação diferente para um segundo bloco da sequência de blocos para adquirir um segundo sinal de resultado reduzido ou livre de aliasing na faixa de sobreposição; e combinar o primeiro sinal de resultado e o segundo sinal de resultado na faixa de sobreposição para adquirir um sinal de áudio processado para a faixa de sobreposição,em que o processamento compreende: modificar o primeiro bloco da sequência usando o primeiro valor de modificação para adquirir um primeiro bloco modificado, modificar o segundo bloco da sequência usando o pelo menos um segundo valor de modificação para adquirir um segundo bloco modificado, modificar o segundo bloco usando o pelo menos um primeiro valor de modificação para adquirir um terceiro bloco modificado, modificar o primeiro bloco usando o pelo menos um segundo valor de modificação para adquirir um quarto bloco modificado, converter o primeiro ao quarto blocos modificados em uma representação de tempo correspondente; sobrepor e adicionar as representações de tempo do primeiro e terceiro blocos modificados para adquirir o primeiro sinal de resultado e sobrepor e adicionar as representações de tempo do segundo e quarto blocos modificados para adquirir o segundo sinal de resultado, em que a combinação compreende combinar o primeiro sinal de resultado e o segundo sinal de resultado realizando o fade-out do primeiro sinal de resultado e, simulatneamente, um fade-in do segundo sinal de resultado e adicionando ambos os sinais.

14. Meio de armazenamento digital não transitório, caracterizado pelo fato de que compreende um conjunto de instruções que, quando executadas, efetuam , um método para processar um sinal de áudio, o sinal de áudio compreendendo uma sequência de blocos espectrais valores, o método compreendendo: processar a sequência de blocos de valores espectrais do sinal de áudio usando pelo menos um primeiro valor de modificação para um primeiro bloco para adquirir o primeiro sinal de resultado reduzido ou sem aliasing em uma faixa de sobreposição e usando pelo menos um segundo valor de modificação diferente para um segundo bloco da sequência de blocos para adquirir um segundo sinal de resultado reduzido ou livre de aliasing na faixa de sobreposição; combinaro primeiro sinal de resultado e o segundo sinal de resultado na faixa de sobreposição para adquirir um sinal de áudio processado para a faixa de sobreposição; em que o processamento compreende: modificar o primeiro bloco da sequência usando o primeiro valor de modificação para adquirir um primeiro bloco modificado; modificar o segundo bloco da sequência usando pelo menos um segundo valor de modificação para adquirir um segundo bloco modificado; modificar o segundo bloco usando o pelo menos um primeiro valor de modificação para adquirir um terceiro bloco modificado; modificar o primeiro bloco usando pelo menos um segundo valor de modificação para adquirir um quarto bloco modificado; converter o primeiro ao quarto bloco modificado em uma representação de tempo correspondente; sobrepor e adicionar representações de tempo do primeiro e terceiro blocos modificados para adquirir o primeiro sinal de resultado; e sobrepor e adicionar representações de tempo do segundo e quarto blocos modificados para adquirir o segundo sinal de resultado; e em que a combinação compreende combinar o primeiro sinal de resultado e o segundo sinal de resultado realizando um fade-out do primeiro sinal de resultado e, simultaneamente, um fade-in do segundo sinal de resultado e adicionando ambos os sinais.